1 2 LE TECNICHE CHE VEDREMO OGGI 3 4 5 6 7 Pi<1/2 8 esistono “in natura” (per esempio unità naturali, quali famiglie; unità amministrative, quali comuni) 9 10 11 La variabile ausiliaria usata per definire le probabilità variabili potrebbe essere, 12 non la dimensione dei grappoli, M, ma una generica X, positivamente correlata con la Y. Pi 13 = s12 14 Identità tra devianze y ij y yij yi M yi y i j 2 2 i j 2 i Devianza totale=devianza within+devianza beetween 1 2 2 2 NM 1 S y y y y S ij ij NM 1 i j i j 2 Sw 2 SB 2 1 2 2 2 y y y y S ij i ij i w N ( M 1) N ( M 1) i j i j 1 M yi y N 1 i j M y y 2 2 i i S B N 1 2 j Mi=M, PER OGNI i 15 S12=MSB2 = = Mi=M, PER OGNI i 16 STIMA PROPORZIONE IN GR Mi=M, per ogni i pˆ gr p i c n corretto N 1 p pˆ 1 f v pˆ n 1 n c 2 c c distorto c pi Pi gr pˆ gr i 2 i a m i ai 1 n c Mi 1 f V pˆ gr n Mi diverso per ogni i gr 1 f V pˆ gr nM 2 1 f v pˆ gr nMˆ 2 ai M i P 2 , M M0 N N 1 a M pˆ , Mˆ 1 M n 1 n c 2 i c i gr c 17 i 18 SOLUZIONE ES. 1 19 SOLUZIONE ES. 1 20 Calcolare le probabilità di inclusione del primo e del secondo ordine. 21 SOLUZIONE ES. 2 P J ’= T’j =Pj/(1-PI) P'j=Pj/(1-pi)T'j 0,076932 0,076932 0,061545 0,138477 0,076932 0,184636 0,076932 0,138477 0,153863 0,092318 0,138477 0,276954 0,353886 0,538522 0,615454 0,753931 0,907794 1,000112 = CAMPIONE ESTRATTO: C=(2,9) 2 0,219 9 0,274 2,9 0,035 22 ESERCIZIO 3 In una strada del centro storico di una certa città ci sono 8 palazzi costruiti prima del 1920. Allo scopo di valutare le condizioni di stabilità dei palazzi ne vengono scelti 2 a caso con probabilità variabili, impiegando come variabile ausiliaria il numero di famiglie residenti in ciascun palazzo. Palazzi 1 2 3 4 5 6 7 8 Famiglie 25 15 40 12 50 28 16 20 residenti a)Si estragga il campione con il metodo di Yates-Grundy. b)Si definiscano le probabilità di inclusione del primo e secondo ordine e si calcolino tali probabilità per il campione estratto in a). 23 ESERCIZIO 4 ospedali n_posti letto 1 2 3 4 5 6 7 8 9 10 470 210 350 960 235 550 125 210 425 232 ( , ) 24 ESERCIZIO 5 ( , , ) 25 ESERCIZIO 6 Si consideri una popolazione di N=4 catene di supermercati di una città italiana; ognuna di esse è presente nella città con tre negozi. L'entrata mensile di ogni negozio è indicata in milioni di euro nella tabella che segue: catena1 catena2 catena3 catena4 3 2,7 5,3 4,7 2,5 4 3,6 3,9 3,8 7 2,8 5,8 a) Verificare l’identità sulle devianze e calcolare il coefficiente di omogeneità nei grappoli. b) Verificare l’espressione di S12 in funzione del coefficiente di omogeneità nei grappoli. c) Si estragga un campione di 2 catene , si stimino il ricavo mensile totale per negozio e per catena con le relative varianze. 26 ESERCIZIO 7 Una impresa con 10 unità locali (U.L.) distribuite nella regione vuole introdurre l'orario flessibile. Allo scopo effettua un sondaggio scegliendo casualmente n=3 U.L tenendo conto del numero di addetti per U.L.. U.L. addetti 1 8 2 12 3 23 4 15 5 50 6 75 7 115 8 43 9 19 10 25 Supponendo che, per le tre U.L. scelte, la proporzione di favorevoli all'orario flessibile sia rispettivamente pari a p1=0,4, p2=0,6, p3=0,2 1. si estragga il campione di n=3 U.L., impiegando il metodo dei totali cumulati 2. si stimi la proporzione di addetti che sono favorevoli all'orario flessibile 3. si stimi la varianza dello stimatore e si definiscano le proprietà dello stimatore impiegato. 27 ESERCIZIO 8 Si vuole condurre un’indagine campionaria sulle ore di assenza dal lavoro da parte degli addetti nelle 870 imprese manifatturiere di un dato settore della regione Lombardia. Supponiamo che venga estratto in blocco un campione di 10 imprese e si considerano tutti gli addetti di ciascuna impresa giungendo ai dati esposti nella seguente tabella, relativi ad una settimana lavorativa. Imprese N. addetti Tot ore assenza 1 7 8 2 29 24 3 64 49 4 52 32 5 85 48 6 12 16 7 47 51 8 34 24 9 72 56 10 21 16 A) Che tipo di campionamento è stato utilizzato? B) Si stimi il totale delle ore di assenza degli addetti nelle 870 aziende e il corrispondente scarto quadratico medio C) Si dica, motivando la risposta, se i dati a disposizione avrebbero consentito la stima della media delle ore di assenza. D) Se non fossero stati considerati tutti gli addetti di ciascuna impresa ma solo 6 per ognuna estratti casualmente, che tipo di campionamento sarebbe stato utilizzato? 28