1 2 LE TECNICHE CHE VEDREMO OGGI 3 4 5 6 7 Pi<1/2 8 esistono “in natura” (per esempio unità naturali, quali famiglie; unità amministrative, quali comuni) 9 10 11 La variabile ausiliaria usata per definire le probabilità variabili potrebbe essere, 12 non la dimensione dei grappoli, M, ma una generica X, positivamente correlata con la Y. Pi 13 = s12 14 Identità tra devianze y ij y yij yi M yi y i j 2 2 i j 2 i Devianza totale=devianza within+devianza beetween 1 2 2 2 NM 1 S y y y y S ij ij NM 1 i j i j 2 Sw 2 SB 2 1 2 2 2 y y y y S ij i ij i w N ( M 1) N ( M 1) i j i j 1 M yi y N 1 i j M y y 2 2 i i S B N 1 2 j Mi=M, PER OGNI i 15 S12=MSB2 = = Mi=M, PER OGNI i 16 STIMA PROPORZIONE IN GR Mi=M, per ogni i pˆ gr p i c n corretto N 1 p pˆ 1 f v pˆ n 1 n c 2 c c distorto c pi Pi gr pˆ gr i 2 i a m i ai 1 n c Mi 1 f V pˆ gr n Mi diverso per ogni i gr 1 f V pˆ gr nM 2 1 f v pˆ gr nMˆ 2 ai M i P 2 , M M0 N N 1 a M pˆ , Mˆ 1 M n 1 n c 2 i c i gr c 17 i 18 SOLUZIONE ES. 1 19 SOLUZIONE ES. 1 20 Calcolare le probabilità di inclusione del primo e del secondo ordine. 21 SOLUZIONE ES. 2 P J ’= T’j =Pj/(1-PI) P'j=Pj/(1-pi)T'j 0,076932 0,076932 0,061545 0,138477 0,076932 0,184636 0,076932 0,138477 0,153863 0,092318 0,138477 0,276954 0,353886 0,538522 0,615454 0,753931 0,907794 1,000112 = CAMPIONE ESTRATTO: C=(2,9) 2 9 2,9 22 0,219 0,274 0,035 ESERCIZIO 3 In una strada del centro storico di una certa città ci sono 8 palazzi costruiti prima del 1920. Allo scopo di valutare le condizioni di stabilità dei palazzi ne vengono scelti 2 a caso con probabilità variabili, impiegando come variabile ausiliaria il numero di famiglie residenti in ciascun palazzo. Palazzi 1 2 3 4 5 6 7 8 Famiglie 25 15 40 12 50 28 16 20 residenti a)Si estragga il campione con il metodo di Yates-Grundy. b)Si definiscano le probabilità di inclusione del primo e secondo ordine e si calcolino tali probabilità per il campione estratto in a). 23 SOLUZIONE ES. 3 a)Le probabilità di estrazione per la prima unità (palazzo), definite in base alla variabile ausiliaria "numero di famiglie residenti"; quindi sono 8 7 6 5 4 3 2 1 Palazzi 20 16 28 50 12 40 15 25 Famiglie res. 0,121 0,073 0,194 0,058 0,243 0,136 0,078 0,097 Pi Ipotizzando di estrarre la i-esima unità occorre ricalcolare le misure di ampiezza normalizzate per l’estrazione della seconda unità: Pi 1 Pi b)Definire le probabilità di inclusione (par.2.6). Per le probabilità di inclusione del primo e secondo ordine, utilizzando il metodo di YatesGrundy, vedi libro (par. 3.4.2.1). Le probabilità di inclusione del primo ordine risultano 8 7 6 5 4 3 2 Palazzi 1 0,249 0,154 0,378 0,124 0,454 0,276 0,163 0,202 i 24 ESERCIZIO 4 ospedali n_posti letto 1 2 3 4 5 6 7 8 9 10 470 210 350 960 235 550 125 210 425 232 ( , ) 25 SOLUZIONE ES. 4 P'j=Pj/(1-Pi) Tj' 0,16747182 0,167472 0,074745035 0,242217 0,12466452 0,366881 0,08373591 0,195920558 0,044551798 0,074745035 0,15136876 0,082662373 0,450617 0,646538 0,69109 0,765835 0,917203 0,999866 26 SOLUZIONE ES. 4 27 SOLUZIONE ES. 4 28 SOLUZIONE ES. 4 29 ESERCIZIO 5 ( , , ) 30 SOLUZIONE ES. 5 , 31 SOLUZIONE ES. 5 ^ = ^ = 32 ESERCIZIO 6 Si consideri una popolazione di N=4 catene di supermercati di una città italiana; ognuna di esse è presente nella città con tre negozi. L'entrata mensile di ogni negozio è indicata in milioni di euro nella tabella che segue: catena1 catena2 catena3 catena4 3 2,7 5,3 4,7 2,5 4 3,6 3,9 3,8 7 2,8 5,8 a) Verificare l’identità sulle devianze e calcolare il coefficiente di omogeneità nei grappoli. b) Verificare l’espressione di S12 in funzione del coefficiente di omogeneità nei grappoli. c) Si estragga un campione di 2 catene , si stimino il ricavo mensile totale per negozio e per catena con le relative varianze. 33 SOLUZIONE ES. 6 a) catena1 catena2 catena3 catena4 3 2,7 5,3 4,7 2,5 4 3,6 3,9 3,8 7 2,8 5,8 _ Yi 9,3 13,7 11,7 14,4 Yi 3,1 4,566667 3,9 4,8 2 Si 0,43 4,863333 1,63 0,91 34 SOLUZIONE ES. 6 b) =5,2425 1-S2w/S2= -0,03024989 c) catene Ricavo totale mensile 2 4 (mil. Euro) 13,7 y i. 4,683333 c 14,4 1 ˆ N2 ˆ v Ygr v( Ygr ) (1 f ) s12 0,007 2 M0 nM 0 S12=0,245 Yˆgr N ˆ Ygr N n* N Yˆgr ˆ N Ygr M0 n* M0 yi . c 14,05 1 ˆ N2 ˆ v Ygr v( Ygr ) (1 f ) s12 2 N nN 0,06125 35 ^ ESERCIZIO 7 Una impresa con 10 unità locali (U.L.) distribuite nella regione vuole introdurre l'orario flessibile. Allo scopo effettua un sondaggio scegliendo casualmente n=3 U.L tenendo conto del numero di addetti per U.L.. U.L. addetti 1 8 2 12 3 23 4 15 5 50 6 75 7 115 8 43 9 19 10 25 Supponendo che, per le tre U.L. scelte, la proporzione di favorevoli all'orario flessibile sia rispettivamente pari a p1=0,4, p2=0,6, p3=0,2 1. si estragga il campione di n=3 U.L., impiegando il "cumulative total method" ed indicando come sono state scelte le U.L. dalle tavole dei numeri casuali; 2. si stimi la proporzione di addetti che sono favorevoli all'orario flessibile 3. si stimi la varianza dello stimatore e si definiscano le proprietà dello stimatore impiegato. 36 SOLUZIONE ES. 7 u.l. addetti 1 2 3 4 5 6 7 8 9 10 Ti 8 12 23 15 50 75 115 43 19 25 385 pi ai=pi*mi 8 20 43 58 108 183 298 341 360 385 (ai-Mi*p^gr)^2 0,4 0,2 30 23 39,42671714 178,8128718 0,6 15 50,31097891 268,5505679 Per utilizzare il metodo dei totali cumulati si considerano i seguenti valori cumulati: 820-43-58-108-183-298-341-360-385. Seleziono i numeri casuali126-367-213 compresi nell'intervallo [1;385], cui corrispondono rispettivamente le U.L. 6-10-7. Poiché i grappoli hanno dimensioni differenti si considera lo stimatore 0,316279 71,66667 1 f v pˆ gr nMˆ 2 c a M pˆ , Mˆ 1 2 i i n 1 gr n Lo stimatore impiegato è asintoticamente corretto. M i v(p^gr)= 0,006100121 c 37 ESERCIZIO 8 Si vuole condurre un’indagine campionaria sulle ore di assenza dal lavoro da parte degli addetti nelle 870 imprese manifatturiere di un dato settore della regione Lombardia. Supponiamo che venga estratto in blocco un campione di 10 imprese e si considerano tutti gli addetti di ciascuna impresa giungendo ai dati esposti nella seguente tabella, relativi ad una settimana lavorativa. Imprese N. addetti Tot ore assenza 1 7 8 2 29 24 3 64 49 4 52 32 5 85 48 6 12 16 7 47 51 8 34 24 9 72 56 10 21 16 A) Che tipo di campionamento è stato utilizzato? B) Si stimi il totale delle ore di assenza degli addetti nelle 870 aziende e il corrispondente scarto quadratico medio C) Si dica, motivando la risposta, se i dati a disposizione avrebbero consentito la stima della media delle ore di assenza. D) Se non fossero stati considerati tutti gli addetti di ciascuna impresa ma solo 6 per ognuna estratti casualmente, che tipo di campionamento sarebbe stato utilizzato? 38 SOLUZIONE ES. 8 A) Che tipo di campionamento è stato utilizzato? Si è utilizzato un campionamento a grappoli, in quanto si ha una popolazione “addetti nelle imprese manifatturiere di un dato settore della Regione Lombardia” suddivisa in 870 grappoli “le aziende”. Si sono estratti in blocco 10 grappoli e si sono esaminati completamente. Dunque: •è noto N=870 numero totale di grappoli •è noto n=10 numero grappoli costituenti il campione •sono note le Mi=numero di unità elementari che formano il grappolo i •sono note le yi=ore di assenza per ciascun grappolo i •non è noto M0=numero di unità elementari che formano la popolazione (totale addetti nelle imprese manifatturiere di un dato settore nella Regione Lombardia) Imprese 1 N. addetti 7 Tot ore assenza y8 2 29 24 3 64 49 4 52 32 5 85 48 6 12 16 7 47 51 8 34 24 9 72 56 10 21 16 39 SOLUZIONE ES. 8 B) Si stimi il totale delle ore di assenza degli addetti nelle 870 aziende e il corrispondente scarto quadratico medio 870 N= 10 n= = 28188 4734,6 = C) Si dica, motivando la risposta, se i dati a disposizione avrebbero consentito la stima della media delle ore di assenza. Nel campionamento a grappoli lo stimatore della media è il seguente: (se si considera la media per addetto) Per il calcolo è necessario conoscere M0, il numero degli addetti di tutte le 870 aziende. Tale dato non è a disposizione. In questo caso non è dunque possibile stimare la media, ma solo il totale (se si considera la media per grappolo si ottiene 32,4) D) campionamento a due stadi 40