Lo stimatore per quoziente è asintoticamente corretto. Per la definizione di stimatore asintoticamente corretto, formula (2.15) pg. 33. B 2 Yˆq C 2 Xˆ v Yˆq 1 f 2 ˆ C X C X n 2 Campione casuale stratificato proporzionale nh/n = Nh/N =Wh nh= n* Nh/N = n*Wh Campioni casuali stratificati con allocazione ottimale. In questo caso si vuole avere un tasso di campionamento diversificato per ogni strato. In particolare si vuole incrementare la numerosità negli strati ad elevata variabilità, diminuirla dove invece è meno elevata al fine di minimizzare la var(yst). Il minimo di var(yst) si ottiene quando i valori di fh sono dati da: fh=nh/Nh=Wh*Sh/Wh*Sh, nh= n* Wh*Sh/Wh*Sh 2 1 fh 2 2 ˆ v(Yqs ) N h ( shy 2 Rˆ h shxy Rˆ h2 shx ) nh h (moltiplicativo) (additivo) Esercizio 1 Il provveditorato di una data città vuole valutare il totale degli studenti delle scuole superiori che frequentano le piscine comunali nelle due ore settimanali di educazione fisica. Sapendo che nella città sono presenti 30 scuole superiori, per un totale di 15674 studenti, si estrae con probabilità costante un campione SSR di 4 scuole, ottenendo i seguenti risultati: Scuole Numero studenti Studenti frequentanti le piscine 1 540 302 2 458 221 3 420 246 4 638 326 a) Stimare il totale degli studenti che frequentano le piscine comunali nelle ore di educazione fisica. b) Proporre una strategia alternativa e indicarne le condizione di applicazione. c) Confrontare le strategie e dire quale risulta più efficiente. Soluzione esercizio 1 a) Stimatore corretto (formula 4.29): , YˆGR 8212,5 con 4 y i 1 i. 1095 ; b) Poiché M0 risulta noto, uno stimatore alternativo potrebbe essere lo stimatore per quoziente, utilizzando come variabile ausiliaria il numero di studenti; (formula 6.49): YˆqGR 8347,777237 4 con M i 1 i 2056 e Rˆ 0,532587549 . v YˆGR 460248,8 con s21=2360,25; v YˆqGR 92369,32 c) Confrontando gli MSE dei due stimatori si osserva che lo stimatore per quoziente è più efficiente 684,8754 Mse= 93054,19527 < 460248,8 Esercizio 2 Un'azienda produttrice di integratori alimentari desidera valutare la spesa totale mensile relativa alla propria tipologia di prodotti in una piccola città. Allo scopo si estrae un campione SSR di n=11 individui di età 30-50 anni e, per ciascuno di essi, viene rilevata la spesa totale mensile per generi alimentari e la spesa totale per integratori, ottenendo i seguenti risultati: Individui Spesa per al. (in migl.) Spesa per int. (in migl.) 1 1200 150 2 880 120 3 520 85 4 1240 200 5 660 95 6 800 110 7 400 65 8 620 90 9 740 105 10 510 80 11 300 20 Sapendo che la dimensione della popolazione di età 30-50 è di 2560 unità ed il totale della spesa mensile per alimentari è pari a 250000 (migl.lire): a) si stimi la spesa totale mensile per integratori, utilizzando i due stimatori alternativi che sfruttano le informazioni sulla variabile ausiliaria; b) in base ai risultati campionari si dica, anche approssimativamente, quale dei due stimatori è preferibile e si discutano le condizioni di tale preferibilità. Soluzione esercizio 2 Esercizio 3 Soluzione esercizio 3 nh 32 12 6 50 244,4920661 14045,60764 960,7882 0,857697 10067,18 Soluzione esercizio 4 Soluzione esercizio 4 Soluzione Esercizio 4 Soluzione Esercizio 4 Esercizio 5 Un proprietario agricolo vuole prevedere, con la maggiore accuratezza possibile, la produzione dell'anno corrente di un terreno di 1000 ettari. Per i primi 10 appezzamenti sperimentali di un ettaro ciascuno ha già ottenuto la produzione nell'anno in corso, misurata in numero di piante e ha conservato, inoltre, i dati relativi alla produzione di tali appezzamenti nell'anno passato. I dati sulla produzione dei 10 appezzamenti sono riportati nella seguente tabella Sapendo che la produzione totale dell'anno passato è stata di 21000 piante e sapendo che nella teoria del campionamento da popolazioni finite sono disponibili due stimatori alternativi che sfruttano le informazioni su una variabile ausiliaria, 1. si stimi il valore della produzione totale dell'anno in corso utilizzando i due stimatori; 2. si stimi la varianza dei due stimatori; 3. sulla base dei risultati ottenuti si dica quale dei due stimatori è preferibile e si discutano le condizioni in base alle quali tale stimatore è preferibile all'altro. Soluzione Esercizio 5 3. Lo stimatore per quoziente va utilizzato quando esiste una dipendenza lineare rappresentabile da una retta uscente dall’origine; se la dipendenza è lineare ma non rappresentabile da una retta uscente dall’origine si usa lo stimatore per regressione. E’ conveniente, quindi, disegnare la nuvola di punti e valutare la dipendenza. Esercizio 6 La direzione generale di un istituto bancario a diffusione nazionale desidera valutare l'opinione dei propri dipendenti in merito all'apertura degli sportelli nella mattina del sabato; decide quindi di selezionare casualmente 32 agenzie delle 121 presenti sul territorio e ripartite in macrozone come riportato nella seguente tabella: Macrozone Nord Totale agenzie 60 Centro Sud Isole 34 8 19 Nell’ipotesi di intervistare tutti i dipendenti delle 32 agenzie scelte, la rilevazione ha fornito la seguente proporzione di favorevoli all'apertura degli sportelli di sabato mattina: Macrozone Nord Prop. favorevoli0,12 Centro Sud Isole 0,11 0,07 0,08 a) Si definisca il piano di campionamento e si effettui l'allocazione più opportuna per il campione. b) Si stimi la proporzione di dipendenti favorevoli all'apertura straordinaria del sabato mattina. c) Si dica con quali criteri possono essere state definite le stime delle percentuali di favorevoli nelle macrozone. Soluzione esercizio 6 a) E’ un campionamento stratificato di grappoli. Non avendo alcuna informazione si suppone di effettuare l’allocazione proporzionale. Essendo W 1=0.496, W2=0.281, W3=0.157, W4=0.066, le numerosità campionarie di strato risultano n1=16, n2=9, n3=5, n4=2. b) pST=0,1076, formula 5.14. c) Trattandosi di una stratificazione di grappoli (agenzie), la stima della proporzione di favorevoli nei singoli strati può essere calcolata con p h nh nh ahi M hi 1 in caso di grappoli di 1 dimensione variabile (vale a dire agenzie con un numero differente di dipendenti) oppure da ph phi nh se i grappoli sono di dimensione costante, pari a M (vedi libro par. 5.6). ich Esercizio 7 Allo scopo di stimare l'ammontare mensile delle multe per infrazione al codice della strada, l'amministrazione di una certa provincia italiana ha deciso di effettuare una indagine campionaria scegliendo casualmente 40 dei suoi comuni. Nell'ipotesi che i comuni siano stati ripartiti in tre strati in funzione della loro dimensione demografica e disponendo delle seguenti informazioni: 1. si effettui l'allocazione che si ritiene più opportuna; 2. si stimi l'ammontare mensile delle multe per l'intera provincia mettendo a confronto le due strategie suggerite dalle informazioni date; Soluzione esercizio 7 Soluzione esercizio 7 c) In alternativa allo stimatore per quoziente, si può utilizzare lo stimatore per regressione combinato, ottenendo i seguenti risultati: In questo caso, risulta evidente il guadagno in termini di efficienza.