STATISTICA DESCRITTIVA INFERENZA STATISTICA Statistica inferenziale Probabilità Campione Popolazione Statistica inferenziale Popolazione finita e suoi parametri Una Popolazione finita è un insieme di unità su cui si può osservare un certo carattere. (es: tutti i pazienti di un reparto) I parametri della popolazione sono delle costanti che descrivono aspetti caratteristici della distribuzione del carattere nella popolazione stessa. Esempio di parametro: media della popolazione 1 N i 1 xi N N 1 2 2 x i Varianza della popolazione N i i Popolazione Campione rappresentativo Stima campionaria Parametro della popolazione Il campione statistico è quel sottoinsieme particolare della popolazione o universo, individuato in essa in modo da consentire, con un rischio definito di errore, la generalizzazione all’intera popolazione. Il campione rappresentativo riproduce in miniatura la popolazione Procedimento casuale Campione rappresentativo Il campione casuale è estratto con procedimento tale che tutte le unità della popolazione hanno la stessa probabilità di essere estratte Con ricollocamento (estrazioni indipendenti) Senza ricollocamento o in blocco (estrazioni indipendenti se n/N<0.05) Campioni casuali L’estrazione casuale dei campioni dalla popolazione può essere • con ripetizione: una volta estratta un’unità viene rimessa dentro la popolazione e quindi potrebbe essere nuovamente estratta; • senza ripetizione: una volta estratta un’unità questa viene messa da parte e quindi non può essere estratta più di una volta. Due campioni non ordinati di uguale numerosità sono diversi tra loro se almeno un’unità del primo campione non è contenuta nel secondo campione. Nei campioni ordinati conta invece anche l’ordine con cui si presentano le diverse unità. Problema: Da una popolazione composta da 5 unità statistiche si voglia estrarre un campione casuale di numerosità 2. Schema con ricollocamento o ripetizione Lo spazio campionario, ovvero l’insieme di tutti i possibili campioni è: AA AB AC AD AE BA BB BC BD BE CA CB CC CD CE DA DB DC DD DE EA EB EC ED EE Vi sono in tutto 52=25 campioni, dati dalle disposizioni con ripetizione di 5 elementi a 2 a 2. Due campioni differiscono sia per l’ordine sia per la natura degli elementi Schema senza ricollocamento o in blocco Lo spazio campionario, ovvero l’insieme di tutti i possibili campioni è: BA CA CB DA DB DC EA EB EC ED Vi sono in tutto 5 =10 campioni, 2 dati dalle combinazioni senza ripetizione di 5 elementi a 2 a 2. Due campioni differiscono solo per la natura degli elementi Metodi di campionamento Campioni probabilistici Campione casuale semplice Campione sistematico Campione stratificato A due o più stadi Campione a grappoli Campioni non probabilistici Per quote Campioni di unità già disponibili Campioni di volontari Campionamento sistematico Si deve disporre di un elenco degli elementi della popolazione da campionare Per individuare le n unità del campione tra gli N della Popolazione si sceglie dall’elenco una unità ogni K (=N/n). Il seme iniziale è una qualunque unità scelta a caso fra le prime K. Si voglia estrarre un campione di 10 unità da una popolazione di 1000. Si sceglie un passo di 1000/10=100. Supponiamo che il numero scelto a caso tra 1 e 100 sia 77. Le unità campionate sono le seguenti: 77; 177; 277;377;477;577;677;777;877;977 Campionamento stratificato La popolazione è divisa in strati internamente omogenei e quindi si procede con campionamento casuale da ciascuno strato. Supponiamo di avere una popolazione di 7448 unità stratificate per sesso e classe di età numerosità degli strati Sesso Maschi Femmine classi di età tra 14 e 34 tra 35 e 64 1879 1046 1756 976 3635 2022 maggiore o uguale a 65 789 1002 1791 3714 3734 7448 numerosità degli strati Sesso Maschi Femmine pesi degli strati Maschi Femmine classi di età tra 14 e 34 tra 35 e 64 1879 1046 1756 976 3635 2022 maggiore o uguale a 65 789 1002 1791 3714 3734 7448 tra 14 e 34 tra 35 e 64 0.25 0.14 0.24 0.13 0.49 0.27 maggiore o uguale a 65 0.11 0.13 0.24 0.50 0.50 1.00 pesi degli strati Maschi Femmine tra 14 e 34 tra 35 e 64 0.25 0.14 0.24 0.13 0.49 0.27 maggiore o uguale a 65 0.11 0.13 0.24 composizione di un campione stratificato di maggiore o 500 unità tra 14 e 34 tra 35 e 64 uguale a 65 Maschi 126 70 53 Femmine 118 66 67 244 136 120 126=0.25*500 0.50 0.50 1.00 249 251 500 53=0.11*500 Campionamento casuale a grappoli e a stadi Nel campionamento casuale a grappoli la popolazione viene suddivisa in sottoinsiemi detti grappoli. Si selezionano, con un’estrazione casuale senza ripetizione, un certo numero di grappoli e si prendono come unità campionarie tutte le unità appartenenti ai grappoli estratti. Nel campionamento casuale a due stadi la popolazione viene suddivisa in un certo numero di grappoli. Al primo stadio si estrae senza ripetizione un certo numero di grappoli. Da ciascuno di questi si estrae con ripetizione (secondo stadio) un certo numero di unità. primo stadio secondo stadio Unità primarie Unità secondarie Piani di campionamento complessi Le indagini sulle famiglie dell’Istat seguono un piano di campionamento in cui i comuni (unità primarie) vengono stratificati e scelti a caso (I° stadio) e da ogni comune campionato viene scelto un campione di famiglie (2° stadio)