Il campionamento: esempio di campionamento in un indagine Multiscopo Barbara Baldazzi Campionamento accidentale • I criteri per la selezione delle unità non sono definiti • Intervisto le persone che capitano • Campione a casaccio • Non posso applicare le tecniche statistiche induttive • Risultati inaffidabili • Risparmio di costo e di tempo Campionamento per quote • Molto simile al campionamento stratificato proporzionale • Campione riflette le proporzioni della popolazione complessiva per una variabile di interesse • Scelta delle persone da intervistare non è casuale • Assenza di una lista • Usato nei sondaggi • Risparmio di tempo e di costi • Campione a volte distorto, autoselezionato • Si possono inserire dei limiti alla libertà degli intervistatori Campionamento a valanga • Si individua un primo gruppo, prima persona da intervistare con le caratteristiche cercate • Questo individuo fornirà altri nominativi (snow ball) • Utile quando è difficile individuare le unità di rilevazione • Utile per reperire informazioni su fenomeni rari Campionamento con testimoni privilegiati – metodo Delphi • Si ricorre a persone che hanno informazioni e notizie su specifici fenomeni • 1) I questionari vengono spediti ai testimoni e ritirati • 2) Si riassumono in nuovi questionari e vengono rispediti, in modo che l’esperto confronta le sue opinioni con le altre • Si reitera fino ad avere una eventuale convergenza di opinioni o l’emergere di criticità • Il limite è sulla scelta delle persone e sulla partecipazione Campionamento stratificato La popolazione viene divisa in gruppi detti strati sulla base di alcune variabili utili per il fenomeno Obiettivo della stratificazione è quello di formare strati di unità primarie con massima omogeneità interna degli strati e massima eterogeneità fra gli strati. Ciò comporterà un guadagno di precisione delle stime ossia una riduzione dell’errore campionario a parità di numerosità campionaria. Dopo aver suddiviso la popolazione in strati, si estrae a caso un campione da ogni strato 1) Con frazione di campionamento costante 2) Dagli strati meno omogenei estraggo più unità Famiglie e soggetti sociali 2003 Conoscere l’intreccio dei percorsi di vita individuali attraverso la ricostruzione delle diverse fasi del ciclo di vita familiare e lo studio dei rapporti interni alla famiglia Conoscere le reti di parentela e le reti di supporto formale e informale Conoscere le biografie lavorative degli individui per studiare la mobilità sociale Argomenti • • • • • • Struttura della famiglia Pendolari della famiglia Permanenza dei giovani in famiglia Reti di parentela e di aiuto informale Vita di coppia Usanze e tradizioni familiari Disegno della ricerca Popolazione di interesse: ossia l’insieme delle unità statistiche sulle quali si intende investigare, è costituita dalle famiglie residenti in Italia e dagli individui ad esse appartenenti, al netto dei membri permanenti delle convivenze. La famiglia è la Famiglia di fatto, ossia l’insieme di persone coabitanti e legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o affettivi Periodo di riferimento: è prevalentemente costituito dai 12 mesi precedenti l’intervista Intervista diretta (faccia a faccia con questionario cartaceo) di tutti gli individui appartenenti alle famiglie del campione Periodo di svolgimento: giugno 2003 L’unità di rilevazione: la famiglia di fatto L’unità di rilevazione è la famiglia di fatto, intesa come insieme di persone coabitanti e legati da vincoli di matrimonio, parentela, affinità, adozione, tutela o da vincoli di affettivi Una famiglia può essere costituita anche da una sola persona L’unità di rilevazione: la famiglia di fatto Le condizioni necessarie perché un insieme di persone formi una famiglia sono: la coabitazione la presenza di qualche tipo di legame La famiglia di fatto differisce dalla famiglia anagrafica, quando: qualcuno lascia definitivamente la famiglia d’origine, ma compare ancora nello stato di famiglia qualcuno, pur avendo costituito un’altra famiglia, continua a vivere in quella d’origine Domini di studio gli ambiti rispetto ai quali sono riferiti i parametri di popolazione oggetto di stima sono: • L’intero territorio nazionale • Le 5 ripartizioni geografiche • Le 19 + 2 regioni geografiche • La tipologia comunale Ripartizioni geografiche Italia Nord-Occidentale Valle d’Aosta + Piemonte + Lombardia + Liguria Italia Nord-Orientale Emilia Romagna + Friuli Venezia Giulia + Veneto + Trentino Alto Adige Italia Centrale Lazio + Toscana + Marche + Umbria Italia Meridionale Campania + Basilicata + Calabria + Abruzzo + Molise + Puglia Italia Insulare Sicilia + Sardegna Regioni geografiche Valle d’Aosta Piemonte Lombardia Liguria Emilia Romagna Friuli Venezia Giulia Veneto Trentino Alto Adige Lazio Toscana Marche Umbria Campania Basilicata Calabria Abruzzo Molise Puglia Sicilia Sardegna Tipologia comunale Ottenuta suddividendo i comuni italiani in sei classi formate in base a caratteristiche socio-economiche e demografiche A) Comuni appartenenti all’area metropolitana A1: Comuni centro dell’area metropolitana – Torino, Milano, Venezia, Genova, Bologna, Firenze, Roma, Napoli, Bari, Palermo, Catania, Cagliari A2: Comuni che gravitano intorno ai comuni centro dell’area metropolitana B) Comuni non appartenenti all’area metropolitana B1: Comuni aventi fino a 2.000 abitanti B2: Comuni con 2.001-10.000 abitanti B3: Comuni con 10.001-50.000 abitanti B4: Comuni con oltre 50.000 abitanti Strategia di campionamento Per una indagine ad obiettivi plurimi è poco realistico pensare ad una strategia campionaria che assicuri prefissati livelli di precisione di tutte le stime prodotte Le stime vanno fornite per livelli territoriali differenti Es 1. se l’unico ambito di stima fosse l’intero territorio nazionale, la soluzione ottimale sarebbe quella di determinare la numerosità nazionale e ripartirla tra le regioni in modo proporzionale alla loro dimensione demografica Es 2. viceversa, per produrre stime con uguale attendibilità a livello regionale la soluzione ottimale sarebbe quella di selezionare un campione uguale in tutte le regioni Numerosità campionaria In base alle considerazioni precedenti si è adottata una soluzione mista basata su criteri di costo ed organizzativi e su considerazioni degli errori campionari delle principali stime a livello nazionale e riferite ai domini territoriali di interesse • La dimensione del campione teorico è pari a 24.000 famiglie • Il numero di comuni campione non deve superare i 900 comuni • L’allocazione del campione di famiglie e di comuni nelle varie regioni adotta un criterio di compromesso tale da garantire sia l’affidabilità delle stime a livello nazionale che delle stime a livello di ciascun dettaglio territoriale visto in precedenza Numerosità campionaria Popolazione di riferimento • 8.101 Comuni • 22.360.539 famiglie • 57.272.931 individui Campione • 787 Comuni • 19.227 famiglie • 49.541 individui Piano di campionamento Di tipo complesso: 2 differenti schemi di campionamento 1) Incrocio tra regione geografica e tipologia comunale 21 regioni geografiche * 6 tipologie comunali = 126 domini 2) In ogni dominio i comuni italiani sono suddivisi in due sottinsiemi sulla base della popolazione residente in modo da avere • l’insieme dei comuni AutoRappresentativi (AR) costituito dai comuni di maggiore dimensione demografica • L’insieme dei comuni NonAutoRappresentativi (NAR) costituito dai rimanenti comuni 3) Due differenti schemi di campionamento per comuni AR e comuni NAR Comuni AR e NAR Stratificazione e selezione delle unità campionarie primarie (UP): i comuni. Obiettivo della stratificazione è quello di formare strati di unità primarie con massima omogeneità interna degli strati e massima eterogeneità fra gli strati. Ciò comporterà un guadagno di precisione delle stime ossia una riduzione dell’errore campionario a parità di numerosità campionaria. • I comuni vengono stratificati in base alla loro dimensione demografica • Viene selezionato un comune in ogni strato per i comuni NAR • Viene scelto il numero minimo di famiglie da intervistare in ciascun comune campione che è pari a 23 famiglie • Gli strati vengono formati in modo da avere ampiezza approssimativamente costante in termini di popolazione residente Comuni AR e NAR Procedimento di stratificazione all’interno di ognuno dei 126 domini: 1) Ordinamento dei comuni del dominio in ordine decrescente secondo la loro dimensione demografica in termini di popolazione residente 2) Determinazione di una soglia di popolazione per la definizione dei comuni AR mediante la relazione Dove rβ= rm rᵟ rf r = generica regione geografica rm = numero minimo di famiglie da intervistare in ciascun comune campione (23 famiglie) rᵟ = numero medio di componenti per famiglia rf = frazione di campionamento Comuni AR e NAR 3) Suddivisione di tutti i comuni in comuni AR e NAR: i comuni di dimensione maggiore o uguale a rβ sono comuni AR e i rimanenti NAR 4) Suddivisione dei comuni NAR in strati aventi dimensione approssimativamente costante e all’incirca pari alla soglia rβ Effettuata la stratificazione i comuni AR sono inclusi con certezza nel campione Per i comuni NAR, nell’ambito di ogni strato viene estratto (senza reimmissione) un comune campione con probabilità proporzionale alla dimensione demografica. Le famiglie La selezione delle famiglie da intervistare in ogni comune campione viene effettuata dalla lista anagrafica di ciascun comune senza reimmissione e con probabilità uguali. La tecnica di selezione è di tipo sistematico 1) Vengono messi in sequenza i fogli delle famiglie dell’anagrafe del comune 2) Si calcola il passo di campionamento numero famiglie residenti Passo di campionamento -----------------------------numero di famiglie campione Le famiglie 3) Si selezionano le famiglie secondo il passo di campionamento Esempio: Comune con 300.000 famiglie Numero di famiglie da estrarre = 2.000 Passo di campionamento = 150 Famiglie estratte: 3; 3+150=153; 153+150=303; 303+150=453; …… Calcolo delle stime Le unità appartenenti al campione rappresentano anche le unità della popolazione che non sono incluse nel campione Ad ogni unità campionaria viene attribuito un peso che denota il numero di unità della popolazione rappresentate dall’unità medesima Es: peso attribuito = 30 l’unità rappresenta se stessa e altre 29 unità della popolazione Calcolo delle stime Procedura complessa che: corregge l’effetto distorsivo della mancata risposta totale (il numero teorico di famiglie non sempre viene realizzato, per l’impossibilità di reperire tutte le famiglie o perché alcune famiglie si rifiutano di concedere l’intervista) tiene conto di alcuni totali noti sulla popolazione in modo da far coincidere le stime campionarie con i totali noti (i totali noti sono: distribuzione regionale della popolazione residente per sesso e classi d’età, distribuzione regionale della popolazione residente per tipo di comune)