Il campionamento: esempio di
campionamento in un
indagine Multiscopo
Barbara Baldazzi
Campionamento accidentale
• I criteri per la selezione delle unità non sono
definiti
• Intervisto le persone che capitano
• Campione a casaccio
• Non posso applicare le tecniche statistiche
induttive
• Risultati inaffidabili
• Risparmio di costo e di tempo
Campionamento per quote
• Molto simile al campionamento stratificato proporzionale
• Campione riflette le proporzioni della popolazione
complessiva per una variabile di interesse
• Scelta delle persone da intervistare non è casuale
• Assenza di una lista
• Usato nei sondaggi
• Risparmio di tempo e di costi
• Campione a volte distorto, autoselezionato
• Si possono inserire dei limiti alla libertà degli intervistatori
Campionamento a valanga
• Si individua un primo gruppo, prima persona da
intervistare con le caratteristiche cercate
• Questo individuo fornirà altri nominativi (snow
ball)
• Utile quando è difficile individuare le unità di
rilevazione
• Utile per reperire informazioni su fenomeni rari
Campionamento con testimoni
privilegiati – metodo Delphi
• Si ricorre a persone che hanno informazioni e notizie su
specifici fenomeni
• 1) I questionari vengono spediti ai testimoni e ritirati
• 2) Si riassumono in nuovi questionari e vengono rispediti,
in modo che l’esperto confronta le sue opinioni con le
altre
• Si reitera fino ad avere una eventuale convergenza di
opinioni o l’emergere di criticità
• Il limite è sulla scelta delle persone e sulla partecipazione
Campionamento stratificato
La popolazione viene divisa in gruppi detti strati sulla base
di alcune variabili utili per il fenomeno
Obiettivo della stratificazione è quello di formare strati di
unità primarie con massima omogeneità interna degli
strati e massima eterogeneità fra gli strati. Ciò
comporterà un guadagno di precisione delle stime ossia
una riduzione dell’errore campionario a parità di
numerosità campionaria.
Dopo aver suddiviso la popolazione in strati, si estrae a caso
un campione da ogni strato
1) Con frazione di campionamento costante
2) Dagli strati meno omogenei estraggo più unità
Famiglie e soggetti sociali 2003
Conoscere l’intreccio dei percorsi di vita individuali attraverso la
ricostruzione delle diverse fasi del ciclo di vita familiare e lo
studio dei rapporti interni alla famiglia
Conoscere le reti di parentela e le reti di supporto formale e
informale
Conoscere le biografie lavorative degli individui per studiare la
mobilità sociale
Argomenti
•
•
•
•
•
•
Struttura della famiglia
Pendolari della famiglia
Permanenza dei giovani in famiglia
Reti di parentela e di aiuto informale
Vita di coppia
Usanze e tradizioni familiari
Disegno della ricerca
Popolazione di interesse: ossia l’insieme delle unità statistiche
sulle quali si intende investigare, è costituita dalle famiglie
residenti in Italia e dagli individui ad esse appartenenti, al
netto dei membri permanenti delle convivenze.
La famiglia è la Famiglia di fatto, ossia l’insieme di persone
coabitanti e legate da vincoli di matrimonio, parentela, affinità,
adozione, tutela o affettivi
Periodo di riferimento: è prevalentemente costituito dai 12
mesi precedenti l’intervista
Intervista diretta (faccia a faccia con questionario cartaceo) di
tutti gli individui appartenenti alle famiglie del campione
Periodo di svolgimento: giugno 2003
L’unità di rilevazione: la famiglia di fatto
L’unità di rilevazione è la famiglia di fatto, intesa come insieme
di persone coabitanti e legati da vincoli di matrimonio,
parentela, affinità, adozione, tutela o da vincoli di
affettivi
Una famiglia può essere costituita anche da una sola
persona
L’unità di rilevazione: la famiglia di fatto
Le condizioni necessarie perché un insieme di persone formi una
famiglia sono:
 la coabitazione
 la presenza di qualche tipo di legame
La famiglia di fatto differisce dalla famiglia anagrafica,
quando:
 qualcuno lascia definitivamente la famiglia d’origine, ma
compare ancora nello stato di famiglia
 qualcuno, pur avendo costituito un’altra famiglia, continua a
vivere in quella d’origine
Domini di studio
gli ambiti rispetto ai quali sono riferiti i parametri di
popolazione oggetto di stima sono:
• L’intero territorio nazionale
• Le 5 ripartizioni geografiche
• Le 19 + 2 regioni geografiche
• La tipologia comunale
Ripartizioni geografiche
Italia Nord-Occidentale
Valle d’Aosta + Piemonte + Lombardia + Liguria
Italia Nord-Orientale
Emilia Romagna + Friuli Venezia Giulia + Veneto + Trentino Alto
Adige
Italia Centrale
Lazio + Toscana + Marche + Umbria
Italia Meridionale
Campania + Basilicata + Calabria + Abruzzo + Molise + Puglia
Italia Insulare
Sicilia + Sardegna
Regioni geografiche
Valle d’Aosta
Piemonte
Lombardia
Liguria
Emilia Romagna
Friuli Venezia Giulia
Veneto
Trentino
Alto Adige
Lazio
Toscana
Marche
Umbria
Campania
Basilicata
Calabria
Abruzzo
Molise
Puglia
Sicilia
Sardegna
Tipologia comunale
Ottenuta suddividendo i comuni italiani in sei classi formate in
base a caratteristiche socio-economiche e demografiche
A) Comuni appartenenti all’area metropolitana
A1: Comuni centro dell’area metropolitana – Torino,
Milano, Venezia, Genova, Bologna, Firenze, Roma, Napoli,
Bari, Palermo, Catania, Cagliari
A2: Comuni che gravitano intorno ai comuni centro
dell’area metropolitana
B) Comuni non appartenenti all’area metropolitana
B1: Comuni aventi fino a 2.000 abitanti
B2: Comuni con 2.001-10.000 abitanti
B3: Comuni con 10.001-50.000 abitanti
B4: Comuni con oltre 50.000 abitanti
Strategia di campionamento
Per una indagine ad obiettivi plurimi è poco realistico pensare ad
una strategia campionaria che assicuri prefissati livelli di
precisione di tutte le stime prodotte
Le stime vanno fornite per livelli territoriali differenti
Es 1. se l’unico ambito di stima fosse l’intero territorio nazionale,
la soluzione ottimale sarebbe quella di determinare la
numerosità nazionale e ripartirla tra le regioni in modo
proporzionale alla loro dimensione demografica
Es 2. viceversa, per produrre stime con uguale attendibilità a
livello regionale la soluzione ottimale sarebbe quella di
selezionare un campione uguale in tutte le regioni
Numerosità campionaria
In base alle considerazioni precedenti si è adottata una soluzione
mista basata su criteri di costo ed organizzativi e su
considerazioni degli errori campionari delle principali stime a
livello nazionale e riferite ai domini territoriali di interesse
• La dimensione del campione teorico è pari a 24.000 famiglie
• Il numero di comuni campione non deve superare i 900
comuni
• L’allocazione del campione di famiglie e di comuni nelle varie
regioni adotta un criterio di compromesso tale da garantire sia
l’affidabilità delle stime a livello nazionale che delle stime a
livello di ciascun dettaglio territoriale visto in precedenza
Numerosità campionaria
Popolazione di riferimento
• 8.101 Comuni
• 22.360.539 famiglie
• 57.272.931 individui
Campione
• 787 Comuni
• 19.227 famiglie
• 49.541 individui
Piano di campionamento
Di tipo complesso: 2 differenti schemi di campionamento
1) Incrocio tra regione geografica e tipologia comunale
21 regioni geografiche * 6 tipologie comunali = 126 domini
2) In ogni dominio i comuni italiani sono suddivisi in due
sottinsiemi sulla base della popolazione residente in modo da
avere
• l’insieme dei comuni AutoRappresentativi (AR) costituito
dai comuni di maggiore dimensione demografica
• L’insieme dei comuni NonAutoRappresentativi (NAR)
costituito dai rimanenti comuni
3) Due differenti schemi di campionamento per comuni AR e
comuni NAR
Comuni AR e NAR
Stratificazione e selezione delle unità campionarie primarie (UP): i
comuni.
Obiettivo della stratificazione è quello di formare strati di unità
primarie con massima omogeneità interna degli strati e
massima eterogeneità fra gli strati. Ciò comporterà un
guadagno di precisione delle stime ossia una riduzione
dell’errore campionario a parità di numerosità campionaria.
• I comuni vengono stratificati in base alla loro dimensione
demografica
• Viene selezionato un comune in ogni strato per i comuni
NAR
• Viene scelto il numero minimo di famiglie da intervistare in
ciascun comune campione che è pari a 23 famiglie
• Gli strati vengono formati in modo da avere ampiezza
approssimativamente costante in termini di popolazione
residente
Comuni AR e NAR
Procedimento di stratificazione all’interno di ognuno dei 126
domini:
1) Ordinamento dei comuni del dominio in ordine decrescente
secondo la loro dimensione demografica in termini di
popolazione residente
2) Determinazione di una soglia di popolazione per la definizione
dei comuni AR mediante la relazione
Dove
rβ= rm rᵟ
rf
r = generica regione geografica
rm = numero minimo di famiglie da intervistare in ciascun
comune campione (23 famiglie)
rᵟ = numero medio di componenti per famiglia
rf = frazione di campionamento
Comuni AR e NAR
3) Suddivisione di tutti i comuni in comuni AR e NAR: i comuni di
dimensione maggiore o uguale a rβ sono comuni AR e i
rimanenti NAR
4) Suddivisione dei comuni NAR in strati aventi dimensione
approssimativamente costante e all’incirca pari alla soglia rβ
Effettuata la stratificazione i comuni AR sono inclusi con
certezza nel campione
Per i comuni NAR, nell’ambito di ogni strato viene estratto
(senza reimmissione) un comune campione con
probabilità proporzionale alla dimensione demografica.
Le famiglie
La selezione delle famiglie da intervistare in ogni comune
campione viene effettuata dalla lista anagrafica di ciascun
comune senza reimmissione e con probabilità uguali.
La tecnica di selezione è di tipo sistematico
1) Vengono messi in sequenza i fogli delle famiglie dell’anagrafe
del comune
2) Si calcola il passo di campionamento
numero famiglie
residenti
Passo di campionamento -----------------------------numero di famiglie
campione
Le famiglie
3) Si selezionano le famiglie secondo il passo di campionamento
Esempio:
Comune con 300.000 famiglie
Numero di famiglie da estrarre = 2.000
Passo di campionamento = 150
Famiglie estratte: 3; 3+150=153; 153+150=303;
303+150=453; ……
Calcolo delle stime
Le unità appartenenti al campione rappresentano anche le
unità della popolazione che non sono incluse nel campione
Ad ogni unità campionaria viene attribuito un peso che denota
il numero di unità della popolazione rappresentate dall’unità
medesima
Es: peso attribuito = 30  l’unità rappresenta se stessa e
altre 29 unità della popolazione
Calcolo delle stime
Procedura complessa che:
 corregge l’effetto distorsivo della mancata risposta
totale (il numero teorico di famiglie non sempre viene realizzato,
per l’impossibilità di reperire tutte le famiglie o perché alcune famiglie
si rifiutano di concedere l’intervista)
 tiene conto di alcuni totali noti sulla popolazione in modo
da far coincidere le stime campionarie con i totali noti (i
totali noti sono: distribuzione regionale della popolazione residente
per sesso e classi d’età, distribuzione regionale della popolazione
residente per tipo di comune)
Scarica

Famiglia di fatto