LEZIONI IN LABORATORIO
Corso di MARKETING
L. Baldi
Università degli Studi di Milano
CAMPIONAMENTO
Estratto dal Cap. 5 di:
“Statistics for Marketing and Consumer Research”,
M. Mazzocchi, ed. SAGE, 2008.
1
Che cosa è un campione

Un sottoinsieme delle unità di una popolazione, che
rappresenta la popolazione stessa
Misurando i dati di un campione:
 le informazioni sulla popolazione si possono
raccogliere ad un costo inferiore rispetto ai
censimenti
 deve essere necessariamente accettato un margine
di errore
2
Campionamento probabilistico e
non probabilistico
Campioni probabilistici: ad ogni unità estratta è
associata a una certa probabilità di essere inclusa
nel campione; ciò comporta che la probabilità di ogni
campione potenziale è nota.
Campionamento non probabilistico: estrazione di
unità del campione che non si basa su regole di
probabilità.
3
Campione e popolazione: alcune
terminologie
Popolazione target: l'insieme di unità oggetto della ricerca da
cui viene estratto il campione.
Lista di campionamento: elenco completo delle unità di
popolazione che può essere usato per estrarre il campione.
Dimensione del campione: numero di unità (n) del campione.
Statistica campionaria: stima del parametro della popolazione
sulla base delle osservazioni del campione.
Distribuzione campionaria: distribuzione di probabilità delle
statistiche campionarie.
4
Il Campione casuale semplice (CCS)



Nel CCS ogni elemento della popolazione ha
la stessa probabilità di essere estratto. Questa
probabilità è nota.
Ogni elemento è estratto indipendentemente
dagli altri elementi.
La probabilità di estrarre un determinato
campione di n elementi è calcolabile (nota).
5
Precisione delle stime e ampiezza
campionaria

Campioni di dimensioni molto grandi non
sono necessariamente convenienti, perché
il guadagno in precisione è molto piccolo e
l'aumento dei costi è molto grande
6
Errori, ampiezza campionaria e
ampiezza della popolazione
Population size
Sample size
100
1,000
2,000
5,000
100,000
1,000,000
100,000,000
30
11.75%
16.28%
16.53%
16.68%
16.77%
16.78%
16.78%
50
6.39%
12.14%
12.46%
12.65%
12.78%
12.78%
12.78%
100
0.00%
8.04%
8.48%
8.75%
8.92%
8.93%
8.93%
200
5.02%
5.65%
6.02%
6.26%
6.27%
6.27%
500
1.98%
2.97%
3.56%
3.93%
3.95%
3.95%
1000
0.00%
1.40%
2.23%
2.76%
2.79%
2.79%
0.00%
1.18%
1.93%
1.97%
1.97%
2000



Per popolazioni di dimensioni elevate non è necessario aumentare
proporzionalmente la dimensione del campione
Una dimensione campionaria pari a 500 garantisce un errore inferiore al 5% per
qualsiasi dimensione della popolazione
Invece di optare per campioni di dimensioni superiori a 500, è meglio prendere
in considerazione la spesa per la riduzione degli errori non campionari
7
Come si determina l’ampiezza
campionaria
Fattori che influenzano la dimensione del campione
(n):




Dimensione della popolazione (N)
Variabilità della popolazione
Livello di precisione desiderato
Vincolo di bilancio
8
Le tecniche di campionamento

Campionamento probabilistico
•
•
•
•
•

Campionamento casuale semplice
Campionamento sistematico (step)
Campionamento stratificato
Campionamento cluster
Tecniche complesse di campionamento
Campionamento non probabilistico
•
•
•
•
Campionamento “di convenienza”
Campionamento “di giudizio”
Campionamento per quote
Campionamento Snowball (a valanga)
9
Campionamento non probabilistico




Non permette di associare valutazioni sulla
precisione e accuratezza delle stime
Non necessariamente è distorto o poco informativo
In alcuni casi - per esempio quando non vi è una
lista di campionamento definita - può rappresentare
l'unica soluzione possibile
Limite fondamentale - in generale, le tecniche di
inferenza statistica non possono essere utilizzate
per generalizzare i risultati dal campione alla
popolazione
10
Tabella-prontuario per stabilire l’ampiezza campionaria
(per popolazioni infinite)
Valida per livelli di confidenza pari al 95%
p= quota di popolazione che possiede
una determinata caratteristica
1%,2%....= limiti di errore
Come costruire la numerosità
di un campione stratificato
DATI
ASSOLUTI
RIPARTIZIONE PERCENTUALE
Territorio Italia
RIPARTIZIONE CAMPIONE n=300
Territorio Italia
Territorio Italia
Tipo dato popolazione residente
Anno 2011
Anno 2011
totale
Cittadinanza
maschi
femmine
Cittadinanza
totale
Età
0-9 anni
maschi
Età
2845132
10-19 anni
2919303
20-29 anni
3197404
5531023
0-9 anni
2745182
5664485
10-19 anni
4.9%
3130487
6327891
20-29 anni
5.4%
7.0%
8.0%
2685891
Anno 2011
totale
4.8%
femmin
e
totale
Cittadinanza
totale
Età
masch femmin
i
e
totale
9.3%
0-9 anni
14
14
28
4.6%
9.5%
10-19 anni
15
14
29
5.3%
10.6%
20-29 anni
16
16
32
7.1%
14.0%
30-39 anni
21
21
42
8.1%
16.1%
40-49 anni
24
24
48
4.5%
30-39 anni
4155287
4190252
8345539
30-39 anni
40-49 anni
4734090
4833778
9567868
40-49 anni
6.5%
6.8%
13.2%
50-59 anni
19
20
40
5.5%
6.0%
11.5%
60-69 anni
17
18
35
50-59 anni
3834719
4037115
7871834
50-59 anni
60-69 anni
3286806
3573355
6860161
60-69 anni
70-79 anni
2510028
3118950
5628978
70-79 anni
4.2%
5.2%
9.5%
70-79 anni
13
16
28
80-89 anni
1130360
1987452
3117812
80-89 anni
1.9%
3.3%
5.2%
80-89 anni
6
10
16
90-99 anni
129918
373156
503074
90-99 anni
0.2%
0.6%
0.8%
90-99 anni
1
2
3
100 anni e più
100 anni e più
totale
2460
12619
15079
28745507
30688237
59433744
100 anni e più
totale
0.0%
0.0%
0.0%
48.4%
51.6%
100.0%
totale
0
0
0
145
155
300
Scarica

campionamento