LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano CAMPIONAMENTO Estratto dal Cap. 5 di: “Statistics for Marketing and Consumer Research”, M. Mazzocchi, ed. SAGE, 2008. 1 Che cosa è un campione Un sottoinsieme delle unità di una popolazione, che rappresenta la popolazione stessa Misurando i dati di un campione: le informazioni sulla popolazione si possono raccogliere ad un costo inferiore rispetto ai censimenti deve essere necessariamente accettato un margine di errore 2 Campionamento probabilistico e non probabilistico Campioni probabilistici: ad ogni unità estratta è associata a una certa probabilità di essere inclusa nel campione; ciò comporta che la probabilità di ogni campione potenziale è nota. Campionamento non probabilistico: estrazione di unità del campione che non si basa su regole di probabilità. 3 Campione e popolazione: alcune terminologie Popolazione target: l'insieme di unità oggetto della ricerca da cui viene estratto il campione. Lista di campionamento: elenco completo delle unità di popolazione che può essere usato per estrarre il campione. Dimensione del campione: numero di unità (n) del campione. Statistica campionaria: stima del parametro della popolazione sulla base delle osservazioni del campione. Distribuzione campionaria: distribuzione di probabilità delle statistiche campionarie. 4 Il Campione casuale semplice (CCS) Nel CCS ogni elemento della popolazione ha la stessa probabilità di essere estratto. Questa probabilità è nota. Ogni elemento è estratto indipendentemente dagli altri elementi. La probabilità di estrarre un determinato campione di n elementi è calcolabile (nota). 5 Precisione delle stime e ampiezza campionaria Campioni di dimensioni molto grandi non sono necessariamente convenienti, perché il guadagno in precisione è molto piccolo e l'aumento dei costi è molto grande 6 Errori, ampiezza campionaria e ampiezza della popolazione Population size Sample size 100 1,000 2,000 5,000 100,000 1,000,000 100,000,000 30 11.75% 16.28% 16.53% 16.68% 16.77% 16.78% 16.78% 50 6.39% 12.14% 12.46% 12.65% 12.78% 12.78% 12.78% 100 0.00% 8.04% 8.48% 8.75% 8.92% 8.93% 8.93% 200 5.02% 5.65% 6.02% 6.26% 6.27% 6.27% 500 1.98% 2.97% 3.56% 3.93% 3.95% 3.95% 1000 0.00% 1.40% 2.23% 2.76% 2.79% 2.79% 0.00% 1.18% 1.93% 1.97% 1.97% 2000 Per popolazioni di dimensioni elevate non è necessario aumentare proporzionalmente la dimensione del campione Una dimensione campionaria pari a 500 garantisce un errore inferiore al 5% per qualsiasi dimensione della popolazione Invece di optare per campioni di dimensioni superiori a 500, è meglio prendere in considerazione la spesa per la riduzione degli errori non campionari 7 Come si determina l’ampiezza campionaria Fattori che influenzano la dimensione del campione (n): Dimensione della popolazione (N) Variabilità della popolazione Livello di precisione desiderato Vincolo di bilancio 8 Le tecniche di campionamento Campionamento probabilistico • • • • • Campionamento casuale semplice Campionamento sistematico (step) Campionamento stratificato Campionamento cluster Tecniche complesse di campionamento Campionamento non probabilistico • • • • Campionamento “di convenienza” Campionamento “di giudizio” Campionamento per quote Campionamento Snowball (a valanga) 9 Campionamento non probabilistico Non permette di associare valutazioni sulla precisione e accuratezza delle stime Non necessariamente è distorto o poco informativo In alcuni casi - per esempio quando non vi è una lista di campionamento definita - può rappresentare l'unica soluzione possibile Limite fondamentale - in generale, le tecniche di inferenza statistica non possono essere utilizzate per generalizzare i risultati dal campione alla popolazione 10 Tabella-prontuario per stabilire l’ampiezza campionaria (per popolazioni infinite) Valida per livelli di confidenza pari al 95% p= quota di popolazione che possiede una determinata caratteristica 1%,2%....= limiti di errore Come costruire la numerosità di un campione stratificato DATI ASSOLUTI RIPARTIZIONE PERCENTUALE Territorio Italia RIPARTIZIONE CAMPIONE n=300 Territorio Italia Territorio Italia Tipo dato popolazione residente Anno 2011 Anno 2011 totale Cittadinanza maschi femmine Cittadinanza totale Età 0-9 anni maschi Età 2845132 10-19 anni 2919303 20-29 anni 3197404 5531023 0-9 anni 2745182 5664485 10-19 anni 4.9% 3130487 6327891 20-29 anni 5.4% 7.0% 8.0% 2685891 Anno 2011 totale 4.8% femmin e totale Cittadinanza totale Età masch femmin i e totale 9.3% 0-9 anni 14 14 28 4.6% 9.5% 10-19 anni 15 14 29 5.3% 10.6% 20-29 anni 16 16 32 7.1% 14.0% 30-39 anni 21 21 42 8.1% 16.1% 40-49 anni 24 24 48 4.5% 30-39 anni 4155287 4190252 8345539 30-39 anni 40-49 anni 4734090 4833778 9567868 40-49 anni 6.5% 6.8% 13.2% 50-59 anni 19 20 40 5.5% 6.0% 11.5% 60-69 anni 17 18 35 50-59 anni 3834719 4037115 7871834 50-59 anni 60-69 anni 3286806 3573355 6860161 60-69 anni 70-79 anni 2510028 3118950 5628978 70-79 anni 4.2% 5.2% 9.5% 70-79 anni 13 16 28 80-89 anni 1130360 1987452 3117812 80-89 anni 1.9% 3.3% 5.2% 80-89 anni 6 10 16 90-99 anni 129918 373156 503074 90-99 anni 0.2% 0.6% 0.8% 90-99 anni 1 2 3 100 anni e più 100 anni e più totale 2460 12619 15079 28745507 30688237 59433744 100 anni e più totale 0.0% 0.0% 0.0% 48.4% 51.6% 100.0% totale 0 0 0 145 155 300