Campionamento
• Campione: parte dell’insieme universo
interessato dall’ipotesi di ricerca
• Popolazione di riferimento: insieme dei casi
potenzialmente reperibili (universo)
Campionamento
• Determinato dall’ipotesi di ricerca e dalle
variabili in gioco
• Determinante rispetto all’analisi e
all’interpretazione dei risultati
Campionamento
Caratteristiche da perseguire nella
scelta del campione:
• adeguatezza rispetto all’ipotesi di
partenza
• rappresentatività rispetto alla popolazione
• controllo della distorsione
• affidabilità
Campionamento
Fattori di distorsione
della stima campionaria:
• influenza i risultati della ricerca
• non è controllabile dal disegno sperimentale
• determinata dalla tecnica di campionamento
utilizzata
Campionamento
Paradosso centrale del
campionamento (Stuart, 1996)
impossibilità di conoscere dall’esame del
campione se sia esso scevro di distorsioni
Campionamento
Distorsione da selezione
• Il campione è adeguato se e solo se non è
influenzato da altre variabili che non siano
quelle in studio
• Per assicurarci questa situazione occorre attuare
un meccanismo di selezione casuale
Tecniche di
Campionamento
Campionamento casuale
• consiste nella scelta di una campione
attraverso un meccanismo casuale
• attraverso questo metodo è possibile
conoscere le probabilità di selezione del
campione
Tecniche di
Campionamento
Il campione casuale
• è privo di distorsioni dovute alla selezione
• è l’unico tipo di campione sul quale è
possibile fare inferenza statistica
Tecniche di
Campionamento
• Esistono diverse tecniche di
campionamento
• Rimane fondamentale la spiegazione delle
procedure di selezione che determinano i
risultati della ricerca
Tecniche di
Campionamento
Campionamento casuale semplice
permette di selezionare un campione dalla
popolazione in modo da avere la stessa
probabilità per ogni possibile campione
Tecniche di
Campionamento
Campionamento stratificato
suddivide il campione in strati, ovvero in
sottogruppi, le cui proporzioni
corrispondono alla suddivisione della
popolazione
Tecniche di Campionamento:
Campionamento stratificato
• per formare gli strati in modo casuale bisogna
estrarre un campione casuale semplice da ogni
strato
• incrementa la precisione del campionamento
• la corretta stratificazione dipende solo dalle
conoscenze e dall’abilità dello sperimentatore
Tecniche di
Campionamento
Campionamento a grappoli
• nella prima fase la popolazione è suddivisa in
gruppi - chiamati grappoli o cluster – ciascuno
dei quali non ha caratteristiche diverse dagli altri
• nella seconda fase da tutti i grappoli ne viene
selezionato casualmente uno
Tecniche di Campionamento:
Campionamento a grappoli
• La differenza fra gli strati e i grappoli sta nel fatto che
mentre la selezione casuale degli strati avviene a livello
della popolazione la selezione casule dei grappoli
avviene a livello di unità della popolazione
• comporta una perdita di precisione che può essere in
taluni casi giustificata da ragioni economiche
• Naturalmente maggior variabilità esiste all’interno dei
grappoli corrisponde a maggior precisione di
campionamento
Tecniche di
Campionamento
Campionamento a stadi
• Dopo aver selezionato due o più grappoli si seleziona
all’interno di essi un individuo sempre attraverso un
campionamento casuale semplice
• Oltre al caso descritto di due stadi si possono verificare
ripartizioni a più stadi che determinano una maggior
flessibilità del progetto a discapito della rappresentatività
del campione
Campionamento
Numerosità campionaria
• Va determinata a priori
Dipende :
 da H0 e da H1
 dalla potenza del test
 dalla minima differenza apprezzabile
 dalla varianza casuale
 da alpha
Confronto fra le tecniche di
campionamento
• Casuale semplice: è alla base delle altre tecniche,
è attuabile quando la popolazione è omogenea
rispetto alla variabile in studio
• Stratificato: applica un metodo più preciso ma
meno casuale
• A grappoli e a stadi: applica un metodo più
casuale ma meno preciso
Fallacia nella Stima
Campionaria e nel Test Statistico
“Una fallacia è un X che sembra Y, ma è Z”
(Johnson, 1987)
• Ambiguità
Fallacia
• Errore
Campione e Inferenza Statistica
• E’ attraverso il campione che posso fare
inferenze in campo statistico
• Non esiste inferenza senza fallacie così
come non esiste campionamento senza
errore
• Controllo dell’errore attraverso il metodo
Campione Rappresentativo
• Rappresenta la popolazione alla quale si riferisce
ma non lo è né per caratteristiche né per
numerosità.
• Campione Rappresentativo:
» Controllo distorsione
nella selezione
» Corrispondenza
fra campione e
popolazione
Casualità
Precisione
Questione di Metodo
• Errori non campionari sono eliminabili
• Errore campionario controllabile in quanto
misurabile
• Piano di campionamento: modalità di
selezione e parametri/stimatori da
misurare
Precisione e Casualità
“The surer you want to be the less you
have to demand”
(Alan Stuart, 1968)
Tanto più cerchiamo di controllare la
precisione tanto più facilmente possiamo
selezionare un campione non casuale
La rappresentatività è data dalla differenza
tra stima campionaria e parametro della
popolazione
Errori legati alla
Dimensione del Campione
La dimensione ottimale del campione è
quella per cui l’errore di campionamento
non va oltre una certa soglia
Efficienza: precisione per unità di costo
Può esser controllata solo nel caso del
campionamento probabilistico
Omogeneità e Numerosità
• Più n si avvicina a N più l’errore di
campionamento diminuisce
• Maggiore è la variabilità della stima
campionaria minore è l’affidabilità
Esempi di fallacie collegate a
distorsioni nel campionamento
– Principio inficiato: Casualità
– Principio inficiato: Idoneità
– Principio inficiato: Numerosità adeguata
Fallacia e Principio di Casualità
Se il campionamento non è probabilistico non può
esser considerato rappresentativo della
popolazione studiata.
Le conclusioni a cui portano i risultati del campione
non saranno facilmente identificabili in una
variabile.
Esempio: applicazione di più test statistici sullo stesso
campione per diverse dimostrazioni
Disegno sperimentale: si ipotizza la diversità fra
tre campioni indipendenti riguardo i punteggi
ottenuti in un questionario che misura il QI
Gruppo 1
Gruppo 2
Gruppo 3
99
102
89
100
103
92
98
107
75
96
102
87
101
110
90
90
100
99
89
103
98
VAR00001
1.00
Media
96.1429
N
Deviazione s td.
7
4.81070
2.00
103.8571
7
3.43650
3.00
90.0000
7
8.00000
Totale
96.6667
21
7.96450
T test: Confronto: 1 con 2, 1 con 3, 3 con 2.
Tre risultati diversi ciascuno dei quali non è
indipendente dall’altro:
T1= -3.45 p=0.005, T2 = 1.742 p>0.05, T3=4.21 p=0.001
Anova: crea matematicamente confronti
indipendenti e dà un unico risultato:
F= 10.23, p<0.001
Applicazione di test univariati su
esperimenti multivariati
Intervallo di confidenza 95%
Variabile dipendente
VAR00001
VAR00002
Media
Errore s td. Limite inferiore
Limite
s uperiore
1.00
98.818
2.301
94.002
103.634
2.00
93.900
2.413
88.849
98.951
1.00
102.273
1.872
98.354
106.191
2.00
95.600
1.964
91.490
99.710
Disegno sperimentale è multivariato ovvero le
variabili sono fra loro interdipendenti:
Esempio: due scale di misurazione dell’intelligenza
Supponiamo di confrontare due gruppi in base ai
punteggi ottenuti alle due scale
Dai test univariati abbiamo due risultati
diversi: F1= 2.1 p>0.05 F2 = 6.04 p=0.024
Che possono avere solo valore descrittivo
Dal test multivariato ho un unico risultato
Calcolato sulla base dell’interdipendenza fra
le due variabili F = 4.17 p=0.032
Che ha valore dimostrativo
Fallacia e Principio di Idoneità
Quando le variabili misurate sul campione sono
troppo eterogenee i risultati non danno nessuna
indicazione oppure danno indicazioni fallaci
rispetto alla popolazione generale
Esempi: regressione su gruppi non omogenei, paradosso di
Simpson
Regressione su gruppi non
omogenei
30
Misura della relazione
fra due parametri X e Y
in campione composto
da due popolazioni
diverse con valori medi
nei due parametri
diversi
y = 2.2161x - 2.9788
R2 = 0.9285
25
20
15
10
5
0
0
2
4
6
8
10
12
Il coefficiente R2 è altissimo e la relazione è significativa dal
punto di vista dell’analisi statistica che non tiene conto
della diversità fra le due subpopolazioni
14
16
Paradosso di Simpson
Immaginiamo di dover confrontare l’efficacia
di due diverse terapie (Terapia A, Terapia
B) nel miglioramento di un particolare
stato patologico
Tutti i soggetti
Migliorati
Non
migliorati
Percentuale
di migliorati
Terapia A
20
20
50
Terapia B
24
16
60
La terapia B è la più efficace perché produce
miglioramento nel 60% dei casi, mentre la terapia A arriva
solo al 50%.
… Considerando la differenza fra
maschi e femmine nelle due
terapie…
Solo maschi
Migliorati
Non migliorati
Terapia A
12
18
Percentuale
di migliorati
40
Terapia B
3
7
30
sia nei maschi che nelle femmine è la terapia A a produrre
una percentuale maggiore di miglioramenti e non la
terapia B
Solo femmine
Migliorati
Non migliorati
Percentuale
di migliorati
Terapia A
8
2
80
Terapia B
21
9
70
Fallacia e Adeguatezza della
Numerosità
Quando il campione non è sufficientemente
numeroso per quel tipo di variabile presa in
esame e per quel tipo di differenza che si vuole
misurare si può concludere erroneamente che
non ci siano differenze.
Esempio: numerosità non sufficiente
Fallacia e principio della causalità
“Post hoc, ergo propter hoc”
Attraverso il test statistico non è possibile stabilire relazioni
causali ma solo differenze. Il test è tutto sbilanciato nel senso di
falsificare H0.
Esempio: due eventi prossimi in senso temporale vengono considerati l’uno la
causa dell’altro.
Utilizzando un campione opportuno per dimensioni e
rappresentatività qualsiasi idea sarebbe dimostrata. Ma siamo
interessati a dimostrare idee qualsiasi o differenze interessanti
dal punto di vista clinico?
Stabilire a priori le caratteristiche del campione significa assicurare la validità
delle idee che si intende dimostrare
Campionamento
• Mappa concettuale
• Domande in itinere
Validità nella ricerca
Nell’ambito ricerca sperimentale:
caratteristiche di
falsificabilità, generalizzabilità, replicabilità
o appropriatezza nella descrizione e
nell’utilizzo dei test statistici
Validità di un test
In ambito psicometrico: attributo del test che
permette di stabilire se il test stesso misura quello
che effettivamente vuol misurare.
caratteristiche:
la struttura del test deve essere unitaria e le
relazioni fra il test e altri test che misurano
costrutti teorici analoghi.
Validità
Validità interna
•
sono stabilite in modo appropriato le
relazioni fra le variabili in studio
•
sono escluse dal disegno sperimentale
quelle variabili confondenti
Validità
Esempi di minaccia alla validità interna:
• Effetto regressione (studi longitudinali)
• L’effetto apprendimento: alcuni fenomeni se
studiati in momenti successivi sono influenzati
dalla consapevolezza del compito e dalla
conoscenza della prova
• maturazione degli individui
Validità
Compito dello sperimentatore è quello di
misurare l’effetto del fenomeno sia in
relazione al ripetersi delle prove che
indipendentemente dalle ripetizioni
Validità
Esempio: disegno sperimentale di Solomon per il
controllo dell’effetto trattamento,
apprendimento e maturazione.
Suddivisione in gruppi:
• Il primo gruppo (I gruppo – sperimentale) è
sottoposto a pretest-trattamento e posttest
• Il secondo gruppo (II gruppo - di controllo) è
sottoposto a pretest e posttest senza trattamento
• Il terzo gruppo (III gruppo - sperimentale) è
sottoposto a trattamento e post-test.
• Il quarto gruppo (IV gruppo – di controllo) è
sottoposto solo a post-test.
Validità
a Variabili confondenti:
fonte di minaccia principale per la validità
interna in quanto non controllabili dallo
sperimentatore
sono spesso distinte in sistematiche e
asistematiche.
Validità
Variabili sistematiche
si riferiscono a quelle variabili che in ogni piano
della ricerca agiscono in modo incontrollato.
Variabili asistematiche
sono caratteristiche di situazioni particolari di
quel disegno di ricerca e solo di quello
Tuttavia … dipende sempre dal disegno di ricerca
Validità
Un esempio di varibili asistematiche sono quelle
legate alla mortalità o ai drop-out dei soggetti
del campione (studi longitudinali).
• Mortalità: perdita non recuperabile di soggetti
del campione durante il corso della ricerca.
• Drop-out: o le mancate risposte a una parte
della ricerca o la perdita recuperabile di soggetti
nel corso della ricerca
 analisi statistiche della popolazione che
all’interno del campione non ha terminato la
ricerca
Validità
Un esempio di analisi per controllare la
mortalità e i drop-out è quella che viene
definita Intention- to-treatment- analysis
che, in modi diversi a seconda del metodo
che viene seguito, confronta la
popolazione di soggetti che ha terminato
lo studio con quella che non lo ha
terminato.
Validità
c Relazioni fra le variabili
• Nel disegno sperimentale il controllo della
validità interna si effettua soprattutto sulla
conoscenza delle relazioni fra le variabili
• Diversi sono i tipi di variabili che sono utilizzati
nelle ricerche sperimentali. Solitamente si
indagano gli effetti che una variabile definita
fattore determina su una variabile definita
dipendente.
Validità
• La distinzione fra variabili dipendenti e
fattori deve essere indagata dallo
sperimentatore in base all’ipotesi che vuole
verificare. Sebbene alcuni casi presentino
una chiara distinzione fra le variabili molte
situazioni si caratterizzano per relazioni più
ambigue.
Validità
• I casi di chiara relazione causale fra variabile dipendente e
fattore sono dette relazioni genuine. Ne è un esempio la
relazione fra altezza e peso.
• I casi in cui la relazione è genuina ma bidirezionale ovvero
entrambe le variabili possono essere considerate influenti l’una
sull’altra, sono definiti da una relazione mutua.
• Quando invece non sono chiare le definizioni fra le variabili
allora la relazione si definisce spuria. (Un esempio è dato
dall’utilizzo di farmaci in base alla gravità della patologia).
Validità
Validità esterna
insieme di caratteristiche della ricerca che
permettono di generalizzare i risultati
ottenuti dalla ricerca alla popolazione
generale che rappresenta il campione
analizzato
Validità
Validità di costrutto
riguarda la teoria di riferimento che si vuole
testare tramite la ricerca.
Per verificare la validità del costrutto teorico alla
base della ricerca occorre che sia possibile
tradurre il costrutto stesso in variabili misurabili.
Validità
Diversi passi:
• Elaborazione preoperativa del costrutto.
• Misurazione.
• Verifica adeguatezza in base alle variabili sudiate.
• Costrutti confondenti. Sono quei costrutti che possono
essere determinanti rispetto al costrutto in studio e che
interferiscono con esso in modo non controllato dallo
sperimentatore.
Validità
Validità statistica o predittiva
si riferisce alla verifica statistica delle ipotesi
sperimentali in ogni suo passo, dalla
formulazione dell’ipotesi al controllo degli errori
di I e II tipo e alla verifica della relazione fra le
variabili dipendenti e i fattori
Sovrapposizione fra validità statistica e validità
interna (validità predittiva)
Validità
Validità ecologica
• Il concetto di validità ecologica è stato introdotto
nell’ambito della ricerca psicologica per
sottolineare l’importanza della distinzione fra
comportamento investigato in laboratorio e
comportamento reale del soggetto nella realtà
abituale. Il valore di questo concetto è
verificabile in alcune condizioni teoriche
particolari nelle quali interessa valutare la
differenza fra ambienti diversi di stimolazione.
Validità
Artefatti
al pari delle variabili confondenti sono fattori
legati al soggetto o allo sperimentatore che
inficiano i risultati della ricerca e che inducono a
conclusioni erronee in modo non controllato dallo
sperimentatore stesso.
Validità
• a Fattori legati al ricercatore
• L’Effetto Rosenthal: lo sperimentatore in modo
inconsapevole riesce a trasmettere al soggetto le
proprie aspettative riguardo ai risultati della
ricerca e quindi alterandone il comportamento a
proprio favore.
• Questo effetto si elimina utilizzando un disegno
sperimentale a doppio cieco ovvero tenendo
all’oscuro chi conduce la ricerca delle ipotesi
sperimentali.
Validità
• L’Effetto Pigmallione è lo studio dell’effetto
Rosenthal nel campo dell’educazione.
Grazie a questo effetto più un soggetto è
percepito da chi lo valuta in senso positivo
più sarà in grado di ottenere una
valutazione positiva.
Validità
• Altri fattori non espliciti e legati a
desiderabilità sociale
• Controllo: figure alternative che conducono
la ricerca
Validità
b Fattori legati al soggetto
• i soggetti sono fiduciosi quando si pongono in
modo genuino rispetto alla ricerca;
• i soggetti buoni sono quelli che intendono
confermare quella che credono essere l’ipotesi
dello sperimentatore;
• i soggetti negativi sono quelli che vogliono invece
disconfermare lo sperimentatore;
• i soggetti apprensivi pensano di essere valutati
dallo sperimentatore e quindi rispondono in
modo da dare un’immagine positiva di sé.
Validità
c Fattori legati alla situazione sperimentale
Riguardano tutti quei comportamenti che
il soggetto mette in atto a causa delle
aspettative e delle modifiche che genera la
situazione sperimentale che alterano la
prestazione del soggetto nel compito.
• Esempio: Effetto placebo
Validità di un test
• Americal Psychological Association quattro aspetti: il
contenuto, la validità esterna, la validità rispetto a un
criterio e il costrutto.
• Ogni questionario o test psicometrico deve essere
sottoposto a una verifica della validità nella quale sono
valutate le caratteristiche del test su un campione
appositamente creato.
Validità di un test
Validità di contenuto
• La validità di contenuto misura quanto gli item
del test misurano dell’argomento che il test si
propone di misurare.
• Per valutare la validità di contenuto ci si affida
al giudizio di esperti e alla letteratura che
sull’argomento ha elaborato materiale a
riguardo.
Validità di un test
Validità interna
• la validità interna misura quanto gli item del test
misurano lo stesso costrutto, ovvero la loro
correlazione. Ci si aspetta, infatti, che gli item di
un test siano fortemente correlati fra loro.
• La validità interna viene solitamente valutata
tramite l’analisi fattoriale che permette di
identificare le dimensioni misurate dal
questionario e la correlazione fra le dimensioni e
gli item.
Validità di un test
Validità rispetto a un criterio
• La validità rispetto a un criterio misura quanto il
questionario è in relazione a altre misure (che
fanno da criterio) che si ipotizza essere legate ad
esso.
• Questa validità viene verificata tramite l’analisi
della correlazione fra il questionario e il criterio
ed è valutata tramite il coefficiente di
correlazione che indica il tipo e la forza della
relazione fra i due.
Validità di un test
Validità rispetto a un criterio
• Validità predittiva nella quale ha rilievo la
dimensione temporale, quindi è la forza
con cui il test è in grado di prevedere il
rendimento futuro del criterio.
• Validità concorrente nella quale il test e il
criterio sono valutati allo stesso tempo
Validità di un test
Validità di costrutto
La validità di costrutto si verifica tramite
una serie di osservazioni e dati che
forniscono una informazione sulle
caratteristiche del costrutto
Validità di un test
All’interno della validità di costrutto vengono
distinte:
• validità convergente: esprime il grado di accordo
tra due o più misure di uno stesso costrutto
• validità discriminante: valuta il grado di
divergenza fra costrutti diversi
• Entrambi i tipi di validità vengono espressi
tramite coefficienti di correlazione
Validità di un test
• Mappa concettuale
• Domande in itinere
Attendibilità
misura l’accuratezza della misurazione
si esprime come capacità nella misura di
produrre sempre gli stessi risultati in
rapporto alla stima dell’errore casuale
Attendibilità
• Il coefficiente o indice di attendibilità
misura il rapporto fra la precisione di misura e
l’errore.
• Ha valori compresi tra 0 (massima
inadeguatezza) e 1 (massima precisione).
• Può essere calcolato attraverso indici di
correlazione diversi a seconda del tipo di dati che
sono considerati.
Attendibilità
Stime dell’attendibilità
Esistono diversi metodi per il calcolo degli
indici di attendibilità ciascun dei quali
produce risultati diversi in quanto basato
su considerazioni teoriche particolari.
Attendibilità
Test paralleli: agli stessi soggetti sono
somministrati due forme parallele di un test
(ovvero che misurano lo stesso costrutto e hanno
la stessa struttura) in tempi di somministrazione
vicini tra loro.
L’attendibilità è calcolata attraverso un indice di
correlazione fra i due punteggi.
limite: misura l’interscambiabilità dei due test
che non sono mai realmente equivalenti
Attendibilità
Test-retest: agli stessi soggetti è somministrato
lo stesso questionario ma in tempi diversi.
È calcolata la correlazione fra le due misure.
Questa attendibilità ha l’accezione di stabilità
nel tempo.
limite: decisione del tempo che intercorre fra una
prova e l’altra che è difficile da stabilire e che
inevitabilmente misurato sugli stessi soggetti
dovrebbe esser considerato come misura
ripetuta.
Attendibilità
Split-half: divide il test a metà e valuta la
correlazione fra le due parti.
Va applicato quando il test è suddivisibile in due
parti equivalenti che misurano lo stesso costrutto.
L’attendibilità deve essere considerata sul test
completo quindi occorre correggere la stima
effettuata sulle singole parti.
limite: la divisione split-half è sempre arbitraria.
Attendibilità: coerenza interna
Coerenza interna: grado di accordo fra
più misure riguardanti lo stesso costrutto
teorico ottenute in una stessa
somministrazione.
Può esser calcolata come relazione fra gli
items, fra gli items e il totale, fra gli items e
le sottoscale e fra le sottoscale.
Indici di coerenza interna
Coefficiente di Kuder-Richardson (KR-20)
si applica nel caso in cui gli items siano
dicotomici
valuta la coerenza interna del test
Indici di coerenza interna
Alpha di Cronbach
Si applica con scale a intervalli equivalenti ed è il
coefficiente più utilizzato in ambito psicometrico.
Confronta la varianza prodotta dagli items con
al varianza totale.
Valuta quindi quanto sono intercorrelati fra loro
gli items.
Indici di coerenza interna
L2 di Guttman
• si pone in alternativa all’Alpha di
Cronbach e misura anche la covarianza
rispetto al primo
Attendibilità
Fattori che influenzano l’attendibilità
•
•
•
•
•
lunghezza del test (ovvero numerosità degli items)
numerosità del campione
rappresentatività del campione
modalità di somministrazione del test
tipologia degli item
Attendibilità
•
•
•
•
Mappa concettuale
Domande in itinere
Esempio
Esempio Spss
Scaricare
Campionamento - Attendibilita`

Campionamento - Attendibilita`

Lucidi8_13

Teoria e metodi della ricerca sociale

Lucidi04_FSRU_14

Comprensione della lettura

Squintani