La regressione II
Cristina Zogmaister
La relazione lineare tra due variabili:

Diagrammi di dispersione

Direzione e intensità della relazione: Coefficiente di correlazione

Previsione: analisi di regressione
Informazioni importanti:
 Significatività del modello
 Percentuale di varianza spiegata
 Valore e significatività della costante e del coefficiente di
regressione

L’output
Alcuni problemi importanti nella regressione:


Gamma di osservazioni ristretta
Presenza di outliers
Normalità di una distribuzione:


Asimmetria e curtosi
Metodi grafici:


Istogrammi di frequenza con sovraimposizione della normale
Grafici di probabilità P-P
Regressione lineare multipla

E’ consigliabile richiedere i coefficienti di correlazione bivariati

Regressione lineare sequenziale (i predittori vengono immessi in
differenti stadi)
 Il cambiamento di R2

Multicollinearità
Multicollinearità
=
•
•

i predittori sono troppo correlati tra di loro
causa problemi logici (ridondanza)
causa problemi statistici (aumenta la dimensione dei termini d’errore,
indebolendo l’analisi)
Nel caso due predittori siano altamente correlati (es. r > .70)



omettere una delle variabili
creare un punteggio composito
SPSS calcola la tolleranza (1 – SMC)


SMC: correlazione multipla di una variabile con tutte le altre, elevata al
quadrato
Se la SMC è elevata, la variabile è altamente correlata con le altre
dell’insieme: situazione di multicollinearità
Statistiche di collinearità:
Tolleranza: Varia tra 0 e 1.
Valori più elevati indicano
minore multicollinearità.
VIF =Variance Inflaction Factor (Fattore
di inflazione della varianza – è il
reciproco della tolleranza)
VIF = 1 se i predittori sono ortogonali.
VIF maggiori di 1 indicano presenza di
relazione tra i predittori.
La radice quadrata di VIF indica quanto
più largo è l’errore standard rispetto al
caso in cui i fattori non fossero correlati.
Correlazione troppo
elevata con gli altri
predittori
In questo caso abbiamo un problema di multicollinearità.
Sarebbe meglio analizzare la relazione tra i due predittori (IQ, short term
memory span) e il criterio (reading ability) tenendo fissa l’età dei bambini.
Se teniamo sotto controllo l’effetto dell’età, c’è un legame tra IQ e abilità di
lettura:
Questo effetto non emergeva quando non tenevamo sotto controllo statistico
l’età (c’era troppa variabilità dovuta all’età nell’abilità di lettura)
Predittori dicotomici

File child_data.sav

Genere sessuale



0 = maschio
1 = femmina
Il modello


Criterio: abilità di lettura
Predittore: genere
genere
Abilità lettura
Inseriamo il predittore dicotomico
come abbiamo fatto per quelli
continui:
Importante: la distribuzione non deve essere troppo sbilanciata nei
confronti di una delle due categorie (Frequenza massima < 90%)
Il punteggio previsto nel criterio per i
maschi (categoria 0) è uguale a 6.155,
Per le femmine è uguale a 6.155 + .490
Il predittore dicotomico nella regressione
multipla
Nella regressione multipla,
è utile chiedere sempre
descrittive e test di
collinearità
Il genere sessuale ha un effetto
significativo sull’abilità di lettura?
La mediazione nella
regressione multipla
Mediatore:

Variabile che spiega la relazione tra predittore e criterio

Modello causale:
c
PREDITTORE
a
MEDIATORE
CRITERIO
b
Nel modello, esistono due vie attraverso cui il predittore influenza il
criterio:
La via diretta (c), ossia l’impatto diretto del predittore sul criterio
La via indiretta (a) X (b), ossia quella parte del legame tra
predittore e criterio che è veicolata dalla variabile mediatrice
Mediazione
Tempera
=tura
Consumo
acqua
Sete
File mediazione.semplice

Esempio ipotetico:



Numero di decilitri di acqua consumati nell’arco di due ore,
con una temperatura ambientale costante
La quantità di acqua consumata è influenzata dalla
temperatura ambientale?
L’effetto della temperatura sul consumo di acqua è mediato
dalla sete?
1° passo: vediamo se la temperatura
influenza il consumo di acqua:
La temperatura ambientale è un predittore significativo del consumo di acqua,
F(1, 48) = 8.519, p = .005.
Al crescere di un grado della temperatura, il consumo stimato di acqua aumenta
di 0.389 dl.
2° passo: Verifichiamo se la temperatura
influenza la sete
3° passo: Verifichiamo se il mediatore ha un
effetto sul criterio, parzializzando il predittore
Possiamo affermare che l’effetto della temperatura
sul consumo di acqua è mediato dalla sete:
(B)
(B)
Infatti sia l’effetto del predittore sul mediatore (A), sia l’effetto del mediatore sul
criterio sono significativi (B).
Mediazione parziale o totale?
Mediazione totale: l’effetto del predittore, parzializzando l’effetto del
mediatore, risulta non significativo
Mediazione parziale: l’effetto del predittore, parzializzando l’effetto
del mediatore, è ridotto ma ancora significativo
Lezione: 15
Come testare la mediazione
(Baron e Kenny, 1986)
Attraverso la stima di una serie di modelli di regressione:
Verificare l’effetto significativo del predittore sul criterio
2)
Verificare l’effetto significativo del predittore sul mediatore
3)
Verificare l’effetto significativo del mediatore sul criterio (parzializzando il
predittore)
Se (1) – (2) – (3) sono soddisfatti
Mediazione totale: il predittore non è significativo in presenza del mediatore;
Mediazione parziale: il predittore ha un effetto significativo sul criterio in
presenza del mediatore
1)
Affinché vi sia mediazione, l’effetto del predittore sul criterio nella terza equazione
deve essere inferiore che nella seconda.
La mediazione è perfetta se nella terza equazione l’effetto del predittore è nullo.
NOTA IMPORTANTE: A causa della multicollinearità tra mediatore e predittore nel
Da soli: Rosenthal.sav


Esempio basato sull’effetto delle aspettative degli
insegnanti sul successo scolastico degli studenti
Due mediatori ipotizzati:




Clima sociale (atteggiamento positivo verso lo studente)
Input (quantità e difficoltà del materiale insegnato allo
studente)
Si ipotizza che in presenza di alte aspettative l’insegnante
manifesti un atteggiamento più positivo e insegni allo
studente più cose e questi due mediatori portino al
maggiore successo.
Testate l’ipotesi che il clima sociale media l’effetto
delle aspettative sulla prestazione
Ipotesi da testare statisticamente:
Aspettative
Successo scolastico
Atteggiamento
1) Il predittore influenza il criterio
2) Il predittore influenza il mediatore social
climate
3) Il mediatore influenza il criterio
(parzializzando il predittore)
4) L’effetto del predittore diminuisce
sensibilmente per effetto della presenza del
mediatore
Mediazione parziale o totale?
Beta = .552 ***
Aspettative
Successo scolastico
(beta = .274, n.s.)
Atteggiamento
Effetto totale = Effetto diretto + Effetto Mediato
. 552
= .274 + .653 * .425
Nota: *** = p < .001;
* = p < .05
Da soli - Ipotesi da testare statisticamente:
Aspettative
Successo scolastico
Input
Fate la decomposizione dell’effetto totale in effetto diretto ed effetto mediato
(anche se l’ipotesi di mediazione non risultasse confermata)
Analisi
1.
2.
3.
4.
Il predittore influenza il criterio? (Sì)
Il predittore influenza il mediatore? (no – STOP)
Il mediatore influenza il criterio? (tendenza)
Confronto tra l’effetto del predittore sul criterio in
presenza / assenza del mediatore
Beta = .552 ***
Aspettative
Successo scolastico
(beta = .492 ***)
Input
Effetto totale = Effetto diretto + Effetto Mediato
. 552
= .492 + .239 * .251
Esempio di report





L’aspettativa degli insegnanti era significativamente legata alla prestazione
degli studenti, F(1,38) = 16.654, beta = .552, p < .001, R2 = . 305, R2
corretto = .286.
Un aumento di un’unità nella scala di aspettativa degli insegnanti era
associato a un aumento di .701 punti nella valutazione di fine semestre.
Sono state condotte due analisi di mediazione, per testare rispettivamente
l’ipotesi che questo effetto fosse mediato da (a) l’atteggiamento degli
insegnati verso gli allievi (variabile social climate) e (b) le informazioni che
venivano impartite attraverso l’insegnamento (variabile input).
E’ emerso un effetto di mediazione statisticamente significativo per la
variabile social climate, ma non per la variabile input.
Le aspettative degli insegnanti erano associate positivamente
all’atteggiamento verso gli studenti, che a sua volta era positivamente
associato al voto di fine semestre. Come emerge dal grafico della
mediazione presentato in fig. 1, l’effetto di mediazione era totale.
Non sono invece emersi effetti significativi delle aspettative degli insegnanti
sull’input, F (1,38) = 2.310, p = .137, R2 = .057, R2 corretto = .032, pertanto
l’ipotesi di mediazione da parte dell’input è stata disconfermata.
Predittore dicotomico
Terapia
0 = tradizionale
1 = + esercizio
Miglioramento
sintomi
Autoefficacia
Effetto della terapia sui sintomi:

Inseriamo il predittore dicotomico come un normale
predittore

Ci sono differenze tra il risultato del trattamento
tradizionale e del trattamento “+ esercizio”?
Quale dei due trattamenti è più efficace?

Effetto del trattamento sull’autoefficacia:
Effetto dell’autoefficacia sul
miglioramento dei sintomi:
Mediazione parziale o totale?
Terapia
0 = tradizionale
1 = + esercizio
Beta = .500 ***
Miglioramento
sintomi
(beta = .188 *)
Autoefficacia
Effetto totale = Effetto diretto + Effetto Mediato
. 500
= .188 + .501 * .623
Da soli: pubblicità.sav – ipotesi da testare
statisticamente
Pubblicità
Consumi
Atteggiamenti
Test effetto di mediazione atteggiamento
esplicito:
Beta = .290 ***
Pubblicità
Consumi
(beta = .277 ***)
Atteggiamenti
espliciti
Controllo: .290 = .277 + .602 * .021
Test effetto di mediazione atteggiamento
implicito:
Beta = .290 ***
Pubblicità
Consumi
(beta = -.042 n.s.)
Atteggiamenti
impliciti
Controllo: .290 = -.042 + .502 * .663
Scarica

La regressione I