Verifica di ipotesi che la
correlazione nella
popolazione sia diversa da
zero
Variabilità del coefficiente di
correlazione
L’ipotesi nulla prevede che la correlazione
nella popolazione sia nulla.
Ma la variabilità stocastica produce
dei coefficienti di correlazione
non esattamente uguali a zero
• Estraendo infiniti campioni di numerosità
N, i coefficienti così ottenuti avranno una
distribuzione approssimativamente
normale con media zero e d.s
inversamente proporzionale alla radice di
n.
H 0: r = 0
0
• Sotto l’ipotesi zero, la distribuzione
campionaria di r
• ha media zero e deviazione standard
pari a
• Ha una distribuzione
approssimativamente normale, meglio
descritta da una t di Student
0,90
1 r2
sr 
n2
90% in
mezzo
2,5% in in
basso, zona di
rifiuto
H 0: r = 0
0
2,5% in alto,
zona di rifiuto
0,90
• Con tali informazioni si possono
individuare delle zone di accettazione e di
rifiuto dell’ipotesi nulla
Le due ipotesi
• L’ipotesi nulla prevede che il coefficiente di
correlazione sia zero.
• L’ipotesi alternativa prevede che r sia
diverso da zero.
90% in
mezzo
2,5% in in
basso, zona di
rifiuto
H 0: r = 0
0
2,5% in alto,
zona di rifiuto
0,90
Non è necessario
definire delle zone di
accettazione per H1
H1: r
≠ 0 bidirezionale
La distribuzione di r
diversa da zera non è
simmetrica, e la sua
assimmetria aumenta
all’aumentare di r
H1: r
≠ 0 bidirezionale
Le due ipotesi
• Secondo l’ipotesi nulla (coefficiente di
correlazione = zero) vlori comuni sono
quelli attorno allo zero. Valori rari sono
molto lontani da zero.
• L’ipotesi alternativa (r sia diverso da zero)
prevede che i valori di r siano elevati e
quindi comuni.
Comuni ?
• Sono comuni quei valori che hanno il 90 (o
95) % di probabilità di accadere.
• Sono rari quei valori che hanno meno del
5 % di probabilità di manifestarsi
Per stabilire il valore critico
• Si usa la t di Student, con n-2 gradi di
libertà (6 coppie producono 4 gradi di
libertà) con la formula
•
t
rxy  N  2
1 r
2
xy
Risultato
• Se il valore di r,calcolato nel campione di N
coppie, è comune, si accetta l’ipotesi di nullità di
correlazione nella popolazione
• Se il valore di r è raro, non si conclude: abbiamo
ottenuto un valore raro con l’ipotesi nulla,
• ma…
– L’ipotesi nulla va rifiutata, il coefficiente di correlazione è
diverso da zero nella popolazione e noi abbiamo appena
trovato un valore comune.
Tabella dei valori critici per p=0,05
La tabella può anche essere
esposta in un altro modo, per
valutare direttamente r senza
calcolare la t di Student
Tabella per
rilevare r
significativo
(ipotesi
bidirezionale,
p=0,05)
Ipotesi monodirezione
• Se abbiamo qualche motivo di ipotizzare
che il coefficiente può essere solo positivo
(e non negativo), formuliamo l’ipotesi
alternativa in questo modo:
• Il coefficiente di correlazione è elevato e
positivo nella popolazione.
H 0: r = 0
0
5 % in alto,
zona di rifiuto
0,90
H 1: r
> 0 monodirezionale
Solo maggiore di,
non “diverso” da
zero
Che altro significa il valore
p = 0,05?
• E’ pur sempre possibile che nella
popolazione il coefficiente di correlazione
sia realmente nullo e che realmente il
campione estratto sia molto raro.
• Il valore 0,05 è la probabilità di rifiutare
l’ipotesi nulla mentre essa è vera: si
afferma che esiste correlazione, mentre in
realtà non esiste.
Si può diminuire p da 0,05 a 0,001
per essere più sicuri?
• Si può farlo, ma in tal caso aumentiamo
il rischio inverso, quello di rifiutare
l’ipotesi alternativa quando essa è vera.
p=0,05
H 0: r = 0
p=0,01
0
0,90
H 1: r
≠0
bidirezionale
Si possono diminuire entrambi i
rischi? Come?
• Si possono diminuire entrambi i rischi
aumentando la numerosità di N, facendo
in modo di diminuire la sovrapposizione
dei valori delle due ipotetiche popolazioni.
N basso, valori dispersi
0
0,90
H 1: r
≠ 0 bidirezionale
N elevato, valori concentrati
0
0,90
Passiamo a SPSS…
Scarica

Lez 2013 10 - Verifica che r sia diverso da zero - e