Verifica di ipotesi che la correlazione nella popolazione sia diversa da zero Variabilità del coefficiente di correlazione L’ipotesi nulla prevede che la correlazione nella popolazione sia nulla. Ma la variabilità stocastica produce dei coefficienti di correlazione non esattamente uguali a zero • Estraendo infiniti campioni di numerosità N, i coefficienti così ottenuti avranno una distribuzione approssimativamente normale con media zero e d.s inversamente proporzionale alla radice di n. H 0: r = 0 0 • Sotto l’ipotesi zero, la distribuzione campionaria di r • ha media zero e deviazione standard pari a • Ha una distribuzione approssimativamente normale, meglio descritta da una t di Student 0,90 1 r2 sr n2 90% in mezzo 2,5% in in basso, zona di rifiuto H 0: r = 0 0 2,5% in alto, zona di rifiuto 0,90 • Con tali informazioni si possono individuare delle zone di accettazione e di rifiuto dell’ipotesi nulla Le due ipotesi • L’ipotesi nulla prevede che il coefficiente di correlazione sia zero. • L’ipotesi alternativa prevede che r sia diverso da zero. 90% in mezzo 2,5% in in basso, zona di rifiuto H 0: r = 0 0 2,5% in alto, zona di rifiuto 0,90 Non è necessario definire delle zone di accettazione per H1 H1: r ≠ 0 bidirezionale La distribuzione di r diversa da zera non è simmetrica, e la sua assimmetria aumenta all’aumentare di r H1: r ≠ 0 bidirezionale Le due ipotesi • Secondo l’ipotesi nulla (coefficiente di correlazione = zero) vlori comuni sono quelli attorno allo zero. Valori rari sono molto lontani da zero. • L’ipotesi alternativa (r sia diverso da zero) prevede che i valori di r siano elevati e quindi comuni. Comuni ? • Sono comuni quei valori che hanno il 90 (o 95) % di probabilità di accadere. • Sono rari quei valori che hanno meno del 5 % di probabilità di manifestarsi Per stabilire il valore critico • Si usa la t di Student, con n-2 gradi di libertà (6 coppie producono 4 gradi di libertà) con la formula • t rxy N 2 1 r 2 xy Risultato • Se il valore di r,calcolato nel campione di N coppie, è comune, si accetta l’ipotesi di nullità di correlazione nella popolazione • Se il valore di r è raro, non si conclude: abbiamo ottenuto un valore raro con l’ipotesi nulla, • ma… – L’ipotesi nulla va rifiutata, il coefficiente di correlazione è diverso da zero nella popolazione e noi abbiamo appena trovato un valore comune. Tabella dei valori critici per p=0,05 La tabella può anche essere esposta in un altro modo, per valutare direttamente r senza calcolare la t di Student Tabella per rilevare r significativo (ipotesi bidirezionale, p=0,05) Ipotesi monodirezione • Se abbiamo qualche motivo di ipotizzare che il coefficiente può essere solo positivo (e non negativo), formuliamo l’ipotesi alternativa in questo modo: • Il coefficiente di correlazione è elevato e positivo nella popolazione. H 0: r = 0 0 5 % in alto, zona di rifiuto 0,90 H 1: r > 0 monodirezionale Solo maggiore di, non “diverso” da zero Che altro significa il valore p = 0,05? • E’ pur sempre possibile che nella popolazione il coefficiente di correlazione sia realmente nullo e che realmente il campione estratto sia molto raro. • Il valore 0,05 è la probabilità di rifiutare l’ipotesi nulla mentre essa è vera: si afferma che esiste correlazione, mentre in realtà non esiste. Si può diminuire p da 0,05 a 0,001 per essere più sicuri? • Si può farlo, ma in tal caso aumentiamo il rischio inverso, quello di rifiutare l’ipotesi alternativa quando essa è vera. p=0,05 H 0: r = 0 p=0,01 0 0,90 H 1: r ≠0 bidirezionale Si possono diminuire entrambi i rischi? Come? • Si possono diminuire entrambi i rischi aumentando la numerosità di N, facendo in modo di diminuire la sovrapposizione dei valori delle due ipotetiche popolazioni. N basso, valori dispersi 0 0,90 H 1: r ≠ 0 bidirezionale N elevato, valori concentrati 0 0,90 Passiamo a SPSS…