Master in Neuropsicologia Clinica Elementi di Statistica I Analisi bivariata Per ogni unità statistica si considerano congiuntamente due variabili: u.s. 1 Età 25 Sesso M 2 32 M 3 41 F 4 28 M 5 51 M … … … 6 29 M Classi di età ni fi Sesso ni fi 18-29 32 0,16 F 48 0,24 30-41 52 0,26 M 152 0,76 42-53 60 0,30 Totale 200 1,00 54-65 26 0,13 66-77 20 0,10 78-89 8 0,04 90-101 2 0,01 Totale 200 1,00 17 maggio 2008 1 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Perché? 1. Rappresentazione sintetica delle distribuzioni di due variabili / quantificazione di un fenomeno 2. Valutazione dell’andamento congiunto delle due variabili 3. Valutazione della relazione causa-effetto tra le due variabili 17 maggio 2008 2 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Sesso Classi di età F M Totale 18-29 8 24 32 30-41 15 37 52 42-53 11 49 60 54-65 7 19 26 66-77 3 17 20 78-89 3 5 8 90-101 1 1 2 Totale 48 152 17 maggio 2008 200 Sesso Classi di età F M Totale 18-29 0,040 0,120 0,160 30-41 0,075 0,185 0,260 42-53 0,055 0,245 0,300 54-65 0,035 0,095 0,130 66-77 0,015 0,085 0,100 78-89 0,015 0,025 0,040 90-101 0,005 0,005 0,010 Totale 0,240 0,760 1,000 3 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Tabella a 2 vie k x h k n. j nij i 1 h ni. nij j 1 k h k h i 1 j 1 n nij ni. n. j i 1 j 1 Distribuzione congiunta Distribuzione marginale 17 maggio 2008 4 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Sesso Sesso F M 18-29 0,167 0,158 0,160 52 30-41 0,313 0,243 0,260 49 60 42-53 0,229 0,322 0,300 7 19 26 54-65 0,146 0,125 0,130 66-77 3 17 20 66-77 0,062 0,112 0,100 78-89 3 5 8 78-89 0,062 0,033 0,040 90-101 1 1 2 90-101 0,021 0,007 0,010 Totale 48 152 200 Totale 1,000 1,000 1,000 Classi di età F M 18-29 8 24 32 30-41 15 37 42-53 11 54-65 Classi di età Totale Totale Sesso Classi di età 17 maggio 2008 F M Totale 18-29 0,250 0,750 1,000 30-41 0,288 0,712 1,000 42-53 0,183 0,817 1,000 54-65 0,269 0,731 1,000 66-77 0,150 0,850 1,000 78-89 0,375 0,625 1,000 90-101 0,500 0,500 1,000 Totale 0,240 0,760 1,000 5 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Distribuzione condizionata di X a y1 Distribuzione condizionata di Y a x2 17 maggio 2008 6 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Relazione tra variabili • Forma: simmetrica X←→Y asimmetrica X→Y (causa-effetto / indipendente-dipendente) • Segno: variazione concorde variazione discorde X↑↓ X↑↓ Y ↑↓ Y ↓↑ + - (var. almeno ordinali…) • Forza: Sovrappeso Sì No Totale Pressione Totale bassa media alta 280 10 10 300 5 290 5 285 300 15 Pressione Totale bassa media alta Sì 180 60 60 300 300 No 50 200 50 300 600 Totale 230 260 110 600 Sovrappeso 17 maggio 2008 Sovrappeso Pressione Totale bassa media alta Sì 102 99 99 300 No 98 103 99 300 Totale 200 202 198 600 7 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Rappresentazioni grafiche 50 60 40 50 30 40 20 F 30 M 20 10 10 0 18-29 30-41 M 42-53 54-65 66-77 F 78-89 0 18-29 30-41 42-53 54-65 66-77 78-89 90-101 90-101 60 50 18-29 30-41 40 42-53 30 54-65 66-77 20 78-89 90-101 10 0 F 17 maggio 2008 M 8 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I 70 60 50 40 M 30 F 20 10 0 18-29 30-41 42-53 54-65 66-77 78-89 90-101 100% 90% 80% 70% 60% M 50% F 40% 30% 20% 10% 0% 18-29 17 maggio 2008 30-41 42-53 54-65 66-77 78-89 90-101 9 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Cenni di Calcolo delle Probabilità Definizione di probabilità Intuitiva: 17 maggio 2008 p.e. lancio una moneta, qual è la probabilità che esce testa? lancio un dado, qual è la probabilità che esce 5? e che esce un numero pari? e che esce 7? e che esce un numero compreso tra 1 e 6? 10 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Terminologia Evento: manifestazione oggetto di attenzione Evento casuale: il risultato dell’esperimento casuale, ovvero di una situazione in cui si è operata una scelta o si è manifestato un evento senza una precisa regola, in modo casuale. certo – evento che si manifesta sicuramente impossibile – evento che non si manifesta sicuramente possibile – evento che si può manifestare incompatibili – due (o più) eventi che non si possono verificare contemporaneamente complementare – evento o insieme di eventi che si verifica in contrasto ad un altro Spazio campionario Ω: l’insieme di tutti i possibili risultati 17 maggio 2008 11 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I • Definizione classica: (Pascal e Fermat, XVII sec.) La probabilità di un evento è il rapporto tra il numero dei casi favorevoli e il numero dei casi possibili, purché questi ultimi siano ugualmente possibili Se su n casi nA sono quelli relativi al verificarsi dell’evento A, la probabilità che si verifichi A è: pA P A nA n • Qual è la probabilità di estrarre una pallina bianca da un’urna che contiene 3 palline bianche, 2 nere e 3 gialle? n=8 A=pallina bianca nA=3 pA=3/8=0,375 17 maggio 2008 12 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I • Definizione frequentista: Se si ripete un processo un gran numero di volte n e se un certo evento con caratteristica A si verifica nA volte, la frequenza relativa di successo di A è nA/n e sarà approssimativamente uguale alla probabilità di A. pA P A nA n Se su 1235 osservazioni rilevo per 371 volte la caratteristica ‘pressione bassa’, allora la probabilità di osservare un soggetto con ‘pressione bassa’ verosimilmente sarà 371/1235=0,300 17 maggio 2008 13 / 23 Master in Neuropsicologia Clinica • Elementi di Statistica I Definizione assiomatica: 1. Dato un processo che genera n risultati (eventi) mutuamente esclusivi, A1, A2, …, An, la probabilità di un dato evento Ai è data da un numero non negativo, ovvero: P(Ai) ≥ 0 2. La somma delle probabilità di tutti gli eventi mutuamente esclusivi è uguale a 1: n P A 1 i 1 i 3. Dati due eventi mutuamente esclusivi, Ai e Aj, la probabilità che si verifichi o Ai o Aj è uguale alla somma delle singole probabilità: P(Ai o Aj) = P(Ai) + P(Aj) 17 maggio 2008 14 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Relazione con la tabella a 2 vie Sesso Classi di età F M Totale 18-29 8 24 32 30-41 15 37 52 42-53 11 49 60 54-65 7 19 26 66-77 3 17 20 78-89 3 5 8 90-101 1 1 2 Totale 48 152 200 1. Le modalità sono mutuamente esclusive 2. Supp. uguale probabilità per ogni u.s. 1. P(F) = 0,24 2. P(54-65) = 0,13 3. P(42-53|M) = 0,322 4. P(30-41 ∩ F) = 0,075 1. e 2. → probabilità marginale 3. → probabilità condizionata 4. → probabilità congiunta 17 maggio 2008 Simbologia: | → condizionamento ∩ → intersezione → contemporaneità (A e B ovvero B e A) U → unione → alternatività e contemp. (A, B, oppure A e B) 15 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Sesso Classi di età F M 18-29 8 24 32 30-41 15 37 52 42-53 11 49 60 54-65 7 19 26 66-77 3 17 20 78-89 3 5 8 90-101 1 1 2 Totale 48 152 0,035 = Totale P(F) = 0,24 P(54-65) = 0,13 P(54-65|F) = 0,146 P(F|54-65) = 0,269 P(54-65 ∩ F) = 0,035 200 0,24 x 0,146 P(54-65 ∩ F) = P(F) x P(54-65|F) Legge del prodotto: P(A∩B) = P(B) x P(A|B) 17 maggio 2008 se P(B)≠0 16 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Legge del prodotto: P(A∩B) = P(B) x P(A|B) P(A∩B) P(A|B) = ----------P(B) se P(B)≠0 P(M o F) = P (M U F) = P(M) + P(F) = 0,76 + 0,24 = 1 Se non sono mutuamente esclusivi?? Es. M e 18-29… Legge della somma: P(A U B) = P(A) + P(B) – P(A ∩ B) Es. P(M U 18-24) = P(M) + P(18-29) – P(M ∩ 18-29) = = 0,76 + 0,160 – 0,120 = 0,80 (152) (32) (24) 17 maggio 2008 se P(B)≠0 Sesso Classi di età F M Totale 18-29 8 24 32 30-41 15 37 52 42-53 11 49 60 54-65 7 19 26 66-77 3 17 20 78-89 3 5 8 90-101 1 1 2 Totale 48 152 200 17 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Eventi indipendenti Es. A = essere M B = avere le ali P(B) non ha effetto su P(A) e viceversa → P(A|B) = P(A) P(B|A) = P(B) P(A ∩ B) = P(B) x P(A|B) = P(B) x P(A) Eventi complementari Es. A = essere M il complementare è = essere F… P A 1 P A 17 maggio 2008 18 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Variabile casuale: variabile i cui valori non possono essere esattamente predetti. discreta: salti o interruzioni nei valori (conteggio…) continua: non ha salti o interruzioni (altezza…) (limite strumento di misura) Distribuzione di probabilità di V.C. discreta: Specificazione di tutti i valori possibili con le rispettive probabilità… Num. infarti ni pi pi 0 782 782/1464 0,534 pi ≡ fi 1 389 389/1464 0,266 1. pi ≥ 0 2 218 218/1464 0,149 3 75 75/1464 0,051 Totale 1464 17 maggio 2008 1,000 per ogni i 2. ∑pi = 1 3. P(Ai o Aj) = pi + pj per ogni i e j 19 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I graficamente… Prob. Cumulata: pi 1,000 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 F(x) = P(X≤ x) -1 0 1 2 3 4 Num. Infarti pi 1,000 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 -1 0 1 2 3 4 Num. Infarti 17 maggio 2008 20 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I graficamente… Prob. Cumulata: pi 1,000 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 F(x) = P(X≤ x) -1 0 1 2 Num. Infarti 3 4 1,2 1 Num. infarti ni pi F(x) 0 782 0,534 0,534 1 389 0,266 0,800 2 218 0,149 0,949 3 75 0,051 1,00 Totale 1464 1,000 0,8 0,6 0,4 0,2 0 0 17 maggio 2008 1 2 3 4 5 21 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I Distribuzione di probabilità continue 20 20 18 18 n→∞ d→0 16 16 14 14 ni 12 12 10 10 88 66 44 22 Area = 1 00 26 26 28 28 30 30 3232 3434 3636 38 38 40 40 Età Età 17 maggio 2008 22 / 23 Master in Neuropsicologia Clinica Elementi di Statistica I fa-b funzione di densità per X v.c. continua: 1. f(x) ≥ 0 2. Area = 1 3. Area (a-b) = P(a ≤ X ≤ b) 17 maggio 2008 23 / 23