Master in Neuropsicologia Clinica Elementi di Statistica I Repetita iuvant • Rappresentazioni grafiche var. qualitative (barre, torta) • Sintesi di variabili quantitative: – Min, max – Media, proprietà: • Internalità • Baricentro • Linearità • Minimizzazione somma quadrati scarti i (xi – )2 i (xi – )2 per qualsiasi – Media ponderata 19 aprile 2008 1 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I Variabilità per variabili quantitative 1. campo di variazione: max(Xi) – min(Xi) 2. scarto interquartile: a) quartili: 19 aprile 2008 mediana quartili → → Q1 → valore associato all’unità ordinata che viene dopo il primo 25% Q2 → valore associato all’unità ordinata che viene dopo il primo 50% (Mediana!!!) 2 parti uguali 4 parti uguali 2 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I Q3 → valore associato all’unità ordinata che viene dopo il primo 75% Q4 → valore associato all’unità ordinata che viene dopo il primo 100% (Max!!!) in pratica: I. si ordinano le unità II. si individuano le unità portatrici di Q1 e Q3: i. Q1 = x((n+1)/4) ii. Q3 = x((n+1)3/4) N.b. il quartile, come la mediana, non è la posizione bensì la modalità associata alla posizione! 19 aprile 2008 3 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I III. se le posizioni non sono un numero intero? i. si considera la parte intera separata da quella decimale: Es.: n = 29 → (n + 1)/4 = 30/4 = 7,5 → parte intera c1 = [(n + 1)/4] 7 parte decimale d1 = (n + 1)/4 – [(n + 1)/4] → 0,5 Q1 = x(c1) + d1(x(c1+1) – x(c1)) = = x(7) + 0,5(x(8) – x(7)) = 18 Totale 19 aprile 2008 Età ni fi Ni Fi 18 10 0,345 10 0,345 19 3 0,104 13 0,449 20 7 0,241 20 0,690 21 9 0,310 29 1,000 29 1,000 4 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I → (n + 1)3/4 = 90/4 = 22,5 parte intera c3 → 22 parte decimale d3 → 0,5 Q3 = x(c3) + d3(x(c3+1) – x(c3)) = = x(22) + 0,5(x(23) – x(22)) = 21 Totale 19 aprile 2008 Età ni fi Ni Fi 18 10 0,345 10 0,345 19 3 0,104 13 0,449 20 7 0,241 20 0,690 21 9 0,310 29 1,000 29 1,000 5 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I b) scarto interquartile: Q = Q3 – Q1 osservazioni: – lo scarto interquartile individua il range del 50% della distribuzione centrata sulla mediana (il secondo quartile…) u.s. modalità (posizione) 2 3 4 … … 4 8 14 … … 26 18 18 18 … … 20 20 20 … (1) (2) (3) … …(14) (15) (16)… 25% … 21 Q2 Q3 18 20 21 25% 29 21 … (27) (28) Q1 25% 27 21 (29) 25% 50% 19 aprile 2008 – maggiore è Q, maggiore sarà la dispersione 6 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I scarto quadratico medio σ: 3. scarto: (xi – μ) n xi quadratico: 2 i 1 n n xi medio: 2 i (xi – )2 i (xi – )2 per qualsiasi i 1 nn n xi x i 1 n 19 19,5 18 19,5 18 19,5 2 2 19 aprile 2008 2 29 2 ... 21 19,5 2 1, 25 7 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I osservazioni: − è nella stessa unità di misura dei dati (dipende dall’ordine di grandezza) circa il 70% dei valori osservati dovrebbe cadere nell’intervallo μ ± σ σ≥0 σ = 0 → omogeneità n x i 1 2 i n __ 2 x 2 __ 2 x 2 382, 482 380,913 1, 25 − se si hanno le distribuzioni di frequenze lo sqm diventa: n 19 aprile 2008 2 xi x ni i 1 n n 2 xi x fi i 1 8 / 17 Master in Neuropsicologia Clinica 4. Elementi di Statistica I varianza σ2: quadrato dello sqm… n 2 xi x 2 i 1 n osservazioni: non è nella stessa unità di misura dei dati bensì il suo quadrato (dipende dall’ordine di grandezza) σ2 ≥ 0 σ2 = 0__ omogeneità 2 x2 2 poco informativa nell’analisi monovariata se si hanno le distribuzioni di frequenze : n 2 19 aprile 2008 2 x x ni i i 1 n n 2 xi x fi i 1 9 / 17 Master in Neuropsicologia Clinica n 2 xi x i 1 n Elementi di Statistica I 2 19 19,5 18 19,5 18 19,5 2 2 2 ... 21 19,5 2 29 sigarette/h ni Età ni 1 6 18 10 2 15 19 3 3 5 20 7 4 3 21 9 totale 29 Totale 1,56 29 qual è la variabile che presenta maggiore variabilità? σetà = 1,249 19 aprile 2008 σsig = 10 / 17 Master in Neuropsicologia Clinica ni xini xi2 xi2ni 1 6 6 1 6 2 15 30 4 60 3 5 15 9 45 4 3 12 16 48 29 63 159 2,172 5,483 sigarette/h Tot Media Elementi di Statistica I σ 0,875 __ 2 x x2 m x i i i 1 n m __ 2 x σetà = 1,249 xn 2 x i ni i 1 n σsig = 0,875 ordini di grandezza differenti, unità di misura diverse, appartenenza a gruppi di numerosità differente… → confronto? 19 aprile 2008 11 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I coefficiente di variazione (CV): X CVX → numero puro! 19 aprile 2008 sig/h Età 18 180 σ 0,875 1,249 18 180 Media 2,172 19,517 20 200 CV 0,403 0,064 21 210 22 220 17 170 15 150 σ 2,429972 24,29972 σ2 5,904764 590,4764 12 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I Raggruppamento in classi Esigenze di sintesi rendono oneroso e di poca rilevanza elencare tutte le modalità con rispettive frequenze modalità → intervalli di valori → classi Es.: • • • • 19 aprile 2008 u.s.: paziente variabile: età unità di misura: anni numerosità gruppo: 1738 13 / 17 15 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 89 91 92 94 95 96 97 99 Master in Neuropsicologia Clinica ni 19 aprile 2008 Elementi di Statistica I età ni 15 1 17 7 18 18 19 18 … … 97 1 99 1 Totale 1738 70 60 50 40 30 20 10 0 Età 14 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I classe: intervallo di valori entro il quale si distribuiscono le osservazioni • procedura (semplificata): – si determina il range: r = max – min – si sceglie il numero di classi = k – si divide il range (r* un po’ più ampio di quello calcolato) per il numero di classi → si ottiene l’ampiezza di ogni classe d – 1° classe: inf < min sup = est. inf. + d 2° classe: inf. = sup.1° + 1 sup. = est. inf. + d ecc... 19 aprile 2008 15 / 17 Master in Neuropsicologia Clinica • • • • • • • • Elementi di Statistica I min=15 max=99 r=84 k=4 r*=88 d=r*/k=22 1° classe : inf = 14 2° classe : inf = 36+1=37 → → sup = 14+22=36 sup = 37+22=59 Classi di Età 19 aprile 2008 inf sup 14 36 37 59 60 82 83 105 16 / 17 Master in Neuropsicologia Clinica Elementi di Statistica I → distribuzione di frequenze per le classi... Classi di età ni fi Ni Fi 14-36 571 0,328 571 0,328 37-59 821 0,472 1392 0,800 60-82 333 0,192 1725 0,992 83-105 13 0,008 1738 1,000 Totale 1738 1,000 osservazioni: • è più conveniente considerare ampiezze costanti • da tale distribuzione non è possibile identificare la reale distribuzione originaria… 19 aprile 2008 17 / 17