QUANTILI Quantili Quantili Un quantile-p, dove p[0,1] è quel valore che divide una distribuzione statistica in p parti uguali, ognuna delle quali contiene la p-esima parte della numerosità della distribuzione totale E’ un numero più grande del 100 x p % dei valori osservati e più piccolo del restante 100 (1-p) %. Es. Un quantile di 0,1 deve essere un valore che lascia a sinistra il 10% delle osservazioni e a destra il rimanente 90% Quantili Se p= 4 Se p=10 Se p=100 Quartili: dividono la distribuzione in quattro parti uguali Decili: dividono la distribuzione in dieci parti uguali Percentili: dividono la distribuzione in cento parti uguali In generale si definisce -percentile quel valore a destra del quale cade (1- )% dei casi e a sinistra l’ % dei casi. (p=0,01, 0,02…..0,99) La mediana si può considerare il 2° quartile e il 50° percentile. Quartili Le quattro distribuzioni individuate dai quartili contengono ognuna il 25% della numerosità totale. Così il 1° quartile contiene il 25% e la distribuzione rimanente è il 75% del totale Il box plot Q3+1.5IR 3° quartile mediana 1° quartile Q1-1.5IR Il box plot è un grafico caratterizzato da tre elementi principali: 1. Una linea o un punto, che indicano la posizione del centro della distribuzione (mediana); 2. Un rettangolo (box) la cui altezza indica la variabilità dei valori “prossimi” alla media (IR= terzo quartile-primo quartile); 3. Due segmenti (baffi) che partono dai lati minori del rettangolo e che terminano in corrispondenza del più piccolo e del più grande valore non outlier. 4. Dei punti, detti outliers, che giacciono 1,5*IR al di sotto del primo quartile e 1,5*IR al di sopra del terzo quartile Asimmetria di una distribuzione Asimmetria negativa o a sx M Me Mo Asimmetria positiva o a dx Mo Me M Distribuzione simmetrica Mo= Me= M Indici di asimmetria 1. Indice assoluto sulla base dei quartili as (Q3 Me) Me Q1 0 as (Q3 Me) Me Q1 0 Indice relativo sulla base dei quartili as as* Q3 Q1 Poco sensibile Asimmetria positiva Asimmetria negativa Indice relativo sulla base degli Scostamenti Sd Ss as1* Sd Ss Più sensibile perché sfrutta tutte le osservazioni Indici di asimmetria di Pearson sk k M Mo 3 x M i ni i 1 N 3 L’indice β è più sensibile dell’indice sk perchè si basa sugli scarti dalla media >0 se Asimmetria positiva =0 simmetrica <0 se Asimmetria negativa