Indici di dispersione
Quantili: sono misure di posizione non centrale che dividono la serie
ordinata di dati in un certo numero di parti di uguale numerosità.
Percentili: sono misure di posizione che dividono la serie ordinata
dei dati in 100 parti di uguale numerosità.
Il p-esimo percentile di una distribuzione è quel valore con p% dei
valori inferiori ad esso.
Quartili: dividono la serie ordinata in 4 parti uguali. Sono il 25esimo
(=1° quartile), il 50esimo (= 2°quartile) e il 75esimo (3°quartile) percentile
L’intervallo tra il 25esimo e il 75esimo percentile si chiama distanza
interquartile.
Mediana: divide la serie ordinata in due parti di uguale numerosità
(50esimo percentile = 2°quartile)
Box plot
Strumento comunemente utilizzato nella statistica descrittiva per
la rappresentazione grafica della distribuzione dei dati.
( t ha-1)
Braccio superiore (=C)
3°quartile
mediana
B
Braccio inferiore (=A)
C
B
1°quartile
A
outlier
Box plot
- Rappresentazione grafica della distribuzione dei dati.
(per data set sufficientemente numerosi)
- Rettangolo su piano cartesiano costituito da un
rettangolo i cui estremi sono il 1° e il 3° quartile.
- Sull’asse delle ordinate (y) sono riportati in scala i
valori assunti dalla variabile in esame
esempio: valori di produzione mais (t ha-1)
Box plot
- I quartili sono misure di posizione che dividono la serie
di dati in 4 parti di uguale numerosità (= 25%).
il 1° quartile è il valore assunto dalla variabile al quale la frequenza
cumulata è il 25% (cioè, il 25% dei dati assume un valore ≤ al 1° quartile)
il 3° quartile è il valore assunto dalla variabile al quale la frequenza
cumulata è il 75% (cioè, il 75% dei dati assume un valore ≤ al 3° quartile)
- Il rettangolo è tagliato da una linea che rappresenta la
mediana (2°quartile) a cui corrisponde la frequenza
cumulata pari al 50%.
.
Box plot
I bracci (= baffi) :
Il braccio inferiore rappresenta la distanza (A) tra il valore minimo della serie di dati
e il 1° quartile.
B è la distanza interquartile tra il 1° e il 3° quartile.
Il braccio può avere una lunghezza massima pari a 1.5 x B.
Se tale distanza A è maggiore di 1.5 x B, il valore minimo viene posto nel grafico
fuori dal braccio (rappresentato come un dato outlier).
Se il valore del 1°quartile è anche il valore minimo dei dati, il braccio non è
rappresentato
Dati outliers:
Se un dato ha un valore inferiore rispetto al valore del 1°quartile diminuito di un valore
compreso tra 1.5 e 3 moltiplicato per B, allora il valore è rappresentato con un pallino.
*
Se un dato ha un valore inferiore rispetto al valore del 1°quartile diminuito di un valore
maggiore di 3 moltiplicato per B, allora il valore è rappresentato con un asterisco.
Box plot
I bracci (= baffi) :
Il braccio superiore rappresenta la distanza (C) tra il valore massimo della serie
di dati e il 3° quartile.
B è la distanza interquartile tra il 1° e il 3° quartile.
Il braccio può avere una lunghezza massima pari a 1.5 x B.
Se la distanza C è maggiore di 1.5 x B, il valore massimo viene posto nel grafico
fuori dal braccio (rappresentato come un dato outlier).
Se il valore del 3°quartile è anche il valore massimo dei dati, Il braccio non è
rappresentato
Dati outliers:
Se un dato ha un valore superiore al valore del 3°quartile sommato ad un valore compreso
tra 1.5 e 3 moltiplicato per B, allora il valore è rappresentato con un pallino.
*
Se un dato ha un valore superiore al valore del 3°quartile sommato ad un valore maggiore di
3 moltiplicato per B, allora il valore è rappresentato con un asterisco.
Scarica

Presentazione