I dati
Qualsiasi contenuto dell’esperienza.
Si definiscono grezzi i dati raccolti ma
non ordinati numericamente.
Esempio: l’insieme delle età dei soci dell’ordine alfabetico di un club
Una serie è un ordinamento di dati
numerici grezzi in ordine crescente o
decrescente di grandezza.
Misure
Il campo di variazione (range) di un
insieme di misure è la differenza tra
misura massima è quella minima.
Campo di variazione= Xmax-Xmin
Se l’ordinamento dei dati numerici è stato
effettuato in ordine crescente
Xmax e Xmin saranno rispettivamente la
prima e l’ultima della serie.
Se l’ordinamento è stato fatto in ordine
decrescente l’ordine di
Xmax-Xmin è invertito.
Distribuzione di frequenza
La distribuzione di frequenza
riassume il numero di volte in cui
ciascuna categoria della scala
compare all’interno di un insieme di
misure.
Parliamo di frequenza () in quanto
vogliamo contare quante volte
compare un evento
Distribuzione di frequenza
Le tabelle in cui schematizziamo
le distribuzioni di frequenza si
definiscono tabelle di frequenza.
Le tabelle si costruiscono
ordinando i nostri dati e
associandoci le relative
distribuzioni di frequenza
Tabelle di frequenza
Disporre i seguenti dati in una
serie ascendente e poi in una
distribuzione di frequenze:
1,40,
1,40,
1,40,
1,46,
1,43,
1,46,
1,40,
1,44,
1,50,
1,46,
1,48,
1,50,
1,51,
1,50,
1,50,
1,50,
1,53,
1,52,
1,43,
1,48,
1,46,
1,52,
1,46,
1,43,
1,50 ,
1,53,
1,44,
1,40.
Tabelle di frequenza
Costruiremo una tabella con tre colonne
(altezza, conteggio, frequenza). La prima
colonna (altezza) sarà formata da tutte le
categorie (unità) comprese nella parte della
scala di misura utilizzata. Dovremo quindi
identificare il valore più grande (Xmax) e
quello più piccolo (Xmin). Il simbolo xi
rappresenterà l’i-esima categoria della
variabile X (altezza). Nel nostro caso avremo
k=14 categorie tra xi=x1=1.40 e xk=1.53
Tabelle di frequenza
La seconda colonna (conteggio) sarà composta
dal numero di misure riscontrate in ogni
categoria. In pratica si conta quante volte
appare la categoria di interesse identificando
ogni ripetizione con un segno di conteggio in
corrispondenza della categoria.
Esistono diverse modalità di conteggio. Tra
le più usate ricordiamo le barrette verticali
Tabelle di frequenza
La terza colonna (frequenza) rappresenta il
riassunto del risultato del conteggio fatto
per ogni categoria.
i è una rappresentazione numerica della
frequenza in ogni categoria K.
Tabelle di frequenza
 rappresenta la somma delle frequenze nella
rispettiva colonna dalla prima alla k-esima
categoria. Simbolicamente si esprime:
K
14

=
=n
i
i
i=1
i=1
insieme delle misure
somma dei valori
campione
dimensione (n) del campione
Tabelle di frequenza
insieme delle misure
somma dei valori
K
i=Ni=1
popolazione
dimensione (N) della popolazione
Altezza in metri
Conteggio
Frequenza
i
1.40
IIII
5
1.41
0
1.42
0
1.43
III
3
1.44
II
2
1.45
1.46
0
IIII
1.47
1.48
0
II
1.49
1.50
2
0
IIII I
1.51
Simbolo di
sommatoria
5
6
1
1.52
II
2
1.53
II
2
28

segno di conteggio
Distribuzione di frequenze relative
Se parliamo di frequenza relativa
(o proporzionale) ci riferiamo alla
frequenza di una data categoria
divisa per la dimensione del
campione
i
n
Nel caso di una popolazione avremo
i
N
Distribuzione di frequenze relative
La % di ciascuna categoria è la %
della frequenza totale che troviamo
in quella categoria. Per calcolarci
le percentuali avremo
i
 n 
Nel caso di una popolazione avremo
i


N
Altezza in
metri
Frequenza
1.40
5
5/28=0.1786
1.41
0
0/28=0.0
0%
1.42
0
0%
1.43
3
0/28=0.0
3/28=0.1071
1.44
2
1.45
0
1.46
5
1.47
i
Frequenze relativa
i/n
2/28=0.0714
0/28=0.0
Percentuale
i/n 
17.86%
10.71%
7.14%
0%
17.86%
0
5/28=0.1786
0/28=0.0
1.48
2
2/28=0.0714
7.14%
1.49
0
1.50
6
0/28=0.0
6/28=0.2142
1.51
1
1.52
0%
0%
21.42%
3.57%
2
1/28=0.0357
2/28=0.0714
1.53
2
2/28=0.0714
7.14%

28
7.14%
Distribuzione cumulata
Una distribuzione di frequenze non
raggruppate può essere trasformata in
una distribuzione di frequenze cumulate.
Ciò avviene quando le frequenze vengono
cumulate (aggiunte al totale) dalla
categoria più piccola, xmin, alla categoria
più grande, xmax.
Distribuzioni cumulate “minore di”
Mostrano quanti valori di un insieme di
dati siano inferiori a qualsiasi valore
considerato. Se i miei dati sono
rappresentati da misure continue
(approssimate) la cumulazione va fino
all’estremo superiore dell’intervallo di
approssimazione di una categoria di
misura. Ad ogni estremo superiore la
cumulazione darà come risultato finale il
numero di misure del nostro campione
inferiori al valore estremo.
Distribuzioni cumulate “minore di”
Se i miei dati sono rappresentati da
misure discrete
(esatte: quindi non caratterizzate da un
intervallo di approssimazione)
la cumulazione va da categoria a
categoria
(da xmin a xmax)
indicando quanti valori siano inferiori al
valore stesso della categoria in esame.
Altezza in metri
Conteggio
Frequenza
i
1.40
IIII
5
1.41
0
1.42
0
1.43
III
3
1.44
II
2
1.45
1.46
0
IIII
1.47
1.48
0
II
1.49
1.50
1.51
5
2
0
IIII I
6
1
Distribuzioni cumulate “minore di”

Altezza in metri
Frequenza cumulata
Meno di 1.395
0
Meno di 1.405
5
Meno di 1.415
5
Meno di 1.425
5
Meno di 1.435
8
Meno di 1.445
10
Meno di 1.455
10
Meno di 1.465
15
Meno di 1.475
15
Meno di 1.485
17
Meno di 1.495
17
Meno di 1.505
23
Meno di 1.515
24
Meno di 1.525
26
Meno di 1.535
28
28
Distribuzioni cumulate “maggiore uguale”
Si ragiona in maniera opposta alle
distribuzioni di frequenze cumulate
“minore di”. La cumulazione va da
xmax a xmin considerando quanti valori
sono uguali o maggiori all’estremo
inferiore dell’intervallo di
approssimazione della categoria.
Distribuzioni cumulate “maggiore uguale”
Se desideriamo costruire una tabella
distribuzioni di frequenze cumulate
“maggiore uguale” dobbiamo porci la
seguente domanda:
“Considerato un dato valore, quanti
valori di un insieme di dati sono
uguali o maggiori di esso?”
Distribuzioni cumulate “maggiore uguale”

Altezza in metri
Frequenza cumulata
1.395 o più
28
1.405 o più
23
1.415 o più
23
1.425 o più
23
1.435 o più
20
1.445 o più
18
1.455 o più
18
1.465 o più
13
1.475 o più
13
1.485 o più
11
1.495 o più
11
1.505 o più
5
1.515 o più
4
1.525 o più
2
1.535 o più
0
28
Distribuzioni cumulate
Abbiamo descritto le due tipologie
più utilizzate nelle indagini
statistiche. Oltre alle distribuzioni di
frequenze cumulate “minore di” e
“maggiore uguale”, esistono altri tipi
di distribuzioni cumulate. (es.:
“minore uguale” o “maggiore di”).
Distribuzioni cumulate “minore di”
Altezza in metri
Frequenza
i
Frequenze relativa
i/n
Percentuale
i/n
Meno di 1.395
0
0/28= 0.00
0%
Meno di 1.405
5
5/28= 0.18
18%
Meno di 1.415
5
5/28= 0.18
18%
Meno di 1.425
5
5/28= 0.18
18%
Meno di 1.435
8
8/28= 0.29
29%
Meno di 1.445
10
10/28= 0.36
36%
Meno di 1.455
10
10/28= 0.36
36%
Meno di 1.465
15
15/28= 0.53
53%
Meno di 1.475
15
15/28= 0.53
53%
Meno di 1.485
17
17/28= 0.61
61%
Meno di 1.495
17
17/28= 0.61
61%
Meno di 1.505
23
23/28= 0.82
82%
Meno di 1.515
24
24/28= 0.86
86%
Meno di 1.525
26
26/28= 0.93
93%
Meno di 1.535
28
28/28= 1.00
100%
Scarica

I dati in statistica V lezione