Statistica in classe
Educazione al pensiero statistico
dalla scuola primaria alle superiori
Gianfranco Arrigo
Dipartimento dell’istruzione e della cultura,
Laboratorio di didattica della matematica
Bellinzona (Svizzera)
• Introduzione
• Fase di preparazione
• Fase di
concettualizzazione
Introduzione
Lo scopo del mio intervento è di stimolare gli insegnanti
e chi si occupa di didattica della matematica ad
assumersi il compito di introdurre l'educazione al
pensiero statistico nella scuola (da quella dell’obbligo in
avanti) e di accentuarne la pratica in classe.
Introduzione
Le mie proposte si suddividono in due gruppi che
concernono due fasi distinte dell’azione didattica.
La prima fase, che chiamo di preparazione, prevede
una serie di attività di risoluzione di problemi avente lo
scopo di abituare l’allievo a ragionare in senso statistico
e di costruirsi un solido bagaglio di esperienza euristica,
che consentirà la fondazione della seconda fase.
Introduzione
La seconda fase, che definisco di generalizzazione, di
concettualizzazione e di prima formalizzazione si
fonda sulla prima e ha lo scopo di porre le basi
(elementari) essenziali di questa disciplina.
Questa fase trova posto principalmente nella scuola
superiore, anche se talune concettualizzazioni possono
essere raggiunte prima.
Educazione statistica
Costituisce, il coronamento del lavoro fatto nei campi
combinatorio e probabilistico. Fondamentalmente si
distinguono due aspetti statistici:
"descrittivo", altrimenti detto "di analisi esplorativa
dei dati", di tipo statico, basato sull'osservazione di dati
osservati;
"inferenziale", di tipo dinamico, consistente
nell'operare "stime statistiche", indissolubilmente
legate al concetto di "rischio assunto" (o, se si
preferisce, a quello di "grado di affidabilità scelto").
Educazione statistica
Troppo spesso, a scuola, ci si accontenta del primo
aspetto, che indubbiamente è più facile e non
abbisogna nemmeno del supporto probabilistico.
Questa scelta risulta però estremamente limitativa
dell'interesse della disciplina. La parte più stimolante è
quella inferenziale ed è proprio praticando situazioni di
inferenza statistica che l'allievo
riesce a capire
l'essenza del ragionamento probabilistico e statistico.
Il compito della scuola consiste nel preparare il
terreno all'apprendimento della statistica nei suoi
due aspetti descrittivo e inferenziale.
L'aspetto descrittivo
Il primo aspetto può essere costruito attorno alla
necessità di trovare caratteristiche rappresentative di
una popolazione.
Per esempio rispondere a domande del tipo:
- Sono più alti (statura) i greci o gli italiani?
- Sono più ricchi gli svizzeri o gli statunitensi?
- In agosto fa più caldo a Cortina o a San Moritz?
- Si guastano di più le Mercedes o le Fiat?
- (…)
L'aspetto descrittivo
L'allievo, in questa prima fase, va messo di fronte a
una molteplicità di dati numerici osservati.
Per gli alunni delle scuole elementari e medie, questo
fatto, costituisce, di solito, una novità (i problemi di
matematica normalmente prevedono pochi dati).
Occorre quindi abituare l'allievo ad affrontare queste
situazioni con consapevolezza delle difficoltà che
comportano.
L'aspetto descrittivo
Per esempio, calcolare la media aritmetica di due
numeri è operazione elementare; se i numeri sono tre o
quattro, non cambia granché; ma se i numeri sono
cinquanta o cento allora le cose mutano radicalmente.
Nessuno pretende che i calcoli si debbano eseguire "a
mano”: si usi pure la calcolatrice. Ma non si pensi che
sia semplice inserire venti, trenta o cinquanta dati in
una calcolatrice. Occorre organizzarsi per evitare che
la minima distrazione non obblighi a ricominciare da
capo.
L'aspetto descrittivo
Il computer può
facilitare
l'immissione di dati
sotto forma di
tabelle (con uno
scanner e un
programma OCR si
può trasportare un
elenco anche
lunghissimo di dati
in un foglio
elettronico, pronti
per l'elaborazione).
L'aspetto descrittivo
Il lavoro in classe dev'essere finalizzato all'accumulo di
esperienze attorno ai concetti di centralità ("valore
rappresentativo" o ”valore medio") e di dispersione
(grado di affidabilità o di fiducia del valore medio).
Opportune esperienze dovranno aiutare l'alunno a
vedere come valore rappresentativo non sempre la
media aritmetica, ma anche la mediana e in certi casi la
moda.
L'aspetto descrittivo
Circa il concetto di dispersione, il parametro più vicino
all'esperienza del neofita è lo scarto medio assoluto.
In statistica, per ragioni di opportunità teorica e tecnica,
si preferisce lo scarto tipo.
Dopo aver visto che le due misure concordano sempre,
si può adottare la seconda (scarto tipo), dal momento
che viene calcolata automaticamente dalle calcolatrici
e dai computer.
L'aspetto descrittivo
Non si dimentichino le situazioni che presentano un
numero elevato di dati osservati: esse portano a capire
la necessità di ordinare i dati, di suddividerli in classi e
di contare le frequenze (assolute) di ogni classe.
Quando poi si volessero confrontare due o più insiemi
di dati osservati di dimensione diversa, la necessità di
normare le frequenze assolute (e di giungere così alle
frequenze relative) balza evidente.
L'aspetto descrittivo: proposte didattiche
PROBLEMA 1: Lavaggio automatico per automobili
Una società possiede tre stazioni di lavaggio:
AUTOPULITA, AUTOBRILLANTE, AUTOLUCENTE.
Le tre stazioni offrono gli stessi 9 programmi (dal più
semplice indicato con la lettera A, al più raffinato
denominato con la lettera I). La differenza di costo da
un programma al successivo è sempre di 1,50 Fr.
L'aspetto descrittivo: proposte didattiche
tipo di
lavaggio
A
3 Fr
B
4,5 Fr
C
6 Fr
D
7,5 Fr
E
9 Fr
F
10,5 Fr
G
12 Fr
H
13,5 Fr
I
15 Fr
nume ro
lavaggi
150
552
1357
2808
4791
6064
6255
5250
2798
A.LUCENTE
A.BRILLANTE
A.PULITA
Ecco i dati relativi all'esercizio del mese scorso:
tipo di
lavaggio
A
3 Fr
B
4,5 Fr
C
6 Fr
D
7,5 Fr
E
9 Fr
F
10,5 Fr
G
12 Fr
H
13,5 Fr
I
15 Fr
nume ro
lavaggi
957
3204
4941
6010
7105
4652
3003
1460
397
tipo di
lavaggio
A
3 Fr
B
4,5 Fr
C
6 Fr
D
7,5 Fr
E
9 Fr
F
10,5 Fr
G
12 Fr
H
13,5 Fr
I
15 Fr
nume ro
lavaggi
1508
5526
6257
8966
4791
2064
1255
1250
798
L'aspetto descrittivo: proposte didattiche
Durante la riunione degli azionisti si cerca di stimare
quale delle tre stazioni ha avuto il maggior ricavo,
senza ricorrere al calcolo preciso dei tre importi.
«Visto che i prezzi sono uguali in tutte le stazioni» dice
Piero, responsabile di AUTOLUCENTE, «basta
calcolare il numero di lavaggi eseguito da ogni
stazione.»
È corretta, secondo te, la proposta di Piero?
L'aspetto descrittivo: proposte didattiche
Per meglio capire, si può ricorrere agli istogrammi (in ascissa: tipi
di lavaggio; in ordinata: numero lavaggi):
AUTOPULITA
7000
6000
5000
AUTOBRILLANTE
4000
3000
8000
2000
7000
1000
6000
5000
0
3
4,5
6
7,5
9
10,5
12
13,5
15
4000
3000
2000
AUTOLUCENTE
1000
10000
0
3
9000
8000
7000
6000
5000
4000
3000
2000
1000
0
3
4,5
6
7,5
9
10,5
12
13,5
15
4,5
6
7,5
9
10,5
12
13,5
15
L'aspetto descrittivo: proposte didattiche
Gli istogrammi mostrano come la situazione della
stazione AUTOPULITA sia interessante, anche se
presenta un numero inferiore di lavaggi eseguiti.
L’istogramma mostra un maggiore carico a destra. Ciò
significa che i clienti di AUTOPULITA preferiscono i
programmi di lavaggio più completi e di conseguenza
più cari; costituiscono, cioè, una buona clientela.
Mentre quelli di AUTOBRILLANTE si orientano sui
programmi medi…
…quelli di AUTOLUCENTE scelgono prevalentemente
i programmi di lavaggio più semplici e meno costosi.
L'aspetto descrittivo: proposte didattiche
Ma a Piero, il battagliero responsabile di AUTOLUCENTE, questi
discorsi non vanno, per cui si decide di calcolare i ricavi ottenuti da
ciascuna stazione.
A
B
C
D
E
F
G
H
I
3 Fr
4, 5 Fr
6 Fr
7, 5 Fr
9 Fr
10 , 5 Fr
1 2 Fr
13 , 5 Fr
1 5 Fr
150
552
1357
2808
4791
6064
6255
5250
2798
450
2484
8142
TOTALI
30025
326832 Fr
21 0 6 0 43 1 1 9 63 6 7 2 75 0 6 0 70 8 7 5 41 9 7 0
AUTOBRILLANTE
AUTOPULITA
A
B
C
D
E
F
G
H
I
3 Fr
4, 5 Fr
6 Fr
7, 5 Fr
9 Fr
10 , 5 Fr
1 2 Fr
13 , 5 Fr
1 5 Fr
957
3204
4941
6010
7105
4652
3003
1460
397
2871
14 4 1 8
29 6 4 6
45 0 7 5
63 9 4 5
48 8 4 6
36 0 3 6
19 7 1 0
5955
A
B
C
D
E
F
G
H
I
3 Fr
4, 5 Fr
6 Fr
7, 5 Fr
9 Fr
10 , 5 Fr
1 2 Fr
13 , 5 Fr
1 5 Fr
1508
5526
6257
8966
4791
2064
1255
1250
798
4524
24 8 6 7
37 5 4 2
67 2 4 5
43 1 1 9
21 6 7 2
15 0 6 0
16 8 7 5
11 9 7 0
TOTALI
31729
266502 Fr
TOTALI
32415
242874 Fr
AUTOLUCENTE
L'aspetto descrittivo: proposte didattiche
A questo punto Piero si pentì di aver insistito. Il ricavo
di AUTOPULITA è nettamente superiore a quelli delle
altre due stazioni.
Da ultimo ci si può porre la domanda: qual è il ricavo
medio per lavaggio ottenuto da ciascuna stazione?
Basta calcolare la media aritmetica dei ricavi:
x(AUTOPULITA )
326832
10, 89 Fr / lav
30025
x(AUTOBRILLANTE )
242874
x(AUTOLUCENTE )
7, 49 Fr / lav
32415
266502
8, 40 Fr / lav
31729
L'aspetto descrittivo: proposte didattiche
Conclusione
Se consideriamo la scala dei prezzi in ordine
crescente, possiamo dire che il valore centrale
(equidistante dagli estremi della scala), detto mediana,
è 9 Fr. L'unica stazione che vanta una media superiore
alla mediana è ancora una volta AUTOPULITA.
Siamo giunti alla fine di un primo itinerario statistico
che ci ha permesso di familiarizzarci con istogrammi,
con la media aritmetica e con la mediana: punti
importanti di partenza per qualunque discorso
statistico.
L'aspetto descrittivo: proposte didattiche
Problema 2: media aritmetica o mediana?
Ecco la lista completa dei salari (in Fr) che la ditta
GANCISA distribuisce ai propri dipendenti.
3000
3150
3300
3600
3650
3950
4500
4650
5250
5500
6550
7500
9950
15000
3000
3300
3650
3950
4500
4650
7500
15000
3300
4500
4500
L'aspetto descrittivo: proposte didattiche
3000
3150
3300
3600
3650
3950
4500
3000
3300
3300
3650
3950
4500
4500
4650
4650
5250
5500
6550
7500
7500
9950
15000 15000
4500
«Egregio Direttore, è
scandaloso che un dirigente
si permetta di dichiarare il
falso in pubblico…»
«Leggo sui quotidiani di oggi
che la GANCISA, secondo
lei, praticherebbe nei
confronti dei propri
dipendenti una politica dei
salari all'avanguardia.»
L'aspetto descrittivo: proposte didattiche
3000
3150
3300
3600
3650
3950
4500
3000
3300
3300
3650
3950
4500
4500
4650
4650
5250
5500
6550
7500
7500
9950
15000 15000
4500
«L'ho detto e lo confermo: il
salario medio di un
dipendente della nostra ditta
(cioè la media aritmetica dei
salari) è di 5496.- Fr…»
«…cioè maggiore di 500 Fr
rispetto alla media nazionale
che, per una impresa mediopiccola come la nostra, si
situa attorno ai 5000.- Fr
mensili, come lei sa meglio di
me.»
L'aspetto descrittivo: proposte didattiche
3000
3150
3300
3600
3650
3950
4500
3000
3300
3650
3950
4500
4650
4650
5250
5500
6550
7500
7500
9950
15000 15000
3300
4500
4500
«Spiacente di contraddirla, ma
il salario medio mensile di un
dipendente della GANCISA,
cioè il valore centrale, la
mediana, se posso
permettermi di usare un
concetto statistico … è di
miseri 4500.- Fr, ben 500.- Fr
al di sotto della media.»
L'aspetto descrittivo: proposte didattiche
Chi dei due
personaggi
ha ragione?
La domanda è
pertinente?
4500 Fr
5496 Fr
L'aspetto descrittivo: proposte didattiche
Problema 3: sulla moda
In una località della Svizzera
centrale è stata fatta un'inchiesta
relativa all'ora di chiusura degli
esercizi pubblici (la cosiddetta
"Polizeistunde").
Ecco, sulla destra, i risultati
organizzati in una tabella:
Apenblick
Bahnhof
Bauernhof
Cafeteria
Edelweiss
Frauenverein
Go go Bar
Helvetia
Kulm
Metzger
Post
Schweizerhof
Seegarten
Sonne
Sporthotel
Steinbock
Stern
Tea Room
Walliser Keller
Weisses Kreuz
Zentral
23.00
23.00
23.00
19.00
22.00
18.00
02.00
23.00
23.00
23.00
22.00
23.00
23.00
23.00
22.00
23.00
23.00
17.00
23.00
19.00
23.00
L'aspetto descrittivo: proposte didattiche
Un vostro amico vi chiede a che
ora è fissata di regola la chiusura
serale degli esercizi pubblici in
quella località.
Che cosa rispondete?
La media aritmetica degli orari
di chiusura è 22.06.
Sarebbe utile all’amico questa
informazione?
Apenblick
Bahnhof
Bauernhof
Cafeteria
Edelweiss
Frauenverein
Go go Bar
Helvetia
Kulm
Metzger
Post
Schweizerhof
Seegarten
Sonne
Sporthotel
Steinbock
Stern
Tea Room
Walliser Keller
Weisses Kreuz
Zentral
23.00
23.00
23.00
19.00
22.00
18.00
02.00
23.00
23.00
23.00
22.00
23.00
23.00
23.00
22.00
23.00
23.00
17.00
23.00
19.00
23.00
L'aspetto descrittivo: proposte didattiche
In realtà vi sono 6 orari di chiusura:
17.00, 18.00, 19.00, 22.00, 23.00,
02.00
Può essere utile considerare il loro
istogramma delle frequenze
assolute.
Apenblick
Bahnhof
Bauernhof
Cafeteria
Edelweiss
Frauenverein
Go go Bar
Helvetia
Kulm
Metzger
Post
Schweizerhof
Seegarten
Sonne
Sporthotel
Steinbock
Stern
Tea Room
Walliser Keller
Weisses Kreuz
Zentral
23.00
23.00
23.00
19.00
22.00
18.00
02.00
23.00
23.00
23.00
22.00
23.00
23.00
23.00
22.00
23.00
23.00
17.00
23.00
19.00
23.00
L'aspetto descrittivo: proposte didattiche
L’orario di chiusura
23.00 è nettamente il
più frequente:gli altri
orari possono essere
considerati eccezioni.
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
17.00
18.00
19.00
22.00
23.00
02.00
Al nostro amico
possiamo dire che, di
regola, la chiusura è
fissata alle 23.00.
Il valore più frequente di un insieme di dati osservati si
dice moda. Può essere usato come valore medio,
quando la sua frequenza è nettamente la più elevata.
L'aspetto descrittivo: proposte didattiche
Problema 4: quando la media non basta…
La stazione di Crestalunga contende i turisti alla rivale
Cimabianca, posta sull’altro versante di una magnifica
vallata alpina. La lotta per attirare gli sciatori è
particolarmente intensa nel mese di gennaio…
Venite in gennaio a sciare a
Crestalunga: troverete neve
bellissima, tanto sole e una
temperatura media di –1
grado, ideale per la pratica
del vostro sport preferito!
Sciate in gennaio a
Cimabianca: avrete ottima
neve, sole e una temperatura
media giornaliera di –1
grado, ideale per la pratica
dello sci!
L'aspetto descrittivo: proposte didattiche
Temperature medie giornaliere del mese di gennaio a
Crestalunga (dal primo al 31 gennaio dello scorso anno):
3 –2 –3 –1 –5
2
5
6
0
8
5
3
0 –6 –9 –12 –12 –10 –6 –2
–1
0
5
6
6
3
0 –3 –4 –5
–2
Temperature medie giornaliere del mese di gennaio a
Cimabianca (dal primo al 31 gennaio dello scorso anno):
–1
0 –2 –1
0 –3
0 –2 –1 –2
–3 –1 –1 –2 –2 –3 –2 –2 –1
1
0
0
0
2
2
1 –3
1 –2 –2
–2
L'aspetto descrittivo: proposte didattiche
Un semplice calcolo mostra che la media aritmetica
delle temperature medie giornaliere è di –1 grado in
tutte e due le stazioni.
Si può dire che la temperatura in gennaio nelle due
stazioni sia molto simile?
Dovendo condurre una classe di bambini o un
gruppo di anziani per una settimana sciistica, quale
delle due stazioni si farebbe preferire, dal punto di
vista della variazione della temperatura?
L'aspetto descrittivo: proposte didattiche
8
6
4
2
31
28
25
22
19
16
13
7
10
-2
4
1
0
Crestalun ga
Cima bian ca
-4
-6
-8
-10
-12
Il grafico cartesiano mostra chiaramente che le
temperature a Crestalunga subiscono variazioni più
consistenti.
L'aspetto descrittivo: proposte didattiche
12
10
8
del taCresta
6
del taCima
4
2
28
25
22
19
16
13
10
7
4
1
0
L'osservazione è confermata se si osserva il grafico
delle differenze assolute di ciascun valore rispetto
alla media (chiamate delta), di ogni stazione.
L'aspetto descrittivo: proposte didattiche
Differenze assolute nella scuola elementare o
media?
In realtà non costituiscono alcuna difficoltà per i
giovani allievi, i quali, senza farsi troppi problemi, nel
calcolare le differenze fra i numeri di una coppia,
non esitano a sottrarre sempre il minore dal
maggiore.
La differenza assoluta è un concetto che fa parte
dell’apprendimento sommerso: peccato non
sfruttarlo.
L'aspetto descrittivo: proposte didattiche
Ci si chiede: è possibile trovare una misura
della variazione della temperatura nelle due
stazioni?
La soluzione più coerente con quanto fatto
finora consiste nel calcolare, per ciascuna
stazione, la media aritmetica delle
differenze assolute.
L'aspetto descrittivo: proposte didattiche
In statistica: la differenza assoluta si
chiama scarto assoluto e la media delle
differenze assolute si chiama scarto
assoluto medio.
Lo scarto assoluto medio è la prima
misura di dispersione che l’allievo incontra.
L'aspetto descrittivo: proposte didattiche
In statistica la dipersione viene misurata per mezzo
dello scarto tipo .
È molto simile allo scarto assoluto medio, solo che,
invece delle differenze assolute, si prendono i
quadrati delle differenze (tra la media e ciascun
valore).
Si calcola poi la media dei quadrati delle differenze.
x1 x x2 x
2
2
xn x
2
n
E infine si estrae la radice quadrata del tutto.
L'aspetto descrittivo: proposte didattiche
Per i puristi, ecco la formula finale…
x1 x x2 x
2
2
xn x
2
n
Perché
…che non
in statistica,
fa paura soprattutto
se la si è vista
per nascere
ragioni
teoriche,
come alternativa
si usa lo allo
scarto
scarto
tipo.assoluto
Il vantaggio
medio.
è
che calcolatrici e computer lo calcolano
automaticamente.
Perché non limitarsi allo scarto assoluto
medio?
L'aspetto descrittivo: proposte didattiche
Come si interpreta la dispersione? Come
faccio a sapere se una certa dispersione è
c’è nessun criterio particolare.
tanta oNon
poca?
A scuola l’esperienza viene acquisita
affrontando situazioni diverse.
L’uso più semplice consiste nel confrontare
le dispersioni di due diverse popolazioni.
Per l’interpretazione di una singola
dispersione, ci si basa solitamente
sull’esperienza.
L'aspetto descrittivo: proposte didattiche
Problema 5: una questione di dispersione
Una squadra di basket sta vagliando l’acquisto di un
pivot straniero.
I tre candidati sono tutti ottimi giocatori, ovviamente,
ma il presidente desidera acquistare il giocatore che
ha maggior continuità di rendimento.
Si è procurato le tabelle relative ai punti messi a
segno dai tre campioni nelle ultime 25 gare ufficiali
alle quali hanno preso parte come titolari.
L'aspetto
descrittivo:
proposte didattiche
Punti marcati Punti marcati Punti marcati
da Jim
da Jeff
da John
20
18
15
17
16
18
28
31
24
16
15
10
12
12
11
12
10
13
15
16
15
18
20
21
22
20
14
7
25
31
12
14
8
31
28
4
22
10
16
32
15
14
22
4
9
13
21
22
17
14
16
14
18
18
14
15
27
19
18
17
18
18
16
25
10
12
16
15
17
18
16
18
19
15
16
L'aspetto descrittivo: proposte didattiche
Dopo attento esame, e qualche calcolo, il presidente non
ha dubbi: prende il telefono e chiama l'allenatore.
«Pronto?» risponde costui.
«Sono il presidente, buongiorno. Le comunico che ho
deciso di ingaggiare per la prossima stagione…tu-tu-tu…»
Proprio nell’istante in cui sta per pronunciare il nome del
prescelto, la linea cade.
Chi sarà stato scelto?
L'aspetto descrittivo: proposte didattiche
Il giocatore che vanta la maggior continuità di
rendimento è colui che denota risultati più raccolti
attorno alla media, cioè quelli con il minore scarto
assoluto medio.
Ecco i risultati:
scarto medio ass.
scarto tipo
Il prescelto è
Jim
Jeff
John
4.00
5.18
6.72
8.04
2.32
3.39
L'aspetto descrittivo: proposte didattiche
Ovviamente…
John!!!
Egli ha il minore scarto assoluto medio (2.32) e anche
il minor scarto tipo (3.39).
L'aspetto descrittivo: proposte didattiche
Problema 6: quando i dati sono tanti…
In una fabbrica si dispone dei dati relativi alla
produzione di un determinato articolo durante 125
giorni lavorativi consecutivi.
Si vorrebbe stabilire un valore medio della
produzione giornaliera e un valore di dispersione
(attorno alla media).
Per affrontare questo problema ci vuole un
computer: basta un foglio elettronico.
I dati sono riportati nella seguente tabella
L'aspetto descrittivo: proposte didattiche
774
887
887
614
903
611
861
507
794
953
836
890
938
856
901
807
734
679
620
692
751
789
895
932
933
830
862
808
635
740
677
572
998
949
986
897
888
859
525
907
555
708
770
785
774
982
910
999
536
898
607
646
998
843
988
898
593
936
985
859
797
541
628
594
826
770
590
840
881
985
600
882
691
507
839
946
914
816
850
812
878
724
631
534
814
655
657
920
848
823
914
643
875
815
937
764
938
642
879
736
647
677
629
880
933
Ecco una prima vera situazione statistica:
125 dati da elaborare. Non c’è che dire…
910
933
906
679
717
673
921
664
680
860
851
880
774
935
703
695
756
703
714
664
L'aspetto descrittivo: proposte didattiche
La prima idea è di ricorrere a una rappresentazione
grafica. Il computer esegue in un attimo, ma l'effetto
è deludente: l'istogramma che appare qui sotto
assomiglia a una foresta caotica e non ci aiuta.
L'aspetto descrittivo: proposte didattiche
Una buona idea suggerisce di ordinare i dati. Il
computer lo fa subito, ed ecco il nuovo grafico.
L'aspetto descrittivo: proposte didattiche
Il grafico mostra come i dati ordinati tendano
a riunirsi a piccoli gruppi.
Nasce così l'idea di suddividerli in classi. Il
rango (cioè la lunghezza dell'intervallo che
va dal dato minimo a quello massimo) si
divide per il numero di classi che si vogliono
ottenere. Il risultato dà l'ampiezza comune
delle classi.
Una buona approssimazione del numero di
classi è dato da n , con n numero di dati
osservati.
L'aspetto descrittivo: proposte didattiche
Decidiamo di formare 11 classi. Ampiezza:
900 - 507 :11 35,73
Ecco le classi, i loro estremi, le loro frequenze assolute
e i loro valori centrali (o centri):
classe 1
classe 2
classe 3
classe 4
classe 5
classe 6
classe 7
classe 8
classe 9
classe 10
classe 11
da
da
da
da
da
da
da
da
da
da
da
507.00
551.73
596.46
641.19
685.91
730.64
775.37
820.10
864.83
909.57
954.28
a 551.73
a 596.46
a 641.19
a 685.91
a 730.64
a 775.37
a 820.10
a 864.83
a 909.57
a 954.28
a 999.00
f. a.
f. a.
f. a.
f. a.
f. a.
f. a.
f. a.
f. a.
f. a.
f. a.
f. a.
6
5
9
14
9
11
10
16
19
18
8
centro
centro
centro
centro
centro
centro
centro
centro
centro
centro
centro
529.37
574.10
618.83
663.55
708.28
753.01
797.74
842.47
887.20
931.93
976.64
L'aspetto descrittivo: proposte didattiche
E finalmente, l’istogramma delle frequenze
assolute…
20
18
16
14
12
10
8
6
4
2
classe 11
classe 10
classe 9
classe 8
classe 7
classe 6
classe 5
classe 4
classe 3
classe 2
classe 1
0
L'aspetto descrittivo: proposte didattiche
La media può essere calcolata sulla base dei centri
e delle frequenze assolute delle classi.
x
6 529,37 5 574,10 18 931,93 8 976,64
787,72
125
E analogamente si può calcolare la misura della
dispersione (in questo caso usiamo lo scarto tipo).
6 529,37 787,72 8 976,64 787,72
2
2
125
43,20
L'aspetto descrittivo: proposte didattiche
Problema 7: l’importanza delle frequenze relative
BUONGAL e IPERPOLLO sono due note marche
produttrici di polli in batteria.
Un’associazione di consumatori ha eseguito dei
controlli riguardanti il peso dei prodotti.
Si sono pesati 70 polli BUONGAL e 55 polli
IPERPOLLO. Di seguito i risultati in grammi:
L'aspetto descrittivo: proposte didattiche
Polli BUONGAL (dati ordinati)
871
951
1022
1058
1093
1192
1263
1296
871
997
1026
1058
1107
1192
1264
1300
892
998
1029
1061
1109
1196
1271
1303
905
999
1031
1069
1136
1198
1281
1303
910
1002
1034
1073
1149
1200
1281
1310
915
1003
1034
1087
1156
1208
1282
1317
922
1003
1037
1088
1188
1228
1292
1320
941
1004
1046
1088
1189
1229
1295
949
1005
1054
1090
1191
1262
1296
921
1075
1170
1233
1238
1270
927
1107
1174
1233
1238
1272
935
1116
1175
1233
1250
1273
993
1120
1182
1233
1252
1281
1008
1121
1228
1234
1260
1283
Polli IPERPOLLO (dati ordinati)
808
1009
1142
1228
1234
1261
1300
810
1009
1153
1230
1235
1267
813
1059
1167
1231
1235
1268
917
1068
1168
1233
1236
1269
L'aspetto descrittivo: proposte didattiche
Il responsabile dell'associazione deve redigere un
articolo per informare adeguatamente il pubblico sul
peso di questi prodotti, poichè essi sono venduti al
pezzo e allo stesso prezzo unitario.
Come si deve orientare?
Per farsene un'idea precisa, basta suddividere i dati in
classi (formiamo 8 classi per ciascun insieme di dati) e
confrontare i grafici delle frequenze.
L'aspetto descrittivo: proposte didattiche
Siccome i due campioni di polli esaminati hanno
dimensioni diverse (70 e 55), affinché il confronto abbia
senso, occorre calcolare le frequenze relative, cioè i
rapporti fra le assolute e la dimensione del campione
corrispondente.
fa : frequenza assoluta
fr : frequenza relativa
n : dim ensione del campione
fa
fr
n