Tabelle di frequenza Disporre i seguenti dati in una serie ascendente e poi in una distribuzione di frequenze: 1,40, 1,40, 1,40, 1,46, 1,43, 1,46, 1,40, 1,44, 1,50, 1,46, 1,48, 1,50, 1,51, 1,50, 1,50, 1,50, 1,53, 1,52, 1,43, 1,48, 1,46, 1,52, 1,46, 1,43, 1,50 , 1,53, 1,44, 1,40. Altezza in metri Frequenza 1.40 5 5/28=0.1786 1.41 0 0/28=0.0 0% 1.42 0 0% 1.43 3 0/28=0.0 3/28=0.1071 1.44 2 1.45 0 1.46 5 1.47 i Frequenze relativa i/n 2/28=0.0714 0/28=0.0 Percentuale i/n 17.86% 10.71% 7.14% 0% 17.86% 0 5/28=0.1786 0/28=0.0 1.48 2 2/28=0.0714 7.14% 1.49 0 1.50 6 0/28=0.0 6/28=0.2142 1.51 1 1.52 0% 0% 21.42% 3.57% 2 1/28=0.0357 2/28=0.0714 1.53 2 2/28=0.0714 7.14% 28 7.14% Distribuzione di frequenze raggruppate Può succedere che risulta più conveniente “raggruppare” le distribuzioni di frequenza. Questo raggruppamento viene fatto riunendo i valori sulla scala di misura riunendoli in gruppi della stessa unità. I gruppi si chiamano classe e la rappresentazione intervallo di classe. Distribuzione di frequenze raggruppate Le tabelle contenenti i gruppi (le classi) saranno formate da diverse colonne corrispondenti agli intervalli di classe, limiti della classe, estremi della classe, valore centrale della classe, conteggio e frequenza. Distribuzione di frequenze raggruppate I limiti della classe sono la misura minima di una classe (limite inferiore della classe) e la misura massima di una classe (limite superiore della classe) e definiscono l’intervallo della classe. Distribuzione di frequenze raggruppate Gli estremi (o confini) della classe rappresentano l’intervallo di approssimazione della classe. Il calcolo dei confini serve a rendere contigue le classi. Possiamo calcolare la misura dell’estremo inferiore di una classe e la misura dell’estremo superiore di una classe considerando il limite superiore di una classe e il limite inferiore della classe successiva. Opereremo come segue 141+142 =141.5 2 Distribuzione di frequenze raggruppate Il valore centrale della classe è il punto medio (centro esatto) della classe. Possiamo ottenere questo valore dividendo per due il risultato della somma del limite inferiore e il limite superiore della classe di interesse =143 mi= 142+144 2 Altezza in metri Limiti inferiorisuperiori della classe Estremi inferiorisuperiori della classe Valore centrale della classe mi (min) Conteggio i 1.39-1.41 1.39-1.41 1.385-1.415 1.40 IIII 5 1.42-1.44 1.42-1.44 1.415-1.445 1.43 IIII 5 1.45-1.47 1.45-1.47 1.445-1.475 1.46 IIII 5 1.48-1.50 1.48-1.50 1.475-1.505 1.49 IIII III 8 1.51-1.53 1.51-1.53 1.505-1.535 1.52 IIII 5 28 Le colonne del conteggio e frequenza sono essenzialmente le stesse delle distribuzioni di frequenze non raggruppate ma rappresentano il numero di misure di ciascuna classe piuttosto che ciascun livello. Distribuzione di frequenze raggruppate L’ampiezza della classe è il numero di livelli che formano una data classe. Possiamo ottenere questo valore dal risultato della differenza tra il limite inferiore (o superiore) di una classe il limite inferiore (o superiore) della classe successiva 144-141=3 Ci sono tabelle costituite da classi di ampiezze uniformi. In questo caso oltre al metodo appena descritto possiamo calcolare l’ampiezza utilizzando Mi Distribuzione di frequenze raggruppate Anche in questo caso è possibile calcolare il valore delle frequenze relative, e delle corrispondenti % di frequenze relative. i N Nel caso di una popolazione avremo i N La % verrà calcolata i n i N Trasformazione di distribuzione di frequenze non raggruppate in raggruppate: principali regole. • • • • Usare non meno di 5 classi e non più di 20 Se possibile usare classi equi-ampie Le ampiezze delle classi possono essere numeri pari o dispari, ma è preferibile un numero dispari in modo che il valore centrale della classe sia una delle unità della scala di misura. Nel caso in cui le ampiezze delle classi siano uniformi bisogna accertarsi che (campo di variazione) < numero delle classi usate * ampiezza delle classi • • Bisogna che la classe con il limite inferiore minimo includa xmin e che la classe con il limite superiore massimo includa xmax Più grande è il campione (o la popolazione) maggiori sarà il numero di classi da utilizzare Classi aperte Vengono utilizzate nei casi in cui si lavora con misure molto grandi o molto piccole, lontane dal punto in cui si concentrano la maggior parte dei dati. Presentano un solo limite della classe, il limite inferiore o il limite superiore. Qualsiasi distribuzione raggruppata abbia una classe aperta a uno od entrambi gli estremi viene definita distribuzione raggruppata aperta. Classi aperte Esempio di distribuzioni raggruppate di classi aperte Altezza (metri) Alunni della scuola media a.s. 2002/2003 meno di 1.40 106 1.41-1.45 168 1.46-1.50 120 1.51-1.55 56 1.56-1.60 23 Oltre 1.61 12 Ha un limite superiore della classe (1.39) ma non ha un limite inferiore Ha un limite inferiore della classe (1.61) ma non ha un limite superiore Classi aperte Altezza in metri Limiti inferiorisuperiori della classe Estremi inferiorisuperiori della classe Valore centrale della classe mi (min) Ampiezza classe Alunni della scuola media a.s. 2002/2003 i Meno di 1.40 ?-1.40 ?-1.405 ? ? 106 1.41-1.45 1.41-1.45 1.405-1.455 1.43 5 168 1.46-1.50 1.46-1.50 1.455-1.495 1.48 5 120 1.51-1.55 1.51-1.55 1.495-1.555 1.53 5 56 1.56-1.60 1.56-1.60 1.555-1.605 1.58 5 23 ? ? 12 1.61 e oltre 1.61-? 1.605-? 485 Classi aperte Nelle distribuzioni raggruppate aperte vengono normalmente utilizzate classi con ampiezza “non uniformi” in modo tale da mettere in risalto raggruppamenti particolari nel caso di indagini statistiche a sfondo politico o demografico. E’ comunque sempre consigliabile evitare l’uso di classi aperte perché quando si lavora con esse abbiamo che le proprietà non sono totalmente definite e risulterà quindi difficile la rappresentazione dei dati. Distribuzione cumulata Una distribuzione di frequenze non raggruppate può essere trasformata in una distribuzione di frequenze cumulate. Ciò avviene quando le frequenze vengono cumulate (aggiunte al totale) dalla categoria più piccola, xmin, alla categoria più grande, xmax. Distribuzioni cumulate “minore di” Mostrano quanti valori di un insieme di dati siano inferiori a qualsiasi valore considerato. Se i miei dati sono rappresentati da misure continue (approssimate) la cumulazione va fino all’estremo superiore dell’intervallo di approssimazione di una categoria di misura. Ad ogni estremo superiore la cumulazione darà come risultato finale il numero di misure del nostro campione inferiori al valore estremo. Distribuzioni cumulate “maggiore uguale” Si ragiona in maniera opposta alle distribuzioni di frequenze cumulate “minore di”. La cumulazione va da xmax a xmin considerando quanti valori sono uguali o maggiori all’estremo inferiore dell’intervallo di approssimazione della categoria. Distribuzioni cumulate raggruppate “minore uguale” in cui consideriamo i valori minori o uguali alla categoria stessa (misure esatte) o minori o uguali all’estremo superiore dell’intervallo di approssimazione della categoria (misure approssimate). “maggiore di” in cui utilizziamo i valori maggiori alla categoria stessa (misure esatte) o maggiori all’estremo inferiore dell’intervallo di approssimazione della categoria (misure approssimate). Distribuzioni cumulate raggruppate Per raggruppare i dati in classi in modo da organizzare distribuzioni cumulate raggruppate “minore di” dobbiamo considerare sia l’estremo superiore di una classe che l’estremo inferiore Altezza in metri Limiti inferiorisuperiori della classe Estremi Valore Conteggio inferioricentrale superiori della della classe classe mi (min) i 1.39-1.41 1.39-1.41 1.385-1.415 1.40 IIII 5 1.42-1.44 1.42-1.44 1.415-1.445 1.43 IIII 5 1.45-1.47 1.45-1.47 1.445-1.475 1.46 IIII 5 1.48-1.50 1.48-1.50 1.475-1.505 1.49 IIII III 8 1.51-1.53 1.51-1.53 1.505-1.535 1.52 IIII 5 28 Distribuzioni cumulate raggruppate “minore di” Altezza in metri Frequenza cumulata Meno di 1.385 0 Meno di 1.415 5 Meno di 1.445 10 Meno di 1.475 15 Meno di 1.505 23 Meno di 1.535 28 Distribuzioni cumulate raggruppate Stesso discorso vale per le distribuzioni cumulate raggruppate “maggiore uguale” dove le classi possono essere cumulate considerando uno qualsiasi dei due estremi (superiore o inferiore) Distribuzioni cumulate raggruppate “maggiore uguale” Altezza in metri Frequenza cumulata 1.385 o più 28 1.415 o più 23 1.445 o più 15 1.475 o più 10 1.505 o più 5 1.535 o più 0 Distribuzioni cumulate raggruppate Proviamo ad inserire nella distribuzione cumulata “minore di” da noi organizzata la frequenza relativa cumulata e la percentuale della frequenza relativa.