I dati Qualsiasi contenuto dell’esperienza. Si definiscono grezzi i dati raccolti ma non ordinati numericamente. Esempio: l’insieme delle età dei soci dell’ordine alfabetico di un club Una serie è un ordinamento di dati numerici grezzi in ordine crescente o decrescente di grandezza. Misure Il campo di variazione (range) di un insieme di misure è la differenza tra misura massima è quella minima. Campo di variazione= Xmax-Xmin Se l’ordinamento dei dati numerici è stato effettuato in ordine crescente Xmax e Xmin saranno rispettivamente la prima e l’ultima della serie. Se l’ordinamento è stato fatto in ordine decrescente l’ordine di Xmax-Xmin è invertito. Distribuzione di frequenza La distribuzione di frequenza riassume il numero di volte in cui ciascuna categoria della scala compare all’interno di un insieme di misure. Parliamo di frequenza () in quanto vogliamo contare quante volte compare un evento Distribuzione di frequenza Le tabelle in cui schematizziamo le distribuzioni di frequenza si definiscono tabelle di frequenza. Le tabelle si costruiscono ordinando i nostri dati e associandoci le relative distribuzioni di frequenza Tabelle di frequenza Disporre i seguenti dati in una serie ascendente e poi in una distribuzione di frequenze: 1,40, 1,40, 1,40, 1,46, 1,43, 1,46, 1,40, 1,44, 1,50, 1,46, 1,48, 1,50, 1,51, 1,50, 1,50, 1,50, 1,53, 1,52, 1,43, 1,48, 1,46, 1,52, 1,46, 1,43, 1,50 , 1,53, 1,44, 1,40. Tabelle di frequenza Costruiremo una tabella con tre colonne (altezza, conteggio, frequenza). La prima colonna (altezza) sarà formata da tutte le categorie (unità) comprese nella parte della scala di misura utilizzata. Dovremo quindi identificare il valore più grande (Xmax) e quello più piccolo (Xmin). Il simbolo xi rappresenterà l’i-esima categoria della variabile X (altezza). Nel nostro caso avremo k=14 categorie tra xi=x1=1.40 e xk=1.53 Tabelle di frequenza La seconda colonna (conteggio) sarà composta dal numero di misure riscontrate in ogni categoria. In pratica si conta quante volte appare la categoria di interesse identificando ogni ripetizione con un segno di conteggio in corrispondenza della categoria. Esistono diverse modalità di conteggio. Tra le più usate ricordiamo le barrette verticali Tabelle di frequenza La terza colonna (frequenza) rappresenta il riassunto del risultato del conteggio fatto per ogni categoria. i è una rappresentazione numerica della frequenza in ogni categoria K. Tabelle di frequenza rappresenta la somma delle frequenze nella rispettiva colonna dalla prima alla k-esima categoria. Simbolicamente si esprime: K 14 = =n i i i=1 i=1 insieme delle misure somma dei valori campione dimensione (n) del campione Tabelle di frequenza insieme delle misure somma dei valori K i=Ni=1 popolazione dimensione (N) della popolazione Altezza in metri Conteggio Frequenza i 1.40 IIII 5 1.41 0 1.42 0 1.43 III 3 1.44 II 2 1.45 1.46 0 IIII 1.47 1.48 0 II 1.49 1.50 2 0 IIII I 1.51 Simbolo di sommatoria 5 6 1 1.52 II 2 1.53 II 2 28 segno di conteggio Distribuzione di frequenze relative Se parliamo di frequenza relativa (o proporzionale) ci riferiamo alla frequenza di una data categoria divisa per la dimensione del campione i n Nel caso di una popolazione avremo i N Distribuzione di frequenze relative La % di ciascuna categoria è la % della frequenza totale che troviamo in quella categoria. Per calcolarci le percentuali avremo i n Nel caso di una popolazione avremo i N Altezza in metri Frequenza 1.40 5 5/28=0.1786 1.41 0 0/28=0.0 0% 1.42 0 0% 1.43 3 0/28=0.0 3/28=0.1071 1.44 2 1.45 0 1.46 5 1.47 i Frequenze relativa i/n 2/28=0.0714 0/28=0.0 Percentuale i/n 17.86% 10.71% 7.14% 0% 17.86% 0 5/28=0.1786 0/28=0.0 1.48 2 2/28=0.0714 7.14% 1.49 0 1.50 6 0/28=0.0 6/28=0.2142 1.51 1 1.52 0% 0% 21.42% 3.57% 2 1/28=0.0357 2/28=0.0714 1.53 2 2/28=0.0714 7.14% 28 7.14% Distribuzione cumulata Una distribuzione di frequenze non raggruppate può essere trasformata in una distribuzione di frequenze cumulate. Ciò avviene quando le frequenze vengono cumulate (aggiunte al totale) dalla categoria più piccola, xmin, alla categoria più grande, xmax. Distribuzioni cumulate “minore di” Mostrano quanti valori di un insieme di dati siano inferiori a qualsiasi valore considerato. Se i miei dati sono rappresentati da misure continue (approssimate) la cumulazione va fino all’estremo superiore dell’intervallo di approssimazione di una categoria di misura. Ad ogni estremo superiore la cumulazione darà come risultato finale il numero di misure del nostro campione inferiori al valore estremo. Distribuzioni cumulate “minore di” Se i miei dati sono rappresentati da misure discrete (esatte: quindi non caratterizzate da un intervallo di approssimazione) la cumulazione va da categoria a categoria (da xmin a xmax) indicando quanti valori siano inferiori al valore stesso della categoria in esame. Altezza in metri Conteggio Frequenza i 1.40 IIII 5 1.41 0 1.42 0 1.43 III 3 1.44 II 2 1.45 1.46 0 IIII 1.47 1.48 0 II 1.49 1.50 1.51 5 2 0 IIII I 6 1 Distribuzioni cumulate “minore di” Altezza in metri Frequenza cumulata Meno di 1.395 0 Meno di 1.405 5 Meno di 1.415 5 Meno di 1.425 5 Meno di 1.435 8 Meno di 1.445 10 Meno di 1.455 10 Meno di 1.465 15 Meno di 1.475 15 Meno di 1.485 17 Meno di 1.495 17 Meno di 1.505 23 Meno di 1.515 24 Meno di 1.525 26 Meno di 1.535 28 28 Distribuzioni cumulate “maggiore uguale” Si ragiona in maniera opposta alle distribuzioni di frequenze cumulate “minore di”. La cumulazione va da xmax a xmin considerando quanti valori sono uguali o maggiori all’estremo inferiore dell’intervallo di approssimazione della categoria. Distribuzioni cumulate “maggiore uguale” Se desideriamo costruire una tabella distribuzioni di frequenze cumulate “maggiore uguale” dobbiamo porci la seguente domanda: “Considerato un dato valore, quanti valori di un insieme di dati sono uguali o maggiori di esso?” Distribuzioni cumulate “maggiore uguale” Altezza in metri Frequenza cumulata 1.395 o più 28 1.405 o più 23 1.415 o più 23 1.425 o più 23 1.435 o più 20 1.445 o più 18 1.455 o più 18 1.465 o più 13 1.475 o più 13 1.485 o più 11 1.495 o più 11 1.505 o più 5 1.515 o più 4 1.525 o più 2 1.535 o più 0 28 Distribuzioni cumulate Abbiamo descritto le due tipologie più utilizzate nelle indagini statistiche. Oltre alle distribuzioni di frequenze cumulate “minore di” e “maggiore uguale”, esistono altri tipi di distribuzioni cumulate. (es.: “minore uguale” o “maggiore di”). Distribuzioni cumulate “minore di” Altezza in metri Frequenza i Frequenze relativa i/n Percentuale i/n Meno di 1.395 0 0/28= 0.00 0% Meno di 1.405 5 5/28= 0.18 18% Meno di 1.415 5 5/28= 0.18 18% Meno di 1.425 5 5/28= 0.18 18% Meno di 1.435 8 8/28= 0.29 29% Meno di 1.445 10 10/28= 0.36 36% Meno di 1.455 10 10/28= 0.36 36% Meno di 1.465 15 15/28= 0.53 53% Meno di 1.475 15 15/28= 0.53 53% Meno di 1.485 17 17/28= 0.61 61% Meno di 1.495 17 17/28= 0.61 61% Meno di 1.505 23 23/28= 0.82 82% Meno di 1.515 24 24/28= 0.86 86% Meno di 1.525 26 26/28= 0.93 93% Meno di 1.535 28 28/28= 1.00 100%