Statistica descrittiva Distribuzioni di frequenza La raccolta dei dati su un campione, sono spesso e volentieri un insieme di valori completamente disordinati; ovvero si presentano come una raccolta inerente l'indagine statistica che si vuol fare ma sono non organizzati. E' molto improbabile che, finchè non vengono organizzati per bene, tali dati forniscano una descrizione capillare del campione considerato. Preliminarmente si individueranno alcuni metodi matematici per individuare, catalogare, organizzare tali dati per poter evidenziare loro caratteristiche, indipendentemente dalla popolazione. Quindi inizialmente ci si occupa solo della statistica descrittiva. Un dato si definisce numerico quando assume un valore matematico numerico; si definisce non numerico quando non assume un valore numerico. Un dato numerico è detto discreto se assume un numero finito di valori numerici; è detto continuo può assumere un numero infinito di valori. Per capire se un dato è discreto o continuo bisogna intuire i valori che quel dato può assumere indipendentemente dai dati raccolti, quindi il numero di automobili è possibile contarlo, il numero di elettroni no. Per capire meglio i dati raccolti si introduce il termine classi e si individuano il numero di elementi di ogni classe. Tale numero è detto frequenza della classe. Si definisce tabella di distribuzione di frequenza una tabella che raccoglie i dati distinti in base alla classe con le relative frequenze. Si definisce intervallo della classe il range di numeri che è compreso fra il limite inferiore ed il limite superiore della classe; tale precisazione è tipica delle classi con dati continui. Grafici delle distribuzioni di frequenza Ogni distribuzione di frequenza oltre ad essere elaborata e esplicitata tramite tabelle, come abbiamo visto fino ad ora, possono essere evidenziate anche con l'utilizzo di grafici che non sono altro che una rappresentazione visiva della relativa tabella. L'utilizzo del grafico permette una rapida e diretta osservazione dei dati a disposizione cosa che la tabella, almeno in prima istanza, non permette. E' da notare che se le classi hanno tutte la stessa ampiezza le altezze dei rettangoli sono uguali, alle corrispondenti frequenze assolute. Al contrario se le classi sono di ampiezza diversa, i rettangoli hanno base uguale alla relativa ampiezza della classe, e area corrispondente alla frequenza: l'altezza del rettangolo sarà uguale al rapporto fra la frequenza e l'ampiezza di classe. Tale rapporto si definisce densità di frequenza. In modo diverso si rappresenta una distribuzione cumulativa. E' utilizzato a tal proposito il grafico detto poligono cumulativo ottenuto rappresentando sull'asse x i valori superiori delle classi e sull'asse y la relativa frequenza cumulativa. Il grafico si ottiene infine unendo i punti così calcolati.