Statistica descrittiva
Distribuzioni di frequenza
La raccolta dei dati su un campione, sono spesso e volentieri un insieme di valori
completamente
disordinati; ovvero si presentano come una raccolta inerente l'indagine statistica
che si vuol fare
ma sono non organizzati.
E' molto improbabile che, finchè non vengono organizzati per bene, tali dati
forniscano una
descrizione capillare del campione considerato.
Preliminarmente si individueranno alcuni metodi matematici per individuare,
catalogare, organizzare
tali dati per poter evidenziare loro caratteristiche, indipendentemente dalla
popolazione.
Quindi inizialmente ci si occupa solo della statistica descrittiva.
Un dato si definisce numerico quando assume un valore matematico numerico; si
definisce non numerico
quando non assume un valore numerico. Un dato numerico è detto discreto se
assume un numero
finito di valori numerici; è detto continuo può assumere un numero infinito di
valori.
Per capire se un dato è discreto o continuo bisogna intuire i valori che quel dato
può assumere indipendentemente dai dati raccolti, quindi il numero di
automobili è possibile contarlo, il numero di elettroni no.
Per capire meglio i dati raccolti si introduce il termine classi e si individuano il
numero di elementi di ogni classe. Tale numero è detto frequenza della classe. Si
definisce
tabella di distribuzione di frequenza una tabella che raccoglie i dati distinti in
base alla classe con le relative frequenze.
Si definisce intervallo della classe il range di numeri che è compreso fra il limite
inferiore ed
il limite superiore della classe; tale precisazione è tipica delle classi con dati
continui.
Grafici delle distribuzioni di frequenza
Ogni distribuzione di frequenza oltre ad essere elaborata e esplicitata tramite
tabelle, come abbiamo visto
fino ad ora, possono essere evidenziate anche con l'utilizzo di grafici che non
sono altro che una
rappresentazione visiva della relativa tabella.
L'utilizzo del grafico permette una rapida e diretta osservazione dei dati a
disposizione
cosa che la tabella, almeno in prima istanza, non permette.
E' da notare che se le classi hanno tutte la stessa ampiezza le altezze dei
rettangoli sono uguali, alle corrispondenti frequenze assolute.
Al contrario se le classi sono di ampiezza diversa, i rettangoli hanno base uguale
alla relativa ampiezza della classe, e area corrispondente alla frequenza:
l'altezza del rettangolo sarà uguale al rapporto fra la frequenza e l'ampiezza di
classe. Tale rapporto si definisce densità di frequenza.
In modo diverso si rappresenta una distribuzione cumulativa.
E' utilizzato a tal proposito il grafico detto poligono cumulativo ottenuto
rappresentando sull'asse x i valori superiori delle classi e sull'asse y
la relativa frequenza cumulativa. Il grafico si ottiene infine unendo i punti così
calcolati.
Scarica

La statistica studia una popolazione, le connessioni tra gli elementi