GRUPPO: Lai, Pisciotta, Zuccalà CLASSE: 4Bi CALCOLO LABORATORIO INDICE DELLA PRESENTAZIONE PRESENTAZIONE GENERALITA’ FASI DELL’INDAGINE STATISTICA RILEVAZIONE E SPOGLIO DEI DATI STATISTICI SISTEMAZIONE DEI DATI: Serie e Seriazione VARIABILI E MUTABILI STATISTICHE RAPPRESENTAZIONI GRAFICHE LE RAPPRESENTAZIONI GRAFICHE CON L’AUSILIO DEI FOGLI ELETTRONICI LE RILEVAZIONI MEDIANTE QUESTIONARIO La Statistica è sorta in tempi antichissimi, fin dai primi insediamenti umani aventi una semplice organizzazione sociale. Esistono notizie relative a rivelazioni statistiche fatte eseguire dall’imperatore cinese Yu, più di 4000 anni fa, allo scopo di ottenere notizie precise sulla situazione dell’agricoltura in ogni provincia, e quindi di poter ripartire equamente le imposte. Presso i Romani, Servio Tullio istituì la prima forma di censimento, chiamato allora <<Census>>, che veniva effettuato ogni cinque anni e serviva a conoscere il numero dei cittadini, l’ammontare dei loro beni, l’andamento delle nascite e delle morti. La ricerca di valori di sintesi di una serie di dati è dovuta agli astronomi. Nel XVII e nel XIX secolo,grazie all’introduzione di metodi matematici e al “calcolo delle probabilità”, il campo di applicazioni della statistica andò ampliandosi in quanto si capì come utilizzare un insieme di informazioni allo scopo di ricercare le cause del manifestarsi di molti fenomeni. E’ consuetudine suddividere la statistica in : -statistica descrittiva,che ha lo scopo di raccogliere ed elaborare i dati per descrivere fenomeni collettivi o di massa; -statistica induttiva (o inferenza statistica),che si occupa dei metodi che permettono di stimare le caratteristiche di un fenomeno collettivo partendo dall’analisi delle caratteristiche di un campione. L’indagine statistica si basa sull’osservazione di fenomeni che possono manifestarsi in svariati modi. I fenomeni si dividono in Tipici, Atipici e Collettivi. Tutti i fenomeni che si presentano costantemente con le stesse caratteristiche sono chiamati fenomeni Tipici. D’altra parte esistono dei fenomeni che si manifestano ogni volta con delle caratteristiche diverse e per i quali è difficile fare previsioni sul loro comportamento, possono essere definiti fenomeni Atipici,come ad esempio i fenomeni meteorologici.Se consideriamo, invece, i fenomeni sociali quali ad esempio le nascite, i matrimoni, le migrazioni, possiamo soprannominarli fenomeni Collettivi. Natura del metodo statistico… I metodi di ricerca delle leggi scientifiche sono essenzialmente due: metodo induttivo e metodo deduttivo. Se si parte dall’osservazione di fatti singoli e, con successive generalizzazioni, si risale ai principi o alle leggi di carattere generale relativi ai fatti studiati, si adopera il metodo induttivo, si procede cioè per induzione. Se invece si stabiliscono a priori assiomi generali, che si pongono come premesse al senso logico, e in seguito , attraverso il ragionamento, se ne ricavano le possibili conseguenze, si adopera il metodo deduttivo, si procede cioè per deduzione. Nel primo caso si procede dal particolare al generale, nel secondo, invece, dal generale al particolare. Il metodo statistico costituisce il metodo induttivo per eccellenza, perché è formato sull’analisi di fenomeni collettivi allo scopo di ricavare, le leggi soggiacenti ai fenomeni stessi, o almeno di evidenziare eventuali regolarità, in modo da poter trarre previsioni relative al comportamento futuro. L’operazione più difficile e importante per l’interpretazione dei fenomeni studiati, è proprio la ricerca delle cause che li hanno generati. Il Quetelet ha formulato alcuni canoni di logica statistica, allo scopo di poter interpretare in maniera valida i risultati di una ricerca, e sono: 1) Non si devono avere idee preconcette sul risultato che si otterrà dalla ricerca. 2) Non si deve eliminare arbitrariamente alcun dato. 3) Non si devono comparare elementi che non siano tra loro compatibili. Dati statistici… Per poter definire meglio che cosa siano i dati statistici, occorre prima precisare che l’unità statistica è il più piccolo elemento sul quale si effettua una osservazione. L’unità statistica può essere: 1) Semplice se corrisponde ad una singola persona o a un oggetto, 2) Composta se è formata da un insieme di elementi. Si definisce dato statistico il risultato di un operazione compiuta sulle unità statistiche (es: numero di persone di sesso maschile della popolazione italiana ecc. ). Per popolazione statistica si intende, <<un insieme finito di dati statistici tra loro omogenei per quanto riguarda una o più caratteristiche>>. Rappresenta una popolazione statistica, l’insieme degli alunni di una scuola. Un universo è: <<una popolazione statistica composta da un numero infinito di elementi>>. Un campione invece è: <<un complesso di osservazioni effettive sugli elementi di una popolazione o universo>>. Ad esempio è un universo l’insieme formato dai risultati di un numero illimitato di lanci di un dado, o l’insieme degli esperimenti. Costituisce un campione, ad esempio, l’insieme di un certo numero di studenti estratti dalla popolazione scolastica di una città. Frequenza e intensità… I dati statistici possono rappresentare due specie di grandezze diverse: se esprimono il numero delle volte in cui il fenomeno si è verificato in relazione ad un determinato periodo di tempo, assumono la natura di frequenza, se invece rappresentano una media, o una somma di misure effettuate sulle unità statistiche, esprimono una intensità. Rappresentano delle frequenze, ad esempio, il numero dei promossi a giugno di una certa scuola; rappresentano, invece, delle intensità: la statura media di un gruppo di giovani della stessa età, le tasse pagate da una determinata categoria di lavoratori. In genere un’intensità viene espressa mediante una misura di peso, di lunghezza, di superficie, di volume, di valore. Carattere,modalità quantitative e qualitative Le unità statistiche vengono studiate secondo uno o più caratteri comuni che rappresentano gli aspetti che si vogliono mettere in evidenza e successivamente vengono divisi rispetto alle varie modalità con cui tale carattere si manifesta. Esaminando ad esempio la distribuzione degli studenti di una data provincia secondo la specie delle scuole, in un determinato anno, diremo che il carattere è rappresentato dal <<tipo di scuola>>, mentre le varie modalità sono rappresentate da: <<scuole materne>>, <<scuole elementari>>, <<scuole medie>>, e <<scuole superiori>>. Le modalità secondo cui vengono classificate le unità statistiche possono essere qualitative o quantitative. Le modalità quantitative sono espresse da numeri risultanti da misurazioni o da enumerazioni, come ad esempio la rilevazione dei redditi di una popolazione. Le modalità quantitative possono essere continue o discrete: Continue se sono espresse da numeri reali e possono assumere tutti i valori di un intervallo (ad esempio, altezze e pesi ). Discrete in caso contrario (ad esempio, numeri dei vani delle abitazioni, numero degli addetti ad un settore industriale). Le modalità qualitative sono espresse da attributi, espressioni verbali,. Fasi dell’ indagine statistica… Per effettuare un indagine statistica bisogna procedere per fasi: • pianificazione del lavoro: è la fase nella quale il lavoro viene preparato ; in essa viene definita la stesura del lavoro,gli obiettivi da raggiungere attraverso l’indagine , l’oggetto di rilevazione e il modo in cui i dati vengono raccolti. • raccolta dei dati:questa fase consiste nella raccolta di dati individuali che costituiscono il fenomeno collettivo da analizzare.La raccolta può avvenire attraverso dei questionari o dei moduli e schede. • spoglio dei dati raccolti:consiste nella classificazione dei dati raccolti secondo il piano prestabilito.I dati del fenomeno vengono raggruppati secondo le modalità di un carattere qualitativo o secondo le intensità di uno quantitativo. • rappresentazione dei dati:è la rappresentazione grafica secondo tabelle o grafici dei risultati ottenuti. • elaborazione dei dati:in questa fase vengono elaborati i dati ”grezzi” per ottenere dati “elaborati”che mettano in evidenza le caratteristiche del fenomeno collettivo da studiare. • interpretazione dei risultati:E’ la fase finale dell’indagine statistica nella quale viene esaminato se l’obiettivo dell’indagine è stato raggiunto,se esistono relazioni con altri fenomeni,se è possibile fare una previsione sulla tendenza del fenomeno nel tempo. RILEVAZIONE E SPOGLIO DEI DATI STATISTICI… 1)Nozioni generali: L’operazione preliminare più importante consiste nello stabilire con molta precisione gli obiettivi che si intendono raggiungere attraverso l’intera indagine statistica. Si possono fissare degli obiettivi generali o degli obiettivi più specifici. La successiva preparazione dei mezzi o strumenti da usare deve essere tale da permettere il raggiungimento degli obiettivi fissati e quindi è fatta in funzione dei risultati che si vogliono ottenere. 2)Oggetto e limiti dell’indagine: Per oggetto della rilevazione si intende il fenomeno preso in esame, definito con la massima cura e tale da permettere il raggiungimento degli obiettivi fissati. Per quanto riguarda i limiti di tempo, questi possono far riferimento ad un istante preciso o a undato periodo di tempo. Riguardo ai limiti di spazio la rilevazione può essere fatta su un territorio più o meno vasto. La scelta dipende, dagli obiettivi che si vogliono raggiungere. Limiti di spazio sono anche quelli riferiti a particolari categorie dell’oggetto dell’indagine. Modalità della rilevazione… La raccolta dei dati si può distinguere , riguardo al modo, in: Automatica se sono gli stessi interessati a fornire le informazioni sui fenomeni che li riguardano(denuncia di nascite, morte e trasferimenti) . Riflessa se viene fatta direttamente da organi preposti a tale scopo(censimenti,indagini di mercato). Rispetto alla durata le rilevazioni si distinguono in: Continue se vengono fatte senza interruzione (ad esempio rilevazioni anagrafiche dei nati, dei morti ecc.). Periodiche se vengono fatte a intervalli regolari di tempo (censimenti con periodicità decennale ecc.). Occasionali se vengono fatte una volta tanto per indagini su fenomeni particolari (ad esempio rilevazioni dei danni di un terremoto ecc.). Organi per la rilevazione statistica… Gli organi che eseguono le rilevazioni possono essere: Privati se la raccolta dei dati viene eseguita da un privato, o da un ente privato. Pubblici quando il fenomeno collettivo, oggetto dell’indagine è di grande interesse pubblico (ad esempio, fenomeni demografici, economici ecc.)e richiede una grande quantità di mezzi a disposizione e una notevole organizzazione. In Italia esiste un organismo dedito agli studi di statistica:l’ Istituto Centrale di statistica(Istat) che ha sede in Roma. L’Istat ha il compito di redigere le statistiche sui numerosi aspetti dell’amministrazione dello stato e di eseguire i censimenti. Inoltre crea alcune pubblicazioni periodiche tra cui: “Il Bollettino Mensile di Statistica, l’Annuario Statistico Italiano, il Compendio Statistico Italiano. In quanto al mezzo di raccolta, distinguiamo fra: Registri nei quali la raccolta dei dati avviene mediante un ordine alfabetico o cronologico; Questionari moduli prestampati che pongono una serie di domande a cui l’interessato dovrà rispondere,(vengono usati nelle rilevazioni riflesse ); Schede moduli particolari che contengono tutte le informazioni necessarie a una unità statistica, (ad esempio nelle biblioteche,autore, titolo ecc…). Rilevazioni totali e rilevazioni per campioni… Una rilevazione si dice: Totalese viene viene estesa a tutti gli elementi di una popolazione statistica; Per campione se viene fatta solo su alcuni elementi della popolazione, scelti con criteri opportuni. La più importante rilevazione totale è costituita dal Censimento attraverso cui si può conoscere la consistenza numerica della popolazione, la sua distribuzione per sesso, per età, stato civile ecc…. In Italia il primo censimento generale della popolazione fu eseguito il31 dicembre 1861, cioè nell’anno della proclamazione del regno. Altri censimenti furono fatti ad intervalli di tempo più o meno regolari. La direzione del censimento è affidata all’ Istat, che emana delle istruzioni per preparare il piano topografico del comune in cui il territorio verrà suddiviso in frazioni geografiche, e ogni frazione geografica in sezioni di censimento. Le rilevazioni campionarie… Nella realtà si ricorre molto spesso a indagini parziali, dette rilevazioni campionarie, quando: occorre contenere i costi; occorre ottenere più tempestivamente i risultati; non è possibile procedere diversamente; La scelta del campione deve essere fatta in modo che esso sia: Rappresentativodeve cioè possedere le stesse caratteristiche della popolazione da esaminare. Sufficientemente ampiopiù il campione è numeroso, più i risultati che fornisce sono significativi. Spoglio dei dati: Tabelle di spoglio… Una volta la rilevazione delle unità statistiche si può procedere alla formazione dei dati statistici, attraverso l’operazione di spoglio delle unità stesse. Lo spoglio comprende: L’enumerazionecon la quale le schede, i questionari, i moduli vengono contati e, nello stesso tempo, controllati, al fine di fornire i dati sull’estensione della rilevazione. Questa fase è molto importante perché permette di conoscere immediatamente l’entità delle <<evasioni>> che, in numero elevato possono anche influenzare l’attendibilità dei risultati. La classificazioneche consiste di raggruppare i dati ottenuti in categorie, classi, a seconda delle intensità o delle qualità dei caratteri rivelati. Lo spoglio materialeche si effettua riportando i dati , già enumerati e classificati, in prospetti chiamati tabelle di spoglio. I due tipi di spoglio… L’intera operazione di spoglio può essere effettuata in due modi: Manualmente,(spoglio manuale). attraverso l’elaboratore elettronico,(spoglio automatico). Nello spoglio manuale si riportano i dati nelle tabelle di spoglio, preparate in base al fenomeno osservato. Le tabelle sono costituite da tre colonne: la prima contiene, nelle diverse righe, le varie modalità del carattere considerato; la seconda,un po’ più larga, contiene le “tacche”che si riferiscono a ciascuna unità esaminata; la terza contiene le frequenze delle varie modalità., che si ottengono contando le tacche per ogni riga. ESEMPIO: Volendo preparare una tabella che classifichi i 24 alunni della 3°A di un certo istituto tecnico, secondo l’anno di nascita, relativamente all’anno scolastico 1988-1989, partiamo alla raccolta dei vari anni.’ ‘71-’72-’70-’72-’72-’72-’72-’72-’73-’72-’72-’72-’71-’70-’71-’72-’73-’72-’72-’70-’72-’72-’72-’72. Prepariamo ora la tabella di spoglio: Questo tipo di spoglio viene chiamato singolo(limitato ad un solo carattere: “anno di nascita”), per distinguerlo dallo spoglio incrociato. Anno di nascita Tacche Frequenza 1970 \\\ 3 1971 \\\ 3 1972 \\\\\\\\\\\\\\\\ 16 1973 \\ 2 Totale 24 Lo spoglio incrociato… Se conosciamo, dei 24 alunni dell’esempio precedente, anche il sesso, possiamo preparare il prospetto di spoglio incrociato tra anno di nascita e sesso. Lo scopo di uno spoglio incrociato, è quello di mettere in evidenza l’esistenza di relazioni fra i due caratteri. Nel caso dell’esempio appena fatto, serviva a collegare il sesso con l’insuccesso scolastico. Il metodo dello spoglio manuale è applicato nel caso di piccole indagini, mentre quando i caratteri sono molti e il numero di unità è grande,si ricorre allo spoglio automatico. Anno di nascita Maschi Femmine Frequenz a maschi Frequenza femmine 1970 \\ \ 2 1 1971 \ \\ 1 2 1972 \\\\\\\\ \\\\\\\\ 8 8 1973 \ \ 1 1 In questo caso occorre: Codificare i dati assegnando un numero a ogni modalità di ciascun carattere qualitativo. Procedere alla registrazione dei dati codificati su dischi magnetici. Predisporre il calcolatorecaricando un programma di spoglio; Inserire i dati già registrati; Fornire le informazioni sugli spogli singoli e incrociati che bisogna effettuare. Una completata l’intera procedura, lo spoglio automatico verrà eseguito in modo velocissimo e con la massima precisione. Sistemazione dei dati:Serie e Seriazione… Una tabella a semplice entrata è costituita da due colonne, la prima riporta le varie modalità del carattere qualitativo, o le varie intensità del carattere quantitativo in esame, la seconda riporta le frequenze o i valori rilevati. Se il carattere è qualitativo la successione dei dati rilevati è detta Serie statistica, se invece il carattere è quantitativo la successione dei dati è detta Seriazione statistica. Diamo ora un esempio di una serie statistica. Esempio n° 1) Distribuzione degli studenti italiani secondo il grado delle scuole, Anno scolastico 1992-93. Si tratta di una serie statistica. Ad ogni modalità del carattere qualitativo è associata una frequenza assoluta, dove per frequenza assoluta intendiamo il numero delle unità statistiche che godono di una certa proprietà. Grado delle scuole N. alunni iscritti Scuole materne 1.564.733 Scuole elementari 2.949.030 Scuole medie 2.059.430 Scuole superiori 2.820.563 Totale 9.393.756 Continuo Serie e Seriazione… Esempio n°2) Autovetture per la quale è stata pagata la tassa di proprietà. E’ una serie storica temporale in quanto i dati rilevati sono riferiti a intervalli di tempo. Le serie storiche sono serie di notevole importanza per lo studio di un fenomeno nel suo evolversi nel tempo. Esempio n°3) Rilevazioni delle abitazioni occupate in Italia secondo il numero di stanze nel 1981. N°Stanze N°Abitazioni 1 300.364 2 1.791.887 3 3.761.695 4 5.616.939 5 3.520.498 6 o più 2.550.369 Totale 17.541.752 Anni Autovetture 1986 23.495.460 1987 24.320.167 1988 25.290.250 1989 26.267.431 1990 27.415.828 La tabella qui di fianco indicata dalla freccia azzurra, rappresenta una seriazione rispetto ad un carattere quantitativo discreto. Seriazioni, estremi, classi… Esempio n°4) Distribuzione dei comuni dell’ Italia per classi di superficie al 31-12-1991. Classi di superficie( in migliaia di ha) N°comuni La seguente tabella rappresenta un seriazione rispetto ad un Fino a 1 1.741 carattere quantitativo continuo. 1 --------| 2 2.061 Nella tabella qui di fianco a ogni intervallo, appartiene, l’estremo 2 --------| 4 2.093 destro, e non il sinistro, ma 4 --------| 6 883 potremmo fare benissimo il 6 --------| 10 742 contrario. La prima e l’ultima classe possono 10 --------| 25 513 non contenere un estremo, perché Oltre i 25 68 i valori possono essere diradati, e Totale 8.101 in questo caso sono dette classi aperte. Il numero di classi varia fra un minimo di 5 e un massimo di 20. Per scegliere l’ampiezza di ogni modulo si considera il campo di variazione del fenomeno osservato. Per la determinazione della 1° classe si cerca di non fare coincidere l’estremo sinistro con una osservazione effettiva. Definiamo ora: Limite inferiore della classe, l’estremo sinistro dell’intervallo. Limite superiore della classe, l’estremo destro dell’intervallo. Intervallo di classe, insieme dei valori contenuti tra due limiti. Ampiezza della classe, la differenza tra limite superiore e limite inferiore. Valore centrale della classe, la semi-somma dei due limiti. Le distribuzioni statistiche nelle quali i dati sono Frequenze assolute; vengono dette Distribuzioni di Frequenza. Tabelle a doppia entrata… S possono eseguire delle rilevazioni su un insieme universo classificando le unità statistiche contemporaneamente rispetto a due o più caratteri;tali rilevazioni si rappresentano mediante tabelle a doppia entrata. Le tabelle a doppia entrata,rappresentanti distribuzioni di frequenza possono essere: di Contingenzase i due caratteri sono entrambi qualitativi, di Correlazionese i due caratteri sono entrambi quantitativi, Mistese uno dei due caratteri è qualitativo e l’altro quantitativo. Vediamo un esempio di tabella a doppia entrata: N°Vani Questa qua di fianco è una tabella di correlazione Componenti famiglia 1 Totali 2 3 4 5 6 1 10 4 1 0 0 0 15 2 6 10 5 2 0 0 23 3 3 10 12 8 2 1 36 4 1 3 8 4 2 2 20 5 0 1 2 1 1 1 6 Totali 20 28 28 15 5 4 100 Le tabelle composte… Le tabelle composte sono tabelle formate da più colonne che si riferiscono a varie caratteristiche di uno stesso fenomeno, anche senza legame fra esse. Alcune di queste sono utilizzate per confrontare due serie storiche e hanno particolare importanza. Vediamone un esempio: Reddito Familiare Pro capite Familiare Pro capite Percentual e consumo su reddito 1980 943 294 854 267 90,6 1981 1.111 347 1.005 314 90,4 1982 1.310 409 1.174 367 89,7 1983 1.458 483 1.269 421 87,1 1984 1.641 544 1.417 469 86,3 Anni Spesa Queste tabelle permettono, come indicato nell’ultima colonna, di confrontare modalità diverse riferendosi però alla stessa popolazione statistica. MUTABILI E VARIABILI STATISTICHE Prendendo in considerazione le distribuzioni di frequenza, a cui a ogni modalità del carattere,(sia esso qualitativo o quantitativo)è associata una frequenza,introduciamo le definizioni di mutabile statistica e di variabile statistica. 1a variabile statistica è definita dall’insieme dei valori osservati di un carattere quantitativo e dalle frequenze a essi associate. Una mutabile statistica è definita dall’insieme delle modalità osservate di un carattere qualitativo e delle frequenze a esse associate. Nel caso della variabile i valori sono indicati con x1,x2,…xnsi hanno le distribuzioni 1a e 1b. Frequenze assolute X1 X2 Y1 Y2 1b Valori X1 X2 - - Una Ai valori della variabile si possono associare al posto delle frequenze assolute, le frequenze relative, che si ottengono dividendo ogni frequenza per la loro somma. Valori - F1=Y1/N F2=Y2/N Fi =Yi/N Xi Yi Xi - - - Xn Yn Xn I=n Nel caso della variabile continua e le determinazioni sono raggruppate in classi si possono avere le distribuzioni 2a e 2b. -Si definiscono inoltre frequenze relative cumulate le frequenze che associano a ogni valore della variabile discreta(o a ogni classe della var. continua), la somma della rispettiva frequenza relativa con le frequenze dei valori precedenti.L’insieme delle modalità del carattere con le corrispondenti frequenze relative cumulate, si definisce distribuzione di frequenze relative cumulate.Se vogliamo poi ottenere le frequenze percentuali basterà moltiplicare le frequenze relative per 100. X1|-X2 - - X1|-X2 - Fi =Yi/N Yi = N I=1 Frequenze relative F1=Y1/N F2=Y2/N Yn I=n Classi X0|-X1 - Xn-1|- Xn 2b Y1 Y2 Yi - Fn =Yn/N I=1 Frequenze assolute X0|-X1 - fi = 1 I=1 Classi - I=n Yi = N 2a Frequenze relative - Xn-1|-Xn - - Fn =Yn/N I=n fi = 1 I=1 RAPPRESENTAZIONI GRAFICHE I dati raccolti in tabelle si possono rappresentare graficamente .I grafici, essendo di facile lettura, permettono di capire l’andamento di un fenomeno. Analizziamo ora i diversi tipi di rappresentazione grafica: A) RAPPRESENTAZIONE GRAFICA MEDIANTE DIAGRAMMI CARTESIANI I diagrammi cartesiani sono usati soprattutto per rappresentare serie storiche e seriazioni discrete. Le unità di misura sui due assi cartesiani sono generalmente diverse.Nei diagrammi cartesiani solitamente si collegano con una spezzata i punti rappresentativi delle coppie di valori, soprattutto nel caso di grafici di serie storiche (tale spezzata mette in evidenza l’evoluzione del fenomeno nel tempo). Nel caso di rappresentazione di seriazioni si segnano con un tratto marcato le ordinate dei punti (diagramma a segmenti). - Nella diapositiva successiva verranno rappresentati graficamente con diagrammi cartesiani esempi di distribuzioni di frequenze relative cumulate. Nel caso di seriazioni con valori discreti,riportando i dati della tabella sottostante, si ottiene il seguente grafico: FREQUENZE * RELATIVE N. STANZE N. ABITAZIONI FREQ. RELAT. FREQ. REL. CUMULATE 1 2 3 4 5 6 e più 300.364 1.791.887 3.761.695 5.616.939 3.520.498 2.550.369 0.0171 0.1022 0.2144 0.3202 0.2007 0.1454 0.0171 0.1193 0.3337 0.6539 0.8546 1.0000 totale 17.541.752 1.0000 * Rilevazione della abitazioni occupate in italia secondo il n° di stanze nel 1981 CUMULATE 1.00.90.80.70.60.50.40.30.20.1| | | | | 1 2 3 4 5 N° STANZE Se invece si ha una seriazione a valori continui suddivisi in classi, si collegano i valori delle frequenze cumulate mediante una spezzata ,supponendo che nell’intervallo di ciascuna classe vi sia una distribuzione uniforme delle frequenze.Si ottiene la cosiddetta poligonale delle frequenze cumulate,riportando i dati della tabella sottostante si ottiene il seguente grafico: * FREQUENZE Classi in superfici N.di comuni Freq.relat cumulate Fino a 1 1 -|2 2 -|4 4 -|6 6 -|10 10 -|25 Oltre 25 1.741 2.061 2.093 883 742 513 68 0,2149 0,4693 0,7277 0,8367 0,9283 0,9916 1,0000 totale 8.101 * Distribuzione dei Comuni dell’ Italia per classi di superficie al 31.12.1991 RELATIVE CUMULATE 1.00.90.80.70.60.5- 0.40.30.20.1| | | | | | | 0 1 2 4 6 10 25 CLASSI DI SUPERFICI B) ISTOGRAMMI Si usano gli istogrammi per rappresentare seriazioni continue con i dati raggruppati in classi. Fissato un sistema di assi cartesiani ortogonali, sulle ascisse si riportano tanti intervalli consecutivi quante sono le classi;su questi intervalli si costruiscono dei rettangoli le cui aree sono proporzionali alle frequenze.Con gli istogrammi la somma delle aree di tutti i rettangoli è proporzionale alla somma delle frequenze.Vediamo ora un esempio di istogramma: Cilindrate (in cm3) N. autovetture 500 -|1000 1000-|1500 1500-|2000 Oltre 2000 433.963 491.798 281.239 50.340 totale 1.257.340 600000 n° autovetture * 400000 200000 0 cilindrata (in cm^3) Le classi hanno tutte la stessa ampiezza,tranne l’ultima che è aperta.In caso di classi aperte o si chiudono indicando un valore estremo logico,oppure si trascurano,quando il rapporto espresso in percentuale fra la frequenza di tale classe a il valore tot. delle frequenze è relativamente piccolo. * Ripartizione delle autovetture italiane prodotte nell’anno 1981 secondo la cilindrata C ) DIAGRAMMI IN COORDINATE POLARI I diagrammi in coordinate polari sono utilizzati per rappresentare particolari serie storiche , dette cicliche,dove le modalità del carattere si ripetono dopo un certo periodo. Con origine in un punto O ,detto polo, si tracciano tante semirette quante sono le modalità, in modo che gli angoli fra due semirette consecutive siano eguali e sulle semirette, a partire dal polo, si riportano i dati, e i punti così ottenuti si collegano con una spezzata. Riportando i dati della tabella sottostante, si ottiene il seguente grafico: * MESI VIAGGIATORI Gennaio Febbraio Marzo Aprile Maggio Giugno Luglio Agosto Settembre Ottobre Novembre Dicembre * (in migliaia) 34.175 32.245 33.114 33.921 31.477 28.389 27.503 25.174 29.482 29.561 33.029 28.426 MG AP MR GG FB LG GN AG DC ST OT Traffico viaggiatori sulle Ferrovie dello Stato nei mesi dell’anno 1980 NV D ) ORTOGRAMMI Per rappresentare serie storiche e serie territoriali,si possono utilizzare gli ortogrammi, costituiti da rettangoli di basi eguali e di altezze proporzionali alle intensità del fenomeno.Si possono anche accostare rettangoli riferiti a sessi, o ad anni, o a paesi diversi allo scopo di effettuare confronti. Diamo un esempio di ortogramma a partire dalla seguente tabella. Agricoltura Industria Altre attività Disoccupati Maschi (in migliaia) Femmine (in migliaia) 962 5.100 7.184 493 545 1.637 4.998 352 8- POPOLAZIONE PER CONDIZIONE E SESSO 76543- Maschi Femmine 210- | Agricoltura | Industria | Altre attività |Disoccupati | E ) ALTRE RAPPRESENTAZIONI GRAFICHE Oltre alle rappresentazioni grafiche che abbiamo visto in precedenza, ne esistono delle altre: - i cartogrammi, che si utilizano per rappresentare serie territoriali,si realizzano riportando su una carta geografica,mediante simboli convenzionali o colorazioni diverse,le intensità osservate nelle varie parti nelle quali è diviso un territorio. - gli ideogrammi, che consistono nel rappresentare figure più o meno grandi in relazione all’intensità del fenomeno. - i settori circolari di un cerchio o di un semicerchio, che si usano per rappresentare certe distribuzioni di frequenza nelle quali la totalità del fenomeno viene ripartita in modalità rappresentate da settori i cui angoli al centro sono proporzionali alle intensità del fenomeno. - i diagrammi a tre dimensioni, che sono rappresentazioni fatte attraverso figure solide e hanno la caratteristica di essere molto significativi;vengono spesso indicati col nome di stereogrammi e sono usati,in genere, per rappresentare i dati di tabelle a doppia entrata. Le rappresentazioni grafiche con l’uso di fogli elettronici Le rappresentazioni grafiche di tabelle statistiche possono essere effettuate mediante fogli elettronici (chiamati comunemente F.E.). Gli F.E. fanno parte di una vasta gamma di programmi applicativi che permettono di Utilizzare i PC anche senza conoscere a fondo le tecniche di programmazione. Gli F.E. trovano applicazione in molti campi in quanto permettono elaborazioni automatiche di tutti i tipi di problemi rappresentati in tabelle. La rapidità e la facilità con cui si apprende l’uso del programma ha fatto hanno favorito il suo successo.Tra i più conosciuti F.E.ricordiamo:Exel , Multiplan , Visical. La caratteristica comune a questi è quella di mettere in condizione, a chi li utilizza,di non sbagliare in quanto tutte le operazioni vengono descritte chiaramente sullo schermo tramite”menù gerarchici”. Oltre a ciò è prevista una opzione di “help”per la quale ,utilizzando un particolare tasto,sullo schermo appare una spiegazione dell’ operazione in corso di svolgimento. Un foglio elettronico è un enorme tabellone suddiviso in caselle identificati da una coppia di coordinate(riga,colonna)che possono contenere numeri o testi. Sullo schermo è visibile solo una parte del foglio che,tramite le frecce posso spostare. Si possono creare presentazioni grafiche scegliendo ogni volta fra le diverse opzioni possibili. Le rilevazioni mediante questionario I questionari attualmente rappresentano uno dei metodi più diffusi nelle ricerche di mercato,nei sondaggi,e negli studi. a)la predisposizione del modello Per la realizzazione di un questionario è essenziale tener presenti gli obiettivi che s’intendono raggiungere dall’indagine. Per prima cosa occorre precisare che un questionario è uno stampato contenente un numero di domande alle quali l’interessato deve rispondere;è preferibile utilizzare domande a risposta chiusa perché facilitano la codifica dei dati raccolti e la loro elaborazione. Le domande devono essere compilate con linguaggio semplice e comprensibile. Il questionario generalmente è diviso in due parti:una prima parte contiene le domande necessarie a ottenere i dati base,una seconda contiene domande più specifiche,che permettono di ottenere le informazioni necessarie al tipo di indagine che si vuole svolgere. Prima di somministrare il questionario occorre fornire agli interessati la spiegazione per la compilazione. Continuo… b)la codifica dei dati La fase successiva è quella della somministrazione del questionario;si passa poi all’enumerazione dei questionari pervenuti,indispensabile al fine di un successivo controllo per la correzione degli errori nella fase dello spoglio.Per la codifica dei dati,occorre predisporre un tabulato che riprenda le domande del questionario.Ogni riga del tabulato conterrà le risposte del questionario. c) Lo spoglio e la tabulazione dei dati Dopo aver riportato tutti i questionari, in codice ,sul tabulato si potrà procedere con lo spoglio e la tabulazione dei dati. Nel caso di uno spoglio semplice ,basterà contare,colonna per colonna,come sono distribuite le risposte alle varie domande. Dopo aver corretto gli errori i dati vengono sistemati in tabelle semplici o così come si presentano o trasformandoli in frequenze percentuali. Nel caso di uno spoglio incrociato vanno esaminati ,ad incrocio, i valori contenuti nelle colonne. Ringraziamo per aver scelto di assistere alla nostra presentazione: -Pisciotta Michela -Lai Stafania - Zuccalà Ilaria