13/03/2013 La scorsa lezione: eruzioni di un geyser Abbiamo a disposizione un campione (222) di misurazioni su due grandezze D= durata dell’eruzione (in minuti) T = tempo di attesa per l’eruzione successiva (in minuti) Calcoliamo la tabella delle frequenze, prendendo come classi i singoli valori della variabile T Tabella delle frequenze (classi = singoli valori di T) 1 13/03/2013 Prima domanda Come estrarre queste frequenze con Excel? 1. Considerare solo la colonna dei tempi 2. Individuare il valore minimo e il valore massimo (funzioni) 3. Preparare la colonna delle classi di singolo valore, a partire dal minimo fino al massimo. Usare il Riempimento (Home) e incremento di 1. Abbiamo creato quindi le classi di ampiezza 1. Vogliamo ora calcolare le frequenze di ogni singolo valore (queste sono le nostre classi). Prima domanda Come estrarre queste frequenze con Excel? La funzione FREQUENZA ha bisogno di una matrice dati (quindi selezionare la colonna dei tempi) e di una matrice delle classi (quindi selezionare quella appena creata). Attenzione: affinché sia riportata la frequenza per ogni valore della classe, occorre che la formula sia in “forma di matrice”. Occorre quindi, PRIMA di richiamare la funzione evidenziare la colonna in cui andrà il risultato (tante celle quante sono le classi +1) Quando poi, dalla finestra di dialogo della funzione FREQUENZA, si immette la matrice delle classi, non premere INVIO ma premere CTRL+MAIUSC+INVIO. Se non si fa così, si visualizza un solo valore. 2 13/03/2013 Precisazioni Le classi sono utilizzate per raggruppare i dati. In generale, il numero di classi in cui suddividere i dati dipende da molti fattori (es. numero di osservazioni, distanza fra il minimo e il massimo ecc.). La frequenza serve per rappresentare il numero di osservazioni che rientra nella corrispondente classe. Ricorda che il numero di frequenze è uno in più rispetto al numero di classi Precisazioni Dividendo il numero di osservazioni di ciascuna classe (frequenza) per il numero totale di osservazioni e moltiplicando il risultato per 100, otteniamo la frequenza percentuale. La frequenza percentuale offre il vantaggio di facilitare il confronto con altri dati derivanti da altre indagini o da altre casistiche nelle quali è stato esaminato un diverso numero di osservazioni. Le percentuali cumulative queste si ottengono, per ogni classe, sommando la frequenza percentuale di quella stessa classe con tutte classi che la precedono. Questo tipo di espressione dei dati è utile per valutazioni quantitative di ogni classe di frequenza. Ad esempio, possiamo rilevare che il 66% circa dei nostri tempi è inferiore a 78 minuti. 3 13/03/2013 Aumentiamo l’ampiezza delle classi Creiamo classi di ampiezza 3 Inseriamo anche la percentuale cumulativa (Esercizio) PROVIAMO! Finora… Abbiamo visto una panoramica di alcune funzionalità di Excel. Ora iniziamo con ordine a studiare i vari aspetti di questo strumento 4 13/03/2013 Grafici (cap. 2) Sono un mezzo per rappresentare dati e indagini statistiche. Sono percepiti con maggiore rapidità rispetto alla forma tabellare. Consentono di cogliere gli elementi essenziali delle distribuzioni dei dati. Diagramma cartesiano Grafici a barre Istogramma Grafici a settori circolari (torte) Diagramma di dispersione Altre rappresentazioni… Grafici a barre Servono principalmente per rappresentare variabili (caratteri) qualitative (cioè non numeriche; ad es., regione di appartenenza, titolo di studio), oppure quantitative (cioè numeriche; ad es., età, reddito) discrete (possono assumere valori in un insieme discreto di numeri reali; ad es. il numero di componenti di una famiglia). 5 13/03/2013 Grafici a barre Per ogni modalità del fenomeno si disegna un rettangolo (orizzontale o verticale) di lunghezza proporzionale alla frequenza o intensità della modalità larghezza arbitraria Possono riportare valori positivi o negativi Si possono rappresentare anche dati di tabelle a doppia entrata Riprendiamo Es. 2.1 Negozio Reddito Negozio 1 € 21.500,00 Negozio 2 € 16.800,00 Negozio 3 € 20.500,00 Negozio 4 € 21.100,00 Negozio 5 € 19.700,00 6 13/03/2013 Riprendiamo Es. 2.1 Negozio Reddito Negozio 1 € 21.500,00 Negozio 2 € 16.800,00 Negozio 3 € 20.500,00 Negozio 4 € 21.100,00 Negozio 5 € 19.700,00 • Inserire Grafico a barre • cliccare sull’area • cliccare su Seleziona dati • Nella finestra di dialogo selezionare i dati Reddito Negozio 5 Negozio 4 Negozio 3 Reddito PROVIAMO Negozio 2 Negozio 1 €- € 5.000,00 € 10.000,00 € 15.000,00 € 20.000,00 € 25.000,00 Tabella a doppia entrata Esempio 2.3: la tabella seguente mostra l’ammontare di esportazioni e importazioni per attività economica 200. Produrre un grafico a barre rappresentativo Classi di attività economica Autoveicoli PROVIAMO Esistono vari modi di graficare la doppia entrata Esportazioni Importazioni 11.681.377 24.736.864 Parti e accessori per autoveicoli 8.494.249 4.862.863 Calzature 8.394.356 3.062.063 Medicinali e preparati farmaceutici 6.988.249 6.483.934 Altre macchine per impieghi speciali 6.895.006 Elettrodomestici 6.011.183 2.495.881 1.119.915 Macchine utensili compresi parti e accessori 5.680.330 2.631.355 Altri indumenti esterni 5.669.565 2.612.787 Gioielli e articoli di oreficeria 5.382.526 941.905 Altre macchine di impiego generale 5.134.691 1.431.210 7 13/03/2013 Grafico a settore circolare (torte) Si usano quando si vuole evidenziare come il fenomeno viene suddiviso tra le varie modalità che lo compongono. La frequenza totale viene rappresentata dall’area del cerchio, mentre quella di ogni modalità viene rappresentata dall’area di un singolo settore. Ci saranno tanti settori quante sono le modalità da rappresentare. L’angolo al centro di ogni settore è proporzionale alla frequenza rappresentata Come viene calcolato? L’ampiezza dell’angolo si ottiene moltiplicando per 360 la frequenza relativa (frequenza della modalità/frequenza totale) Se occorre rappresentare più di una serie di dati (più colonne) si possono usare i grafici ad anello 8 13/03/2013 Esempio 2.4 La tabella seguente rappresenta il numero complessivo di depositi bancari suddivisi per aree geografiche. Produrre un grafico a torte. Italia Nord-Occidentale Italia Nord-Orientale Italia Centrale Italia Meridionale Italia Insulare PROVIAMO 214.476 129.678 141.728 85.614 40.817 • Inserire Grafico a torta • cliccare sull’area • cliccare su Seleziona dati • Nella finestra di dialogo selezionare i dati • In Layout grafico (Progettazione) far uscire le percentuali. • In Etichette dati (Layout) si può far comparire il dato Titolo del grafico 7% 14% 35% Italia Nord-Occidentale Italia Nord-Orientale Italia Centrale Italia Meridionale Italia Insulare 23% 21% 9 13/03/2013 Istogramma Vengono utilizzati per rappresentare distribuzioni di variabili quantitative continue, rappresentate in classi Classi di uguale ampiezza Classi di ampiezza diversa Rettangoli con - stessa base -altezza proporzionale alla frequenza Rettangoli con -Base proporzionali all’ampiezza della classe -Altezza proporzionale alla densità di frequenza (freq. diviso ampiezza della classe) area dei rettangoli = frequenza totale moltiplicato l’ampiezza della classe Area dei rettangoli = frequenza della classe Manualmente… Calcola l’ampiezza delle classi Calcola la densità di frequenza (frequenza/ampiezza) Sulle ascisse rappresenta le classi Si “innalzano” i rettangoli di base due valori successivi delle ascisse, e per altezze le densità 10 13/03/2013 Automaticamente Usando “Analisi dei dati” Diagramma cartesiano Si usa quando si vuole rappresentare l’andamento di un fenomeno (serie statistica), che varia in funzione di un parametro. Si usano le frequenze relative congiunte con una spezzata. (Se si vuole mostrare il contributo che ogni serie fornisce al totale al variare del tempo, si possono usare i diagrammi ad aree) Ascisse: modalità Ordinate: frequenze 11 13/03/2013 Esempio 2.8 Un’azienda alimentare produttrice di gelato vuole controllare il processo di riempimento di vaschette di gelato da essa prodotte. Si osservano i dati di 30 lotti di 5 vaschette, ottenendo la tabella seguente. Si vuole visualizzare l’andamento del processo al variare dei lotti • selezionare grafico a linee •In Progettazione, selezionare i dati: ascisse inserire prima colonna (da 1 a 30); creare 5 serie, e per ognuna indicare i valori (la colonna corrispondente) Titolo del grafico 108,0 106,0 104,0 102,0 Titolo asse 100,0 1a vaschetta 2a vaschetta 98,0 3a vaschetta 4a vaschetta 96,0 5a vaschetta 94,0 92,0 90,0 88,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 12 13/03/2013 Diagramma di dispersione Si usano nel caso di una statistica doppia, in cui entrambi i caratteri sono delle variabili Serve per osservare la “dispersione” ossia la vicinanza o distanza tra le unità statistiche Esempio 2.10 La tabella seguente riporta la concentrazione di alcuni reagenti in funzione del tempo (secondi), verificatesi durante una reazione chimica. tempo misure di concentrazione 0 995,14 10 970,43 20 931,54 30 900,51 40 884,08 50 847,10 60 815,00 70 791,08 80 755,32 90 733,93 100 712,53 110 688,51 120 668,22 130 636,10 13 13/03/2013 Esempio 2.10 La tabella seguente riporta la concentrazione di alcuni reagenti in funzione del tempo (secondi), verificatesi durante una reazione chimica. Visualizzare le misure di concentrazione in funzione del tempo, evidenziando la vicinanza o la distanza tra le unità • selezionare diagramma a dispersione •In Progettazione, selezionare i dati e poi “aggiungi” • Nome della serie “concentrazione”; • Valori X: inserire prima colonna (tempo) • Valori Y: le misure di concentrazione misure di concentrazione 1200,00 1000,00 Titolo asse 800,00 600,00 misure di concentrazione 400,00 200,00 0,00 0 100 200 300 400 500 600 Titolo asse 14 13/03/2013 Esercizi Esercizi per casa Esempio 2.2: la tabella seguente mostra gli arrivi (variazioni in percentuale rispetto allo stesso periodo dell’anno precedente) negli alberghi italiani, nel periodo di ferragosto 2001 Zona geografica Italiani Stranieri Nord - ovest 1,1 -7,6 Nord - est -1,0 -1,6 Centro -2,9 5,9 Sud e isole 6,5 16,1 Produrre un grafico a barre che la rappresenti 15 13/03/2013 Esercizi per casa Dovrebbe uscire un grafico così Arrivi negli esercizi alberghieri per ripartizione geografica ferragosto 2001 (fonte: ISTAT) 20 15 10 5 0 -5 Nord - ovest Nord - est Centro Sud e isole Italiani Stranieri -10 16