CORSO DI STATISTICA SOCIALE Statistica sociale Laboratorio 1 Dott.ssa Agnieszka Stawinoga [email protected] Cosa è la statistica E’ l’insieme delle metodologie per lo studio di fenomeni che hanno l’attitudine a variare. Comprende la raccolta, l’elaborazione e la definizione di informazioni per agevolare sia l’analisi dei dati che i processi decisionali. Ricordiamo sempre che: Ogni risultato va interpretato. Ogni interpretazione può essere giusta o sbagliata, utile o inutile, rilevante o irrilevante rispetto al problema che dobbiamo risolvere. Ciò su cui si deve essere d’accordo è il processo che ha generato quel risultato. Le variabili quantitative Continue - possono assumere tutti i valori compresi in un intervallo di infiniti numeri reali. I dati continui sono di solito il risultato di una misurazione. Esempio: Il peso e l’altezza delle persone, l’età, la durata della chiamata telefonica Discrete - un insieme discreto (finito e numerabile ) di numeri interi. Sono spesso il risultato del conteggio del numero di volte in cui qualcosa si verifica. Esempio: Il numero di prove per ottenere un certo risultato, il numero di membri di un nucleo famigliare, il numero di persone in fila Cliente Durata della telefonata (min) 1 23 2 15 3 40 4 19 5 41 6 40 7 28 8 44 2. Creare la tabella dei dati 9 38 3. Calcolare la durata media della telefonata, 10 43 11 16 12 38 13 35 14 34 6. Creare una nuova variabile Y=4+5X 15 20 7. Dividere in 3 gruppi e calcolare la media 16 37 8. Calcolare la varianza campionaria e lo 17 38 18 25 19 41 20 43 Esercizio 1 Una ditta che vende mobili per corrispondenza vuole conoscere il tempo trascorso al telefono da un cliente con un agente di vendita. La ditta raccoglie informazioni sulla durata delle telefonate (in minuti) per 20 diversi clienti. 1. Aprire una nuova cartella di lavoro Excel la mediana e la moda 4. Qual è il valore minimo e massimo? 5. Calcolare gli scarti dalla media scarto quadratico medio Esercizio 2 1. Aprire la cartella di lavoro “Dati_STUDENTI” 2. In una nuova cartella di lavoro creare la tabella dove saranno riportati i dati che riguardano il peso degli studenti degli anni 1993 e 1994. 3. Usando lo strumento di Excel dall’ esercizio precedente determinare le statistiche descrittive 4. Per la distribuzione in classi di ampiezza 5 (40- 45, 45- 50, …, 110- 115, 115- 120) calcolare: 4.1 le frequenze relative (fi), percentuali (pi) 4.2 le frequenze cumulate (Ni), le frequenze relative cumulate(Fi), le frequenze percentuali cumulate (Pi) 4.3 la media, la mediana, la classe modale 5. Gli stessi calcoli fare per la distribuzione in classi di ampiezza 10( 40-50, 50- 60, …, 110- 120) 6. Confrontare i valori medi calcolati nel punto 3, 4 e 5 Gli strumenti di Excel I. Statistica descrittiva 1. Aprite un nuovo foglio e digitate i dati da analizzare. 2. Selezionate Analisi dati dal menu Dati. Sullo schermo appare la finestra di dialogo illustrata nella Figura 1. Figura 1 3. Fatte doppio clic su Statistica descrittiva . Sullo schermo appare la finestra di dialogo Statistica descrittiva. Figura 2. 4. Dati raggruppati per. Quando i vostri dati sono organizzati in colonne selezionate Colonne. 5. Intervallo di input. Inserite il riferimento alle celle che contengono i dati, inclusa l’etichetta della variabile. 6. Etichetta nella prima riga. Attivate questa casella quando l’intervallo di input include un’etichetta. Figura 2 7. Intervallo di output. Fate clic su questo pulsante e inserite nel campo a destra il riferimento alla prima delle celle che conterranno i risultati di questa analisi statistica. In alternativa, potete inviare i dati di output in un nuovo foglio di lavoro della cartella corrente o di una nuova cartella. 8. Riepilogo statistiche. Attivate questa casella perché il riepilogo delle statistiche è il motivo principale per cui si usa lo strumento Statistica descrittiva. 9. Dopo aver specificato tutte le informazioni necessarie nella finestra di dialogo Statistica descrittiva, fate clic sul pulsante OK. II. Distribuzione in classi 1. Aprite un nuovo foglio e digitate i dati. 2. Preparate una colonna con i punti di separazione delle classi (in ordine crescente). La colonna D nella Figura 3. 3. Selezionate Analisi dati dal menu Strumenti e scegliete Istogramma dalla finestra di dialogo. Figura 3 4. Intervallo di input. Digitate i riferimenti delle celle che contengono i dati, inclusa l’etichetta. 5. Intervallo della classe. Digitate i riferimenti delle celle che contengono i valori che separano gli intervalli, inclusa l’etichetta. 6. Etichette. Attivate questa casella per indicare che le etichette sono state incluse nei riferimenti degli intervalli di input e delle classe. 7. Intervallo di output. Digitate il riferimento della prima cella in alto a sinistra dell’intervallo delle celle che conterranno la tabella e il grafico di output. 8. Pareto (istogramma ordinato). Disattivate questa opzione per ottenere una distribuzione delle frequenze e un diagramma standard. 9. Percentuale cumulativa. Attivate questa casella per ottenere le frequenze cumulative oltre alle singole frequenze di ogni intervallo. 10. Grafico in output. Attivate questa casella per ottenere un istogramma oltre alla tabella con la distribuzione delle frequenze. 11. Dopo aver specificato tutte le informazioni necessarie nella finestra di dialogo Istogramma, fate clic sul pulsante OK. Alcuni suggerimenti 1. Per adeguare la larghezza della colonna alla voce più lunga, fate doppio clic sul trattino che separa le lettere delle colonne. In alternativa, selezionate le colonne, aprite il menu Formato e selezionate le opzioni Colonna | Adatta. 2. Per semplificare la lettura della tabella, formattate le celle con un numero minore di cifre decimali. Scegliete le celle da formattare, fate clic più volte sul pulsante Diminuisci decimali fino a visualizzare solo le cifre decimali desiderate. In alternativa, scegliete il comando Celle dal menu Formato. Nella finestra di dialogo Formato celle, fate clic sulla scheda Numero e digitate il numero di decimali nel campo Posizioni decimali. Fate clic su OK. 3. Se facendo le operazioni aritmetiche non volete che il riferimento ad una cella particolare sia adattato è possibile utilizzare i riferimenti assoluti. Quando volete rendere assoluto solo il riferimento di riga o di colonna potete usare i riferimenti misti. Riferimento assoluto $A$1 Riferimenti misti - assoluto di colonna $A1 - assoluto di riga A$1