Associazione tra variabili qualitative • È possibile verificare l’associazione anche tra variabili qualitative (nominali o ordinali) attraverso un apposito test. • Esempio: • Verificare l’associazione tra genere e scelta della facoltà universitaria. • Ossia ci si sta chiedendo: la scelta della facoltà universitaria dipende dal genere o è indipendente al genere? • Dunque bisogna testare la dipendenza tra le due variabili. Costruire la tabella di frequenza doppia Soggetti 1 2 3 4 5 6 7 8 9 10 Genere Maschio Femmina Femmina Femmina Maschio Femmina Femmina Maschio Femmina Maschio Facoltà Psicologia Psicologia Psicologia Psicologia Ingegneria Psicologia Psicologia Ingegneria Ingegneria Ingegneria Tabella di frequenza doppia Maschi Femmine Tot colonna Psicologia 1 5 6 Ingegneria 3 1 4 Totale riga 4 6 10 Informazioni della Tabella di frequenza doppia: Esprime la relazione tra le modalità (o livelli) di 2 variabili qualitative. I numeri all’interno di ciascuna cella indicano le frequenze osservate (fo) sul campione, ossia derivanti dalla rilevazione. Frequenze attese • Per verificare l’eventuale dipendenza è necessario calcolare la frequenza attesa (fe; expected frequencies) per ciascuna cella (frequenza osservata). • Ossia in questo caso: sapendo che i maschi sono 4 e che gli iscritti a psicologia sono 6, quanti maschi “mi aspetto” che si iscrivano a psicologia? fe tot riga tot colonna N Tabella doppia con fo ed fe Maschi Femmine Tot colonna Psicologia Ingegneria Totale riga 1 (fe=2,4) 5 (fe=3,6) 6 3 (fe=1,6) 1 (fe=2,4) 4 4 6 10 La somma delle frequenze attese per riga deve al totale di riga. La somma delle frequenze attese per colonna deve al totale di colonna. La somma di tutte le frequenze attese deve essere uguale a N. Indice di dipendenza χ2 • Dopo aver calcolato le fe si calcola il χ2: 2 fo fe 2 fe • Se tutte le fo e le fe sono uguali il valore del χ2 sarà uguale a 0, dunque le due variabili non sono dipendenti. • Di conseguenza, maggiore è la differenza tra fo ed fe, maggiore sarà il valore del χ2. Calcolo del χ2 Psicologia Ingegneria Totale riga 1 fe=2,4 5 fe=3,6 6 3 fe=1,6 1 fe=2,4 4 4 Maschi Femmine Tot colonna 1 2,4 2 2 2,4 3 1,6 2 1,6 6 10 5 3,6 2 3,6 1 2,4 2 2,4 0,82 1,23 0,54 0,82 3,41 2 Caratteristiche del χ2 • L’indice χ2 è sempre positivo • Può assumere valori che variano tra 0 (massima indipendenza) ed N (massima dipendenza) • Il χ2 risulta dunque difficilmente interpretabile e pertanto è necessario calcolare il χ2 relativo (φ) ossia χ2/N • φ varia tra 0 ed 1 e si interpreta come segue: 0 e 0,5 0,5 e 1 Indipendenza tra le variabili Dipendenza tra le variabili Calcolo del χ2 relativo: interpretazione • φ= χ2/N • φ= 3,41/10=0,34 • Interpretazione • Le due variabili non risultano associate, ossia genere e scelta della facoltà universitaria sono indipendenti (o più precisamente, la scelta universitaria non dipende dal genere). Esercizio 1 • Verificare l’associazione tre le variabili “genere” ed “esito dell’esame di psicometria”. Soggetti Genere Esito 1 Maschio Bocciato 2 Maschio Bocciato 3 Maschio Promosso 4 Femmina Promosso 5 Femmina Promosso 6 Femmina Promosso 7 Femmina Bocciato 8 Femmina Bocciato 9 Femmina Bocciato 10 Femmina Bocciato 11 Femmina Bocciato 12 Femmina Bocciato Tabella di massima indipendenza Promozione Bocciatura Totale riga 1 fe=1 3 fe=3 4 2 fe=2 6 fe=6 8 3 Maschi Femmine Tot colonna 12 1 1 2 2 3 3 6 6 2 2 9 1 2 2 2 3 2 6 0 Esercizio 2 • Verificare l’associazione tra le variabili “genere” e “professione”. Soggetti Genere Professione 1 Maschio Meccanico 2 Maschio Meccanico 3 Maschio Meccanico 4 Maschio Meccanico 5 Maschio Meccanico 6 Maschio Meccanico 7 Maschio Estetista 8 Femmina Estetista 9 Femmina Estetista 10 Femmina Estetista 11 Femmina Estetista 12 Femmina Estetista Tabella di frequenza doppia Estetista 1 fe=3,5 5 fe=2,5 6 Maschi Femmine Tot colonna Meccanico 6 fe=3,5 0 fe=2,5 6 Totale riga 7 5 12 2 2 2 2 1 3 , 5 6 3 , 5 5 2 , 5 0 2 , 5 2 1,79 1,79 2,5 2,5 8,58 3,5 3,5 2,5 2,5 φ=0,72 quindi? Le due variabili sono dipendenti: in particolare i maschi scelgono di fare il meccanico, mentre le femmine di fare l’estetista. Esercizio 3 • Verificare l’efficacia della psicoterapia rispetto a tra diversi disturbi. Soggetti 1 2 3 4 5 6 7 8 9 10 Disturbo Depressione Ansia Bipolare Depressione Ansia Bipolare Depressione Ansia Bipolare Depressione Esito dopo 2 mesi Migliorato Migliorato Stabile Stabile Migliorato Peggiorato Stabile Migliorato Peggiorato Migliorato Risultati Peggiorato Stabile Migliorato Totale riga Ansia 0 fe=0,6 0 fe=0,9 3 fe=1,5 3 Bipolare 2 fe=0,6 1 fe=0,9 0 fe=1,5 3 Depressione 0 fe=0,8 2 2 fe=1,2 3 2 fe=2 5 4 Tot colonna 10 • χ2=9,11; φ=0,91; c’è dipendenza tra le variabili. • In particolare: le persone con disturbo di ansia hanno avuto un miglioramento; le persone con disturbo bipolare hanno avuto un peggioramento; le persone con disturbo di depressione sono rimaste stabili.