Distribuzioni congiunte di 2 caratteri Tabella 2.2 – Durata della batteria in ore di conversazione, numero di memorie disponibili nel telefono, rete (Dual Band GSM o Etacs) e disponibilità del protocollo Wap di 20 telefoni cellulari. Durata Memorie Cellulare batteria disponibili Rete Wap Alcatel – OneTouchEasyDB 5 0 DB No Ericsson – A 2618 4 100 DB No Ericsson – A 2628 4 99 DB Si Ericsson – R 320 s 4 99 DB Si Ericsson – T 10 s 3 0 DB No Motorola – M 3588 4 0 DB No Motorola – StarTAC Etacs 1 100 E No Motorola – Talkabout T2288 3 0 DB Si Motorola Talkabout T180 3 0 DB No Nec – DB4100 2 0 DB No Nokia – Ringo 2 60 E No Panasonic – GD30 3 50 DB No Philips – Savvy Vogue 4 0 DB No Sagem – MW 930 3 100 DB Si Sagem – MW 936 3 100 DB Si Siemens – C30 4 0 DB No Telit – GM810e 5 0 DB No Telit – GM822 4 0 DB Si Telit – GM830 4 0 DB No Trium – Galaxy 3 100 DB No Tab. 1: Distribuzione congiunta dei telefoni cellulari in base alla durata della batteria ed al numero di memorie Durata della batteria Memorie disponibili < 60 ≥ 60 Totale 1 0 1 1 2 1 1 2 3 4 3 7 4 5 3 8 5 2 0 2 Totale 12 8 20 Tab. 2: Distribuzione congiunta dei telefoni cellulari in base alla durata della batteria ed alla rete Durata della batteria Rete Dual Band GSM ETACS Totale 1 0 1 1 2 1 1 2 3 7 0 7 4 8 0 8 5 2 0 2 Totale 18 2 20 Tab. 3: Distribuzione congiunta dei telefoni cellulari in base alla rete e alla disponibilità del protocollo Rete Protocollo Wap Dual Band GSM ETACS Totale SI 6 0 6 NO 12 2 14 Totale 18 2 20 E’ possibile rappresentare in una tabella di contingenza 2 caratteri quantitativi (discreti o continui), un carattere quantitativo ed uno qualitativo oppure due caratteri qualitativi Distribuzioni di frequenza congiunta Due caratteri A e B (a1, a2, …, ak ) (b1, b2, …, bh) nij = frequenza assoluta di (ai,bj) A a1 a2 .. ak Tabella di contingenza. B b1 b2 … bh Totale n11 n12 … n1h n1 . n22 … n2h … … … nk 2 … nkh n.2 … n.h n21 … nk 1 Totale n.1 k h n i 1 j 1 ij n n2 . … nk . n Frequenze marginali Frequenza di ai ni . ni1 ni2 Frequenza di bj n.j n1j n2 j A a1 a2 … ak h nih nij j1 k nkj nij i1 Tabella di contingenza. B b1 b2 … bh Totale n11 n12 … n1h n1 . n21 ... nk 1 Totale n.1 n22 ... n2h … … … nk 2 … nkh n.2 … n.h n2 . … nk . n Distribuzioni di frequenza congiunta fij = frequenza relativa di (ai,bj) = nij/n A Tabella di contingenza. B b1 b2 … bh Totale a1 a2 .. ak Totale f11 f12 … f1h f21 … fk1 f.1 f22 … fk2 f.2 … … … … f2h … fkh f.h f1. f2. … fk. 1 E’ possibile moltiplicare ogni frequenza fij per 100 in modo da ottenere le frequenze percentuali pij Distribuzioni di frequenza condizionate Tab. 1: Distribuzione congiunta dei telefoni cellulari in base alla durata della batteria ed al numero di memorie Durata della batteria Memorie disponibili < 60 ≥ 60 Totale 1 0 1 1 2 1 1 2 3 4 3 7 4 5 3 8 5 2 0 2 Totale 12 8 20 • Qual è la distribuzione della durata della batteria per telefoni con più di 60 memorie disponibili? • Qual è la distribuzione delle memorie disponili per telefoni la cui batteria dura 3 ore? Tab. 1: Distribuzione della durata della batteria per telefoni con più di 60 memorie disponibili Durata della batteria | Memorie disponibili ≥ 60 ni 1 1 2 1 3 3 4 3 5 0 Totale 8 Tab. 2: Distribuzione delle memorie disponibili per telefoni la cui batteria dura 3 ore Memorie disponibili | Durata della batteria =4 ni < 60 4 ≥ 60 3 Totale 7 Distribuzioni di frequenza condizionata A|B=bj a1 a2 .. Frequenze condizionate n1j n2j … ak nkj Totale n.j B | A =ai b1 b2 .. bh Totale Frequenze condizionate ni1 ni2 … nih ni. L’analisi congiunta di due caratteri, quantitativi e/o qualitativi, viene effettuata per verificare se tra i caratteri esiste una relazione (associazione) oppure se sono tra loro indipendenti (indipendenza in distribuzione) Date due variabili quantitative e/o qualitative si ha indipendenza in distribuzione se nij:ni.=n.j:n o, alternativamente, se nij ni. n. j n Esempio Età Giorni di assenza in un semestre 0 1-2 3-4 5-6 7e+ Tot < 30 12 3 6 6 3 30 30 - 40 8 2 4 4 2 20 40 - 50 4 1 2 2 1 10 50 e + 16 4 8 8 4 40 Tot 40 10 20 20 10 100 2=(20*10)/100 La relazione vale per tutte le frequenze nij Disturbi cardiaci Si No Totale Frequenze osservate su “Disturbi cardiaci e russare notturno” Russare notturno Russa Russa Non Russa quasi tutte le Totale russa occasionalmente ogni notti notte 24 35 21 30 110 603 192 224 1355 2374 638 213 254 1379 2484 C’è indipendenza in distribuzione tra i caratteri? Frequenze teoriche sotto l’ipotesi di indipendenza tra caratteri Russare notturno Russa Disturbi Russa Non Russa quasi cardiaci tutte le Totale russa occasionalmente ogni notti notte Si 61,07 28,25 9,43 11,25 110 No 1317,93 609,75 203,57 242,75 2374 Totale 638 213 254 1379 2484 (110*1379)/2484 Indice Chi-quadrato di Pearson k h 2 i 1 j 1 n ij nˆij nˆij 2 0 nmin k 1, h 1 2 Indipendenza tra caratteri Massima associazione Disturbi cardiaci e russare notturno 24 61.07 2 2 35 28.25 61.07 28.25 2 224 242.75 72.78 242.75 0 2 2484 2 ... Indipendenza in media Per variabili miste o quantitative Y è indipendente in media da X, se al variare delle modalità di X le medie condizionate di Y rimangono costanti X è indipendente in media da Y, se al variare delle modalità di Y le medie condizionate di X rimangono costanti L’indipendenza in distribuzione implica l’indipendenza in media, ma non è vero il contrario L’indipendenza in media di Y da X non implica quella di X da Y, e viceversa Indipendenza in media di Y da X Y X y1 y2 … yj … yh Totale x1 n11 n12 … n1j … n1h n1. x2 n21 n22 … n2j … n2h n2. . . . . . xi ni1 ni2 nih ni. . . . . . xk nk1 nk2 … nkj … nkh nk. Totale n.1 n.2 … n.j … n.h n … . … nij … . Y |X x1 1 n1. Y | X xk 1 nk. h y j n1 j j 1 h y j nkj j 1 y1 yk y1 y2 ... y i ... y k Esempio Reddito della famiglia X Basso Medio Alto Numero di auto per famiglia Y 1 2 3 2 4 6 4 8 12 6 12 18 1* 2 2 * 4 3 * 6 y1 2,33 12 1* 4 2 * 8 3 *12 y2 2,33 24 1* 6 2 *12 3 *18 y3 2,33 36