Distribuzioni congiunte di
2 caratteri
Tabella 2.2 – Durata della batteria in ore di conversazione,
numero di memorie disponibili nel telefono, rete (Dual Band
GSM o Etacs) e disponibilità del protocollo Wap di 20 telefoni
cellulari.
Durata Memorie
Cellulare
batteria disponibili Rete Wap
Alcatel – OneTouchEasyDB
5
0
DB No
Ericsson – A 2618
4
100
DB No
Ericsson – A 2628
4
99
DB Si
Ericsson – R 320 s
4
99
DB Si
Ericsson – T 10 s
3
0
DB No
Motorola – M 3588
4
0
DB No
Motorola – StarTAC Etacs
1
100
E
No
Motorola – Talkabout T2288
3
0
DB Si
Motorola Talkabout T180
3
0
DB No
Nec – DB4100
2
0
DB No
Nokia – Ringo
2
60
E
No
Panasonic – GD30
3
50
DB No
Philips – Savvy Vogue
4
0
DB No
Sagem – MW 930
3
100
DB Si
Sagem – MW 936
3
100
DB Si
Siemens – C30
4
0
DB No
Telit – GM810e
5
0
DB No
Telit – GM822
4
0
DB Si
Telit – GM830
4
0
DB No
Trium – Galaxy
3
100
DB No
Tab. 1: Distribuzione congiunta dei telefoni
cellulari in base alla durata della batteria
ed al numero di memorie
Durata della
batteria
Memorie disponibili
< 60
≥ 60
Totale
1
0
1
1
2
1
1
2
3
4
3
7
4
5
3
8
5
2
0
2
Totale
12
8
20
Tab. 2: Distribuzione congiunta dei telefoni
cellulari in base alla durata della batteria
ed alla rete
Durata della
batteria
Rete
Dual Band
GSM
ETACS
Totale
1
0
1
1
2
1
1
2
3
7
0
7
4
8
0
8
5
2
0
2
Totale
18
2
20
Tab. 3: Distribuzione congiunta dei telefoni
cellulari in base alla rete e alla disponibilità
del protocollo
Rete
Protocollo
Wap
Dual Band
GSM
ETACS
Totale
SI
6
0
6
NO
12
2
14
Totale
18
2
20
E’ possibile rappresentare in
una tabella di contingenza 2
caratteri quantitativi
(discreti o continui), un
carattere quantitativo ed
uno qualitativo oppure due
caratteri qualitativi
Distribuzioni di
frequenza congiunta
Due caratteri A e B
(a1, a2, …, ak )
(b1, b2, …, bh)
nij = frequenza assoluta di (ai,bj)
A
a1
a2
..
ak
Tabella di contingenza.
B
b1 b2 … bh Totale
n11 n12 … n1h
n1 .
n22 … n2h
… … …
nk 2 … nkh
n.2 … n.h
n21
…
nk 1
Totale n.1
k
h
 n
i 1 j 1
ij
n
n2 .
…
nk .
n
Frequenze marginali
Frequenza di ai
ni .  ni1  ni2 
Frequenza di bj
n.j  n1j  n2 j 
A
a1
a2
…
ak
h
 nih   nij
j1
k
 nkj  nij
i1
Tabella di contingenza.
B
b1 b2 … bh Totale
n11 n12 … n1h
n1 .
n21
...
nk 1
Totale n.1
n22 ... n2h
… … …
nk 2 … nkh
n.2 … n.h
n2 .
…
nk .
n
Distribuzioni di
frequenza congiunta
fij = frequenza relativa di (ai,bj)
= nij/n
A
Tabella di contingenza.
B
b1 b2 … bh Totale
a1
a2
..
ak
Totale
f11 f12 … f1h
f21
…
fk1
f.1
f22
…
fk2
f.2
…
…
…
…
f2h
…
fkh
f.h
f1.
f2.
…
fk.
1
E’ possibile moltiplicare ogni frequenza fij
per 100 in modo da ottenere le
frequenze percentuali pij
Distribuzioni di frequenza
condizionate
Tab. 1: Distribuzione congiunta dei telefoni
cellulari in base alla durata della batteria
ed al numero di memorie
Durata della
batteria
Memorie disponibili
< 60
≥ 60
Totale
1
0
1
1
2
1
1
2
3
4
3
7
4
5
3
8
5
2
0
2
Totale
12
8
20
• Qual è la distribuzione della durata
della batteria per telefoni con più
di 60 memorie disponibili?
• Qual è la distribuzione delle
memorie disponili per telefoni la cui
batteria dura 3 ore?
Tab. 1: Distribuzione della durata della
batteria per telefoni con più di 60
memorie disponibili
Durata della batteria | Memorie disponibili ≥ 60
ni
1
1
2
1
3
3
4
3
5
0
Totale
8
Tab. 2: Distribuzione delle memorie
disponibili per telefoni la cui batteria
dura 3 ore
Memorie disponibili | Durata della batteria =4
ni
< 60
4
≥ 60
3
Totale
7
Distribuzioni di
frequenza condizionata
A|B=bj
a1
a2
..
Frequenze
condizionate
n1j
n2j
…
ak
nkj
Totale
n.j
B | A =ai
b1
b2
..
bh
Totale
Frequenze
condizionate
ni1
ni2
…
nih
ni.
L’analisi congiunta di due caratteri,
quantitativi e/o qualitativi, viene
effettuata per verificare se tra i
caratteri esiste una relazione
(associazione) oppure se sono tra
loro indipendenti (indipendenza in
distribuzione)
Date due variabili quantitative e/o
qualitative si ha indipendenza in
distribuzione se
nij:ni.=n.j:n
o, alternativamente, se
nij 
ni.  n. j
n
Esempio
Età
Giorni di assenza in un semestre
0
1-2
3-4
5-6
7e+
Tot
< 30
12
3
6
6
3
30
30 - 40
8
2
4
4
2
20
40 - 50
4
1
2
2
1
10
50 e +
16
4
8
8
4
40
Tot
40
10
20
20
10
100
2=(20*10)/100
La relazione vale per tutte
le frequenze nij
Disturbi
cardiaci
Si
No
Totale
Frequenze osservate su
“Disturbi cardiaci e russare notturno”
Russare notturno
Russa
Russa
Non
Russa
quasi
tutte le Totale
russa occasionalmente ogni
notti
notte
24
35
21
30
110
603
192
224
1355
2374
638
213
254
1379
2484
C’è indipendenza in distribuzione tra i
caratteri?
Frequenze teoriche
sotto l’ipotesi di indipendenza tra caratteri
Russare notturno
Russa
Disturbi
Russa
Non
Russa
quasi
cardiaci
tutte le Totale
russa occasionalmente ogni
notti
notte
Si
61,07
28,25
9,43
11,25
110
No
1317,93
609,75
203,57 242,75 2374
Totale
638
213
254
1379
2484
(110*1379)/2484
Indice Chi-quadrato di
Pearson
k
h
  
2
i 1 j 1
n
ij
 nˆij 
nˆij
2
0    nmin k  1, h  1
2
Indipendenza
tra caratteri
Massima
associazione
Disturbi cardiaci e russare
notturno

24  61.07 

2

2

35  28.25

61.07
28.25
2

224  242.75

 72.78
242.75
0   2  2484
2
 ...


Indipendenza in media
Per variabili miste o quantitative
 Y è indipendente in media da X, se al
variare delle modalità di X le medie
condizionate di Y rimangono costanti
 X è indipendente in media da Y, se al
variare delle modalità di Y le medie
condizionate di X rimangono
costanti


L’indipendenza in distribuzione implica
l’indipendenza in media, ma non è vero il
contrario
L’indipendenza in media di Y da X non
implica quella di X da Y, e viceversa
Indipendenza in media di Y da X
Y
X
y1
y2
…
yj
…
yh
Totale
x1
n11
n12
…
n1j
…
n1h
n1.
x2
n21
n22
…
n2j
…
n2h
n2.
.
.
.
.
.
xi
ni1
ni2
nih
ni.
.
.
.
.
.
xk
nk1
nk2
…
nkj
…
nkh
nk.
Totale
n.1
n.2
…
n.j
…
n.h
n
…
.
…
nij
…
.
Y |X  x1
1

n1.
Y | X  xk
1

nk.
h
y j n1 j

j 1
h
y j nkj

j 1
 y1
 yk
y1  y2  ...  y i  ...  y k
Esempio
Reddito
della
famiglia
X
Basso
Medio
Alto
Numero di auto per
famiglia
Y
1
2
3
2
4
6
4
8
12
6
12
18
1* 2  2 * 4  3 * 6
y1 
 2,33
12
1* 4  2 * 8  3 *12
y2 
 2,33
24
1* 6  2 *12  3 *18
y3 
 2,33
36
Scarica

Tab. 2