1
2
LE TECNICHE CHE VEDREMO OGGI
3
4
5
6
7
Pi<1/2
8
esistono “in natura” (per esempio unità naturali,
quali famiglie; unità amministrative, quali comuni)
9
10
11
La variabile ausiliaria usata per definire le probabilità variabili potrebbe essere,
12
non la dimensione dei grappoli, M, ma una generica X, positivamente correlata
con la Y.
Pi
13
=
s12
14
Identità tra devianze
 y
ij  y    yij  yi    M  yi  y 
i
j
2
2
i
j
2
i
Devianza totale=devianza within+devianza beetween
1
2
2
2




NM  1
S 
y

y

y

y

S


ij
ij
NM  1 i j
i
j
2
Sw
2
SB
2
1
2
2
2





y

y

y

y

S


ij
i
ij
i
w  N ( M  1) 
N ( M  1) i j
i
j
1

M  yi  y

N 1 i j
  M y  y 
2
2
i
i
S B  N  1
2
j
Mi=M, PER OGNI i
15
S12=MSB2
=
=
Mi=M, PER OGNI i
16
STIMA PROPORZIONE IN GR
Mi=M, per ogni i
pˆ gr 
p
i
c
n
corretto
 N 1

p  pˆ 
1 f
v pˆ  
 n 1
n
c
2
c
c
distorto
c
 pi  Pi 
gr
pˆ gr
i
2
i
a

m
i
ai
1
 
n c Mi
1 f
V  pˆ gr  
n
Mi diverso per ogni i
gr
1 f
V  pˆ gr  
nM 2
1 f
v pˆ gr  
nMˆ 2
ai  M i P 2 , M
M0
N
 N 1
a  M pˆ  , Mˆ  1 M
 n 1

n
c

2
i
c
i
gr
c
17
i
18
SOLUZIONE ES. 1
19
SOLUZIONE ES. 1
20
Calcolare le probabilità di inclusione del primo e del
secondo ordine.
21
SOLUZIONE ES. 2
P J ’=
T’j
=Pj/(1-PI)
P'j=Pj/(1-pi)T'j
0,076932 0,076932
0,061545
0,138477
0,076932
0,184636
0,076932
0,138477
0,153863
0,092318
0,138477
0,276954
0,353886
0,538522
0,615454
0,753931
0,907794
1,000112
=
CAMPIONE ESTRATTO: C=(2,9)
 2  0,219
 9  0,274
 2,9  0,035
22
ESERCIZIO 3
In una strada del centro storico di una certa città ci sono 8
palazzi costruiti prima del 1920. Allo scopo di valutare le
condizioni di stabilità dei palazzi ne vengono scelti 2 a
caso con probabilità variabili, impiegando come variabile
ausiliaria il numero di famiglie residenti in ciascun
palazzo.
Palazzi 1 2 3 4 5 6 7 8
Famiglie 25 15 40 12 50 28 16 20
residenti
a)Si estragga il campione con il metodo di Yates-Grundy.
b)Si definiscano le probabilità di inclusione del primo e
secondo ordine e si calcolino tali probabilità per il
campione estratto in a).
23
ESERCIZIO 4
ospedali
n_posti
letto
1
2
3
4
5
6
7
8
9
10
470 210 350 960 235 550 125 210 425 232
(
,
)
24
ESERCIZIO 5
(
,
,
)
25
ESERCIZIO 6
Si consideri una popolazione di N=4 catene di supermercati di una
città italiana; ognuna di esse è presente nella città con tre negozi.
L'entrata mensile di ogni negozio è indicata in milioni di euro nella
tabella che segue:
catena1 catena2 catena3 catena4
3
2,7
5,3
4,7
2,5
4
3,6
3,9
3,8
7
2,8
5,8
a) Verificare l’identità sulle devianze e calcolare il coefficiente di
omogeneità nei grappoli.
b) Verificare l’espressione di S12 in funzione del coefficiente di
omogeneità nei grappoli.
c) Si estragga un campione di 2 catene , si stimino il ricavo mensile
totale per negozio e per catena con le relative varianze.
26
ESERCIZIO 7
Una impresa con 10 unità locali (U.L.) distribuite nella regione vuole introdurre
l'orario flessibile. Allo scopo effettua un sondaggio scegliendo casualmente n=3 U.L
tenendo conto del numero di addetti per U.L..
U.L.
addetti
1
8
2
12
3
23
4
15
5
50
6
75
7
115
8
43
9
19
10
25
Supponendo che, per le tre U.L. scelte, la proporzione di favorevoli all'orario
flessibile sia rispettivamente pari a p1=0,4, p2=0,6, p3=0,2
1. si estragga il campione di n=3 U.L., impiegando il metodo dei totali cumulati
2. si stimi la proporzione di addetti che sono favorevoli all'orario flessibile
3. si stimi la varianza dello stimatore e si definiscano le proprietà dello stimatore
impiegato.
27
ESERCIZIO 8
Si vuole condurre un’indagine campionaria sulle ore di assenza dal lavoro da parte degli
addetti nelle 870 imprese manifatturiere di un dato settore della regione Lombardia.
Supponiamo che venga estratto in blocco un campione di 10 imprese e si considerano
tutti gli addetti di ciascuna impresa giungendo ai dati esposti nella seguente tabella,
relativi ad una settimana lavorativa.
Imprese
N. addetti
Tot ore assenza
1
7
8
2
29
24
3
64
49
4
52
32
5
85
48
6
12
16
7
47
51
8
34
24
9
72
56
10
21
16
A) Che tipo di campionamento è stato utilizzato?
B) Si stimi il totale delle ore di assenza degli addetti nelle 870 aziende e il
corrispondente scarto quadratico medio
C) Si dica, motivando la risposta, se i dati a disposizione avrebbero consentito la stima
della media delle ore di assenza.
D) Se non fossero stati considerati tutti gli addetti di ciascuna impresa ma solo 6 per
ognuna estratti casualmente, che tipo di campionamento sarebbe stato utilizzato?
28
Scarica

Diapositiva 1