Distribuzioni censurate
Troncamento: y<a esiste ma ma non è osservabile
Censura: y<a è osservabile come un valore unico
Esempi:
Acquisto di beni durevoli
“Salario di riserva”
Posti a teatro
Esempio:
Siamo interessati alla domanda di biglietti per uno stadio che
ha 20.000 posti.
Ciò che possiamo osservare sono i biglietti venduti, quindi,
quando lo stadio si riempie totalmente ciò che sappiamo è
che la domanda di biglietti è SUPERIORE al numero di
biglietti venduti.
Misurare la domanda di biglietti con il numero di biglietti
venduta provoca una CENSURA
La teoria per le distribuzioni Censurate è simile (non
identica) a quella per le distribuzioni troncate:
Se y* è distribuita come una N(,²)
Definiamo una variabile
y=a se
y* <= a
y=y* se
y* > a
La distribuzione di y è una mistura di una parte
discreta e di una continua
f ( x)
densità
f ( x / x  a) 

Prob(x  a) ripartizio ne
infatti:
per
ya
a
Pr ob( y  a)  Pr ob( y*  a )  1  

  
per y  a
f ( y )  f ( y*)
Nel troncamento la densità dei non osservati viene
“spalmata” sulla parte non osservata del dominio di y
Nella censura la densità non osservata si “concentra” tutta
nel punto di troncamento
0,45
0,4
0,35
0,3
y*
0,25
0,2
0,15
0,1
0,05
0
-4
-3
-2
-1
0
1
2
3
4
0,45
0,4
0,35
0,3
y
0,25
0,2
0,15
0,1
0,05
0
-3,5
-3
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
3
I parametri della distribuzione censurata
E ( y )  Pr ob( y  a )  E ( y / y  a )  Pr ob( y  a)  E ( y / y  a ) 
 Pr ob( y*  a )  a  Pr ob( y*  a )  E ( y * / y*  a ) 
  ( )  a  1   ( )(    )
Per a  0

E ( y )      
 

 


dove  

 
 
Media “troncata
In maniera più complessa si ottiene la varianza:



Var ( y)   2 1  ( ) 1       2 ( )

(si sfrutta la relazione: V(y)=E(var.condiz.)+V(media condiz.)
Nel caso di censura a destra y*<a:
Si sostituisce  con 1-
e  diventa = -()/()
Torniamo all’esempio:
Siamo interessati alla domanda di biglietti per uno stadio che
ha 20.000 posti.
Lo stadio risulta esaurito per il 25% degli eventi sportivi
In media (compresi gli esauriti) si vendono 18.000 biglietti
per evento
Qual è la media e lo scarto della domanda di biglietti?
Ovviamente qui
y*=domanda di biglietti
y= biglietti venduti
y=20.000
y=y*
per y*>20.000
per y*<=20.000
La censura è a “destra”
Esempio continua:
 E (vendite)  1   ( ) a  (    ) ( )


 20000   









 ( )

 ( )
 ( )  0.75    0.675
0.318
  0.675   ( )  0.318    
 0.424
0.75
quindi
18000  0.25(20000)  0.75(   0.424 )

0.675  20000  
  18362   2426
Confronto con il troncamento:
18000 = è media delle vendite quando non c’è il tutto esaurito
Il tutto esaurito si verifica il 25% delle volte
 E (troncata)    


a
    



 ( )

 ( )
 ( )  0.75    0.675
  0.675   ( )  0.318 
quindi
18000    0.424

0.675  20000  
  18772   1820
0.318

 0.424
0.75
Scarica

Censura