Proprietà degli stimatori Lo stimatore del parametro θ è la statistica T=t(X1,X2,…,Xn), ovvero la funzione delle osservazioni campionarie, utilizzata per assegnare un valore al parametro incognito Stima puntuale e stimatore La stima t può essere considerata t ( x , , x ) 1 n come una realizzazione della variabile casuale chiamata stimatore di T t ( X , , X ) 1 n Esempio: campione osservato (2,5,3,6,4,4,1,2,2,5) media della popolazione. Parametro: 110 Stimatore: media campionaria X X i 10 i 1 , 4 Stima: x3 3 Stima puntuale e stimatore Lo stimatore, dipendendo dal campione, è una variabile casuale e quindi possiede una distribuzione campionaria la cui conoscenza permette di capire se lo stimatore scelto produrra con elevata probabilità stime “vicine al valore vero del parametro. 4 Proprietà degli stimatori Per valutare la “bontà” di uno stimatoreT si può guardare alle sue proprietà: Proprietà per n finito: - Correttezza - Efficienza Proprietà per n (asintotiche): - Consistenza - Correttezza asintotica 5 Proprietà degli stimatori Correttezza Lo stimatore T è uno stimatore corretto di se E ( T ) Per tutti i possibili valori di La distorsione di uno stimatore è uguale a: B ( T ) ) E ( T 6 Proprietà degli stimatori Per valutare la prossimità diT a possiamo usare l’errore quadratico medio (mean square error) dato dalla quantità: 2 MSE ( T ) E [( T )] Proprietà: 2 2 MSE ( T ) E [( T )] Va ( T ) B ( T ) 2 ( T ) E [ T E ( T )] dove Var Diremo che T1 è più efficiente di T2 se MSE ( T ) MSE ( T ) 1 2 Per tutti i possibili valori di . Precisione e accuratezza di uno stimatore Accuratezza: capacità di uno stimatore di essere corretto in media. Uno stimatore non accurato è distorto. Il BIAS è l’errore sistematico, non casuale, in cui i valori tendono ad essere non accurati in una precisa direzione Precisione (riproducibilità o attendibilità): capacità di un certo stimatore di fornire lo stesso risultato o uno molto simile con stime ripetute dello stesso parametro. L’errore casuale da solo, se grande, può determinare mancanza di precisione. L’errore quadratico medio include in sé sia la misura dell’accuratezza (Bias) sia la misura della precisione (Varianza) Accuratezza e precisione Distorsione, precisione Accuratezza, non precisione Distorsione, non precisione Proprietà degli stimatori Nella figura sono riportate le distribuzioni campionarie di due stimatori corretti. lo stimatore T1 (linea rossa) possiede un errore quadratico medio (ossia una varianza) più piccolo di T2 (linea nera). 10 Sufficienza: Uno stimatore sufficiente è tale se raccoglie ed esaurisce tutte le informazioni riguardanti θ contenute nel campione casuale (x1,x2,…,xn) n Sono stimatori sufficienti: x, f , xi i1 Proprietà per grandi campioni Consistenza: Uno stimatore Tn è consistente in probabilità per θ se: 0 lim Pr ob T 1 n n Correttezza asintotica: limETn n Stima puntuale della media della popolazione Si consideri una popolazione X con media e varianza 2 La media campionaria X è uno stimatore corretto per la ( X ) media della popolazione, ossia E 2 ( X ) n La varianza della media campionaria è Var pertanto è uno stimatore consistente, poiché 2 lim MSE ( X ) lim 0 n n n n 2 , Se la popolazione è distribuita come una Normale, N allora anche la media campionaria si distribuisce come una Normale 2 X N , n 13 Stima puntuale della proporzione della popolazione Si consideri una popolazione X distribuita come una Bernoulli con parametro . La media campionaria X è uno stimatore corretto della proporzione della popolazione, ossia E ( X ) ( X ) 1 n La varianza della media campionaria è Var pertanto è uno stimatore consistente, poiché 1 lim MSE ( X ) lim 0 n n n n 14 Stima puntuale della varianza della popolazione Si consideri una popolazione X con media e varianza entrambe ignote. 2 Si definisce varianza campionaria corretta lo stimatore: 1n 2 S X X i n 1 i 1 2 S 2 è uno stimatore corretto della varianza della popolazione 2 2 , ossia E ( S ) Sn2 è uno stimatore consistente per 2 , ossia 2 lim MSE ( S ) 0 n n 15 Stima per intervallo Sia X una v.c. che rappresenta un carattere osservato su una popolazione. Supponiamo che la v.c. sia definita da una funzione di probabilità fx ; dipendente dal parametro incognito. , , x , , X Sia X un campione di dimensione n e x 1 n 1 n il corrispondente campione osservato. Obiettivo: Determinare due statistiche campionarie: L L ( X , , X ) L L ( X , , X ) 1 1 1 n 2 2 1 n tali che L 1 L 2 per ogni possibile campione e che l’intervallo L 1,L 2contenga il parametro con probabilità 1 16 Stima per intervallo L’intervallo casuale si L X , , X , L X , , X 1 1 n 2 1 n definisce intervallo di confidenza di livello 1 per il parametro se contiene con probabilità 1 il parametro ignoto della popolazione, ossia: Pr L X , , X L X , , X 1 1 1 n 2 1 n In genere si fissano valori di 1 pari a 0,99; 0,95; 0,90 e viene detto livello di confidenza. Una volta estratto il campione si ottiene l’intervallo di confidenza stimato. 17 Nota: Non è possibile sapere se l’intervallo stimato contenga o meno il valore vero del parametro; d’altra parte se si estraesse dalla popolazione un numero sufficientemente elevato di campioni e calcolassimo i corrispondenti intervalli di confidenza, circa il di questi conterrebbe il parametro ignoto. 100 ( 1 ) % Stima per intervallo - esempio Esempio (continua) Nella seguente figura si mostrano, in corrispondenza di 6 campioni osservati, gl’intervalli di confidenza stimati per la media della popolazione a un livello di confidenza 0,95. Osserviamo che dal campione 5 si ottiene un intervallo stimato che non contiene il vero parametro della popolazione. 18