Infe 03 - 1 / 61 Lezione 6 Inferenza statistica Infe 03 - 2 / 61 ERRATA CORRIGE teorema 5.1: • estraendo a caso un campione di numerosità n finita da una popolazione su cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, la variabile casuale Xn m T s n Xn m T Sn n segue una distribuzione t di Student con n-1 gradi di libertà Infe 03 - 3 / 61 parte 3 Esercizi sulla stima della media e della varianza Infe 03 - 10 / 61 Distribuzione della media campionaria • estraendo da una popolazione per cui è definita la variabile casuale X avente distribuzione qualsiasi, media m e varianza s2, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, se n è sufficientemente grande la media campionaria 1 Xn n - segue una distribuzione normale - con media m e varianza s 2 / n n X j 1 j Infe 03 - 11 / 61 Distribuzione della media campionaria • estraendo da una popolazione per cui è definita la variabile casuale X con distribuzione normale, media m e varianza s 2 finite, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, per qualsiasi n la media campionaria 1 Xn n - segue una distribuzione normale - con media m e varianza s 2 / n n X j 1 j Infe 03 - 12 / 61 Dalla media campionaria alla media campionaria standardizzata • Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n • è quindi facile costruire una variabile casuale con distribuzione normale standard, cioè con media nulla e varianza unitaria. Xn m Z s n Infe 03 - 13 / 61 Intervallo di confidenza per la media possiamo sostenere che: estraendo a caso un campione con un numero n sufficientemente elevato elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale I1 a s Xn z1 a / 2 n in cui z1-a/2 è il valore del quantile (1 - a/2) di una variabile Z normale standardizzata contenga il valore della media m per l’intera popolazione. Infe 03 - 14 / 61 Intervallo di confidenza per la media: n finito possiamo sostenere che: estraendo a caso un campione con n finito da una popolazione per cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale I1a s Xn z1a / 2 n in cui z1-a/2 è il valore del quantile (1 - a/2) di una variabile normale standardizzata contenga il valore della media m per l’intera popolazione. Infe 03 - 15 / 61 Intervallo di confidenza per la media: n finito e s 2 sconosciuta possiamo sostenere che: estraendo a caso un campione con n finito da una popolazione su cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale I1 a Sn Xn t1 a / 2 n in cui t1-a/2 è il valore del quantile (1 - a/2) di una variabile T distribuita secondo la t di Student con n -1 g.d.l. contenga il valore della media m della popolazione. Infe 03 - 17 / 61 Intervallo di confidenza per la media: n < N • se n 30 e la varianza per la popolazione s s m xn zQ sup n 2 è nota: N n N 1 • se n < 30 , X è normale e la varianza per la popolazione s s n N n N 1 Sn m xn tQ sup n N n N 1 m xn zQ sup • se X è normale: 2 è nota: Infe 03 - 18 / 61 Esercizio 1 stima della media Infe 03 - 19 / 61 Esercizio 1 • Determinazione dei parametri statici di un OpAmp: misurazione della tensione di offset di ingresso • La tensione di offset di ingresso è quella tensione continua che, in assenza di segnale utile, deve essere applicata all’ingresso di un operazionale per rendere nulla la tensione di uscita. Infe 03 - 25 / 61 Esercizio 1 la tensione di offset di ingresso è quindi espressa dalla: vout R2 vos 1 R1 R1 vos vout R1 R2 Infe 03 - 26 / 61 Esercizio 1 R1 vos vout R1 R2 costituiamo un campione con 11 propotipi di un nuovo OpAmp e misuriamo i valori delle tensioni vout in mV usando i resistori R1 = 1 W e R2 = 1 kW: { + 17,87 ; + 18,16 ; + 17,80 ; + 17,99 ; + 18,16 ; + 17,97 ; + 18,12 ; + 17,98 ; + 17,99 ; + 17,84 ; + 17,99 } da questi ricaviamo i valori delle tensioni di offset in mV: { + 17,85 ; + 18,14 ; + 17,78 ; + 17,97 ; + 18,14 ; + 17,95 ; + 18,10 ; + 17,96 ; + 17,97 ; + 17,82 ; + 17,97 } Infe 03 - 27 / 61 Esercizio 1 Sulla popolazione degli OpAmp definiamo una variabile aleatoria X che assume, per ciascun elemento della popolazione, un valore x coincidente con il valore in mV della tensione di offset dell’elemento (trasformazione lineare). A causa della molteplicità dei fattori del processo produttivo che condizionano l’offset e per la linearità della trasformazione è plausibile ritenere che la X abbia distribuzione normale. Le immagini dei componenti il campione sono: x1 = + 17,85 ; x2 = + 18,14 ; x3 = + 17,78 ; x4 = + 17,97 ; x5 = + 18,14 ; x6 = + 17,95 ; x7 = + 18,10 ; x8 = + 17,96 ; x9 = + 17,97 ; x10 = + 17,82 ; x11 = + 17,97 Infe 03 - 28 / 61 Esercizio 1 utilizziamo questi valori per individuare la stima del valore medio dell’offset per la intera popolazione mediante lo stimatore “media campionaria”: 1 xn 11 11 xj j 1 lo stimatore “media campionaria” ci fornisce il valore xn 17,97 Questo risultato ci permette di affermare che la stima fatta del valore medio della tensione di offset di ingresso per l’intera popolazione di OpAmp risulta di +17,97 mV Infe 03 - 29 / 61 Esercizio 1 dobbiamo ora trovare quanto il dato è “affidabile” stimando quanto la casualità del campione può condizionarne il valore: dato che non conosciamo la varianza della X per la popolazione degli OpAmp costruiamo la variabile T che avrà una distribuzione “t di Student”: Xn m T Sn n attraverso cui individueremo l’intervallo di confidenza usando la: sn sn tQ inf xn m tQ sup n n Infe 03 - 30 / 61 Esercizio 1 il campione ha n = 11 quindi useremo la t di Student a 10 g.d.l. e, se cerchiamo un intervallo di confidenza al 90%, dovremo individuare i percentili 5% e 95% (cioè 0,05 e 0,95): in realtà ci basta individuare il 95% in quanto l’altro percentile è simmetrico rispetto a zero. la tabella della t di Student ci fornisce il valore del percentile: tQ sup 1,812 da cui: tQ inf 1,812 Infe 03 - 31 / 61 Esercizio 1 ricordando che vogliamo applicare la: sn sn tQ inf xn m tQ sup n n notiamo che ora è necessario stimare la varianza della media campionaria X mediante la varianza campionaria corretta n 1 S n 1 2 n X n j Xn 2 j 1 Dai valori della X del campione individuiamo quindi il valore della varianza campionaria corretta e della sua radice (deviazione standard): 1 s 10 2 n x 11 j 1 j x n 2 0,0147 sn 0,122 Infe 03 - 32 / 61 Esercizio 1 pertanto sostituendo nella: sn sn tQ inf xn m tQ sup n n otteniamo: 0,122 0,122 1,812 xn m 1,812 3,316 3,316 da cui: 0,07 xn m 0,07 Infe 03 - 33 / 61 Esercizio 1 dalla: 0,07 xn m 0,07 è facile ottenere: xn 0,07 m xn 0,07 da cui: m 17,97 0,07 che rappresenta l’intervallo di confidenza al 90% per la media m della variabile casuale riferita all’intera popolazione Infe 03 - 34 / 61 Esercizio 1 Questo risultato ci permette di affermare che, con una probabilità del 90%, il valore medio della tensione di offset di ingresso della intera popolazione degli OpAmp è compreso nell’intervallo di estremi: 17,90 μV e 18,04 μV Infe 03 - 35 / 61 Esercizio 2 stima per intervalli della media Infe 03 - 36 / 61 Esercizio 2 costituiamo un campione con 16 propotipi di resistori di nuovo tipo e misuriamo i valori delle resistenze in kW: { + 15,37 ; + 15,16 ; + 15,80 ; + 15,49 ; + 15,26 ; + 15,87 ; + 15,12 ; + 15,58 ; + 15,39 ; + 15,64 ; + 15,27 ; + 15,22 ; + 15,57 ; + 15,54 ; + 15,64 ; + 15,32 } Data la molteplicità delle cause indipendenti che determinano la variabilità della resistenza è plausibile ritenerla distribuita normalmente. Costruita la variabile casuale X che assume per ciascun elemento valore pari al valore in kW della sua resistenza elettrica (è una trasformazione lineare quindi X conserva la distribuzione normale) si individui l’intervallo di confidenza al 95% per il valore tipico della resistenza della intera popolazione supponendo che la varianza della X per l’intera popolazione sia s2 = 0,0256 Infe 03 - 37 / 61 Esercizio 2 risoluzione: 1 xn 16 x 16 j 15,46 j 1 dato che la X è distribuita normalmente si costruisce la variabile Z Xn m s n che segue una distribuzione normale standardizzata Infe 03 - 38 / 61 Esercizio 2 risoluzione (segue): 1 xn 16 16 Z x j 15,46 j 1 Xn m s n dalla tabella si ottiene: zQ sup 1,96 s 2 0,0256 n 16 m xn zQ sup s n zQ inf 1,96 s 0,16 0,04 4 n 15,46 0,0784 15,46 0,08 Infe 03 - 39 / 61 Esercizio 2 Questo risultato ci permette di affermare che, con una probabilità del 95%, il valore tipico della resistenza della intera popolazione dei resistori è compreso nell’intervallo di estremi: 15,38 kW e 15,54 kW Infe 03 - 40 / 61 Esercizio 1bis stima della media Infe 03 - 41 / 61 Esercizio 1bis Sulla popolazione degli OpAmp definiamo una variabile aleatoria X che assume, per ciascun elemento della popolazione, un valore x coincidente con il valore in centesimi di mV della tensione di offset dell’elemento diminuito di 1800 (trasformazione lineare): X 1800 X 100 vos 18 vos 100 A causa della molteplicità dei fattori del processo produttivo che condizionano l’offset è plausibile ritenere che la X abbia distribuzione normale. Le immagini dei componenti il campione sono pertanto x1 = -15 ; x2 = + 14 ; x3 = -22 ; x4 = - 3 ; x5 = + 14 ; x6 = - 5 ; x7 = + 10 ; x8 = - 4 ; x9 = - 3 ; x10 = - 18 ; x11 = - 3 ; Infe 03 - 42 / 61 Esercizio 1bis utilizziamo questi valori per individuare la stima del valore medio dell’offset per la intera popolazione mediante lo stimatore “media campionaria”: 1 xn 11 x 11 j j 1 lo stimatore “media campionaria” ci fornisce il valore xn 3,18 X 1800 X 100 vos 18 vos 100 Questo risultato ci permette di affermare che la stima fatta del valore medio della tensione di offset di ingresso per l’intera popolazione di OpAmp risulta di +17,97 mV Infe 03 - 43 / 61 Esercizio 1bis dobbiamo ora trovare quanto il dato è “affidabile” stimando quanto la casualità del campione può condizionarne il valore: sn sn tQ inf xn m tQ sup n n dato che non conosciamo la varianza della X per la popolazione degli OpAmp costruiamo la variabile T che avrà una distribuzione “t di Student”: Xn m T Sn n Infe 03 - 44 / 61 Esercizio 1bis il campione ha n = 11 quindi useremo la t di Student a 10 g.d.l. e, se cerchiamo un intervallo di confidenza al 90%, dovremo individuare i percentili 5% e 95% (cioè 0,05 e 0,95): in realtà ci basta individuare il 95% in quanto l’altro percentile è simmetrico rispetto a zero. la tabella della t di Student ci fornisce il valore del percentile: tQ sup 1,812 da cui: tQ inf 1,812 Infe 03 - 45 / 61 Esercizio 1bis ricordando che vogliamo applicare la: sn sn tQ inf xn m tQ sup n n notiamo che ora è necessario stimare la varianza della media campionaria X mediante la varianza campionaria corretta n 1 S n 1 2 n X n j Xn 2 j 1 Dai valori della X del campione individuiamo quindi il valore della varianza campionaria corretta e della sua radice (deviazione standard): 11 1 2 sn2 x j xn 148,2 sn 12,17 10 j 1 Infe 03 - 46 / 61 Esercizio 1bis pertanto sostituendo nella: sn sn tQ inf xn m tQ sup n n otteniamo: 12,17 12,17 1,812 xn μ 1,812 3,316 3,316 da cui: 6,65 xn μ 6,65 Infe 03 - 47 / 61 Esercizio 1bis dalla: 6,65 xn m 6,65 6,65 xn μ 6,65 è facile ottenere: xn 6,65 μ xn 6,65 da cui: μ 3,18 6,65 che rappresenta l’intervallo di confidenza al 90% per la media m della variabile casuale X riferita all’intera popolazione Infe 03 - 48 / 61 Esercizio 1bis μ 3,18 6,65 X 100 vos 18 vos vosinf X 1800 100 9,83 1800 3,47 1800 17,9017 ; vossup 18,0347 100 100 Questo risultato ci permette di affermare che, con una probabilità del 90%, il valore tipico della tensione di offset di ingresso della intera popolazione degli OpAmp è compreso nell’intervallo di estremi: 17,90 μV e 18,04 μV Infe 03 - 49 / 61 Esercizio 2bis stima per intervalli della media Infe 03 - 50 / 61 Esercizio 2bis costituiamo un campione con 16 propotipi di resistori di nuovo tipo e misuriamo i valori delle resistenze in kW: { + 15,37 ; + 15,16 ; + 15,80 ; + 15,49 ; + 15,26 ; + 15,87 ; + 15,12 ; + 15,58 ; + 15,39 ; + 15,64 ; + 15,27 ; + 15,22 ; + 15,57 ; + 15,54 ; + 15,64 ; + 15,32 } Data la molteplicità delle cause indipendenti che determinano la variabilità della resistenza è plausibile ritenerla distribuita normalmente. Costruita la variabile casuale X che assume per ciascun elemento valore pari a… (è una trasformazione lineare quindi X conserva la distribuzione normale) si individui l’intervallo di confidenza al 95% per il valore tipico della resistenza della intera popolazione supponendo che la varianza della X per l’intera popolazione sia s2 = 0,0256 * ? X 1 b X a s 21 b 2 s 2 Infe 03 - 51 / 61 Esercizio 2 Questo risultato ci permette di affermare che, con una probabilità del 95%, il valore tipico della resistenza della intera popolazione dei resistori è compreso nell’intervallo di estremi: 15,37 kW e 15,55 kW Infe 03 - 52 / 61 Esercizio 3 stima per intervalli della media Infe 03 - 53 / 61 Esercizio 3 Si è definita su di una popolazione di sfere da cuscinetto una variabile casuale avente, per ciascuna sfera prodotta, valore uguale al valore del diametro misurato in centimetri. Un campione casuale costituito da 200 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la media della variabile casuale relativa all’intera popolazione. Infe 03 - 54 / 61 Esercizio 3 risoluzione: Dato che la varianza della X per l’intera popolazione è sconosciuta si dovrebbe costruire una variabile casuale T definita: Xn m T s n per determinare la risposta al problema mediante la tQ inf xn m s s tQ sup xn tQ inf n m xn tQ sup n sn n n n Infe 03 - 55 / 61 Esercizio 3 risoluzione (segue): : tQ inf xn m sn sn tQ sup xn tQ inf m xn tQ sup sn n n n dato che n = 200 la distribuzione della t di Student (con 199 gdl) è approssimabile con la distribuzione normale standardizzata: sn sn xn zQ inf m xn zQ sup n n 0,042 0,042 0,824 2,575 m 0,824 2,575 200 200 Infe 03 - 56 / 61 Esercizio 3 risoluzione (segue): 0,042 0,042 0,824 2,575 m 0,824 2,575 200 200 0,824 0,00765 m 0,824 0,00765 E’ quindi possibile affermare che, con una probabilità del 99%, il valore tipico del diametro per l’intera popolazione è compreso fra i valori: 0,816 cm e 0,832 cm Infe 03 - 57 / 61 Esercizio 4 stima per intervalli della media Infe 03 - 58 / 61 Esercizio 4 Ricalcolare l’intervallo di confidenza dell’esercizio precedente nell’ipotesi che il campione sia costituito da 20 sfere. Un campione casuale costituito da 20 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la media della variabile casuale relativa all’intera popolazione. Infe 03 - 59 / 61 Esercizio 4 risoluzione: A causa della molteplicità dei fattori del processo produttivo che condizionano il diametro di ciascuna sfera è plausibile ritenere che la popolazione abbia distribuzione normale. sn sn xn tQ inf m xn tQ sup n n 0,824 2,861 0,042 0,042 m 0,824 2,861 20 20 0,824 0,027 m 0,824 0,027 E’ quindi possibile affermare che, con una probabilità del 99%, il valore medio del diametro per l’intera popolazione è compreso fra i valori: 0,797 cm e 0,851 cm Infe 03 - 60 / 61 Esercizio 5 stima per intervalli della media Infe 03 - 61 / 61 Esercizio 5 Che risultato si sarebbe ottenuto nell’esercizio precedente usando, erroneamente, la teoria dei campioni numerosi? Un campione casuale costituito da 20 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la media della variabile casuale relativa all’intera popolazione. Infe 03 - 62 / 61 Esercizio 5 risoluzione: sn sn xn zQ inf m xn zQ sup n n 0,042 0,042 0,824 2,575 m 0,824 2,575 20 20 0,824 0,024 m 0,824 0,024 mentre abbiamo visto che il risultato corretto è: 0,824 0,027 m 0,824 0,027 Infe 03 - 63 / 61 Tecnica delle misurazioni applicate – Esame del 27 marzo 2008 Problema 1. Microlè SpA è un’impresa che costruisce relè per la commutazione di segnali. Essa dichiara sul suo catalogo che la resistenza parassita dei contatti (chiusi) dei propri relè è garantita, tramite un controllo di qualità sul 100% della produzione, non superiore a 10,2 mW. Un nuovo progetto di un modello di relè in produzione da tempo sembra poter apportare benefici, ma l’ing. Tizio, Responsabile della Produzione, teme che la resistenza parassita dei contatti dei nuovi relè possa avere una elevata variabilità: ciò potrebbe riflettersi in un aumento della percentuale di dispositivi “fuori tolleranza” che dovranno pertanto essere scartati durante il controllo di qualità del prodotto. L’ing. Tizio decide di condurre una valutazione, su di una preserie campione, del valore dello “scarto per fuori tolleranza” che il nuovo progetto potrebbe determinare. Realizzata una preserie di 16 elementi Tizio misura con uno strumento di elevata qualità (tanto da poter ritenere trascurabile la incertezza di misura) la resistenza parassita Rp dei contati chiusi di ciascun relè ottenendo i seguenti risultati: Rp1 = 9,5 mW Rp2 = 9,6 mW Rp3 = 9,6 mW Rp4 = 9,7 mW Rp5 = 9,7 mW Rp6 = 9,7 mW Rp7 = 9,8 mW Rp8 = 9,8 mW Rp9 = 9,8 mW Rp10 = 9,8 mW Rp11 = 9,9 mW Rp12 = 9,9 mW Rp13 = 9,9 mW Rp14 = 10,0 mW Rp15 = 10,0 mW Rp16 = 10,1 mW Si chiede al candidato di determinare, sulla base dei risultati sopra riportati: 1. l’intervallo di valori della Rp che corrisponde all’intervallo di confidenza al 90% per la media della variabile casuale che si è adottata. 2. Il valore massimo e minimo dello scarto che può essere atteso per l’intera popolazione dei relè eventualmente prodotti in base al nuovo progetto (si operi con una confidenza del 90% nella determinazione della varianza della variabile casuale che si è adottata).