Test 01 - 1 / 80 Lezione 7 i Test statistici Test 01 - 2 / 80 introduzione ai test di ipotesi L’inferenza sulla popolazione mediante il campione comporta, oltre alla stima dei parametri, il controllo di ipotesi al fine di valutare la loro compatibilità con i dati campionari. In linea di principio il procedimento implica il confronto della misura di un parametro con un termine di paragone prefissato per dedurre, ad un livello di fiducia prefissato, se la discrepanza dei loro valori sia da attribuire a cause accidentali oppure possa essere ritenuta sistematica. Sul piano logico si tratta di esprimere un giudizio su di una ipotesi “principale” e, se queste sono state formulate, su ipotesi “alternative” in conseguenza del valore assunto da un parametro campionario. Test 01 - 3 / 80 parte 1 le basi dei test Test 01 - 4 / 80 sommario • test sull’ipotesi principale H0 – – – – azioni decisionali e criterio decisionale su H0 l’inferenza e le conseguenze sul criterio decisionale rischio di errore 1ª specie affidabilità del criterio decisionale e significatività del test • test sull’ipotesi principale H0 e sulle alternative Hj – azioni decisionali su H0 e su Hj – rischio di errore 2ª specie – affidabilità del criterio decisionale e potenza contro Hj • formulazione di un test di ipotesi Test 01 - 5 / 80 test sull’ipotesi principale H0 : il criterio decisionale a Test 01 - 6 / 80 azioni decisionali sull’ipotesi H0 In generale, quando viene espressa un’ipotesi, che indichiamo con H0, si possono assumere tre diverse posizioni: j si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione; k non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio; l si conferma la validità di H0 disponendo di informazioni sufficienti a giustificare la decisione; Test 01 - 7 / 80 azioni decisionali sull’ipotesi H0 In generale, quando viene espressa un’ipotesi, che indichiamo con H0, si possono assumere tre diverse posizioni: j si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione; S. Illaro, patrono di Lugo, si festeggia il 30 febbraio k non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio; S. Petronio, patrono di Bologna, si festeggia il 4 ottobre l si conferma la validità di H0 disponendo di informazioni sufficienti a giustificare la decisione; S. Ciriaco, patrono di Ancona, si festeggia il 4 maggio Test 01 - 8 / 80 azioni decisionali sull’ipotesi H0 In generale, quando viene espressa un’ipotesi, che indichiamo con H0, si possono assumere tre diverse posizioni, ma: nel caso in cui l’ipotesi H0 riguardi la caratteristica di una popolazione, per esempio: H0 : m = m0 oppure: H0 : s < s0 (in generale) non è possibile la terza azione decisionale l si conferma la validità di H0 disponendo di informazioni sufficienti a giustificare la decisione; prima di aver esaminato l’intera popolazione!!! Test 01 - 9 / 80 azioni decisionali sull’ipotesi H0 La conferma dell’ipotesi H0 non è quindi possibile attraverso l’inferenza statistica e le prove a campione, ma può essere condotta esclusivamente con prove a tappeto. Le decisioni che possono essere prese mediante l’esecuzione di un test statistico su di un campione sono solo le prime due: j si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione; k non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio; Test 01 - 10 / 80 azioni decisionali sull’ipotesi H0 Come è facile vedere se il test a cui è stata sottoposta l’ipotesi H0 ha avuto esito positivo ed ha fornito informazioni sufficienti (potremmo dire: “se il test è stato utile”) l’azione decisionale è la j cioè il rifiuto di H0 : j si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione; k non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio; Test 01 - 11 / 80 azioni decisionali sull’ipotesi H0 esempio 1: preso un campione di n elementi da una popolazione su cui è definita una variabile casuale X con media m incognita e varianza s2 conosciuta posso esprimere una decisione in merito all’ipotesi H0 : m m0 ? le premesse a questo test sono le seguenti: – si estrae un campione casuale dalla popolazione e si misurando i valori della caratteristica comune – si definisce la variabile casuale X, – si individuano i valori assunti dalla variabile casuale X in corrispondenza degli elementi che compongono il campione, Test 01 - 12 / 80 azioni decisionali sull’ipotesi H0 esempio 1: preso un campione di n elementi da una popolazione su cui è definita una variabile casuale X con media m incognita e varianza s2 conosciuta posso esprimere una decisione in merito all’ipotesi H0 : m m0 ? questo test si conduce: – definendo una opportuna variabile casuale a partire dagli stimatori campionari e fissando un valore “critico” (cioè un discriminante), – calcolando il valore della variabile prescelta, – confrontando tale valore con quello critico fissato e decidendo, in base al confronto, se è possibile rifiutare oppure se non è possibile rifiutare H0 : m m0 Test 01 - 13 / 80 azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 V/ms. 1) Come definiamo la variabile casuale X ? La variabile casuale X associa a ciascun punto campione un numero positivo ed adimensionale di valore uguale al valore dello slew-rate misurato in V/ms . Test 01 - 14 / 80 azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 V/ms. 2) Come valutare la affermazione dei tecnici del dR&D? Dato che non sarà possibile provare l’intera popolazione (non ancora prodotta) sarà necessario agire tramite un gruppo di prototipi, cioè un campione, ed accettare l’incertezza insita nel trasferire informazioni ricavate dal campione alla intera popolazione: ovviamente si userà la media campionaria come stimatore di m. Test 01 - 15 / 80 azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 V/ms. 3) Come definire il valore discriminante per la media campionaria? Si potrebbe pensare di fissare il discriminante al valore di m0 = 80, per rifiutare l’ipotesi qualora il valore della media campionaria risultasse minore di m0 = 80 : questa scelta è però sbagliata in quanto, se m fosse realmente uguale a m0 , a causa della aleatorietà del campione il valore della media campionaria avrebbe uguale probabilità di superare e di non superare il discriminante. Test 01 - 16 / 80 azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 V/ms. 3) Come definire il valore discriminante per la media campionaria? Test 01 - 17 / 80 azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 V/ms. 3) Come definire il valore discriminante per la media campionaria? Si fissa il discriminante ad un valore diverso da m0 , tale da individuare un campo di valori in cui, se m fosse realmente uguale a m0 , il valore della media campionaria (aleatorio a causa della aleatorietà del campione) avrebbe probabilità molto bassa di entrare. Test 01 - 18 / 80 azioni decisionali sull’ipotesi H0 esempio 1: Il responsabile del Laboratorio Prove e Misure decide pertanto di adottare un test che prevede le seguenti fasi: 1. si costituirà un campione composto da un prestabilito numero di OpAmp, ad esempio 49 OpAmp; 2. mediante appositi strumenti si misurerà lo slew-rate di ciascun elemento del campione per ricavare i valori della X; 3. se il valore della media campionaria risulterà inferiore a 78,5 si rifiuterà l’affermazione dei tecnici del dR&D circa il preteso miglioramento; se invece tale soglia verrà uguagliata o superata non si contesterà la loro affermazione. Test 01 - 19 / 80 criterio decisionale sull’ipotesi H0 esempio 1: Il criterio decisionale adottato è quindi il seguente: j se X 49 78,5 rifiuto H 0 k se X 49 78,5 non rifiuto H 0 Test 01 - 20 / 80 test sull’ipotesi principale H0 : le prestazioni del criterio decisionale a Test 01 - 21 / 80 affidabilità del criterio decisionale su H0 il criterio decisionale che è stato adottato nell’esempio appena mostrato dice che, qualora la media campionaria risulti inferiore a 78,5, riterremo che il test ci abbia fornito informazioni sufficienti a decidere e rifiuteremo l’ipotesi H0 : m m0 come è possibile individuare la probabilità che l’azione intrapresa, cioè il rifiuto di H0, sia sbagliata? Test 01 - 22 / 80 affidabilità del criterio decisionale su H0 dai dati del problema è possibile individuare la distribuzione della media campionaria pertanto è possibile individuare il valore della probabilità: P X 49 78,5 a m 80 2 2 a s s Test 01 - 23 / 80 affidabilità del criterio decisionale su H0 dai dati del problema è possibile individuare la distribuzione della media campionaria pertanto è possibile individuare il valore della probabilità: P X 49 78,5 m 80 2 2 a s s a indica quindi la probabilità di estrarre un campione “fallato” (cioè con media campionaria minore di 78,5) da una popolazione che ha media m = 80 e varianza s2 conosciuta; per come è stato fissato il criterio decisionale è evidente che la probabilità di commettere un errore negando H0 : m m0 quando essa è realmente valida è pari alla probabilità di estrarre un campione “fallato” pertanto tale probabilità ha valore pari ad a; Test 01 - 24 / 80 affidabilità del criterio decisionale su H0 non si deve però confondere il significato di a con il valore di a ! l’area in giallo rappresenta esclusivamente la probabilità che la media campionaria sia minore del discriminante a prescelto. il grafico, come è ben evidente, rappresenta la densità di probabilità di una variabile casuale continua, nel nostro caso la media campionaria, il cui valore compare sull’asse delle ascisse. Test 01 - 25 / 80 affidabilità del criterio decisionale su H0 non si deve però confondere il significato di a con il valore di a ! l’area in giallo rappresenta esclusivamente la probabilità che la media campionaria sia minore del discriminante a prescelto. quando si esamina il criterio decisionale relativamente al caso j, cioè al rifiuto di H0 , per valutare la sua affidabilità si deve considerare che si sta discutendo di una variabile casuale binaria: il rifiuto di H0 è sbagliato; il rifiuto di H0 è giusto; Test 01 - 26 / 80 affidabilità del criterio decisionale su H0 si è già notato che c’è una probabilità pari ad a che il rifiuto di H0 sia sbagliato! dato che il caso j, cioè il rifiuto di H0 , è un’azione che può essere esclusivamente sbagliata o giusta (*), è semplice individuare la probabilità che la scelta fatta sia giusta: P j sbagliato a P j giusto 1 a (*) H0 è l’unica ipotesi che viene presa in considerazione. Test 01 - 27 / 80 affidabilità del criterio decisionale su H0 P j sbagliato a la probabilità che j sia sbagliato, cioè che si rifiuti H0 quando essa è in realtà vera, viene indicata come: “rischio (di errore) di prima specie” P j giusto 1 a la probabilità che j sia giusto, cioè che si rifiuti H0 quando essa è realmente falsa, viene indicata come: “affidabilità” (o “fiducia”) del criterio decisionale 1 - a è quindi la affidabilità del criterio decisionale che mi porta a rifiutare H0 Test 01 - 28 / 80 significatività del test Si è mostrato che la probabilità ( o rischio ) di commettere un errore di 1ª specie è legato alla scelta del valore discriminante; nel caso di un test sulla media della popolazione: P X n X c | H0 a per ridurre il rischio di errore di 1ª specie ed aumentare la fiducia, se non si modifica la numerosità del campione, è necessario aumentare il campo di valori dello stimatore campionario entro cui si afferma di non poter agire in quanto non si dispone di informazioni sufficienti. Test 01 - 29 / 80 significatività del test Si è mostrato che la probabilità ( o rischio ) di commettere un errore di 1ª specie è legato alla scelta del valore discriminante; nel caso di un test sulla media della popolazione: P X n X c | H0 a per ridurre il rischio di errore di 1ª specie ed aumentare la fiducia, se non si modifica la numerosità del campione, è necessario aumentare il campo di valori dello stimatore campionario entro cui si afferma di non poter agire in quanto non si dispone di informazioni sufficienti: ciò equivale a dire che il risultato della prova è poco significativo. Test 01 - 30 / 80 significatività P j sbagliato a la probabilità che j sia sbagliato, cioè che si rifiuti H0 quando essa è in realtà vera, viene indicata come: “rischio (di errore) di prima specie” P j giusto 1 a la probabilità che j sia giusto, cioè che si rifiuti H0 quando essa è realmente falsa, viene indicata come: “affidabilità” (o “fiducia”) del criterio decisionale il livello di significatività del criterio decisionale che mi porta a rifiutare H0 con affidabilità = 1 - a è pari ad a Test 01 - 31 / 80 formulazione di un test di ipotesi Test 01 - 32 / 80 test di ipotesi il processo di inferenza che è stato messo in atto per accettare o rifiutare un’ipotesi relativa alla popolazione attraverso lo studio del comportamento di un campione viene chiamato test di ipotesi Test 01 - 33 / 80 formulazione del test di ipotesi per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 34 / 80 conduzione del test di ipotesi - dopo aver formulato il test si procede alla composizione del campione con numerosità pari a quella stabilita ; - si conducono le prove sperimentali ; - si determina il valore dello stimatore campionario precelto ; - se tale valore cade nella regione di rifiuto si respinge l’ipotesi principale H0 ; - se il valore dello stimatore cade nella/nelle regione di non accettazione delle ipotesi alternative - non si accettano queste ultime e - non si rifiuta l’ipotesi principale H0 . Test 01 - 35 / 80 i test sulla media: H0 Test 01 - 36 / 80 formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 37 / 80 formulazione di un test sulla media 1. si stabilisce la numerosità n del campione con cui si vuole condurre il test (nel caso occorrano più campioni si stabilisce la numerosità di ciascuni di essi). ricordiamo che se n è grande si può invocare il teorema limite centrale per affermare che la media campionaria è distribuita in modo normale qualunque sia la distribuzione della X Test 01 - 38 / 80 formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 39 / 80 formulazione di un test sulla media 2. si definisce la regola di costruzione della variabile casuale X che sarà utilizzata nel test statistico: la regola più semplice consiste nel definire una variabile casuale X che abbia, per ciascun elemento della popolazione, valore xi pari al valore della grandezza caratteristica misurata in base ad una opportuna unità di misura. esempio: h1 = 1,78 m h2 = 1,82 m x1 = 178 x2 = 182 Tensione elettrica v1 = 12,4 V v2 = -9,2 V x1 = 12,4 x2 = -9,2 Statura Test 01 - 40 / 80 formulazione di un test sulla media 2. si definisce la regola di costruzione della variabile casuale X che sarà utilizzata nel test statistico: la regola piùalternativa semplice consiste nel definire una variabile casuale X una regola che abbia, per ciascun elemento della popolazione, valore xi pari al un valore xi fornito valore grandezza caratteristica misurata in base ad una da unadella arbitraria trasformazione lineare applicata al valore misurato opportuna unità di misura. della caratteristica comune. esempio: h1 = 1,78 m h2 = 1,82 m x1 = 178 (1,78 – 1,70) / 0,04 = 2 x2 = 182 (1,82 – 1,70) / 0,04 = 3 Tensione elettrica v1 = 12,4 V v2 = -9,2 V x1 = 12,4 (12,4 – 1,6) / 10,8 = +1 x2 = -9,2 ( -9,2 – 1,6) / 10,8 = -1 Statura Test 01 - 41 / 80 formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 42 / 80 formulazione di un test sulla media 3. si individua l’ipotesi H0 (ipotesi principale) che deve essere sottoposta a test. esempio: H0 : m m0 ; oppure: H0 : m = m0 ; il test non ci porta a determinare quanto valga la probabilità che l’ipotesi H0 sia vera oppure falsa, ma ci dice solamente se possiamo escludere, con il rischio di errore prefissato, che l’ipotesi H0 sia vera. Test 01 - 43 / 80 formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 44 / 80 formulazione di un test sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si potrebbero usare indifferentemente: - la media campionaria 1 Xn n n j 1 Xj che ha distribuzione normale con media m e varianza s2 / n; - la variabile X n m0 Z s n che ha distribuzione normale standard. Test 01 - 45 / 80 formulazione di un test sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si potrebbero usare indifferentemente: - la media campionaria 1 Xn n n j 1 che ha distribuzione normale con media m e varianza s2 / n; - la variabile Xj Problema: non dispongo di valori tabulati ! X n m0 Z s n che ha distribuzione normale standard. Test 01 - 46 / 80 formulazione di un test sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la popolazione ha distribuzione normale con varianza s2 incognita si usa la variabile X n m0 T Sn n che ha distribuzione t di Student con n - 1 g.d.l. se n > 30 la variabile T può essere approssimata con la: X n m0 Z Sn n che ha distribuzione normale standard Test 01 - 47 / 80 formulazione di un test sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota ma il campione è poco numeroso (n 30) si usa: - la variabile X n m0 T s n che ha distribuzione t di Student con n - 1 g.d.l. se la X ha distribuzione normale Test 01 - 48 / 80 formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 49 / 80 formulazione di un test sulla media 6. si stabiliscono i valori a del rischio di errore di 1ª specie che si è disposti a correre e 1 - a della affidabilità richiesta. La probabilità a di commettere un errore di 1ª specie viene chiamata “livello di significatività” al quale si intende condurre il test. a Test 01 - 50 / 80 formulazione di un test sulla media 6. si stabiliscono i valori a del rischio di errore di 1ª specie che si è disposti a correre e 1 - a della affidabilità richiesta. La probabilità a di commettere un errore di 1ª specie viene chiamata “livello di significatività” al quale si intende condurre il test. criterio di scelta: la scelta del valore di rischio accettabile richiede considerazioni di vario tipo, non solamente tecniche ma, molto spesso, economiche, di politica aziendale, di immagine, ecc. Test 01 - 51 / 80 formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 52 / 80 formulazione di un test sulla media 8. in base a ciò che si è stabilito nei punti precedenti, si identifica il valore critico (o la coppia di valori critici) della statistica campionaria che individua nel dominio la “regione di rifiuto” dell’ipotesi principale H0 . a Test 01 - 53 / 80 formulazione di un test sulla media 8. in base a ciò che si è stabilito nei punti precedenti, si identifica il valore critico (o la coppia di valori critici) della statistica campionaria che individua nel dominio la “regione di rifiuto” dell’ipotesi principale H0 . a/2 a/2 Test 01 - 54 / 80 conduzione di un test sulla media Dopo aver formulato il test: si procede alla composizione del campione con numerosità pari a quella stabilita, si conducono le prove sperimentali, si determina il valore della variabile campionaria precelta, a/2 a/2 Test 01 - 55 / 80 conclusione del test Se il valore della variabile cade nella regione di rifiuto di H0 si respinge l’ipotesi principale H0 con un rischio pari ad a di commettere un errore: - il rifiuto di H0 avviene con una “fiducia” pari a 1 - a corrispondente alla probabilità di avere correttamente respinto H0 quando essa è realmente falsa Test 01 - 56 / 80 numerosità del campione 1. si stabilisce la numerosità n del campione con cui si vuole condurre il test. per comprendere l’effetto di un aumento della numerosità del campione si può fare la seguente considerazione: supponiamo di avere scelto come variabile campionaria la: Z X n m0 s n che, per n sufficientemente grande, sappiamo avere distribuzione normale standardizzata Test 01 - 57 / 80 numerosità del campione Z X n m0 s n X n mX0 n m0 Z Z s n s n Test 01 - 58 / 80 1° test sulla media varianza nota Test 01 - 59 / 80 test di ipotesi sulla media (con s2 nota) • Problema: Si è acquistato un campione di induttori di nuovo tipo e ci si interroga sulla possibilità che il valore tipico di induttanza della popolazione sia uguale a 12,50 mH, Si definisce sulla popolazione una X come “valore della induttanza misurata in mH” che ha varianza s2 (per l’intera popolazione) nota: s2 = 0,09 Test 01 - 60 / 80 formulazione del test di ipotesi per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 61 / 80 test di ipotesi sulla media (con s2 nota) • Si è acquistato un campione di induttori di nuovo tipo e ci si interroga sulla possibilità che il valore tipico di induttanza della popolazione sia uguale a 12,50 mH. 1. stabiliamo di operare con un campione di 36 induttori ; 2. Definiamo, come da testo del problema, la X come “valore della induttanza misurata in mH” 3. indicando con m0 il valore 12,50 si scrive: H0 : m = m0 ; 5. come variabile campionaria viene scelta la media campionaria che, se la numerosità n del campione è sufficientemente elevata, segue la distribuzione normale con media m e varianza s2 / n (si ricordi il teorema limite centrale); Test 01 - 62 / 80 Test di ipotesi sulla media (con s2 nota) 6. fissiamo il livello accettabile per il rischio di errore di prima specie: a = 0,04 ( che comporta un “livello di fiducia” del 96% ); 8. calcoliamo il valore (oppure i valori) critici della statistica campionaria adottata che individuano le regioni di accettazione e di rifiuto della ipotesi principale H0 in funzione del valore di a che è stato prestabilito (0,04); utilizzeremo la “distribuzione a due code” in quanto l’ipotesi principale deve essere rigettata sia se la media della X per l’intera popolazione risulta superiore a m0 , sia se essa risulta inferiore a m0 Test 01 - 63 / 80 Test di ipotesi sulla media (con s2 nota) utilizzando un foglio elettronico, per esempo MS Excel per il quale la funzione da invocare è la INV.NORM(probabilità;media;dev_standard) , risulta agevole individuare i due valori critici cercati: x̂inf INV.NORM( a / 2 ; m0 ; s / n ) x̂sup INV.NORM( 1 - a / 2 ; m0 ; s / n ) Test 01 - 64 / 80 Test di ipotesi sulla media (con s2 nota) utilizzando un foglio elettronico, per esempo MS Excel per il quale la funzione da invocare è la INV.NORM(probabilità;media;dev_standard) , risulta agevole individuare i due valori critici cercati: Xˆ inf INV.NORM( a / 2 ; m0 ; s / 6 ) 0,02 INV.NORM( 1 - a / 2 ; m 0,02 Xˆ sup 0;s /6 ) Test 01 - 65 / 80 Test di ipotesi sulla media (con s2 nota) regione di rifiuto di H0 : 0,02 X 36 12,397 X 36 > 12,603 0,02 Test 01 - 66 / 80 Test di ipotesi sulla media (con s2 nota) composto il campione si procede con la misurazione della induttanza di ciascun elemento mediante un “metodo a risonanza” 1 0 C1 L0 Test 01 - 67 / 80 Test di ipotesi sulla media (con s2 nota) composto il campione si procede con la misurazione della induttanza di ciascun elemento mediante un “metodo a risonanza” 11 00 C2C1LL00 Lx Test 01 - 68 / 80 Test di ipotesi sulla media (con s2 nota) composto il campione si procede con la misurazione della induttanza di ciascun elemento mediante un “metodo a risonanza” 1 0 C1 L0 ; 1 0 C2 L0 Lx Test 01 - 69 / 80 Test di ipotesi sulla media (con s2 nota) composto il campione si procede con la misurazione della induttanza di ciascun elemento mediante un “metodo a risonanza” 1 0 C1 L0 ; 1 0 C2 L0 Lx C1 L0 C2 L0 Lx C2 L0 C2 Lx C1 C2 Lx L0 C2 Test 01 - 70 / 80 Test di ipotesi sulla media (con s2 nota) terminata la campagna sperimentale sul campione e determinata la media campionaria si ottiene: X 36 12,75 Test 01 - 71 / 80 Test di ipotesi sulla media (con s2 nota) Dato che possiamo, con un “livello di X 36 12,75 fiducia” del 96%, rigettare l’ipotesi H0 : m = m0 = 12,50 Test 01 - 72 / 80 Esercizio 1 Test 01 - 73 / 80 Esercizio 1 Un costruttore di condensatori teme che la linea di produzione sia andata “fuori taratura” e produca componenti con una capacità inferiore a quella desiderata: osservando i valori della capacità misurata a 1 kHz di tre condensatori da 10 mF nota i seguenti valori: 9,84 mF 9,94 mF 9,96 mF Decide quindi di condurre un test statistico per assicurarsi che la capacità tipica della popolazione non sia scesa sotto i 9,90 mF, valore questo ritenuto accettabile dato che la classe di tolleranza dei condensatori è ± 1% Il test deve essere condotto con una affidabilità del 95% e con un campione di 16 elementi. Test 01 - 74 / 80 Esercizio 1 … per assicurarsi che la capacità tipica della popolazione non sia scesa sotto i 9,90 mF… … affidabilità del 95% … campione di 16 elementi. Gli elementi del campione di 16 condensatori mostrano i seguenti valori della capacità misurata a 1 kHz: 9,80 mF 9,84 mF 9,92 mF 9,88 mF 9,94 mF 9,90 mF 9,96 mF 9,96 mF 9,97 mF 9,98 mF 10,00 mF 10,02 mF 10,04 mF 10,08 mF 10,12 mF Cosa conclude il costruttore ? 9,95 mF Test 01 - 75 / 80 formulazione del test di ipotesi per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 01 - 76 / 80 Esercizio 1 1. La numerosità del campione era stata data nella definizione del problema: n 16 2. Come variabile casuale X viene scelta una variabile adimensionale che assume, per ciascun elemento della popolazione, valore pari a: X Cmis 9,80 100 3. Come ipotesi principale H0 si prende: (… per assicurarsi che la capacità tipica della popolazione non sia scesa sotto i 9,90 mF…) H0 : m m0 10 Test 01 - 77 / 80 Esercizio 1 5. È plausibile che la X abbia distribuzione normale e come variabile campionaria idonea a svolgere il test si prende: ( la varianza s2 non è nota ed il campione ha n = 16) - la variabile X n m0 T Sn n che ha distribuzione t di Student con 15 g.d.l. 6. si stabilisce il valore ( … affidabiltà del 95% … ) del rischio di errore di 1ª specie: a = 0,05 Test 01 - 78 / 80 Esercizio 1 8. Il valore critico della T che individua la regione di rifiuto di H0 è: tsup 1,753 e la regione di rifiuto di H0 è T tsup 1,753 Test 01 - 79 / 80 Esercizio 1 Dai dati del problema si ricava: X n 16 S 69,47 S n 8,34 2 n X n m 0 16 10 T 2.88 Sn 8,34 4 n Test 01 - 80 / 80 Esercizio 1 Dato che: X n m 0 16 10 T 2.88 Sn 8,34 4 n e che la regione di rifiuto è: T tsup 1,753 il costruttore conclude che è possibile escludere che la capacità tipica della produzione sia scesa sotto i 9,90 mF