Test del 2 Confronto dato empirico e dato teorico modalità testa croce n= frequenze empiriche: fe 499 501 1000 probabilità teoriche: p 0,5 0,5 frequenze teoriche: ft=p*n 500 500 funzione test 2= livello di significativita' a= valore critico c2= 2 (fe - ft) / ft 0,002 0,002 0,004 0,05 Confrontare 2 col valore teorico nel caso di moneta non truccata 3,841458821 Il valore critico lo posso ottenere dalla tabella dei valori della distribuzione 2, in funzione di a e dei gradi di libertà, o calcolarlo direttamente con INV.CHI(probabilità; gradi_libertà), dove gradi di libertà = quantità delle frequenze sperimentali che devo conoscere direttamente. Nel nostro esempio: a = 0,05 e gradi di libertà = 1 (perché basta conoscere p per ottenere q=1-p) 2 c = INV.CHI(0,05;1) = 3,841458821 Valori in tabella con Excel Come ottenere i valori in tabella con Excel? 20,950 = 0,004 DISTR.CHI(0,004;1) = 0,950 INV.CHI(0,950;1) = 0,004 20,050 = 3,841 DISTR.CHI(3,841;1) = 0,050 INV.CHI(0,050;1) = 3,841 20,050 corrisponde alla probabilità 5% 20,010 corrisponde alla probabilità 1% 20,950 corrisponde alla probabilità 95% ACCETTO se 2 < 2C Accettazione (come indica il libro di Excel) Il valore della funzione test Il valore critico 2 = 0,004 = 20,950 2C = 3,841 = 20,050 0,004 < 3,841 quindi ACCETTO. Equivalentemente: ACCETTO se 0,95 > 0,05 = a livello di significatività scelto; ovvero ACCETTO se 95% > 5% In Excel la percentuale 0,950 la posso ottenere direttamente: 0,950 = TEST.CHI(int_effettivo; int_previsto) dove int_effettivo e int_previsto sono rispettivamente le tabelle delle frequenze empiriche e teoriche Quindi più velocemente: ACCETTO se TEST.CHI(int_effettivo; int_previsto) > a Funzione TEST.CHI TEST.CHI(B2:B3;D2:D3) = 0,950 Indica direttamente che il valore di 2 (0,004) corrisponde a 20,950 Dato che 0,950 > 0,05: ACCETTO l’ipotesi nulla! Esempio dal libro di fisica La tabella mostra 40 misurazioni di una variabile. Vogliamo valutare col test di 2 la concordanza con una distribuzione normale di Gauss. 731 772 771 681 722 688 653 757 733 742 739 780 709 676 760 748 672 687 766 645 678 748 689 810 805 778 764 753 709 675 698 770 754 830 725 710 738 638 787 712 Procediamo come segue. Calcoliamo la media X, la deviazione standard s. Stabiliamo di considerare i valori nei 4 intervalli individuati da X - s, X, X + s. Per ogni intervallo calcoliamo le frequenze empiriche Ok, date del numero di valori che ricadono in quell’intervallo. Come passo intermedio, calcoliamo il numero di valori ≤ X - s, X, X + s, rispettivamente, con la funzione CONTA.PIÙ.SE(A1:J4;"< X - s"), eccetera. Otteniamo: X ≤ 683,3 X ≤ 730,1 X ≤ 776,9 X>776,9 frequenze ausiliare 8 18 34 6 Calcolo probabilità intermedie Calcoliamo ora le probabilità teoriche concordi ad una distribuzione normale. Come passo intermedio calcoliamo: P(X ≤ 683,3) = DISTRIB.NORM.N(683,3;$B$9;$B$10;VERO) e similmente per le altre. Otteniamo: X ≤ 683,3 X ≤ 730,1 X ≤ 776,9 X>776,9 frequenze ausiliare 8 18 34 6 probabilità ausiliare 0,16 0,50 0,84 0,50 Calcolo probabilità teoriche Con i valori calcolati nella slide precedente, possiamo ora calcolare: frequenze probabilità empiriche Ok teoriche pk frequenza teorica Ek (fe-ft)2/ft k Intervallo 1 0< X ≤ 683,3 8 0,16 6,3 0,4320 2 683,3< X ≤ 730,1 10 0,34 13,7 0,9825 3 730,1< X < 776,9 16 0,34 13,7 0,4018 4 X >776,9 6 0,16 6,3 0,0176 2 = 1,8340 Per esempio: P(683,3< X ≤ 730,1) = P(X ≤ 730,1) - P(X ≤ 683,3). Ek = pk * n, dove n=CONTA.VALORI(A1:J4) Il valore 2 è ottenuto come la somma dei valori soprastanti. Considerazioni finali Infine calcolo il valore critico con cui confrontare con INV.CHI(0,05;1) ed accetto se 2 è minore di tale valore 2 = 1,8340 valore critico = 3,84 risultato: accetto H0 con la funzione SE(F26<F28; "accetto H0";"rifiuto H0"). 731 739 678 698 772 780 748 770 n= minimo= 40 638 massimo= 830 X media= 730,1 s dev. standard= 46,8 X-s= 683,3 X+s= 776,8 771 709 689 754 681 676 810 830 frequenze probabilità empiriche Ok teoriche pk 722 760 805 725 688 748 778 710 frequenza teorica Ek (fe-ft)2/ft 0,16 6,3 0,4320 10 0,34 13,7 0,9825 730,1< X < 776,9 16 0,34 13,7 0,4018 X >776,9 6 0,16 6,3 0,0176 X ≤ 683,3 X ≤ 730,1 X ≤ 776,9 X>776,9 frequenze ausiliare 8 18 34 6 probabilità ausiliare 0,16 0,50 0,84 0,16 k Intervallo 1 0< X ≤ 683,3 8 2 683,3< X ≤ 730,1 3 4 2 = 1,8340 valore critico = 3,84 risultato: accetto H0 653 672 764 738 757 687 753 638 733 766 709 787 742 645 675 712