Dati campionari:media, varianza,…bruchi Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha trovato presenti dei bruchi, secondo i numeri riportati nella seguente tabella: n° dei bruchi n° delle foglie 0 167 1 98 2 30 3 5 Calcolare il numero medio di bruchi per foglia e la relativa deviazione standard Dati campionari: media, varianza,…bruchi Per calcolare il numero medio di bruchi per foglia, dobbiamo calcolare il numero totale dei bruchi, il numero totale delle foglie e fare il rapporto tra questi due numeri. Numero totale bruchi:0·167 + 1·98 + 2·30 +3·5 = 173 Numero totale foglie: 167+98+30+5 = 300 Numero medio di bruchi per foglia = 173/300≈4% Dati campionari: media, varianza,…bruchi Per calcolare la deviazione standard dobbiamo calcolare dapprima la varianza, infatti la deviazione standard è la radice quadrata della varianza. Utilizziamo la formula per il calcolo “veloce” della varianza, vale a dire: calcoliamo la media dei quadrati e sottraiamo la media al quadrato: Media dei quadrati:( 0·167 + 1·98 + 22·30 +32·5)/300 = =263/300 Media al quadrato: (173/300)2 Varianza: 263/300 − (173/300)2 = 48971/90000 Deviazione standard: sqr(48971/90000) ≈ 0.74 Dati campionari: media, varianza,… Esercizio: Nella seguente tabella sono rappresentate le frequenze del numero dei giorni che un certo unguento impiega per far scomparire i segni di un rash cutaneo Numero dei giorni 1 2 3 4 5 6 Determina la media e la varianza campionaria Frequenza 2 7 9 27 11 5 Dati campionari: media, varianza,… SOLUZIONE: Il numero medio dei giorni che l’unguento impiega a far scomparire i segni del rash cutaneo si ottiene dal calcolo seguente: Numero totale giorni osservati/Numero totale casi esaminati=(2 +14+27+108+55+30)/61 =236/61 ≈ 3.87 Per la varianza possiamo utilizzare la formula: media aritmetica dei dati elevati al quadrato − media dati elevata al quadrato, quindi (2+28+81+432+275+180)/61− (3.87)2 ≈ 1.38 Dati campionari: media, varianza,…pile Due ditte di pile pubblicizzano il loro modello “ministilo” a 1.5 volt e affermano, entrambe, che le loro pile hanno una carica complessiva di 1.25 A h (carica equivalente a un flusso di corrente di 1.25 ampere della durata di un’ora). Per verificare queste affermazioni, vengono scelti due campioni casuali di 50 pile prodotte da ciascuna delle due ditte, viene compilata la tabella dei valori delle frequenze assolute con cui sono stati osservati i diversi valori di carica Dati campionari: media, varianza,…pile Carica in A h 1.15 1.20 1.25 1.30 Prima ditta 1 16 25 8 Seconda ditta 17 0 9 24 Che cosa possiamo concludere? Dati campionari: media, varianza,…pile La carica media in entrambi i casi è 1.24 La varianza per la prima ditta è 0.065/50=0.0013 La varianza per la seconda ditta è 0.225/50=0.0045 La DS per la prina ditta è ≈ 0.036 La DS per la seconda ditta è ≈ 0.067 Nella seconda ditta, i dati sono più dispersi rispetto alla media, quindi il valore della media è più attendibile per la prima ditta. Farmaco e tempo di coagulo… Ad un campione di 12 cavie è stato somministrato un diverso quantitativo di un certo farmaco che si vuol stabilire se produce, oltre ad effetti benefici, un ritardo nel coagulo del sangue per tararne il dosaggio. Indicando con X la dose di farmaco somministrata, misurata in mg, e con Y il tempo di coagulo rilevato, misurato in minuti, si sono osservati i dati riportati nella tabella che segue. E’ ragionevole ipotizzare una dipendenza lineare di Y da X? Farmaco e tempo di coagulo… X 81 21 68 35 15 40.5 19 48.5 17.5 57.5 72 29.5 x* 42.04 Y 33.1 2.0 11.2 4.0 1.6 5.1 1.9 7.2 1.8 9.1 15.3 3.2 y* 7.96 X2 6561 441 4624 1225 225 1640.25 361 2352.25 306.25 3306.25 5184 870.25 x2* 2258.02 Y2 1095.61 4.0 125.44 16.0 2.56 26.01 3.61 51.84 3.24 82.81 234.09 10.24 y2 * 137.95 XY 2681.1 42.0 761.6 140.0 24.0 206.55 36.1 349.2 31.5 523.25 1101.6 94.4 (xy)* 499.275 Farmaco e tempo di coagulo… Determiniamo la retta di regressione Y=mX+q Otteniamo m (vedi slides Lez13) dalla formula m = [(x·y)* − x*·y*]/[(x2 )* − (x*)2] m= [499.275 −(42.04)·(7.96)]/[2258.02 − (42.04)2 ] ≈ 0.34 Si ottiene q dalla formula q = y* − mx*, quindi q=7.96 − (0.34)(42.04) ≈ − 6.33 Vediamo se la retta approssima bene i dati calcolando il coefficiente di correlazione di Pearson CP, dalla formula CP= [(x·y)* − x*·y*]/ (DSx · DSy ) Farmaco e tempo di coagulo… CP= [(x·y)* − x*·y*]/ (DSx · DSy ) Calcoliamo la deviazione standard dei dati campionari X, DSx =sqr(2258.02 −(42.04)2 ) ≈ 22.15 Con “sqr” indichiamo la radice quadrata Calcoliamo la deviazione standard dei dati campionari Y, DSy =sqr(137.95 − (7.96)2 ) ≈ 8.64 Siamo ora in grado di calcolare il CP CP=[499.275 − (42.04)(7.96)] /[(22.15)(8.64)] ≈ 0.86 Il CP non è vicinissimo ad 1, la relazione tra X ed Y potrebbe essere di tipo non lineare. Potremmo ipotizzare una legge a potenza Y=cXk ?