Dati campionari:media, varianza,…bruchi
Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha
trovato presenti dei bruchi, secondo i numeri riportati nella seguente tabella:
n° dei bruchi
n° delle foglie
0
167
1
98
2
30
3
5
Calcolare il numero medio di bruchi per foglia e la relativa deviazione standard
Dati campionari: media, varianza,…bruchi
Per calcolare il numero medio di bruchi per foglia,
dobbiamo calcolare il numero totale dei bruchi, il
numero totale delle foglie e fare il rapporto tra questi
due numeri.
Numero totale bruchi:0·167 + 1·98 + 2·30 +3·5 = 173
Numero totale foglie: 167+98+30+5 = 300
Numero medio di bruchi per foglia = 173/300≈4%
Dati campionari: media, varianza,…bruchi
Per calcolare la deviazione standard dobbiamo calcolare
dapprima la varianza, infatti la deviazione standard è
la radice quadrata della varianza. Utilizziamo la
formula per il calcolo “veloce” della varianza, vale a
dire: calcoliamo la media dei quadrati e sottraiamo la
media al quadrato:
Media dei quadrati:( 0·167 + 1·98 + 22·30 +32·5)/300 =
=263/300
Media al quadrato: (173/300)2
Varianza: 263/300 − (173/300)2 = 48971/90000
Deviazione standard: sqr(48971/90000) ≈ 0.74
Dati campionari: media, varianza,…
Esercizio:
Nella seguente tabella sono rappresentate le frequenze del numero dei
giorni che un certo unguento impiega per far scomparire i segni di un
rash cutaneo
Numero dei giorni
1
2
3
4
5
6
Determina la media e la varianza campionaria
Frequenza
2
7
9
27
11
5
Dati campionari: media, varianza,…
SOLUZIONE: Il numero medio dei giorni che
l’unguento impiega a far scomparire i segni del rash
cutaneo si ottiene dal calcolo seguente:
Numero totale giorni osservati/Numero totale casi
esaminati=(2 +14+27+108+55+30)/61 =236/61 ≈ 3.87
Per la varianza possiamo utilizzare la formula: media
aritmetica dei dati elevati al quadrato − media dati
elevata al quadrato, quindi
(2+28+81+432+275+180)/61− (3.87)2 ≈ 1.38
Dati campionari: media, varianza,…pile
Due ditte di pile pubblicizzano il loro modello “ministilo”
a 1.5 volt e affermano, entrambe, che le loro pile hanno una
carica complessiva di 1.25 A h (carica equivalente a un
flusso di corrente di 1.25 ampere della durata di un’ora).
Per verificare queste affermazioni, vengono scelti due
campioni casuali di 50 pile prodotte da ciascuna delle due
ditte, viene compilata la tabella dei valori delle frequenze
assolute con cui sono stati osservati i diversi valori di
carica
Dati campionari: media, varianza,…pile
Carica in A h
1.15
1.20
1.25 1.30
Prima ditta
1
16
25
8
Seconda ditta
17
0
9
24
Che cosa possiamo concludere?
Dati campionari: media, varianza,…pile
La carica media in entrambi i casi è 1.24
La varianza per la prima ditta è 0.065/50=0.0013
La varianza per la seconda ditta è 0.225/50=0.0045
La DS per la prina ditta è ≈ 0.036
La DS per la seconda ditta è ≈ 0.067
Nella seconda ditta, i dati sono più dispersi
rispetto alla media, quindi il valore della media è
più attendibile per la prima ditta.
Farmaco e tempo di coagulo…
Ad un campione di 12 cavie è stato somministrato un
diverso quantitativo di un certo farmaco che si vuol
stabilire se produce, oltre ad effetti benefici, un
ritardo nel coagulo del sangue per tararne il dosaggio.
Indicando con X la dose di farmaco somministrata,
misurata in mg, e con Y il tempo di coagulo rilevato,
misurato in minuti, si sono osservati i dati riportati
nella tabella che segue.
E’ ragionevole ipotizzare una dipendenza lineare di Y
da X?
Farmaco e tempo di coagulo…
X
81
21
68
35
15
40.5
19
48.5
17.5
57.5
72
29.5
x*
42.04
Y
33.1
2.0
11.2
4.0
1.6
5.1
1.9
7.2
1.8
9.1
15.3
3.2
y*
7.96
X2
6561
441
4624
1225
225
1640.25
361
2352.25
306.25
3306.25
5184
870.25
x2*
2258.02
Y2
1095.61
4.0
125.44
16.0
2.56
26.01
3.61
51.84
3.24
82.81
234.09
10.24
y2 *
137.95
XY
2681.1
42.0
761.6
140.0
24.0
206.55
36.1
349.2
31.5
523.25
1101.6
94.4
(xy)*
499.275
Farmaco e tempo di coagulo…
Determiniamo la retta di regressione Y=mX+q
Otteniamo m (vedi slides Lez13) dalla formula
m = [(x·y)* − x*·y*]/[(x2 )* − (x*)2]
m= [499.275 −(42.04)·(7.96)]/[2258.02 − (42.04)2 ] ≈
0.34
Si ottiene q dalla formula q = y* − mx*, quindi
q=7.96 − (0.34)(42.04) ≈ − 6.33
Vediamo se la retta approssima bene i dati calcolando
il coefficiente di correlazione di Pearson CP, dalla
formula CP= [(x·y)* − x*·y*]/ (DSx · DSy )
Farmaco e tempo di coagulo…
CP= [(x·y)* − x*·y*]/ (DSx · DSy )
Calcoliamo la deviazione standard dei dati campionari
X, DSx =sqr(2258.02 −(42.04)2 ) ≈ 22.15
Con “sqr” indichiamo la radice quadrata
Calcoliamo la deviazione standard dei dati campionari
Y, DSy =sqr(137.95 − (7.96)2 ) ≈ 8.64
Siamo ora in grado di calcolare il CP
CP=[499.275 − (42.04)(7.96)] /[(22.15)(8.64)] ≈ 0.86
Il CP non è vicinissimo ad 1, la relazione tra X ed Y
potrebbe essere di tipo non lineare. Potremmo
ipotizzare una legge a potenza Y=cXk ?
Scarica

Dati campionari:media, varianza,…bruchi