Esercizio 1
Riportiamo alcuni dati relativi al traffico del mercato
dell’abbigliamento per paese nel 1997:
Paese
Valore merci
(ml lire)
Russia
Moldavia
Portogallo
Francia
Repubblica Ceca
Marocco
Serbia-Montenegro
Slovenia
Ucraina
Tunisia
15,2
16,3
18,8
19,1
20,6
22,1
25,7
30,1
30,5
31,7
Paese
Bielorussia
Cina
Albania
Polonia
Bulgaria
Croazia
Slovacchia
Ungheria
Romania
Valore merci
(ml lire)
38,3
40,8
43,4
70,8
72,1
77,8
97,2
179,9
501,8
Istruzioni di R
Diagramma scatola baffi
•In questo caso i quartili della distribuzione sono:
q(1)=20,5
med=q(2)=31,7
q(3)=72,1.
• Il minimo valore osservato è Russia=15,2
•Il massimo è Romania=501,8
•Lo scarto interquartilico è SI=72,1-20,5=51,6
•Le barriere sono: BI=-56,9 e BS=149,5
Esercizio 2
Riportiamo alcuni dati relativi al censimento del
1990 in California per gruppi di individui (in
media circa 1425.5 per gruppo) che vivono in
areee geograficamente compatte. Si tratta di 20640
gruppi sui quali viene rilevato il valore mediano
dell’abitazione (in migliaia di dollari).
Ne riportiamo l’istogramma di frequenze relative e
una sintesi in tabella di frequenze.
> summary(dati[,1])
Min. 1st Qu. Median Mean 3rd Qu. Max.
15000 119600 179700 206900 264700 500000
> table(cut(dati[,1]/1000,breaks=c(0,50,100,150,200,250,300,350,400,450,500,550)))
Valore
(0;50]
(50;100]
(100;150]
(150;200]
(200;250]
(250;300]
(300;350]
(350;400]
(400;450]
(450;500]
>500
totale
freq.
210
3448
3962
4311
2927
1946
1263
829
487
292
965
20640
> boxplot(dati[,1])
Esercizio 3
Riportiamo alcuni dati relativi alla distribuzione del
gas al dettaglio (Il sole-24 ore, 9-10-2000).
Vengono rilevati per i 16 principali distributori
italiani di gas le seguenti variabili:
• metri cubi distribuiti
• Clienti serviti
I Principali distributori italiani al dettaglio di gas
Consumo medio per
cliente.
>media del consumo medio
[1] 1965.159
deviazione standard
[1] 512.5386
> summary(ve)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1121 1632 2003 1965 2294 2753
[1] 1500.769
[2] 1675.203
[3] 1154.284
[4] 2147.059
[5] 1227.384
[6] 1959.374
[7] 2753.012
[8] 1120.635
[9] 2741.071
[10] 2046.667
[11] 2451.883
[12] 1936.620
[13] 1850.000
[14] 2046.118
[15] 2241.071
[16] 2591.398
Esercizio 4
La tabella mostra la distribuzione delle imprese
commerciali secondo il numero di addetti (ISTAT,
18-12-1998).
Classe Numero
Numero
di addetti di imprese di addetti
<10
1198533 2185011
[10-20)
20661
268397
[20-50)
6703
191178
[50-250)
1598
147814
>=250
216
188767
•Quali sono le unità statistiche?
•Qual è il fenomeno rilevato?
•Quante sono le unità censite?
•Quanti sono gli addetti del settore commerciale,
secondo questa rilevazione?
•Qual è la dimensione mediana delle imprese?
•Qual è la dimensione media delle imprese?
•Qual è lo scarto?
•Quale rappresentazione grafica ritieni più
adeguata.
numerosità campionaria:
ini =1227711
Media del numero di addetti per impresa
ixi /ini=2981167/ 1227711=2.428232
Mediana del numero di addetti per impresa
indice 1227711/2=613855
1198533/10=119853.3
119853.3*5= 599266.5 (classe=4)
119853.3*6= 719119.8 (classe=5)
Mediana=5 addetti
Esercizio 5
L’istogramma è relativo alla distribuzione della pressione sanguigna
per tutte le 14148 donne nel Drug Study.
• La percentuale di donne con pressione sanguigna che supera i
130 mmHg è pari al 25%, 50% o 75%?
• La percentuale di donne con pressione sanguigna tra i 90 mmHg
e i 160 mmHg è pari all’1%, 50% o 99%?
• In quale intervallo ci sono più donne: 135-140 o 140-150? e
quale dei due è più affollato (densità più alta)?
• L’altezza dell’istogramma per 125-130 è 2.1% mmHg: a quale
percentuale di donne corrisponde?
Esercizio 2
Durante la correzione delle bozze di un libro di
280 pagine si è riscontrata la seguente
distribuzione degli errori di stampa per pagina
Errori x 0
N(x) 112
1
88
2
44
3
18
4
10
5
8
Totale
280
•Qual è l’unità statistica e il
fenomeno rilevato?
•Di che tipo è la scala di
modalità
Calcolare :
•media
•moda
•mediana e quartili
Scarica

Scarica presentazione originale