Esercizio 1 Riportiamo alcuni dati relativi al traffico del mercato dell’abbigliamento per paese nel 1997: Paese Valore merci (ml lire) Russia Moldavia Portogallo Francia Repubblica Ceca Marocco Serbia-Montenegro Slovenia Ucraina Tunisia 15,2 16,3 18,8 19,1 20,6 22,1 25,7 30,1 30,5 31,7 Paese Bielorussia Cina Albania Polonia Bulgaria Croazia Slovacchia Ungheria Romania Valore merci (ml lire) 38,3 40,8 43,4 70,8 72,1 77,8 97,2 179,9 501,8 Istruzioni di R Diagramma scatola baffi •In questo caso i quartili della distribuzione sono: q(1)=20,5 med=q(2)=31,7 q(3)=72,1. • Il minimo valore osservato è Russia=15,2 •Il massimo è Romania=501,8 •Lo scarto interquartilico è SI=72,1-20,5=51,6 •Le barriere sono: BI=-56,9 e BS=149,5 Esercizio 2 Riportiamo alcuni dati relativi al censimento del 1990 in California per gruppi di individui (in media circa 1425.5 per gruppo) che vivono in areee geograficamente compatte. Si tratta di 20640 gruppi sui quali viene rilevato il valore mediano dell’abitazione (in migliaia di dollari). Ne riportiamo l’istogramma di frequenze relative e una sintesi in tabella di frequenze. > summary(dati[,1]) Min. 1st Qu. Median Mean 3rd Qu. Max. 15000 119600 179700 206900 264700 500000 > table(cut(dati[,1]/1000,breaks=c(0,50,100,150,200,250,300,350,400,450,500,550))) Valore (0;50] (50;100] (100;150] (150;200] (200;250] (250;300] (300;350] (350;400] (400;450] (450;500] >500 totale freq. 210 3448 3962 4311 2927 1946 1263 829 487 292 965 20640 > boxplot(dati[,1]) Esercizio 3 Riportiamo alcuni dati relativi alla distribuzione del gas al dettaglio (Il sole-24 ore, 9-10-2000). Vengono rilevati per i 16 principali distributori italiani di gas le seguenti variabili: • metri cubi distribuiti • Clienti serviti I Principali distributori italiani al dettaglio di gas Consumo medio per cliente. >media del consumo medio [1] 1965.159 deviazione standard [1] 512.5386 > summary(ve) Min. 1st Qu. Median Mean 3rd Qu. Max. 1121 1632 2003 1965 2294 2753 [1] 1500.769 [2] 1675.203 [3] 1154.284 [4] 2147.059 [5] 1227.384 [6] 1959.374 [7] 2753.012 [8] 1120.635 [9] 2741.071 [10] 2046.667 [11] 2451.883 [12] 1936.620 [13] 1850.000 [14] 2046.118 [15] 2241.071 [16] 2591.398 Esercizio 4 La tabella mostra la distribuzione delle imprese commerciali secondo il numero di addetti (ISTAT, 18-12-1998). Classe Numero Numero di addetti di imprese di addetti <10 1198533 2185011 [10-20) 20661 268397 [20-50) 6703 191178 [50-250) 1598 147814 >=250 216 188767 •Quali sono le unità statistiche? •Qual è il fenomeno rilevato? •Quante sono le unità censite? •Quanti sono gli addetti del settore commerciale, secondo questa rilevazione? •Qual è la dimensione mediana delle imprese? •Qual è la dimensione media delle imprese? •Qual è lo scarto? •Quale rappresentazione grafica ritieni più adeguata. numerosità campionaria: ini =1227711 Media del numero di addetti per impresa ixi /ini=2981167/ 1227711=2.428232 Mediana del numero di addetti per impresa indice 1227711/2=613855 1198533/10=119853.3 119853.3*5= 599266.5 (classe=4) 119853.3*6= 719119.8 (classe=5) Mediana=5 addetti Esercizio 5 L’istogramma è relativo alla distribuzione della pressione sanguigna per tutte le 14148 donne nel Drug Study. • La percentuale di donne con pressione sanguigna che supera i 130 mmHg è pari al 25%, 50% o 75%? • La percentuale di donne con pressione sanguigna tra i 90 mmHg e i 160 mmHg è pari all’1%, 50% o 99%? • In quale intervallo ci sono più donne: 135-140 o 140-150? e quale dei due è più affollato (densità più alta)? • L’altezza dell’istogramma per 125-130 è 2.1% mmHg: a quale percentuale di donne corrisponde? Esercizio 2 Durante la correzione delle bozze di un libro di 280 pagine si è riscontrata la seguente distribuzione degli errori di stampa per pagina Errori x 0 N(x) 112 1 88 2 44 3 18 4 10 5 8 Totale 280 •Qual è l’unità statistica e il fenomeno rilevato? •Di che tipo è la scala di modalità Calcolare : •media •moda •mediana e quartili