Si indaga il numero di pezzi acquistati da 60 soggetti che, in un supermercato di Saronno, pagano alla corsia "Max 10 pezzi"; di seguito si riportano le frequenze assolute xi ni 2 2 3 2 5 3 6 13 7 21 8 13 9 4 10 2 Esempio 1 La MEDIA ARITMETICA è 6,8 La DEVIAZIONE STANDARD è 1,59 x x / ds PUNTI Z: x x / ds La MEDIA ARITMETICA è 6,8 La DEVIAZIONE STANDARD è 1,59 xi 2 3 5 6 7 8 9 10 Esempio 1 x x PUNTI Z: x x / ds La MEDIA ARITMETICA è 6,8 La DEVIAZIONE STANDARD è 1,59 xi x 6,8 2 -4,8 3 -3,8 5 -1,8 6 -0,8 7 0,2 8 1,2 9 2,2 10 3,2 Esempio 1 PUNTI Z: xi x x / ds x x x x / 1,59 2 -4,8 3 -3,8 5 -1,8 6 -0,8 7 0,2 8 1,2 9 2,2 10 3,2 Esempio 1 PUNTI Z: xi x x / ds x x x x / ds 2 -4,8 -3,03 3 -3,8 -2,41 5 -1,8 -1,15 6 -0,8 -0,52 7 0,2 0,10 8 1,2 0,73 9 2,2 1,36 10 3,2 1,99 Esempio 1 PUNTI Z: xi x x / ds x x Z 2 -4,8 -3,03 3 -3,8 -2,41 5 -1,8 -1,15 6 -0,8 -0,52 7 0,2 0,10 8 1,2 0,73 9 2,2 1,36 10 3,2 1,99 Esempio 1 Correlazione tra peso e altezza di 60 soggetti; ecco il diagramma di dispersione: 200 190 180 170 160 ALTEZZA 150 140 130 30 40 50 60 70 80 90 100 PESO r = 0,954; la correlazione è positiva; al crescere dell’altezza aumenta il peso. Correlazione tra età e numero di giocattoli su 100 bambini; ecco il diagramma di dispersione: 18 16 14 12 10 8 6 GIOCHI 4 2 0 2 ANNI 4 6 8 10 12 r = -0,945; la correlazione è negativa; al crescere dell’età diminuisce il numero di giocattoli posseduti. Correlazione tra età e altezza su 100 adulti; ecco il diagramma di dispersione: 80 70 60 50 40 ANNI 30 20 120 130 ALTEZZA r = -0,060 non c’è correlazione 140 150 160 170 180 190 200 Correlazione tra peso e tempo impiegato per una maratona su 100 adulti; ecco il diagramma di dispersione: 100 90 80 70 60 PESO 50 40 30 20 TEMPO 30 40 50 60 70 r = 0,589; c’è una correlazione positiva moderata tra peso e tempo impiegato C’è correlazione tra il numero di bicchieri di vino bevuti e le sigarette fumate dagli invitati? invitati marco paolo giovanna antonio vasco maria antonella tot bicchieri 3 5 5 7 21 2 3 46 sigarette 0 2 3 6 10 0 0 21 1° passo: trovare medie e deviazioni standard delle 2 var. invitati bicchieri sigarette marco 3 0 paolo 5 2 giovanna 5 3 antonio 7 6 vasco 21 10 maria 2 0 antonella 3 0 tot 46 21 Media bicchieri = 46/7 = 6,57 Media sigarette = 21/7 = 3 N.B. essendo una matrice dei dati (e non una matrice di frequenza, poiché il numero di bicchieri e sigarette corrispondono a modalità!), non serve calcolare i passaggi visti negli esempi passati con le frequenze assolute, poiché sono tutte pari a 1. 1° passo: trovare medie e deviazioni standard delle 2 var. Focalizzandosi su bicchieri… Media bicchieri = 6,57 invitati bicchieri x-media (x-m)² marco 3 -3,57 12,76 paolo 5 -1,57 2,47 giovanna 5 -1,57 2,47 antonio 7 0,42 0,18 vasco 21 14,42 208,18 maria 2 -4,57 20,90 antonella 3 -3,57 12,76 tot 259,71 √(259,71/7) = 6,09 Ds bicchieri = 6,09 1° passo: trovare medie e deviazioni standard delle 2 var. Focalizzandosi sulle sigarette… Media sigarette = 3 invitati sigarette x-m (x-m)² marco 0 -3 9 paolo 2 -1 1 giovanna 3 0 0 antonio 6 3 9 vasco 10 7 49 maria 0 -3 9 antonella 0 -3 9 tot 86 √(86/7) = 3,51 Ds sigarette = 3,51 2° passo: standardizzare le 2 var. Media bicchieri = 6,57 Media sigarette = 3 Ds bicchieri = 6,09 Ds sigarette = 3,51 invitati bicchieri sigarette Z bicchieri Z sigarette marco 3 0 -0,59 -0,86 paolo 5 2 -0,26 -0,29 giovanna 5 3 -0,26 0,00 antonio 7 6 0,07 0,86 vasco 21 10 2,37 2,00 maria 2 0 -0,75 -0,86 antonella 3 0 -0,59 -0,86 tot z x x / ds 3° passo: moltiplicare le 2 var. standardizzate invitati Z bicchieri Z sigarette Z bicchieri * Z sigarette marco -0,59 -0,86 0,50 paolo -0,26 -0,29 0,07 giovanna -0,26 0,00 0,00 antonio 0,07 0,86 0,06 vasco 2,37 2,00 4,73 maria -0,75 -0,86 0,64 antonella -0,59 -0,86 0,50 tot 6,51 4° passo: calcolare la media dei prodotti: r = 6,51 / 7 = 0,93 C’è una correlazione positiva, chi beve di più fuma di più!