Teoria della probabilità - Descrivere lo Spazio di Probabilità (ovverosia lo Spazio Campionario,la Famiglia di eventi e la Distribuzione di Probabilità) del lancio contemporaneo di due dadi a quattro facce Si definisce Spazio di probabilità una qualsiasi terna (Ω,Є,Pr) costituita da: 1. Uno Spazio Campionario Ω (insiemi degli esiti di un dato fenomeno casuale) 2. Una Famiglia di Eventi Є (insieme di sottoinsiemi di Ω, chiuso a tutte le operazioni) 3. Una Distribuzione di probabilità Pr (definita su ε a valori reali) SPAZIO CAMPIONARIO: insieme che racchiude tutti gli esiti di un dato esperimento casuale. Nel caso in cui un esperimento sia composto da più operazioni dall’esito casuale, lo spazio campionario sarà composto dal prodotto cartesiano delle singole operazioni. Ω = Ω1 x Ω2 = {1,2,3,4} x {1,2,3,4} Card (X)²= 4²= 16 X²=X x X= {1,2,3,4} x {1,2,3,4}= {(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1) ,(4,2),(4,3),(4,4)} FAMIGLIA DI EVENTI:simbolicamente rappresentata da Є, è un qualsiasi insieme di eventi chiuso a tutte le operazioni insiemistiche (“campo” di eventi). Ovvero è un insieme di sottoinsiemi di Ω dove, compiendo una qualsiasi operazione insiemistica tra qualsiasi due insiemi (eventi) , il risultato (evento risultante ) è presente tra gli elementi che compongono la Famiglia di Eventi. Se non specificato si può intendere come l’insieme potenza dello spazio campionario P(Ω). Є= P(Ω)= { Ǿ,{(1,1)}, {(1,2)}, {(1,3)},{(1,4)}, {(2,1)}, {(2,2)},…, {(1,1),(1,2)},{(1,1),(1,3)},…, {(1,1),(1,2),(1,3)},…, {(1,1),(1,2),(1,3),(1,4)},…, {(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1) ,(4,2),(4,3),(4,4)} } DISTRIBUZIONE DI PROBABILITA’(o misura di probabilità): Si definisce come una qualsiasi funzione Pr con dominio la famiglia di eventi Є e codominio i numeri reali R che soddisfi le tre seguenti proprietà: 1. ¥a εЄ : Pr(a) ≥ 0 (non-negatività) 2. Pr(Ω) = 1 (normatività) 3. ¥ a; b ε Є : (a/b = Ǿ ) Pr(a [ b) = Pr(a) + Pr(b) (additività) Per determinare la probabilità di verificarsi di un evento semplice dentro uno spazio campionario considereremo soltanto l’approccio classico: Ogni esito di un dato esperimento ha la stessa probabilità di verificarsi degli altri; si parla quindi di esiti equiprobabili. ¥ Ω : Ω è equiprobabile ¥ ω ε Ω : Pr({ω}) = 1/ |Ω| Pr({Ǿ})=0 Pr Pr Pr Pr ({(1,1)})= 1/ |Ω|= 1/16 ({(1,2)})= 1/ |Ω|=1/16 ({(1,3)})= 1/ |Ω|=1/16 ({(1,4)})= 1/ |Ω|=1/16 Pr ({(1,1),(1,2)})= Pr ({(1,1)}) + Pr ({(1,2)})=1/16 +1/16= 2/16= 1/8 … Pr ({(1,1),(1,2),(1,3)})= Pr ({(1,1)}) + Pr ({(1,2)})+ Pr ({(1,3) })=1/16 +1/16+ 1/16= 3/16 … Pr ({(1,1),(1,2),(1,3),(1,4)})= Pr ({(1,1)}) + Pr ({(1,2)})+ Pr ({(1,3),(1,4)})= 1/16+1/16+1/16+1/16= 4/16=1/4 … Pr({(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1), (4,2),(4,3),(4,4)} }= 16/16= 1 Graficamente… {Ǿ} {(1,1)}… {(1,1),(1,2)}… {(1,1),(1,2),(1,3)}… {(1,1),(1,2),(1,3),(1,4)}… …. {(1,1),(1,2),(1,3),(1,4),(2,1), (2,2),(2,3),(2,4),(3,1),(3,2), (3,3),(3,4),(4,1), (4,2),(4,3) ,(4,4)} ε 1 … … … … … 1/4 3/16 1/8 1/16 0 R E ora??? …. • 2. Partendo da tale spazio di probabilità, rappresentare con un grafico la variabile casuale X che associa ad ogni esito la somma dei valori registrati e rappresentare infine la funzione cumulativa e quella di massa della variabile casuale X. Dobbiamo prima definire lo spazio di probabilità euclideo… SPAZIO DI PROBABILITA’ Standard- Euclideo Spazio di probabilità euclideo una qualsiasi terna (R;B; Pr) costituita da: • • • 1. Uno Spazio Campionario R (qualsiasi numero reale `e un potenziale esito) 2. Una Famiglia di Eventi B (insieme di sottoinsiemi di R chiuso a tutte le operazioni) 3. Una Distribuzione di probabilit`a Pr (definita su B a valori reali) è detta Spazio di Probabilità Euclideo Unidimensionale. Similmente, una qualsiasi terna (Rn;Bn; Pr) costituita da: • • • 1. Uno Spazio Campionario Rn (qualsiasi numero reale `e un potenziale esito) 2. Una Famiglia di Eventi Bn (insieme sottoinsiemi di R chiuso a tutte le operazioni) 3. Una Distribuzione di probabilità Pr definita su B a valori reali) è detta Spazio di Probabilità Euclideo n-dimensionale. Le Variabili casuali Dati uno spazio di probabilità (Ω,Є, Pr) e spazio di probabilità euclideo (R;B; Pr), si chiama Variabile Casuale una qualsiasi funzione V con dominio Ώ e codominio R tale per cui: ¥ В εΒ Vˉ¹(B) εΒ Quindi è una funzione che associa ad ogni esito dello spazio campionario un valore in R. Dallo Spazio campionario Ώ={(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4, 1),(4,2),(4,3),(4,4)} } Devo associare ad ogni esito la somma dei valori, quindi: {(1,1)}=2, {(1,2),(2,1)}=3, {(1,3),(3,1),(2,2)}=4, {(1,4),(2,3),(3,2),(4,1)}=5, {(2,4),(3,3),(4,2)}= 6, {(3,4),(4,3)}= 7, {(4,4)}=8; R 2 3 4 5 6 7 8 … {(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4, 3),(4,4)} Ω FUNZIONE DI DISTRIBUZIONE CUMULATIVA Si chiama funzione di distribuzione cumulativa, ed è genericamente indicata con la lettera F, una qualsiasi funzione a valori reali definita su ℝ che soddisfi le seguenti condizioni: (x<y)⇒F(x)≤F(y), ∀ x,y ∈ ℝ (monotòna non decrescente) Limxx1 + F (x) = F(x1), ∀x1 ∈ ℝ (continua da destra) Limx-∞F(x) = 0 (convergenza a 0 verso -∞) limx+∞F(x) = 1 (convergenza a 1 verso +∞ ) Se x = Pr([-∞, x ]) F(x)=Pr([-∞, x ])=Pr(Ø)=0 F(2)=Pr([-∞, 2 ])=Pr{(1,1)}= 1/16 F(3)=Pr([-∞, 3 ])=Pr{(1,2),(2,1)}= 2/16 F(4)=Pr([-∞, 4 ])=Pr{(1,3),(3,1),(2,2)}= 3/16 F(5)=Pr([-∞, 5])=Pr{(1,4),(2,3),(3,2),(4,1)}= 4/16=1/4 F(6)=Pr([-∞, 6])=Pr{(2,4),(3,3),(4,2)}= 3/16 F(7)=Pr([-∞, 7])=Pr{(3,4),(4,3)}= 2/16 F(8)=Pr([-∞, 8])=Pr{(4,4)}= 1/16 4/16 3/16 2/16 1/16 2 3 4 5 6 7 8 FUNZIONE DI MASSA Si chiama funzione di massa, ed è genericamente indicata con la lettera f , una qualsiasi funzione a valori reali definita su ℝ per la quale esista un insieme Mf c ℝ di cardinalità inferiore o uguale a N(|Mf | ≤ N0) tale per cui le seguenti condizioni siano soddisfatte: 1. >0 =0 f (x) 2. • Σ x ∈Mf x ∉ Mf ∀x∈ℝ f(x) =1 Gli elementi dell’insieme Mf sono detti Punti Massa. Quindi considerando i punti massa… • • • • • • • F(2)=F(2)=Pr{(1,1)}= 1/16 F(3)=Pr{(1,2),(2,1)}= 2/16 F(4)=Pr{(1,3),(3,1),(2,2)}= 3/16 F(5)=Pr{(1,4),(2,3),(3,2),(4,1)}= 4/16=1/4 F(6)=Pr{(2,4),(3,3),(4,2)}= 3/16 F(7)=Pr{(3,4),(4,3)}= 2/16 F(8)=Pr{(4,4)}= 1/16 4/16 3/16 2/16 1/16 2 3 4 5 6 7 8 Teoria della probabilità.. parte II Sia X una raccolta di dati (su scala a intervalli) di un campione di 28 studenti di psicologia sul tempo mediamente impiegatone preparare un esame: X = {15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120, 120} a) compilare una tabella delle frequenze e calcolare tutte le statistiche significanti su tale scala (tra cui il 13° e il 78° percentile). Frequenza f Proporzioni P 15 1 0,03 20 3 30 Freq. Perc. f % Freq. Cum. f. c. Freq.Cum.P. f. c. % 3% 1 3,5 % 0,1 10 % 4 14,2 % 1 0,03 3% 5 17,8 % 35 1 0,03 3% 6 21,4 % 45 2 0,07 7% 8 28,5 % 50 3 0,1 10 % 11 39,2 % 65 1 0,03 3% 12 42,8 % 75 1 0,03 3% 13 46,4 % 80 1 0,03 3% 14 50 % 90 3 0,1 10 % 17 60,7 % 95 2 0,07 7% 19 67,8 % 100 6 0,2 20 % 25 89,2 % 110 1 0,03 3% 26 92,8 % 120 2 0,07 7% 28 100% Tot. 28 0,92 92 % INDICI DELLA TENDENZA CENTRALE MODA: All’interno di un insieme di misurazioni di un dato sistema relazionale empirico è quel valore che compare con la massima frequenza Md = 100 (frequenza = 6) MEDIANA: All’interno di un insieme di misurazioni disposte in ordine crescente è quel valore che occupa la posizione centrale ovvero il dato al di sopra e al di sotto del quale si trovano il 50% dei dati. Se il numero n delle osservazioni è pari: i = n/2 e la successiva all’interno dei dati i = 28/2 = 14 e la successiva ovvero 15 Mdn (X) = Mdn(15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120, 120 ) = 85 MEDIA: è la statistica che associa all’insieme X il numero che si ottiene sommando tutti gli n dati e dividendo il valore ottenuto per n. Media = 71.7 Indici di posizione QUARTILI: - primo quartile (Q1),è quel valore che ha il 25% dei dati a lui uguali o inferiori: i = ¼ (n+1) i = ¼ (28+1) =7,25 Q1 = 45 - secondo quartile (Q2), coincide con la mediana: i = ½ (28+1) =14,5 i = ½ (n +1) Q2 = 80 - terzo quartile (Q3),è quel valore che ha il 75% dei dati a lui inferiori: i = ¾ (n+1) i = ¾ (28+1) =21,7 Q3 = 100 - quarto quartile (Q4) è il valore più alto della serie ordinata: i = 29 i=n Q4 = 120 PERCENTILI (Pm): quel valore al di sotto del quale cade una percentuale di dati pari ad m: i = (n·m)/100 i = (28 × 13) / 100 = 3,64 i = (28 × 78) / 100 = 21,84 posizione 3 Þ 20 posizione 21 Þ 100 RANGHI PERCENTILI: è quel numero che rappresenta la percentuale di dati uguali o inferiori a lui: Rp (xi) = (k/n)·100 Frequenza f Proporzioni P 15 1 0,03 20 3 30 Freq. Perc. f % Freq. Cum. f. c. Freq.Cum.P. f. c. % 3% 1 3,5 % 0,1 10 % 4 14,2 % 1 0,03 3% 5 17,8 % 35 1 0,03 3% 6 21,4 % 45 2 0,07 7% 8 28,5 % 50 3 0,1 10 % 11 39,2 % 65 1 0,03 3% 12 42,8 % 75 1 0,03 3% 13 46,4 % 80 1 0,03 3% 14 50 % 90 3 0,1 10 % 17 60,7 % 95 2 0,07 7% 19 67,8 % 100 6 0,2 20 % 25 89,2 % 110 1 0,03 3% 26 92,8 % 120 2 0,07 7% 28 100% Tot. 28 0,92 92 % Indici di dispersione o di variabilità CLASSI DI EQUIVALENZA: Valore che indica il numero di classi di equivalenza riscontrate a livello del sistema relazionale empirico • NdE = 14 • GAMMA: è statistica che associa all’insieme X il numero che si ottiene sottraendo il valore minimo al valore massimo degli elementi di X. G = 120-15= 105 • DIFFERENZA INTERQUARTILICA: è la statistica che associa all’insieme X il numero che si ottiene sottraendo il valore del primo quartile al terzo quartile. • DI = 89 - 28 = 61 SEMIDIFFERENZA INTERQUARTILICA: si ottiene dividendo a metà la differenza interquartilica. SI = 61/2 = 30,5 VARIANZA: è la statistica che associa all’insieme X il numero che si ottiene sommando il quadrato di tutte le differenze di ogni dato dalla media di X e dividendo il risultato per n. s² = ∑ⁿ¡=1 (xi –media)² n s² = 1082,5 (Varianza) DEVIAZIONE STANDARD: è la radice quadrata della varianza Xi f Media ( xi – media) f·(Xi-media)² s =√∑ⁿ¡=1 (xi - media)² √n Punti z 15 1 71,7 - 56,7 3214,89 32,9 - 1,7 20 3 71,7 - 51,7 2672,89 - 1,5 30 1 … - 41,7 1738,89 - 1,2 35 1 … - 36,7 1346,89 - 1,1 45 2 - 26,7 712,89 - 0,8 50 3 - 21,7 470,89 - 0,6 65 1 - 6,7 44,89 - 0,2 … … … … Calcoliamo: Ω*= {15, 20, 30, 35, 45, 50, 65, 75, 80, 90, 95, 100, 110, 120} N.B. Ω * indica lo Spazio Campionario con gli eventi non ripetuti 2. La famiglia di Eventi å coincide con l’insieme potenza P(Ù*) = å å = P(Ù*) = {Ø,{15}, {20}, {30}, {35},…, {15, 20}, {15, 30},…, {15, 20, 30},…} Gli esiti dello spazio campionario sono equiprobabili, ovvero l’esito di un dato esperimento ha la stessa probabilità di verificarsi degli altri. La probabilità di accadere di un certo evento è uguale alla cardinalità dell’insieme che esprime tale evento diviso la cardinalità dello spazio campionario: per ogni e Є ε Pr(e) = |e| / | Ω | • Dunque: Pr({ 15 }) = Pr({ 30 }) = Pr({ 35 }) = Pr({ 65 }) = Pr({ 75 }) = Pr({ 80 }) = Pr({ 110 }) = 1/28 = 0.03 • • Pr({ 20}) = Pr({ 50 }) = Pr({ 90 }) = 3/28 = 0.1 • Pr({ 45}) = Pr({ 95 }) = Pr({ 120 }) = 2/28 = 0.07 • Pr({ 100 }) = 6/28 = 0,2 • • • • Pr ({15, 20 }) = Pr({15 }) + Pr({20 }) = 1/28 + 3/28 = 4/28 = 0,14 Pr ({15, 45 }) = Pr({15 }) + Pr({45}) = 1/28 + 2/28 = 3/28 = 0,1 Pr ({15,100 }) = Pr({15 }) + Pr({100}) = 1/28 + 6/28 = 7/28 = o,25 Pr ({15, 20,45 }) = Pr({15 }) + Pr({20 }) + Pr({45}) = 1/28 + 3/28 + 2/28 = 6/28 = 0,2 • Pr ({15, 20,45, 100 }) = Pr({15 }) + Pr({20 }) + Pr({45})+ Pr({100}) = 1/28 + 3/28 + 2/28 + 6/28 = 12/28 = 0,42 Distribuzione di probabilità ε {15},{20},{30},…, {15,20}, …, {15, 20,120} Pr 1 {15, 20,45 100} … 0,42 {15,20,45} … {15,100} … 0,25 0,2 {15,45} {15, 20} 0,14 {100} … {45} {20} {15} Ø 0,1 0,07 0,03 0 R Teoria della probabilità.. parte III Sia V una variabile casuale che associa ad ogni studente il tempo mediamente impiegato per preparare un esame. Descrivere la distribuzione di probabilità indotta da tale variabile casuale. DISTRIBUZIONE DI PROBABILITA’ INDOTTA Dati uno spazio di probabilità (Ω,ε,Pr), uno spazio di probabilità euclideo (ℝ,B,Pr), e una variabile casuale V, si chiama distribuzione di probabilità indotta da Pr mediante la variabile casuale V e indicata simbolicamente da PrV, la funzione così definita: ¥BЄ B PrV(B) = Pr(V-1(B)) X = (15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90, 90, 95, 95, 100, 100, 100, 100, 100, 100, 110, 120, 120) 0 15 20 30 35 45 50 65 75 80 90 95 100 110 120 V Xxxxxxxxx x x x x x x x x x x x x x x x x x x x 1 2 11 14 15 23 24 25 3 4 5 6 7 8 9 10 12 13 16 17 18 19 20 21 22 26 27 28 Spazio campionario teorico: Ω = X Famiglia degli eventi: ε = P(Ω), | ε| = 228 Spazio campionario effettivo: Ω* = {15,20,30,35,45,50,65,75,80,90,95,100,110,120} Famiglia degli eventi: ε = P(Ω*), | ε| = 214 DISTRIBUZIONE DI PROBABILITA’ INDOTTA DA V Per semplicità calcoliamo solo le probabilità degli intervalli punti campione in B: PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28 PrV ([45]), ([95]), ([120]) = 2/28 PrV ([20], ([50]), ([90]) = 3/28 PrV ([100]) = 6/28 La distribuzione di probabilità indotta PrV per ognuno dei rimanenti elementi di ε si otterrà sommando le singole probabilità dei punti campione. Esempio: PrV({15,20}) = 1/28 + 3/28 = 4/28 …. Rappresentare le funzioni di distribuzione cumulative e di massa derivate dalla variabile casuale V. F(x) = PrV((-∞,15[) = 0/28 F(x) = PrV((-∞,15]) = 1/28 F(x) = PrV((-∞,20]) = 4/28 F(x) = PrV((-∞,30]) = 5/28 F(x) = PrV((-∞,35]) = 6/28 F(x) = PrV((-∞,45]) = 8/28 F(x) = PrV((-∞,50]) = 11/28 F(x) = PrV((-∞,65]) = 12/28 F(x) = PrV((-∞,75]) = 13/28 F(x) = PrV((-∞,80]) = 14/28 F(x) = PrV((-∞,90]) = 17/28 F(x) = PrV((-∞,95]) = 19/28 F(x) = PrV((-∞,100]) = 25/28 F(x) = PrV((-∞,110]) = 26/28 F(x) = PrV((-∞,120]) = 28/28 28/28 27/28 26/28 25/28 24/28 23/28 22/28 21/28 20/28 19/28 18/28 17/28 16/28 15/28 14/28 13/28 12/28 11/28 10/28 9/28 8/28 7/28 6/28 5/28 4/28 3/28 2/28 1/28 120 115 110 105 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 FUNZIONE DI MASSA.. Limitando il calcolo ai punti massa: f (15), (30), (35), (65), (75), (80), (110) = PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28 f (45), (95), (120) = PrV ([45]), ([95]), ([120]) = 2/28 f (20), (50), (90) = PrV ([20], ([50]), ([90]) = 3/28 f (100) = PrV ([100]) = 6/28 Si noti la differenza tra PrV ([x]) funzione di insiemi e f(x) funzione di punti. Il medesimo risultato si sarebbe ottenuto con la formula: f(x) = F(x) – F(x-), ∀x ∈ ℝ 28/28 27/28 26/28 25/28 24/28 23/28 22/28 21/28 20/28 19/28 18/28 17/28 16/28 15/28 14/28 13/28 12/28 11/28 10/28 9/28 8/28 7/28 6/28 5/28 4/28 3/28 2/28 1/28 120 115 110 105 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 Maiorano Doriana Montecchi Giulia Piovesan Jessica