Teoria della probabilità
- Descrivere lo Spazio di Probabilità (ovverosia lo Spazio Campionario,la Famiglia
di eventi e la Distribuzione di Probabilità) del lancio contemporaneo di due
dadi a quattro facce
Si definisce Spazio di probabilità una qualsiasi terna (Ω,Є,Pr) costituita da:
1. Uno Spazio Campionario Ω (insiemi degli esiti di un dato fenomeno casuale)
2. Una Famiglia di Eventi Є (insieme di sottoinsiemi di Ω, chiuso a tutte le operazioni)
3. Una Distribuzione di probabilità Pr (definita su ε a valori reali)
SPAZIO CAMPIONARIO: insieme che racchiude tutti gli esiti di un dato
esperimento casuale. Nel caso in cui un esperimento sia composto da più
operazioni dall’esito casuale, lo spazio campionario sarà composto dal prodotto
cartesiano delle singole operazioni.
Ω = Ω1 x Ω2 = {1,2,3,4} x {1,2,3,4}
Card (X)²= 4²= 16
X²=X x X= {1,2,3,4} x {1,2,3,4}=
{(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1)
,(4,2),(4,3),(4,4)}
FAMIGLIA DI EVENTI:simbolicamente rappresentata da Є, è un qualsiasi
insieme di eventi chiuso a tutte le operazioni insiemistiche (“campo” di
eventi). Ovvero è un insieme di sottoinsiemi di Ω dove, compiendo una
qualsiasi operazione insiemistica tra qualsiasi due insiemi (eventi) , il
risultato (evento risultante ) è presente tra gli elementi che
compongono la Famiglia di Eventi.
Se non specificato si può intendere come l’insieme potenza dello spazio
campionario P(Ω).
Є= P(Ω)= { Ǿ,{(1,1)}, {(1,2)}, {(1,3)},{(1,4)}, {(2,1)}, {(2,2)},…,
{(1,1),(1,2)},{(1,1),(1,3)},…, {(1,1),(1,2),(1,3)},…, {(1,1),(1,2),(1,3),(1,4)},…,
{(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1)
,(4,2),(4,3),(4,4)} }
DISTRIBUZIONE DI PROBABILITA’(o misura di probabilità):
Si definisce come una qualsiasi funzione Pr con dominio la famiglia di eventi Є e
codominio i numeri reali R che soddisfi le tre seguenti proprietà:
1. ¥a εЄ : Pr(a) ≥ 0 (non-negatività)
2. Pr(Ω) = 1 (normatività)
3. ¥ a; b ε Є : (a/b = Ǿ )
Pr(a [ b) = Pr(a) + Pr(b) (additività)
Per determinare la probabilità di verificarsi di un evento semplice dentro uno spazio
campionario considereremo soltanto l’approccio classico:
Ogni esito di un dato esperimento ha la stessa probabilità di verificarsi degli altri;
si parla quindi di esiti equiprobabili.
¥ Ω : Ω è equiprobabile
¥ ω ε Ω : Pr({ω}) = 1/ |Ω|
Pr({Ǿ})=0
Pr
Pr
Pr
Pr
({(1,1)})= 1/ |Ω|= 1/16
({(1,2)})= 1/ |Ω|=1/16
({(1,3)})= 1/ |Ω|=1/16
({(1,4)})= 1/ |Ω|=1/16
Pr ({(1,1),(1,2)})= Pr ({(1,1)}) + Pr ({(1,2)})=1/16 +1/16= 2/16= 1/8
…
Pr ({(1,1),(1,2),(1,3)})= Pr ({(1,1)}) + Pr ({(1,2)})+ Pr ({(1,3) })=1/16 +1/16+ 1/16= 3/16
…
Pr ({(1,1),(1,2),(1,3),(1,4)})= Pr ({(1,1)}) + Pr ({(1,2)})+ Pr ({(1,3),(1,4)})=
1/16+1/16+1/16+1/16= 4/16=1/4
…
Pr({(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),
(4,2),(4,3),(4,4)} }= 16/16= 1
Graficamente…
{Ǿ}
{(1,1)}…
{(1,1),(1,2)}…
{(1,1),(1,2),(1,3)}…
{(1,1),(1,2),(1,3),(1,4)}…
….
{(1,1),(1,2),(1,3),(1,4),(2,1),
(2,2),(2,3),(2,4),(3,1),(3,2),
(3,3),(3,4),(4,1),
(4,2),(4,3)
,(4,4)}
ε
1
…
…
…
…
…
1/4
3/16
1/8
1/16
0
R
E ora???
….
• 2. Partendo da tale spazio di probabilità, rappresentare con un
grafico la variabile casuale X che associa ad ogni esito la somma
dei valori registrati e rappresentare infine la funzione
cumulativa e quella di massa della variabile casuale X.
Dobbiamo prima definire lo spazio di probabilità euclideo…
SPAZIO DI PROBABILITA’
Standard- Euclideo
Spazio di probabilità euclideo
una qualsiasi terna (R;B; Pr) costituita da:
•
•
•
1. Uno Spazio Campionario R (qualsiasi numero reale `e un potenziale esito)
2. Una Famiglia di Eventi B (insieme di sottoinsiemi di R chiuso a tutte le
operazioni)
3. Una Distribuzione di probabilit`a Pr (definita su B a valori reali)
è detta Spazio di Probabilità Euclideo Unidimensionale.
Similmente, una qualsiasi terna (Rn;Bn; Pr) costituita da:
•
•
•
1. Uno Spazio Campionario Rn (qualsiasi numero reale `e un potenziale esito)
2. Una Famiglia di Eventi Bn (insieme sottoinsiemi di R chiuso a tutte le
operazioni)
3. Una Distribuzione di probabilità Pr definita su B a valori reali)
è detta Spazio di Probabilità Euclideo n-dimensionale.
Le Variabili casuali
Dati uno spazio di probabilità (Ω,Є, Pr) e spazio di probabilità euclideo
(R;B; Pr), si chiama Variabile Casuale una qualsiasi funzione V con
dominio Ώ e codominio R tale per cui:
¥ В εΒ
Vˉ¹(B) εΒ
Quindi è una funzione che associa ad ogni esito dello spazio campionario un valore in
R.
Dallo Spazio campionario
Ώ={(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,
1),(4,2),(4,3),(4,4)} }
Devo associare ad ogni esito la somma dei valori, quindi:
{(1,1)}=2,
{(1,2),(2,1)}=3,
{(1,3),(3,1),(2,2)}=4,
{(1,4),(2,3),(3,2),(4,1)}=5,
{(2,4),(3,3),(4,2)}= 6,
{(3,4),(4,3)}= 7,
{(4,4)}=8;
R
2
3
4
5
6
7
8
…
{(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,
3),(4,4)}
Ω
FUNZIONE DI DISTRIBUZIONE CUMULATIVA
Si chiama funzione di distribuzione cumulativa, ed è genericamente
indicata con la lettera F, una qualsiasi funzione a valori reali
definita su ℝ che soddisfi le seguenti condizioni:
(x<y)⇒F(x)≤F(y),
∀ x,y ∈ ℝ
(monotòna non decrescente)
Limxx1 + F (x) = F(x1), ∀x1 ∈ ℝ
(continua da destra)
Limx-∞F(x) = 0
(convergenza a 0 verso -∞)
limx+∞F(x) = 1
(convergenza a 1 verso +∞ )
Se x = Pr([-∞, x ])
F(x)=Pr([-∞, x ])=Pr(Ø)=0
F(2)=Pr([-∞, 2 ])=Pr{(1,1)}= 1/16
F(3)=Pr([-∞, 3 ])=Pr{(1,2),(2,1)}= 2/16
F(4)=Pr([-∞, 4 ])=Pr{(1,3),(3,1),(2,2)}= 3/16
F(5)=Pr([-∞, 5])=Pr{(1,4),(2,3),(3,2),(4,1)}= 4/16=1/4
F(6)=Pr([-∞, 6])=Pr{(2,4),(3,3),(4,2)}= 3/16
F(7)=Pr([-∞, 7])=Pr{(3,4),(4,3)}= 2/16
F(8)=Pr([-∞, 8])=Pr{(4,4)}= 1/16
4/16
3/16
2/16
1/16
2
3
4
5
6
7
8
FUNZIONE DI MASSA
Si chiama funzione di massa, ed è genericamente indicata con la lettera f , una
qualsiasi funzione a valori reali definita su ℝ per la quale esista un insieme
Mf c ℝ di cardinalità inferiore o uguale a N(|Mf | ≤ N0) tale per cui le
seguenti condizioni siano soddisfatte:
1.
>0
=0
f (x)
2.
•
Σ
x ∈Mf
x ∉ Mf
∀x∈ℝ
f(x) =1
Gli elementi dell’insieme Mf sono detti Punti Massa.
Quindi considerando i punti massa…
•
•
•
•
•
•
•
F(2)=F(2)=Pr{(1,1)}= 1/16
F(3)=Pr{(1,2),(2,1)}= 2/16
F(4)=Pr{(1,3),(3,1),(2,2)}= 3/16
F(5)=Pr{(1,4),(2,3),(3,2),(4,1)}= 4/16=1/4
F(6)=Pr{(2,4),(3,3),(4,2)}= 3/16
F(7)=Pr{(3,4),(4,3)}= 2/16
F(8)=Pr{(4,4)}= 1/16
4/16
3/16
2/16
1/16
2
3
4
5
6
7
8
Teoria della probabilità..
parte II
Sia X una raccolta di dati (su scala a intervalli) di un
campione di 28 studenti di psicologia sul tempo mediamente
impiegatone preparare un esame:
X = {15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80, 90, 90,
90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120, 120}
a) compilare una tabella delle frequenze e calcolare tutte le
statistiche significanti su tale scala (tra cui il 13° e il 78°
percentile).
Frequenza
f
Proporzioni
P
15
1
0,03
20
3
30
Freq. Perc.
f %
Freq. Cum.
f. c.
Freq.Cum.P.
f. c. %
3%
1
3,5 %
0,1
10 %
4
14,2 %
1
0,03
3%
5
17,8 %
35
1
0,03
3%
6
21,4 %
45
2
0,07
7%
8
28,5 %
50
3
0,1
10 %
11
39,2 %
65
1
0,03
3%
12
42,8 %
75
1
0,03
3%
13
46,4 %
80
1
0,03
3%
14
50 %
90
3
0,1
10 %
17
60,7 %
95
2
0,07
7%
19
67,8 %
100
6
0,2
20 %
25
89,2 %
110
1
0,03
3%
26
92,8 %
120
2
0,07
7%
28
100%
Tot.
28
0,92
92 %
INDICI DELLA TENDENZA CENTRALE
MODA: All’interno di un insieme di misurazioni di un dato sistema relazionale empirico
è quel valore che compare con la massima frequenza
Md = 100 (frequenza = 6)
MEDIANA: All’interno di un insieme di misurazioni disposte in ordine crescente è quel
valore che occupa la posizione centrale ovvero il dato al di sopra e al di sotto del quale si
trovano il 50% dei dati.
Se il numero n delle osservazioni è pari: i = n/2 e la successiva all’interno dei dati
i = 28/2 = 14 e la successiva ovvero 15
Mdn (X) = Mdn(15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80,
90, 90, 90, 95, 95, 100,100, 100, 100, 100, 100, 110, 120, 120 ) = 85
MEDIA: è la statistica che associa all’insieme X il numero che si ottiene sommando
tutti gli n dati e dividendo il valore ottenuto per n.
Media = 71.7
Indici di posizione
QUARTILI: - primo quartile (Q1),è quel valore che ha il 25% dei dati a lui uguali o
inferiori:
i = ¼ (n+1)
i = ¼ (28+1) =7,25
Q1 = 45
- secondo quartile (Q2), coincide con la mediana:
i = ½ (28+1) =14,5
i = ½ (n +1)
Q2 = 80
- terzo quartile (Q3),è quel valore che ha il 75% dei dati a lui inferiori:
i = ¾ (n+1)
i = ¾ (28+1) =21,7
Q3 = 100
- quarto quartile (Q4) è il valore più alto della serie ordinata:
i = 29
i=n
Q4 = 120
PERCENTILI (Pm): quel valore al di sotto del quale cade una percentuale di dati
pari ad m:
i = (n·m)/100
i = (28 × 13) / 100 = 3,64
i = (28 × 78) / 100 = 21,84
posizione 3 Þ 20
posizione 21 Þ 100
RANGHI PERCENTILI: è quel numero che rappresenta la percentuale di dati
uguali o inferiori a lui:
Rp (xi) = (k/n)·100
Frequenza
f
Proporzioni
P
15
1
0,03
20
3
30
Freq. Perc.
f %
Freq. Cum.
f. c.
Freq.Cum.P.
f. c. %
3%
1
3,5 %
0,1
10 %
4
14,2 %
1
0,03
3%
5
17,8 %
35
1
0,03
3%
6
21,4 %
45
2
0,07
7%
8
28,5 %
50
3
0,1
10 %
11
39,2 %
65
1
0,03
3%
12
42,8 %
75
1
0,03
3%
13
46,4 %
80
1
0,03
3%
14
50 %
90
3
0,1
10 %
17
60,7 %
95
2
0,07
7%
19
67,8 %
100
6
0,2
20 %
25
89,2 %
110
1
0,03
3%
26
92,8 %
120
2
0,07
7%
28
100%
Tot.
28
0,92
92 %
Indici di dispersione o di variabilità
CLASSI DI EQUIVALENZA: Valore che indica il numero di classi di equivalenza
riscontrate a livello del sistema relazionale empirico
•
NdE = 14
• GAMMA: è statistica che associa all’insieme X il numero che si ottiene sottraendo il
valore minimo al valore massimo degli elementi di X.
G = 120-15= 105
• DIFFERENZA INTERQUARTILICA: è la statistica che associa all’insieme X il
numero che si ottiene sottraendo il valore del primo quartile al terzo quartile.
• DI = 89 - 28 = 61
SEMIDIFFERENZA INTERQUARTILICA: si ottiene dividendo a metà la differenza
interquartilica.
SI = 61/2 = 30,5
VARIANZA: è la statistica che associa all’insieme X il numero che si ottiene sommando
il quadrato di tutte le differenze di ogni dato dalla media di X e dividendo il risultato
per n.
s² = ∑ⁿ¡=1 (xi –media)²
n
s² = 1082,5 (Varianza)
DEVIAZIONE STANDARD: è la radice quadrata della
varianza
Xi
f
Media
( xi – media)
f·(Xi-media)²
s =√∑ⁿ¡=1 (xi - media)²
√n
Punti z
15
1
71,7
- 56,7
3214,89
32,9
- 1,7
20
3
71,7
- 51,7
2672,89
- 1,5
30
1
…
- 41,7
1738,89
- 1,2
35
1
…
- 36,7
1346,89
- 1,1
45
2
- 26,7
712,89
- 0,8
50
3
- 21,7
470,89
- 0,6
65
1
- 6,7
44,89
- 0,2
…
…
…
…
Calcoliamo:
Ω*= {15, 20, 30, 35, 45, 50, 65, 75, 80, 90, 95, 100, 110, 120}
N.B.
Ω * indica lo Spazio Campionario con gli eventi non ripetuti
2. La famiglia di Eventi å coincide con l’insieme potenza P(Ù*) = å
å = P(Ù*) = {Ø,{15}, {20}, {30}, {35},…, {15, 20}, {15, 30},…, {15, 20, 30},…}
Gli esiti dello spazio campionario sono equiprobabili, ovvero l’esito di un dato
esperimento ha la stessa probabilità di verificarsi degli altri.
La probabilità di accadere di un certo evento è uguale alla cardinalità dell’insieme
che esprime tale evento diviso la cardinalità dello spazio campionario:
per ogni e Є
ε
Pr(e) = |e| / | Ω |
•
Dunque: Pr({ 15 }) = Pr({ 30 }) = Pr({ 35 }) = Pr({ 65 }) = Pr({ 75 })
= Pr({ 80 }) = Pr({ 110 }) = 1/28 = 0.03
•
• Pr({ 20}) = Pr({ 50 }) = Pr({ 90 }) = 3/28 = 0.1
• Pr({ 45}) = Pr({ 95 }) = Pr({ 120 }) = 2/28 = 0.07
• Pr({ 100 }) = 6/28 = 0,2
•
•
•
•
Pr ({15, 20 }) = Pr({15 }) + Pr({20 }) = 1/28 + 3/28 = 4/28 = 0,14
Pr ({15, 45 }) = Pr({15 }) + Pr({45}) = 1/28 + 2/28 = 3/28 = 0,1
Pr ({15,100 }) = Pr({15 }) + Pr({100}) = 1/28 + 6/28 = 7/28 = o,25
Pr ({15, 20,45 }) = Pr({15 }) + Pr({20 }) + Pr({45}) = 1/28 + 3/28 +
2/28 = 6/28 = 0,2
• Pr ({15, 20,45, 100 }) = Pr({15 }) + Pr({20 }) + Pr({45})+ Pr({100}) =
1/28 + 3/28 + 2/28 + 6/28 = 12/28 = 0,42
Distribuzione
di probabilità
ε
{15},{20},{30},…,
{15,20}, …, {15,
20,120}
Pr
1
{15, 20,45 100}
…
0,42
{15,20,45}
…
{15,100}
…
0,25
0,2
{15,45}
{15, 20}
0,14
{100}
…
{45}
{20}
{15}
Ø
0,1
0,07
0,03
0
R
Teoria della probabilità..
parte III
Sia V una variabile casuale che associa ad ogni studente il
tempo mediamente impiegato per preparare un esame.
Descrivere la distribuzione di probabilità indotta da tale
variabile casuale.
DISTRIBUZIONE DI PROBABILITA’
INDOTTA
Dati uno spazio di probabilità (Ω,ε,Pr), uno spazio di
probabilità euclideo (ℝ,B,Pr), e una variabile casuale V,
si chiama distribuzione di probabilità indotta da Pr
mediante la variabile casuale V e indicata
simbolicamente da PrV, la funzione così definita:
¥BЄ B
PrV(B) = Pr(V-1(B))
X = (15, 20, 20, 20, 30, 35, 45, 45, 50, 50, 50, 65, 75, 80,
90, 90, 90, 95, 95, 100, 100, 100, 100, 100, 100, 110, 120,
120)
0
15 20
30 35
45 50
65 75 80 90 95 100 110
120
V
Xxxxxxxxx x
x x x
x
x x x x x x x x
x x
x x x x
1 2
11
14
15
23 24
25
3 4 5 6 7
8 9
10
12
13
16
17
18
19
20
21
22
26
27 28
Spazio campionario teorico: Ω = X
Famiglia degli eventi: ε = P(Ω), | ε| = 228
Spazio campionario effettivo: Ω* =
{15,20,30,35,45,50,65,75,80,90,95,100,110,120}
Famiglia degli eventi: ε = P(Ω*), | ε| = 214
DISTRIBUZIONE DI PROBABILITA’ INDOTTA DA V
Per semplicità calcoliamo solo le probabilità degli intervalli punti
campione in B:
PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28
PrV ([45]), ([95]), ([120]) = 2/28
PrV ([20], ([50]), ([90]) = 3/28
PrV ([100]) = 6/28
La distribuzione di probabilità indotta PrV per ognuno dei rimanenti
elementi di ε si otterrà sommando le singole probabilità dei punti
campione.
Esempio: PrV({15,20}) = 1/28 + 3/28 = 4/28
….
Rappresentare le funzioni di distribuzione
cumulative e di massa derivate dalla
variabile casuale V.
F(x) = PrV((-∞,15[) = 0/28
F(x) = PrV((-∞,15]) = 1/28
F(x) = PrV((-∞,20]) = 4/28
F(x) = PrV((-∞,30]) = 5/28
F(x) = PrV((-∞,35]) = 6/28
F(x) = PrV((-∞,45]) = 8/28
F(x) = PrV((-∞,50]) = 11/28
F(x) = PrV((-∞,65]) = 12/28
F(x) = PrV((-∞,75]) = 13/28
F(x) = PrV((-∞,80]) = 14/28
F(x) = PrV((-∞,90]) = 17/28
F(x) = PrV((-∞,95]) = 19/28
F(x) = PrV((-∞,100]) = 25/28
F(x) = PrV((-∞,110]) = 26/28
F(x) = PrV((-∞,120]) = 28/28
28/28
27/28
26/28
25/28
24/28
23/28
22/28
21/28
20/28
19/28
18/28
17/28
16/28
15/28
14/28
13/28
12/28
11/28
10/28
9/28
8/28
7/28
6/28
5/28
4/28
3/28
2/28
1/28
120
115
110
105
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0
FUNZIONE DI MASSA..
Limitando il calcolo ai punti massa:
f (15), (30), (35), (65), (75), (80), (110) =
PrV ([15]), ([30]), ([35]), ([65]), ([75]), ([80]), ([110]) = 1/28
f (45), (95), (120) = PrV ([45]), ([95]), ([120]) = 2/28
f (20), (50), (90) = PrV ([20], ([50]), ([90]) = 3/28
f (100) = PrV ([100]) = 6/28
Si noti la differenza tra PrV ([x]) funzione di insiemi e f(x) funzione di punti.
Il medesimo risultato si sarebbe ottenuto con la formula:
f(x) = F(x) – F(x-),
∀x ∈ ℝ
28/28
27/28
26/28
25/28
24/28
23/28
22/28
21/28
20/28
19/28
18/28
17/28
16/28
15/28
14/28
13/28
12/28
11/28
10/28
9/28
8/28
7/28
6/28
5/28
4/28
3/28
2/28
1/28
120
115
110
105
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0
Maiorano Doriana
Montecchi Giulia
Piovesan Jessica
Scarica

Studenti_Esercizi_Psicometria_17_04_08 - e