Corso di biomatematica Lezione 2:
Probabilità e distribuzioni di probabilità
Davide Grandi
Sommario
•Definizione di probabilità
•la frequenza
•Assiomi
•Definizioni
•Distribuzioni di probabilità:
•Valor medio e varianza
•Discrete - esempi
La probabilità
La probabilità P(E) di un evento E è il rapporto tra il numero
di casi favorevoli F (al realizzarsi di E) ed il numero di casi N
possibili, giudicati egualmente possibili (stesso peso)
P(E)=F/N con 0 P(E) 1
[N finito]
Se F=0 non esistono casi favorevoli, e l’evento è IMPOSSIBILE
ovvero P(E)=0
Se F=N ovvero tutti i casi sono favorevoli, l’evento è CERTO e
P(E)=1.
N.B. difficile determinare l’eguaglianza di tutti i casi possibili
Davide Grandi - Dottorato in Biologia
La probabilità
• definizione di frequenza
Si definisce frequenza relativa di un evento in n prove
effettuate nelle stesse condizioni, il rapporto tra il numero
v delle prove in cui l’evento si è verificato e il numero n
delle prove effettuate:
f=v/n
con 0 f 1
f=0 evento mai verificato, f=1 evento sempre verificato
La frequenza dipende dal numero di prove
Se il numero di prove è sufficientemente alto il rapporto
f=v/n tende a stabilizzarsi
Davide Grandi - Dottorato in Biologia
La probabilità
• legge empirica del caso
In una serie di prove, ripetute un gran numero di volte,
eseguite tutte nelle stesse condizioni, la frequenza “tende”
ad assumere valori prossimi alla probabilità dell’evento e
l’approssimazione è tanto maggiore quanto più sono
numerose le prove eseguite.
Definizione frequestista di probabilità:
La probabilità di un evento è la frequenza relativa ad un
numero “elevato” di prove.
Davide Grandi - Dottorato in Biologia
Assiomi della probabilità
• definizione matematica di probabilità (Kolmogorov)
Sia S un insieme di possibili risultati (Ai) di un esperimento,
cioè S{A1, A2, A3,……An} se tali eventi sono mutualmente
escludentesi allora per ognuno di essi esiste una probabilità
P(A) rappresentata da un numero reale che soddisfa le
seguenti proprietà:
• P(A) 0
• Se come abbiamo ipotizzato A1, A2, A3,…… sono eventi
mutualmente escludentesi, allora deve valere:
P(A1 oppure A2) = P(A1) + P(A2)
Dove P(A1 oppure A2) è la probabilità di avere il risultato A1
o il risultato A2
Davide Grandi - Dottorato in Biologia
Assiomi della probabilità
i P(Ai) = 1 dove la sommatoria è estesa su tutti gli eventi
mutualmente escludentesi
Le conseguenze dei tre assiomi sono:
• P(non Ai) = 1 P(Ai) ovvero la probabilità di non ottenere
Ai é uno meno la probabilità di ottenerlo
• P(Ai) 1
La probabilità è un numero reale compreso tra 0 e 1, ovvero
in pratica 0 P(Ai) 1 dove 1 rappresenta la certezza di
ottenere l’evento e 0 di non ottenerlo
•
Davide Grandi - Dottorato in Biologia
Definizioni
• Evento
Nel calcolo delle probabilità si definisce evento ogni fatto che
in seguito ad una prova può accadere oppure no. Ad ogni
evento è associato un numero reale che è tanto maggiore
quanto più elevata è la possibilità che si verifichi: chiamiamo
tale evento probabilità dell’evento.
• Eventi dipendenti ed indipendenti
Sia dice che l’evento A è dipendente dall’evento B, se la
probabilità dell’evento A dipende dal fatto che l’evento B si
sia verificato o meno. A è indipendente da B se la probabilità
dell’evento A non dipende dal verificarsi di B
Davide Grandi - Dottorato in Biologia
Definizioni
• Eventi certi e impossibili
Definiamo evento certo quell’evento che in seguito ad un
esperimento DEVE obbligatoriamente verificarsi. Esso
costituisce l’unità di misura della probabilità: gli si
attribuisce probabilità uguale all’unità. Tutti gli altri eventi,
probabili ma non certi, avranno probabilità minore
dell’unità.
L’evento contrario all’evento certo è detto impossibile, ossia
NON può accadere nella prova in questione. Ad esso è
associata una probabilità uguale a zero.
Davide Grandi - Dottorato in Biologia
Definizioni
• Eventi mutualmente escludentesi
Si dicono eventi mutualmente escludentesi o incompatibili
quegli eventi aleatori che non possono verificarsi
simultaneamente in una data prova (es moneta).
• Eventi equiprobabili
Degli eventi casuali si dicono equiprobabili in una data
prova se la simmetria dell’esperimento permette di supporre
che NESSUNO di essi sia più probabile di un altro ( ad
esempio lancio di UN dado)
Davide Grandi - Dottorato in Biologia
Definizioni
• Eventi contrari
Si dicono eventi contrari due o più eventi mutualmente
escludentesi che formano un gruppo completo.
• Somma degli eventi
Si dice somma di due eventi A e B l’evento C che consiste nel
verificarsi dell’evento A o dell’evento B o di entrambe. La
probabilità dell’evento C si scrive come:
P(C)= P(AB)=P(A+B) =P(A oppure B)
Davide Grandi - Dottorato in Biologia
Definizioni
• Prodotto degli eventi
Si chiama prodotto di due eventi A e B l’evento C che consiste
nel verificarsi simultaneo degli eventi A e B. La probabilità
dell’evento C si indica così:
P(C)=P(AB) = P(AxB) = P(A e B)
• Probabilità condizionata
La probabilità che si verifichi l’evento A calcolata a
condizione che si verifichi l’evento B si dice appunto
probabilità condizionata e si denota con:
P(A|B)
Davide Grandi - Dottorato in Biologia
Definizioni
• Gruppo completo di eventi
Si dice che eventi casuali formano un gruppo completo di
eventi se almeno uno di essi deve definitivamente accadere
(da 1 a 6 per il dado).
• Variabili aleatorie
Si dicono variabili aleatorie quelle grandezze che possono
assumere nel corso di una prova un valore sconosciuto a
priori. Si distinguiono tra discrete (numero finito) e continue
(riempino densamente un intervallo), e miste.
Davide Grandi - Dottorato in Biologia
Definizioni
• Valore atteso di una variabile aleatoria
Si dice valore atteso o speranza matematica la somma di tutti
i possibili valori della variabile per la probabilità.
Il valore atteso è legato al valor medio per un gran numero di
prove poichè la media tende alla speranza matematica.
Davide Grandi - Dottorato in Biologia
Definizioni
• Prodotto delle probabilità
Si intende il verificarsi simultaneamente di due eventi
(esempio estrazione del due ed estrazione di picche da un
mazzo di carte…. ovvero il due di picche!)
P(AB) = P(A) + P(B) P(AB)
oppure
P(AxB) =P(A) + P(B) P(A+ B)
Davide Grandi - Dottorato in Biologia
Definizioni
• Addizione delle probabilità
Si intende il verificarsi di due (o più) eventi sia che
accadano insieme oppure in alternativa
P(AB) = P(A) + P(B) P(AB)
oppure
P(A+B) =P(A) + P(B) P(AXB)
Davide Grandi - Dottorato in Biologia
Definizioni
• Probabilità composta
Legato al teroema di moltiplicazione delle probabilità, dice
che: la probabilità del prodotto di due eventi è uguale al
prodotto della probabilità di uno degli eventi per la
probabilità condizionata dell’altro, calcolata a condizione
che il primo abbia luogo
ovvero:
P(AB) = P(A) P(B|A)=P(B)P(A|B)
Se gli eventi sono mutualmente escludentesi, abbiamo che
P(B|A)=P(B) e P(A|B)=P(A) e quindi
P(AB) = P(A) P(B)
Davide Grandi - Dottorato in Biologia
Distribuzioni di probabilità
Gli assiomi (3°) della probabilità ci dicono che
i P(Ai) = 1
Dato un insieme di valori possibili mutualmente escludentisi,
quindi questa probabilità si distribuisce in un certo modo tra
i valori della variabile.
Per descrivere una variabile aleatoria dal punto di vista
probabilistico specifichiamo questa distribuzione, ovvero
stabiliamo la legge di distribuzione della variabile aleatoria.
La legge di distribuzione è quindi una relazione che stabilisce
una corrispondenza tra i valori possibili di tale variabile e la
loro probabilità
Davide Grandi - Dottorato in Biologia
Distribuzioni di probabilità
Il fatto che una variabile aleatoria si distribuisca secondo
una data distribuzione ci permette di trarre alcune
conclusioni importanti tra cui la possibilità di definire quello
che viene chiamato livello di confidenza : ovvero la
probabilità che l’affermazione a cui esso si riferisce sia vera.
Le distribuzioni per variabili aleatorie si distinguono in
• Discrete
• Continue
Davide Grandi - Dottorato in Biologia
Distribuzioni discrete
• Valor medio e varianza
Per una distribuzione discreta di probabilità, di variabile
casuale xi il valor medio è dato da:
x x p( x )
n
i 1
i
i
Lo scarto del valore xi dalla media è:
x x
i
i
Si dice varianza (o scarto quadratico medio) s2 il valor
medio del quadrato degli scarti, cioè:
s
2
i 1
n
2
i
2
p ( x ) xi x p ( x ) x
n
i
i 1
Davide Grandi - Dottorato in Biologia
i
2
x
2
Distribuzioni discrete
• Teorema di Bienaymè-Cebicev
Fissiamo il valore di uno scarto come riferimento, posso
mettere in relazione con questo valore gli altri scarti i con
esso e con la varianza s2 , infatti detto X uno scarto in esame
vale:
s
X
2
2
P
Ovvero la probabilità che la distanza di un dato dalla media
sia superiore ad un valore predefinito NON SUPERA il
rapporto tra la varianza e il quadrato del valore stesso
Davide Grandi - Dottorato in Biologia
Distribuzioni discrete
• Distribuzione uniforme
Un esempio tipico è il lancio di un dado (o di una moneta): i
sei eventi possibili sono i sei punteggi, a ciascuno
corrisponde il valore di probabilità
1
Pi 6
Per il terzo assioma della probabilità:
P 1
6
i 1
i
In generale avremo
1
Pi N
1
N
m
12
2
Davide Grandi - Dottorato in Biologia
sm
1
12
N
2
Distribuzioni discrete
• Teorema delle prove ripetute
Sia p=P(E) la probabilità dell’evento E e sia q la probabilità
dell’evento complementare Ec, ci chiediamo qual è la
probabilità che su n esperimenti l’evento E si verifichi k volte
(con k<=n)
Per il principio della probabilità composta abbiamo che la
probabilità di una specifica combinazione di k eventi E e di
k
nk
(n-k) eventi Ec è
pq
E questa combinazione è realizzata da
n!
k! n k !
disposizioni ovvero
n
Pn,k k
Davide Grandi - Dottorato in Biologia
k
pq
nk
Distribuzioni discrete
• Distribuzione binomiale o di Bernoulli
Dati i valori n e p, il teorema precedente può essere
interpretato come una funzione di una variabile casuale, k,
con k che assume valori tra 0 ed n, e quindi come funzione
di distribuzione discreta detta binomiale o bernoulliana, essa
B k
n
k
k
pq
nk
gode della seguente proprietà k 0 B(k ) 1
ed il valor medio ed il valor medio dei quadrati saranno
k
n
k 0 kB(k ) np
k k B(k ) np n p np
n
Da cui
2
k 0
s np np npq
2
n
2
e
Davide Grandi - Dottorato in Biologia
2
2
s
npq
2
2
Distribuzioni discrete
• Distribuzione di Poisson
Un caso tipico è il decadimento di un elemento radioattivo, il
numero di prove è costituito dal numero di nuclei che
potenzialmente possono decadere (molto grande, per una
mole sono circa 1023) mentre la probabilità di “successo” è
molto piccola. Si suppone che la probabilità p di
decadimento sia costante e che la probabilità di successo in
un intervallo [t, t+Dt] sia in prima approssimazione
proporzionale a Dt. Una variabile aleatoria si distribuisce in
modo poissoniano se
m
a
Pm m! e
a
Davide Grandi - Dottorato in Biologia
Distribuzioni discrete
• Distribuzione di Poisson
Dove la grandezza a è detta parametro della legge di Poisson
e rappresenta la frequenza media di accadimento dell’evento
osservato.
Ad esempio la probabilità di ottenere due successi è
2
a
P 2! e
a
2
La probabilità
di ottenere tre successi, e cosi’ via
3
a
P3 3! e
a
Valor medio e
ma
deviazione standard sono
Davide Grandi - Dottorato in Biologia
s
m
a