Corso di biomatematica Lezione 3: Distribuzioni di probabilità continue Davide Grandi Sommario •Distribuzioni di probabilità continue: •Definizioni •Funzione distribuzione cumulativa •Densità di probabilità •Continue - esempi •La distribuzione di gauss-introduzione Distribuzioni continue • Funzione di distribuzione cumulativa La funzione di distribuzione cumulativa per una variabile aleatoria continua X è definita come la probabilità che la variabile X assuma un valore minore di un determinato valore x: P(X<x) = F(X) E’ caratteristica di una variabile aleatoria ed esiste sia per quelle continue che per quelle discrete. Davide Grandi - Dottorato in Biologia Distribuzioni continue • Funzione di distribuzione cumulativa Le sue proprietà fondamentali sono: • F(X) è una funzione non decrescente, cioè per x2 > x1 si ha F(x2) F(x1) • Quando l’argomento della funzione tende a la funzione di distribuzione tende a zero, F( )= 0 • Quando invece l’argomento tende a + la funzione di distribuzione tende a uno, F(+ )= 1 Davide Grandi - Dottorato in Biologia Distribuzioni continue • Funzione di distribuzione cumulativa :esempio Supponiamo di avere una variabile aleatoria discreta che assume solo cinque valori: le probabilità di ottenere i singoli valori siano: Andiamo ora a costruire la funzione di distribuzione cumulativa, ovvero F(X)= P(X<x) = S xi <x P(X=xi ) Dove la disuguaglianza xi <x significa che la sommatoria è estesa a tutti gli xi minori di x Davide Grandi - Dottorato in Biologia Distribuzioni continue • Funzione di distribuzione cumulativa :esempio Otteniamo dunque: E il grafico di tale funzione è: Davide Grandi - Dottorato in Biologia Distribuzioni continue • Funzione di distribuzione cumulativa :esempio Ovvero la funzione di distribuzione cumulativa è sempre una funzione a gradino (per distribuzioni discrete di probabilità) i cui salti sono ovviamente in corrispondenza dei valori possibili della variabile, la somma di tutti i salti è uno (assioma probabilità). Per una distribuzione continua aumentano i valori possibili e diminuiscono gli intervalli, per cui la funzione di distribuziuone cumulativa diventa una funzione continua (sempre crescente) caratteristica delle variabili aleatorie continue. Davide Grandi - Dottorato in Biologia Distribuzioni continue • Funzione densità di probabilità Definita la funzione di distribuzione cumulativa, vediamo di considerare la probabilità che la mia variabile aleatoria assuma valori in un intervallo con estremi per x1 e x2 : P(x1 X < x2 ) = F(x2 ) – F(x1) Esprimo la probabilità di questo evento attraverso i seguenti 3 eventi: • Evento A corrispondente a X< x2 • Evento B corrispondente a X< x1 • Evento C corrispondente a x1 X < x2 Davide Grandi - Dottorato in Biologia Distribuzioni continue • Funzione densità di probabilità Avremo che l’evento A si può esprimere come come la somme degli altri due, cioè A=B+C e per il teorema di addizione delle probabilità avremo: P(X < x2 ) = P(X < x1 ) + P(x1 X < x2 ) d a cui ricavo la formula P(x1 X < x2 ) = F(x2 ) – F(x1) Facendo tendere Dx 0 Calcoliamo il rapporto tra la differenza della funzione di distribuzione cumulativa e l’intervallo stesso (derivata) ovvero… Davide Grandi - Dottorato in Biologia Distribuzioni continue • Funzione densità di probabilità Abbiamo F ( x Dx) F ( x) lim Dx0 Dx dF ( x) dx si definisce quindi funzione di distribuzione o densità di probabilità: dF ( x) p( x) dx La funzione p(x) caratterizza la densità di probabilità dei valori in un punto x (esprimo la legge della distribuzione) Davide Grandi - Dottorato in Biologia Distribuzioni continue • Condizione di normalizzazione la condizione di normalizzazione è la generalizzazione al caso continuo del terzo assioma della probabilità, e dal fatto che F(+ )= 1 abbiamo: dF ( x) p( x)dx dx dx 1 Davide Grandi - Dottorato in Biologia Distribuzioni continue • Distribuzione uniforme Variabili aleatorie di cui è noto a priori che i loro valori possibili appartengono ad un dato intervallo e all’interno di questo intervallo tutti i valori sono equiprobabili si dicono uniformemente distribuite. Considero la variabile aleatoria X soggetta ad una legge di distribuzione uniforme nell’intervallo (a,b) e scrivo la densità di probabilità p(X), che deve essere costante nell’intervallo e nulla al di fuori, cioè p(X)= c per a <x <b p(X)= 0 altrove Davide Grandi - Dottorato in Biologia Distribuzioni continue • Distribuzione uniforme Per la condizione di normalizzazione avremo che l’area delimitata dalla curva sarà uguale all’unità, ovvero: c(ba) 1 Da cui risulta c=1/(ba) Ovvero la distribuzione di probabilità sarà: p(X)= 1/(ba) per a <x <b p(X)= 0 altrove Davide Grandi - Dottorato in Biologia Distribuzioni continue • Proprietà della distribuzione uniforme Le caratteristiche fondamentali della distribuzione aleatoria sono: Il valor medio vale m a b 2 La deviazione standard vale: m b a 2 3 Davide Grandi - Dottorato in Biologia Distribuzioni continue • Distribuzioni limite Posso parlare di distribuzioni limite se il numero di eventi tende all’infinito (o comunque è sufficientemente grande….). Dopo un certo numero di eventi i risultati ottenuti si disporranno secondo una determinata distribuzione, che diventerà sempre più evidente al crescere del numero di eventi.. Ad esempio vediamo i seguenti istogrammi nel caso in cui si siano effettuate 10, 100 e 1000 misure della stessa grandezza Davide Grandi - Dottorato in Biologia Distribuzioni continue • Distribuzioni limite Davide Grandi - Dottorato in Biologia Distribuzioni continue • Esempio come ottenere la distribuzione di Gauss Lanciamo un dado e calcoliamo la frequenza con cui escono i numeri da 1 a 6, dopo un numero abbastanza grande di ripetizioni. Ora lanciamo due dadi, facciamo la somma e vediamo con che frequenza escono i numeri da 2 a 12, dopo un numero abbastanza grande di ripetizioni. Ora lanciamo 3 dadi, facciamo la somma e vediamo con che frequenza escono i numeri da 3 a 18 Davide Grandi - Dottorato in Biologia Distribuzioni continue • Esempio come ottenere la distribuzione di Gauss Lanciamo N dadi e vediamo con che frequenza escono i numeri da N a 6N. Rappresentiamo il tutto su dei grafici. Al limite di infinite misure la frequenza più probabile sarà……. N, 6N,6N/2? Davide Grandi - Dottorato in Biologia