Prof.ssa Nadia Cococcioni Variabili casuali discrete Distribuzione di probabilità di una variabile casuale discreta Funzione di ripartizione di una variabile casuale discreta Caratteristiche numeriche di una variabile casuale discreta La distribuzione binomiale o di Bernoulli La distribuzione di Poisson La disuguaglianza di Bienayme-Cebicev Variabili casuali continue La funzione di densità di una variabile casuale continua Funzione di ripartizione di una variabile casuale continua Caratteristiche numeriche di una variabile casuale continua Distribuzione normale o gaussiana Distribuzione normale standardizzata Un concetto fondamentale della teoria della probabilità è quello di variabile aleatoria o casuale . Si chiama variabile casuale una grandezza X variabile in un insieme numerico tale che ad ogni modalità xi , che essa assume, è associata la probabilità pi che essa si verifichi . Una variabile si dice discreta se può assumere un numero finito o un’infinità numerabile di valori, si dice invece continua se può assumere gli infiniti valori di un intervallo . M Consideriamo le famiglie che hanno tre figli . La composizione di tali famiglie, rispetto al sesso dei figli, può essere rappresentata con un diagramma ad albero . M F M M F F M M I casi possibili sono otto : MMM MMF MFM MFF FMM FMF FFM FFF F F M F F Prendiamo in considerazione il numero delle figlie femmine in una famiglia con tre figli e vediamo come è possibile elaborare un modello matematico per studiare la situazione. Notiamo che il numero delle figlie femmine può assumere quattro valori numerici legati ciascuno ad un valore di probabilità secondo la seguente tabella : N° figlie 0 1 2 3 probabilità 1\8 3\8 3\8 1\8 Questa tabella, che associa a tutti i possibili esiti del fenomeno la relativa probabilità, è un esempio di come si rappresenta la variabile aleatoria “Numero delle figlie femmine in una famiglia con tre figli” . Si chiama distribuzione di probabilità di una variabile casuale discreta ogni relazione che stabilisce una corrispondenza tra i valori della variabile e le probabilità ad essi associate . X xi x2 … xi … xn P(X) pi p2 … pi ... pn Nella definizione di variabile casuale la somma delle probabilità è 1 in quanto vengono presi in considerazione tutti i possibili esiti dell’evento, la cui unione dà l’insieme universo . La legge di distribuzione di una variabile casuale discreta può essere rappresentata graficamente con un diagramma a barre. Rappresentare graficamente la variabile aleatoria X con la seguente distribuzione di probabilità: X 1 P(X) 0.1 1 0,9 0,8 0,7 0,6 Probabilità 0,5 0,4 0,3 0,2 0,1 0 1 2 2 3 4 5 0.2 0.2 0.3 0.2 3 Variabile casuale 4 5 Spesso nello studio di un fenomeno si è interessati alla ricerca della probabilità in un dato intervallo . Per esempio in un controllo di qualità che un azienda effettua sulla propria produzione si può considerare accettabile un numero di pezzi difettosi compreso in un intervallo assegnato piuttosto che fissare il numero esatto di pezzi difettosi . Per questo si studia un’importante funzione associata ad una variabile aleatoria: la funzione di ripartizione . Si chiama funzione di ripartizione di probabilità della variabile aleatoria X la funzione F(x) che fornisce la probabilità che X non assuma un valore superiore a un valore fissato x: F(x) = P(X x) Dalla definizione segue che il valore di F(x) si ottiene sommando i valori di probabilità per X xi . X x1 P(x) p1 F(x) p1 x3 …... xn p2 p3 …... pn p1 p2 p1 p2 p3 ….. 1 x2 Rappresentiamo graficamente una funzione di ripartizione: F ( xn ) F ( x2 ) La funzione di ripartizione è una funzione a gradini definita su tutto l’asse dei reali tale che: F ( x1 ) F(x) = 0 per F ( x3 ) x1 x2 x3 xn F(x) = 1 x x1 per x xn Come abbiamo già detto, nel risolvere problemi pratici relativi a variabili aleatorie è necessario calcolare la probabilità che una variabile assuma un valore compreso in un intervallo ( a, b ) . Per la definizione data della funzione di ripartizione, supposto che l’estremo destro dell’intervallo gli appartenga e quello sinistro no , risulta : P(a < X b) = P(X b) - P( X a) = F(b) - F (a) Possiamo dedurre, quindi ,che: La probabilità che la variabile aleatoria appartenga a un dato intervallo è uguale all’incremento della funzione di ripartizione in questo intervallo . La seguente variabile aleatoria con relativa funzione di ripartizione descrive i voti di una verifica di matematica in una classe . X 3 4 5 6 7 8 P(X) 0,04 0,06 0,15 0,47 0,18 0,07 F(x) 0,04 0,1 0,25 0,72 0,9 9 0,03 0,97 1 L’insegnante è interessato a valutare : a) la percentuale di alunni insufficienti; b) la percentuale di alunni con voto compreso fra 6 e 7; c) la percentuale di alunni con voto maggiore di 7 . Le risposte sono : a) P( X 5) F (5) 0,25 b) P(6 X 7) F (7) F (6) P(6) 0,90 0.72 0,47 0,65 c) P( X 7) 1 F (7) 0,10 Per descrivere in modo sintetico una variabile aleatoria è sufficiente indicare alcuni parametri numerici che la caratterizzano . Un valore medio intorno al quale si raggruppano i valori della variabile, un numero che caratterizza la dispersione di questi valori intorno al valore medio sono valori sintetici della distribuzione che ne forniscono un’immagine riassuntiva . Data la variabile aleatoria X : X P(X) x1 p1 x2 p2 …. …. xi pi …. …. xn pn Si chiama media o speranza matematica della variabile X la somma dei prodotti dei valori della variabile per le rispettive probabilità: n M ( X ) xi pi i 1 La varianza è la caratteristica numerica della dispersione, cioè della deviazione dei valori della variabile casuale rispetto al valore medio . Si definisce varianza della variabile X la mediadel quadrato della differenza tra la variabile X e la sua speranza matematica : n V ( X ) ( xi mx ) 2 pi i 1 Per il calcolo della varianza esiste una formula alternativa più utile : V ( X ) M ( X 2 ) M ( X ) 2 Si chiama scarto quadratico medio della variabile X la radice quadrata della varianza : V (X ) Le probabilità associate ai valori che può assumere una variabile casuale X costituiscono la distribuzione di X e vengono elencati in una tabella , ma a volte è anche possibile formulare una legge matematica che, al variare dei valori di X, determini i relativi valori di probabilità . Immaginiamo di ripetere più volte e nelle stesse condizioni una certa prova in modo indipendente . Ogni prova può condurre ad un evento casuale A ( detto successo ) oppure all’evento contrario A ( detto insuccesso ) , Sia p la probabilità che l’evento A si verifichi e q=1-p la probabilità dell’evento contrario, allora : La probabilità che su n prove indipendenti, l’evento A di probabilità p, si presenti x volte è data dalla funzione di probabilità : n f ( x) P( X x) p x q n x x La distribuzione di probabilità legata ad un problema delle prove ripetute è detta distribuzione binomiale ( di ordine n e parametro p ) perché per x=0, 1,2, 3, … , n corrisponde ai successivi termini dello sviluppo binomiale : n n 1 n n2 2 n n 1 n n qp p n 1 (q p) q q p q p .... 1 2 n 1 Questa distribuzione è anche detta bernoulliana in onore di J. Bernoulli che la scoprì alla fine del XVIII secolo . Se X è una variabile aleatoria bernoulliana di ordine n e parametro p : il suo valore medio è dato da : M(X)=np ; la sua varianza è data da : V(X)=npq ; il suo scarto quadratico medio è dato da : npq np(1 p) Un’urna contiene 4 palline rosse e 6 palline verdi, siano p e q le probabilità di estrarre dall’urna rispettivamente una pallina rossa e una pallina verde . Si eseguono 4 estrazioni, riponendo ogni volta la pallina estratta nell’urna .Si determini la distribuzione di probabilità della variabile casuale X “ numero delle palline rosse estratte “, il valore medio e la varianza . Si calcoli inoltre : a. la probabilità che vengano estratte esattamente due palline rosse b. la probabilità che vengano estratte almeno due palline rosse c. La probabilità che il numero delle palline rosse estratte sia compreso tra uno e tre . X 0 1 2 P(X=x) 0,1296 0,3456 0,3456 M(X ) = 1,6 3 4 0,1536 0,0256 V(X) = 0,96 a. P(X=2) = 0,3456 b. P(X 2) = 0,3456 + 0,1536 + 0,0256 c. P(1 X 3) = 0,356 + 0,356 + 0,1536 Quando in una distribuzione bernoulliana il numero n delle prove ripetute assume un valore molto alto e la probabilità p del successo assume un valore molto piccolo , cioè se la probabilità dell’evento A è vicina a 0 e n , la distribuzione di Bernoulli può essere approssimata da un’altra distribuzione che prende il nome di distribuzione di Poisson ( dal nome del matematico che la costruì nel 1837). Nella distribuzione di Poisson la variabile aleatoria X assume i valori 0, 1, 2 ... e la funzione di probabilità di X è : f ( x) P( X x) xe x! dove è una costante positiva che rappresenta il parametro della distribuzione . Nel caso in cui questa distribuzione approssima quella bernoulliana è data dalla media np . Si dimostra che il valore medio e la varianza di una variabile X che ha una distribuzione di Poisson hanno lo stesso valore ed è : M (X ) V (X ) La distribuzione di Poisson descrive molti fenomeni naturali come il numero di chiamate telefoniche che arrivano ad un centralino in un certo intervallo di tempo, il numero di particelle radioattive emesse da una sostanza nell’unità di tempo, il numero di utenti che arrivano allo sportello di un ufficio in un’ora . . . Il parametro in questi casi rappresenta il numero medio di volte che il fenomeno si verifica nell’intervallo di tempo che prendiamo in considerazione . In un ufficio postale transitano , per un certo sportello, mediamente 90 persone ogni ora . Se l’operatore si deve allontanare per 5 minuti, qual è la probabilità che non arrivi nessuno in quei 5 minuti ? Qual è la probabilità che arrivino 3 persone ? = ( 90 : 60 ) x 5 = 7,5 (7,5) 0 7,5 p( X 0) e 5,5 104 0! (7,5)3 7 ,5 p( X 3) e 0,04 3! Fin qui abbiamo visto che, nota la distribuzione di probabilità di una variabile casuale, è possibile determinare i due valori che la caratterizzano: la media e la varianza . Ma spesso capita nelle ricerche sperimentali di conoscere il valore medio e la varianza di una variabile senza conoscere la sua distribuzione . La disuguaglianza di Bienayme-Cebicev mette in relazione tra di loro gli indicatori caratteristici di una distribuzione , la media e lo scarto quadratico medio , offrendo la possibilità di avere infornazioni sui valori di probabilità . Per ogni variabile aleatoria X, di media e scarto quadratico medio , fissato un opportuno valore positivo K, vale la seguente relazione : p( X k ) 2 k2 La probabilità che la variabile aleatoria X assuma valori al di fuori dell’intervallo k; k non supera il rapporto tra la varianza e il valore di k elevato al quadrato . Nella realtà è molto frequente lo studio di quei caratteri , che possono assumere tutti i valori in un certo intervallo, come il peso o l’altezza di un gruppo di individui, il tempo, la distanza e, in generale, tutte quelle grandezze che possono essere misurate . Sono questi caratteri continui per i quali non è possibile, nè tantomeno interessante, trattare le modalità singolarmente : occorre raggruppare per classi i dati di cui si dispone . Consideriamo la tabella delle frequenze assolute e relative delle stature di un campione di 200 individui NUMERO CLASSI LIMITI CLASSI VALORI CENTRALI FREQUENZA ASSOLUTA FREQUENZA RELATIVA 1 150 - 154 152 2 0,010 2 154 . 158 156 7 0,035 3 158 - 162 160 22 0,110 4 162 - 166 164 13 0,065 5 166 - 170 168 44 0,220 6 170 - 174 172 36 0,180 7 174 - 178 176 32 0,160 8 178 - 182 180 13 0,065 9 182 . 186 184 21 0,105 10 186 - 190 188 10 0,050 Tracciamo l’istogramma delle frequenze relative 0,06 0,05 0,04 0,03 0,02 0,01 0 150- 154- 158- 162- 166- 170- 174- 178- 182- 186154 158 162 166 170 174 178 182 186 190 Nell’istogramma l’area di ciascun rettangolo rappresenta la frequenza relativa della classe, la probabilità che un elemento appartenga ad una classe . Ciascun valore riportato sull’asse y dell’istogramma rappresenta il rapporto tra la frequenza relativa degli individui che appartengono alla classe e l’ampiezza della classe stessa . Tali valori rappresentano la DENSITA’ DI FREQUENZA RELATIVA . Consideriamo una variabile casuale discreta che assuma i valori centrali delle classi con la seguente distribuzione di probabilità : X P(X) 152 156 0,010 0,035 160 164 168 0,110 0,065 172 176 180 184 188 0,220 0,180 0,160 0,065 0,105 0,050 Tracciamo la poligonale che unisce i punti aventi come ascissa i valori centrali delle classi e come ordinata la densità di probabilità delle varie classi . densità di probabilità 0,06 0,05 0,04 0,03 0,02 0,01 0 152 156 160 164 168 172 176 180 184 188 variabile casuale Al crescere del numero delle classi, la loro ampiezza diminuisce fino a tendere ad un punto . In questo modo la variabile casuale discreta tende ad assumere tutti i valori del dominio e può essere considerata una variabile casuale continua . DENSITA' DI PROBABILITA' La poligonale può essere approssimata da una curva che rappresenta la FUNZIONE DI DENSITA’ DI PROBABILITA’ della variabile casuale continua . 0,06 0,05 0,04 0,03 0,02 0,01 0 150 155 160 165 170 STATURA 175 180 185 190 Nel caso della variabile casuale continua la probabilità corrispondente ad un particolare valore assunto dalla variabile stessa è ovviamente uguale a zero. Questo fatto si può intuire pensando che si ha il rapporto fra un caso favorevole ed infiniti casi possibili . E’ possibile però determinare la probabilità che questo valore particolare cada in un intervallo (a,b) . Se teniamo presente che nell’istogramma delle frequenze relative la probabilità che un valore della popolazione cada in una classe è data dall’area del rettangolo costruito su di essa, per la variabile casuale continua la probabilità P ( a<X<b ) è data dall’area del trapezoide delimitato dalla curva di densità, dall’asse x e dalle rette x=a e x=b , quindi dal valore dell’integrale definito tra a e b della funzione di densità della variabile : b P(a X b) f ( x)dx a Da quanto detto si deduce che la funzione di densità di una variabile casuale continua deve soddisfare a due condizioni : 1) è definita e non negativa per ogni valore reale della variabile indipendente . 2) f ( x)dx 1 Data una variabile casuale continua X con funzione di densità f(x) si definisce funzione di ripartizione : x F ( x) f ( x)dx Segue dalla definizione che la funzione di ripartizione esprime per ogni valore di x la probabilità che la variabile assuma un valore minore o uguale a x . La probabilità che la variabile X assume un valore appartenente all’intervallo (a,b) è uguale all’incremento della funzione di ripartizione in tale intervallo : b P(a X b) f ( x)dx a b a f ( x)dx f ( x)dx F (b) F (a) Possiamo osservare che la funzione di densità di probabilità f(x) e la funzione di ripartizione corrispondente F(x) sono legate dalla relazione : F’(x) = f(x) Per quanto riguarda il grafico della funzione di ripartizione di una variabile casuale continua, essa è una funzione non decrescente con : lim F ( x) 1 lim F ( x) 0 x x 0 F ( X ) ( x 2) 2 1 per x<2 per 2 x 3 per x>3 1,2 1 F(X) 0,8 0,6 0,4 0,2 0 0 1 2 3 X 4 5 6 Si chiama valore medio della variabile casuale continua X l’espressione : M (X ) xf ( x)dx Si chiama varianza di una variabile casuale X la media dei quadrati degli scarti fra i valori della variabile e il suo valore medio : V (X ) 2 x M ( X ) f ( x)dx oppure V ( X ) M ( X 2 ) M ( X ) 2 Si chiama moda il valore della variabile casuale continua X per il quale la sua funzione di densità di probabilità assume il valore massimo . Si chiama mediana della variabile casuale continua X il numero m che soddisfa la relazione : m f ( x)dx m f ( x)dx 1 2 La distribuzione casuale continua legata ai più importanti fenomeni fisici, biologici o economici è la distribuzione normale o gaussiana che ha funzione di densità : 2 1 f ( x) e 2 ( x ) 2 2 Tale funzione è definita in R e dipende dai parametri e che rappresentano la deviazione standard e la media della variabile casuale . La curva che la rappresenta è asintotica all’asse x, possiede un massimo per x , due flessi per x . 0,6 0,5 f(x) 0,4 0,3 0,2 0,1 0 0 1 2 3 x 4 5 Una distribuzione normale che ha valore medio = 0 e scarto quadratico medio = 1 prende il nome di distribuzione normale standardizzata . L’equazione della sua funzione di densità di probabilità è : f ( z) 1 e 2 z2 2 avendo indicato con z la variabile normale standardizzata . Il grafico della curva normale standardizzata è il seguente : f(z) 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 -4 -2 0 z 2 4 E’ possibile ottenere l’equazione della funzione di densità della variabile normale standardizzata trasformando la funzione di densità della corrispondente variabile non standardizzata, di media e scarto quadratico , con un’affinità di equazioni : x x ' y ' y Quindi è possibile passare dalla variabile aleatoria X, che ha come media e come scarto quadratico medio , alla corrispondente variabile standardizzata Z, che ha valore medio 0 e scarto quadratico medio 1, con la formula : Z X Per la curva normale standardizzata i valori dell’area delle regioni comprese tra la curva, l’asse x e le rette di equazione x=a e x=b , corrispondenti alla probabilità che la variabile standardizzata assuma valori compresi nell’intervallo (a,b) , sono stati calcolati e riportati in apposite tavole . Con l’introduzione della distribuzione normale standardizzata , ogni calcolo relativo alla probabilità di variabili aleatorie continue può essere ricondotto al calcolo della probabilità della corrispondente variabile standardizzata . Infatti, tenendo conto che in una trasformazione affine il rapporto fra le aree delle superfici corrispondenti è uguale al rapporto di affinità che nel nostro caso è uguale a 1, si ha : P( x1 X x2 ) P( z1 Z z2 ) Sappiamo che il diametro effettivo delle sfere di acciaio prodotte da una ditta può essere considerato una variabile normale di media 5,1 cm e scarto quadratico medio 0,08 . Calcola la probabilità che il diametro di una sfera scelta a caso sia compreso tra 4,98 e 5,15 cm . z1 4,98 5,1 1,5 0,08 z2 5,15 5,1 0,625 0,08 P(4,98 d 5,15) P(1,5 z 0,63) 0,4332 0,2357 0,6689 67%