PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 Stessa probabilità di accadere e di non accadere 1/2 0 Evento con poca probabilità di accadere 1 Evento con molta probabilità di accadere L’INSIEME UNIVERSO è l’insieme di tutti i possibili esiti Un EVENTO è un sottoinsieme dell’insieme universo La CLASSE DEGLI EVENTI è l’insieme su cui definisco la funzione probabilità INSIEMISTICA unione intersezione complementare ASSIOMI DI KOLMOGOROV •L’unione di eventi è sempre un evento •L’insieme universo stesso è un evento •La probabilità dell’insieme universo è sempre 1 •Se A è un evento, allora anche –A è un evento •La somma delle probabilità di un evento e del suo complementare è sempre 1 Una PROBABILITÀ per essere tale deve rispettare questi assiomi Se UNISCO eventi disgiunti la probabilità P(A B) = P(A) + P(B). Se essi non sono disgiunti, all’unione devo sottrarre l’intersezione Se INTERSECO eventi indipendenti la probabilità P(A B) = P(A) * P(B) Giuseppe 0,7 probabilità di vittoria contro il padre Giuseppe 0,3 probabilità di vittoria contro il maestro V V V V V S S V V MAESTRO - PADRE - MAESTRO P (V V V) + P ( V V S) + P ( S V V) (0,3 * 0,7 * 0,3) + (0,3 * 0,7 * 0,7) + (0,7 * 0,7 * 0,3) = 0,357 PADRE - MAESTRO - PADRE P (V V V) + P ( V V S) + P ( S V V) (0,7 * 0,3 * 0,7) + (0,7 * 0,3 * 0,3) + (0,3 * 0,3 * 0,7) = 0,273 PROBABILITÀ CONDIZIONATA La probabilità condizionata è il nuovo giudizio di probabilità basato sull’aumento dell’informazione Ho una probabilità di ½ di uscire con quella ragazza!! Aumento di informazione: ha già il ragazzo… Ora ho una probabilità di 1/1000… PB(A)*P(B) = P(A∩B) per tutti gli A appartenenti alla classe degli eventi Mr. Brown ha 2 figli. Qual è la probabilità che il secondo figlio sia una femmina se: 1. sappiamo che almeno una figlia è femmina? 2. sappiamo che la primogenita è una femmina? (aumento di informazione) Due figli: Primogenita è una Almeno una femmina: femmina FF FM MF MM 1) P( 2F | 1F 2F) = ½ / ¾ = 2) P(2F | 1F) = P(2F) = 1/2 2/3 VARIABILE ALEATORIA La variabile aleatoria è il risultato di un esperimento che può assumere diversi valori numerici ad ognuno dei quali corrisponde una probabilità • La MEDIA è la somma dei valori moltiplicati per le rispettive probabilità MEDIA = somma (valore * probabilità) • La VARIANZA indica quanto grande è la dispersione della variabile aleatoria VARIANZA = somma [(valore – media)^2 * probabilità valore] PERCHÈ NON CONVIENE GIOCARE AL LOTTO? Come funziona: vengono estratti cinque numeri da 1 a 90. Se si azzecca un ambo con la posta di 1€ se ne vincono 235! X = probabilità di vincere 235€ 1-x = probabilità di perdere 1€ VINCITA MEDIA = 236x -1 VINCITA MEDIA = 236*(2/801) -1 = -0,41€ CASI TOTALI: (90*89*88*87*86) / (5*4*3*2*1) CASI FAVOREVOLI: (88*87*86) / (3*2*1) PROBABILITÀ = casi favorevoli / casi totali = 2/801 = x PASSEGGIATA CASUALE •Si parla di passeggiata casuale SIMMETRICA quando la probabilità di compiere un passo su o giù è identica. Abbiamo visto che i grafici tornano a 0 infinite volte •Si parla di passeggiata casuale ASIMMETRICA quando la probabilità di compiere un passo su o giù è differente. In questo caso le traiettorie tornano a 0 un numero finito di volte senza barriere con barriere GAUSSIANA La gaussiana è un esempio di variabile aleatoria continua. La probabilità che assuma valori in un certo intervallo è pari all’area sottesa dalla curva (a campana) che la definisce Asse x = valori Asse y = distribuzione dati TEOREMA CENTRALE DEL LIMITE afferma che: La somma di N variabili aleatorie di tipo Bernoulli (es.: testa o croce) opportunamente standardizzata, si approssima con una legge gaussiana Se eseguo N prove, la percentuale di successi è vicina alla probabilità di successo in un tentativo? La probabilità di essere in un intervallo di ampiezza δ/2√N intorno alla media si trova come integrale e l’abbiamo disegnato sul grafico precedente. Quindi l’intervallo si riduce all’aumentare di N o al diminuire di δ Sondaggi Fare un sondaggio è come lanciare N volte una moneta con probabilità di successo pari al valore reale di gradimento del candidato. Il valore trovato sarà vicino a quello reale con un certo grado di fiducia; quanto vicino dipende dal grado di fiducia nel sondaggio (più voglio essere convinto, più ampio devo prendere l’intervallo, quindi δ) e dal numero di interviste effettuate (più voglio un intervallo piccolo, maggiore deve essere il numero di interviste). In ogni caso, ho sempre la possibilità di avere trovato un campione “non corretto”, per cui la percentuale calcolata non corrisponde a quella reale, pur avendo fatto tutto per bene. Es.: se trovo x=0,51 e voglio la sicurezza al livello 0,95 (quindi con δ=2) che nell’intervallo (0,50; 0,52) sia compreso il valore reale,deve essere: (x – δ/2√N , x + δ/2√N ) δ/2√N = 0,01 N=10.000