appunti complementari al corso di probabilità e statistica raccolti in modo più o meno sparso nell’anno accademico 2013-14 andrea battinelli dipartimento di ingegneria dell’informazione e scienze matematiche via Roma 56 - 53100 Siena - Italia [email protected] 14 maggio 2014 (seconda versione) 0.1 premessa notazionale Premetto un elenco di convenzioni per la notazione. Per motivi di coerenza ed equilibrio, l’elenco è leggermente più esteso dello stretto necessario, e varia in modo crescente con lo sviluppo degli appunti. Notazione 1 Uso di regola lettere maiuscole per denotare insiemi e matrici, lettere maiuscole in corsivo per indicare famiglie di insiemi, lettere minuscole latine per denotare vettori o liste ordinate, lettere minuscole in corpo normale per denotare scalari e funzioni, in particolare lettere minuscole greche per denotare le componenti di un vettore o lista ordinata denotato con la corrispondente lettera latina1 . Notazione 2 Il simbolo “ ” è de…nitorio, serve cioè a speci…care che quanto se ne scrive a sinistra - …no al momento non de…nito - deve intendersi d’ora in poi come ciò che se ne scrive a destra - che invece è già noto. Come tale, esso va tenuto ben distinto, nè tantomeno sostituito come purtroppo accade sovente, dal simbolo di uguaglianza “=”, che pone in relazione oggetti entrambi giá de…niti. Notazione 3 N è l’insieme dei numeri naturali strettamente positivi. Notazione 4 Per qualunque n 2 N, n (grassetto) è l’insieme dei primi n numeri naturali strettamente positivi2 , nc è l’insieme dei numeri naturali strettamente maggiori di n, e n0 f0g [ n. Notazione 5 Pm (n) è l’insieme di tutti i sottoinsiemi di n aventi esattamente m elementi (così, in particolare,SPm (n) = ; se m > n e, per ogni n, Pn (n) = fng, P0 (n) = f;g). P (n) i2n Pi (n) è l’insieme di tutti i sottoinsiemi di n e, più in generale, per qualunque insieme , P ( ) è l’insieme di tutti i sottoinsiemi di . Notazione 6 Uso la notazione esponenziale per il prodotto cartesiano iterato. Così nm è il prodotto cartesiano di m “copie” dell’insieme n, cioè l’insieme delle m-ple ordinate3 di numeri naturali compresi fra 1 e n. Per ciascun i 2 m, la proiezione i-esima pri : nm ! n; d = ( j )j2m 7! i speci…ca la i-esima componente di ciascuna m-pla; e la mappa estensionale # : nm ! P (n) ; d 7! fprj (d)gj2m raccoglie in un insieme (di cardinalità variabile) le componenti di ciascuna mpla4 . 1 Così ad esempio b ( i )i2n , r j j2m . insieme è d’uso assai frequente, e viene da moltissimi - in modo davvero farraginoso - denotato f1; 2; : : : ; ng. 3 La cardinalità di nm è nm . 4 Cosi ad esempio per (n; m) = (5; 3) si ha $ ((2; 5; 3)) = f2; 3; 5g = f2; 5; 3g = f5; 3; 2g di cardinalità 3 e $ ((5; 5; 3)) = f3; 5g = f5; 3g = f5; 5; 3g di cardinalità 2. 2 Questo 1 r r Notazione 7 Indico anche con Dn;m l’insieme nm , e con Dn;m la sua cardir nalità. Chiamo Pm l’insieme Dm;m , che può essere identi…cato con quello delle corrispondenze biunivoche di m in sé (“permutazioni di m”). Indico con Dn;m r il sottoinsieme di Dn;m i cui elementi sono a componenti tutte diverse fra loro, e con Dn;m la sua cardinalità5 Notazione 8 Indico con = r la relazione di equiestensionalità in Dn;m : r (c; d) 2 Dn;m n r (c; d) 2 Dn;m r Dn;m : # (c) = # (d) r Dn;m : 9 2 Pm ; 8i 2 m; (i) = i o che è un’equivalenza6 . Denoto con [d] la classe di -equivalenza di un qualunque r r r r elemento d 2 Dn;m , con Cn;m l’insieme quoziente Dn;m = , e con Cn;m la sua 7 cardinalità . Notazione 9 Indico con lo stesso simbolo, un po’abusivamente, la restrizione di a Dn;m . Denoto con Cn;m l’insieme quoziente Dn;m = , e con Cn;m la sua cardinalità8 . Cn;m può venire identi…cato, come farò, con un sottoinsieme r . Inoltre, Cn;m può venire identi…cato con Pm (n). di Cn;m r Notazione 10 In ciascun elemento [d] di Cn;m (risp. Cn;m ) vi è un elemento particolare r[d] , per il quale la funzione i 7! i è non decrescente (crescente). Chiamo questo elemento rappresentante canonico della classe, e, nel caso m = n, chiamo permutazione fondamentale il rappresentante canonico r r la funzione che dell’unico elemento di Cn;n . Denoto con $ : Cn;m ! Dn;m a ciascuna classe [d] associa la propria rappresentante canonica r[d] , e con r r : Dn;m ! Dn;m la funzione che a ciascun elemento d associa la rappresentante canonica della propria classe, r[d] 9 . Notazione 11 Data una qualunque matrice A di ordine m n, e due numeri r r h 2 m e k 2 n, per qualunque coppia (c; d) 2 Dm;h Dn;k , c A è la matrice composta dalle sole righe di A, anche ripetute, il cui indice è una componente di c (nell’ordine proprio di c), Ad è la matrice composta dalle sole colonne di A, anche ripetute, il cui indice è una componente di d (nell’ordine proprio di d), e c Ad indica, indi¤ erentemente, c (Ad ) oppure (c A)d , cioè la matrice composta dalle sole righe e colonne di A, anche ripetute, il cui indice è una componente di c e di d, rispettivamente, sempre nell’ordine proprio di c e d. Notazione 12 Indico la trasposizione di matrici mediante un apice posposto; i vettori non ulteriormente quali…cati sono vettori colonna; per ottenere vettori riga traspongo esplicitamente. è noto, Dn;m è uguale a (n n!m)! se n m, mentre Dn;m = ; e Dn;m = 0 se n < m. d vuol dunque dire che le componenti di c sono quelle di d, eventualmente disposte in ordine diverso; ossia che $ (c) e $ (d) sono lo stesso insieme. (n+m 1)! 7 Come è noto, C r n;m è uguale a (n 1)!m! . 8 Come è noto, e come si può direttamente vedere osservando che tutte le classi di n! . equivalenza in Dn;m hanno lo stesso numero m! di elementi, Cn;m è uguale a (n m)!m! 9 “riordina” in modo non decrescente gli elementi di d. Ad esempio, per (n; m) = (5; 3), r r % ((2; 4; 2)) = (2; 2; 4) e % ((5; 2; 3)) = (2; 3; 5). Se { : Dn;m ! Cn;m è la funzione che associa a ciascun d la sua classe di -equivalenza [d] , si ha = { $. 5 Come 6c 2 Notazione 13 Allorché h = 1 o k = 1, cioè quando c o d hanno una sola componente, scrivo i a0 piuttosto che (i) A per denotare la i-esima riga di A, e scrivo aj piuttosto che A(j) per denotare la j-esima colonna di A. Così A = A0 = (aj )j2n = (i a0 )i2m a0j j2n = (i a)i2m Notazione 14 La decomposizione in blocchi per le matrici è indicata per sem(i)i2m\hc , plice giustapposizione; ad esempio se k < n, I (i)i2h , I J (j)i2k , J (j)i2n\kc , A= I AJ I AJ I AJ I AJ Notazione 15 Denoto jAj il determinante della matrice quadrata A; qualunque sia il numero n 2 N, denoto det l’unica funzione di n variabili vettoriali ndimensionali su un campo K, a valori in K, multilineare, alternante, e normalizzata. Così, se A è quadrata di ordine n, jAj = det (aj )j2n = det (i a)i2n Notazione 16 Denoto anche jAj - in modo non ambiguo credo - la cardinalità dell’insieme …nito A, cioè il numero naturale n per cui esiste una corrispondenza biunivoca tra A ed n. 1 1.1 complementi di calcolo combinatorio il principio di inclusione-esclusione jA1 [ A2 j = jA1 j + jA2 j jA1 \ A2 j jA1 [ A2 [ A3 j = jA1 j + jA2 j + jA3 j jA1 \ A2 j jA2 \ A3 j + jA1 \ A2 \ A3 j (1) (2) jA3 \ A1 j Le (1-2) si ottengono in de…nitiva per semplice contabilità della presenza di ciascun elemento dell’insieme universale di cui sono parte gli insiemi della famiglia, e come vedremo l’argomentazione non è diversa nel caso generale. Se un elemento ! 2 non appartiene ad alcun insieme in considerazione, entrambi i membri delle (1-2) sono nulli; se appartiene ad un solo insieme, non appartiene ad alcuna delle intersezioni indicate, ed entrambi i membri valgono 1; se appartiene a 2 insiemi, che siano gli unici in esame come nella (1) o 2 dei 3 come nella (2), al …ne di uguagliare la singola contabilizzazione nel membro di sinistra10 , la doppia contabilizzazione nel membro di destra dovuta all’appartenenza individuale a ciascuno dei 2 insiemi deve essere “neutralizzata” con la singola contabilizzazione (in sottrazione) dovuta all’appartenenza alla loro intersezione, 1 0 Ogni elemento appartenente ad almeno un insieme della famiglia, cioè alla loro unione, viene contabilizzato esattamente una volta nel membro di sinistra, indipendentemente dal numero di insiemi della famiglia cui appartiene. 3 e ciò avviene esattamente una volta anche nel caso della (2) oltre che nella (1); se in…ne ! 2 appartiene a tutti e 3 gli insiemi, l’applicazione (nella sola (2)) della precedente procedura contabile conduce ad una triplice contabilizzazione per l’appartenenza individuale, e ad una triplice contabilizzazione in sottrazione per l’appartenenza alle intersezioni degli insiemi a due a due; e deve pertanto venire ulteriormente corretta mediante una singola contabilizzazione aggiuntiva dovuta all’intersezione tripla. La formula generale11 è contenuta nella seguente: Proposizione 17 (principio di inclusione-esclusione) Per una qualunque famiglia A (Ai )i2n di sottoinsiemi …niti di un dato insieme universo si ha " # P P T S h+1 ( 1) (3) Ai = j2h A j i2n h2n [d]2Cn;h dove, per qualunque h 2 n e per qualunque [d] 2 Cn;h , il “multi-indice” r ( i )i2h = $ ([d]) = r[d] è la rappresentante canonica di [d]. Dimostrazione. È su¢ ciente veri…care, per ogni k 2 n, che un elemento ! 2 appartenente ad esattamente k degli insiemi Ai dà luogo ad un insieme di contributi agli addendi nella doppia sommatoria del membro di destra che sommano esattamente ad 1. Infatti, posto P Sh [d]2Cn;h T j2h A j per ciascun h > k il contributo ad Sh dovuto alla presenza di ! è nullo, poiché qualunque c 2 Ck;h ha almeno h k componenti j che sono T indici di insiemi Ai cui ! non appartiene, e allora ! non può appartenere a j2h A j ; per h 2 k, invece, il contributo ad Sh dovuto alla presenza di ! è esattamente uguale a T Ck;h , perchè ! appartiene a j2h A j se e solo se le h componenti j j2h di r[d] sono gli indici di h dei k insiemi Ai cui ! appartiene. Pertanto il contributo complessivo alla doppia sommatoria dovuto alla presenza di ! è P h+1 ( 1) Ck;h = 1 1+ h2n P h+1 ( 1) h2k = 1 P h ( 1) h2n[f0g = 1 = 1 1.2 (1 k h k h ! k 1) funzioni tra insiemi …niti Ciascun coe¢ ciente del calcolo combinatorio fornisce direttamente - o quasi la risposta al problema di contare quante siano le funzioni aventi insiemi …niti 1 1 Conviene ricordare qui la convenzione d’uso comune per la notazione abbreviata riferita all’iterazione diN una qualunque operazione associativa allorché l’insieme di indici contiene un solo elemento: A` i2f`g Ai 4 come dominio ed insieme valore, e che soddisfano una assegnata proprietà tra quelle d’uso comune. Ciò è riassunto nella seguente tabella: Fk;n : funzioni k ! n arbitrarie r Dn;k = i Fk;n : funzioni k ! n iniettive Dn;k = c Fk;n : funzioni k ! n crescenti Cn;k = nd Fk;n : funzioni k ! n non decrescenti r Cn;k = s Fk;n : funzioni k ! n suriettive P nk n! (n k)! (n n! k)!k! Cn+k h ( 1) P h ( 1) h2(n 1)0 = Cn;h (n h2(n 1)0 = 1;k (n (n + k 1)! (n 1)!k! (4) k h) n! (n h)!h! k h) (5) La prima riga della tabella (4) si riconosce osservando che un elemento di nk è una k-pla ordinata di elementi di n, quindi già precisamente una funzione da k in n, quella che assegna a ciascun indice di posizione nella k-pla l’elemento di n che in quella posizione si trova. Pertanto, se Fk;n è l’insieme di tutte le funzioni r , oppure si deve almeno da k in n, o si sostiene direttamente che Fk;n = Dn;k ammettere che vi sia una biezione tra i due insiemi; in de…nitiva, jFk;n j = nk . La seconda riga della tabella (4) potrebbe venir riconosciuta osservando che per una funzione iniettiva da k in n la scelta del valore f (1) può essere fatta in n modi, quella del valore f (2) in n 1 modi perché il valore f (1) non può esser ripetuto, “e così via”…no ad f (k) per il quale sono rimaste solo n (k 1) possibilità. Preferisco formulare anche un’argomentazione che fa a meno dell’“e così via”, o meglio che lo formalizza in un’applicazione del principio di induzione, e che può essere vista come una dimostrazione della validità della formula che descrive Dn;k nella nota 5. i Per ogni n 2 N, se per ogni k 2 n Fk;n è l’insieme di tutte le funzioni iniettive da k in n, posso dimostrare che vale n! i Fk;n = (n (6) k)! per induzione su n, e ogni k 2 n, una volta che sia stata riconosciuta, per ogni n 2 N e per ogni k 2 n, la validità della relazione i Fk+1;n+1 = jFk+1;n+1 j (n + 1) jFk;n+1 j i Fk;n (7) La (7) consiste nel descrivere il numero delle funzioni iniettive da k + 1 in n + 1 come di¤erenza tra il numero delle funzioni arbitrarie da k + 1 in n + 1 (che 5 costituiscono Fk+1;n+1 ) e il numero di quelle tra esse che iniettive non sono. Queste ultime sono contate così: se f è una funzione non iniettiva da k + 1 in n + 1, assegnato in un qualunque modo il valore f (k + 1) (n + 1 possibilità), la restrizione di f al sottoinsieme residuo k del suo dominio k + 1 è una funzione arbitraria da k in n + 1 (quindi un elemento di Fk;n+1 ), purché non assegni in modo iniettivo k valori tutti diversi da f (k + 1) (cioè non sia un elemento di i Fk;n ). Considero così stabilita la (7). Il passo iniziale dell’argomentazione induttiva su n consiste nel veri…care la (6) per n = 1 e k 2 1 cioè k = 1, quindi che vale i = F1;1 1! =1 0! cosa immediata. Il passo induttivo (su n) assume la validità della (6) per n e per ogni k 2 n e ne mostra la validità allorché n viene sostituito da n + 1, e quindi anche per ogni k 2 n + 1. Ciò si può fare prima per k = 1 controllando l’uguaglianza i F1;n+1 = (n + 1)! n! che è vera perchè entrambi i membri dell’uguaglianza sono direttamente uguali a n + 1; e poi simultaneamente12 per ogni k 2 (n + 1) 1 muovendo dalla (7) e i sostituendovi i valori noti (di jFk+1;n+1 j e jFk;n+1 j) e quello assunto vero (Fk;n ) per ipotesi induttiva: i Fk+1;n+1 = k+1 (n + 1) k (n + 1) (n + 1) (n n! (n + 1) k+1 k+1 = (n + 1) (n + 1) + (n k)! (n + 1)! = [(n + 1) (k + 1)]! n! k)! La terza riga della tabella (4) discende dall’identi…cazione di ciascuna combinazione semplice, che è una classe [d] di equiestensionalità di disposizioni semplici13 , con la propria rappresentante canonica r[d] . Detto in altre parole, ciò che caratterizza una combinazione semplice è l’insieme dei k elementi scelti da n, che sono tutti e soli quelli che ciascuna disposizione della classe [d] ordina in un modo diverso; di qui l’identi…cazione di Cn;k con Pk (n). Pertanto, una volta che i k elementi siano stati scelti, nulla vieta di disporli in ordine crescente (strettamente, visto che si tratta di k elementi distinti), cioè appunto scegliere r[d] a rappresentare [d] . Ma r[d] è appunto anche la descrizione di una funzione strettamente crescente da k ad n, precisamente della funzione i 7! i . Così ad ogni combinazione semplice [d] corrisponde una ben determinata funzione crescente da k ad n (descritta da r[d] ). Inversamente, la giustapposizione dei k valori assunti da una funzione f crescente da k ad n, nello stesso ordine che (n + 1)! = (n + 1) n immagi(n 1)! nando di contare le posizioni di una matrice quadrata di ordine n+1 al di fuori della diagonale principale, in numero appunto di (n + 1)2 (n + 1) = (n + 1) n, identi…cando ogni elemento i di F2;n+1 con la coppia (indice di riga; indice di colonna). 1 3 Vedi le notazioni (8) e (9) 1 2 Del i resto si veri…ca rapidamente che vale anche F2;n+1 = 6 hanno in k gli argomenti da cui provengono, fornisce la rappresentazione canonica r[d] di un ben preciso elemento [d] di Cn;k . Inoltre, siano f e g due tali funzioni, e siano r[c] e r[d] le rappresentazioni canoniche di due elementi [d] e [d0 ] che esse rispettivamente forniscono con la procedura anzidetta; se f e g sono diverse, vi è un indice minimo i tra quelli dell’insieme fi : f (i) 6= g (i)g; sia per …ssare le idee f i < g i , allora f i non è un valore assunto dalla funzione g, nessuna disposizione in [d0 ] ha g i tra le sue componenti, e [d] 6= [d0 ] . La quarta e ultima riga della tabella (4) risulta giusti…cata mostrando nd l’esistenza di una corrispondenza biunivoca tra l’insieme Fk;n di tutte le funzioni c non decrescenti da k ad n e l’insieme Fk;n+k 1 di tutte le funzioni strettamente crescenti da k a n + k 1. Questa corrispondenza è la funzione “di sparigliamento a scarto minimo”che garantisce la trasformazione in funzione del secondo tipo di una qualunque funzione del primo tipo, aggiungendovi un contributo via via maggiore al crescere dell’argomento; in altre parole, sommandole una molto semplice funzione crescente. Precisamente, sia : k ! (k 1)0 ; i 7! i 1; allora nd c : Fk;n ! Fk;n+k 1 ; f 7! f + risulta ben de…nita, iniettiva e suriettiva. Infatti, è chiaro in primo luogo che (f ) è strettamente crescente se f è non decrescente, poiché, per ogni i 2 (k 1), si ha (f ) (i) = f (i) + (i 1) f (i + 1) + (i 1) < f (i + 1) + i = (f ) (i + 1) nd e che, per ogni f 2 Fk;n , (f ) (k) = f (k) + (k 1) n + (k 1) nd c quindi è ben de…nita su Fk;n , ed assume valori in Fk;n+k 1 . In secondo c luogo, se g è una qualunque funzione in Fk;n+k 1 , allora fg g è tale che (fg ) = fg + = g, e inoltre per ogni i 2 (k 1), si ha fg (i + 1) = g (i + 1) i (g (i) + 1) i = g (i) (i 1) = fg (i) fg (k) = g (k) (k 1) n + (k 1) (k 1) = n fg (1) = g (1) 1 [ (f ) = (h)] , f + = h + , f = h nd quindi fg è ben de…nita, appartiene a Fk;n , è invertibile, e (g 7! fg ) = 1 . In…ne, la formula nella (5) sul numero delle funzioni suriettive risulta da una applicazione del principio di inclusione-esclusione (Proposizione 17). ns A¢ nché una funzione f da k in n non sia suriettiva (f 2 Fk;n ) deve esistere almeno un numero i 2 n per cui i 2 = f (k). Sia allora A (Ai )i2n la famiglia degli insiemi costituiti dalle funzioni da k in n che “mancano” di almeno un elemento di n nella propria immagine Ai ff 2 Fk;n : i 2 = f (k)g Poichè si ha manifestamente ns Fk;n = S 7 i2n Ai e, per ogni14 h 2 (n 1), una funzione f cui “mancano” almeno h elementi di T n comunque scelti (9 [d] 2 Cn;h , r = $ ([d]), f 2 j2h A j ) appartiene ad h insiemi della famiglia A, e ha un’immagine (arbitraria) contenuta nell’insieme di n h elementi n # ([d]), T k h) j2h A j = jFk;n h j = (n e vi sono esattamente Cn;h distinti sottoinsiemi di n composti da h elementi, dal principio di inclusione-esclusione si ottiene # " P T P h+1 ns ( 1) Fk;n = j2h A j h2n 1 P = [d]2Cn;h h+1 ( 1) Cn;h (n k h) h2n 1 P = h+1 ( 1) h2n 1 In…ne s Fk;n k h) ns Fk;n P h+1 P h+1 n ( 1) ( 1) (n h h2n 1 h2n 1 = jFk;n j = nk P = h2(n 1)0 1.3 n! (n h! (n h)! h ( 1) n (n h k h) k h) complementi sulla de…nizione di probabilitá De…nizione 18 Un evento è un insieme di circostanze di fatto (astratte o concrete, presenti, passate, o future) espresso da una proposizione dichiarativa (semplice o composta), suscettibile in linea di principio di essere accertata vera, o alternativamente falsa senza residua sospensione di giudizio, mediante opportuni protocolli di veri…ca concordati dai soggetti parlanti, che ne trasformino lo stato informativo in cui si trovano. De…nizione 19 L’indicatore E di un evento E è un numero aleatorio (condizionale, contingente, non conosciuto al momento in cui se ne parla) che vale 1 se si accerta che E è vero, e vale 0 se si accerta che E è falso. De…nizione 20 Dato un evento E, si chiama evento opposto ad E, e si denota E 0 , l’evento che risulta vero quando si accerti che E è falso, e falso quando si accerti che E è vero. Dati due eventi E ed F , si chiama somma logica di E ed F , e si denota E _ F , l’evento che risulta vero quando uno almeno tra E ed F venga accertato vero; si chiama prodotto logico di E ed F , e si denota E ^ F , l’evento che risulta vero quando entrambi E ed F siano accertati veri. Rileviamo la presenza di semplici relazioni algebriche tra gli indicatori di due eventi opposti, e tra quelli di due eventi e degli eventi che ne sono il prodotto logico e la somma logica E=1 1 4 Una E E^F =E F E_F =E+F E F funzione di Fk;n cui “mancano” n elementi nell’immagine non è de…nita. 8 (9) De…nizione 21 Un evento che è ritenuto doversi veri…care in ogni concepibile circostanza, o che è già noto, si dice certo; un evento che è ritenuto non potersi veri…care in alcuna circostanza, o di cui si sia già accertata la falsità, si dice impossibile. Di regola, verrà usata la notazione C per un evento certo, e la notazione I per un evento impossibile. Vale naturalmente C=1 I=0 (10) De…nizione 22 Dati due eventi E ed F , si dice che E implica logicamente F , e si scrive E F , se dall’eventuale accertamento della verità di E segue in ogni caso quello della verità di F . Si dice che E ed F sono logicamente equivalenti, e si scrive E ! F , se E ed F si implicano a vicenda, cioè se valgono tanto E F quanto F E. Rileviamo anche per queste de…nizioni una corrispondenza con relazioni algebriche tra indicatori E F se (e solo se) E F E=F se (e solo se) E ! F (11) De…nizione 23 Due eventi E ed F si dicono incompatibili se il loro prodotto logico è un evento impossibile: E^F !I (12) e si dicono esaustivi se la loro somma logica è un evento certo: E_F !C (13) Algebricamente, per E, F incompatibili vale E F 0 E_F =E+F (14) E F =1 (15) e per eventi E, F esaustivi vale E+F De…nizione 24 (Impostazione soggettivista corrente) La probabilità di un evento E, secondo l’opinione di una persona A, è una misura equa del grado di …ducia ch’ella ha del fatto che E risulti vero; precisamente, essa è espressa da un numero reale p = pA (E) tale che A accetti di stipulare una scommessa, sia dalla parte della scommettitrice che da quella del banco, in cui si paga subito la quota p per esigere 1 (in un’unità di conto pre…ssata) nel solo caso in cui si accerti che E è vero. Per la scommettitrice, il guadagno G associato ad una scommessa di quota q relativa all’evento E è G E q= * 1 q se si accerta che E è vero (16) q se si accerta che E è falso 9 per il banco, che trattiene la quota in ogni caso, vale esattamente il contrario: l’incasso …nale I associato alla medesima scommessa è * q 1 se si accerta che E è vero (17) I q E= q se si accerta che E è falso Poiché G è negativo in ogni caso se q è maggiore di 1, si può ritenere che nessuna scommettitrice accetti quote superiori a 1. Poiché I è negativo in ogni caso se q è minore di 0, si può ritenere che nessun banco conceda quote inferiori a 0. Queste circostanze sono del resto unanimemente riscontrate nella realtà, al punto da farne ritenere l’enunciazione una banalità. Per gli stessi motivi, per altro, si può ritenere che qualunque scommettitrice accetti scommesse con quote negative, che la fanno guadagnare in ogni caso, e qualunque banco conceda scommesse con quote superiori ad 1, traendone un incasso favorevole certo. Ne segue che gli insiemi S (“sì”) e N (“no”) di quote per cui una scommettitrice accetta, e rispettivamente ri…uta, di stipulare scommesse non sono vuoti, contenendo l’intervallo ( 1; 0) il primo e (1; +1) il secondo; e che gli insiemi corrispondenti S 0 e N 0 per un banco sono altrettanto non vuoti, contenendo gli stessi intervalli sia pure scambiati: ( 1; 0) ( 1; 0) S N0 (1; +1) N (1; +1) S 0 (18a) (18b) Poiché il guadagno G è in entrambe le eventualità decrescente rispetto alla quota, se una scommettitirice ri…uta di scommettere ad una quota q, ri…uta di scommettere ad ogni quota q > q; e se accetta di scommettere ad una quota q, accetta di scommettere ad ogni quota q < q. Da ciò segue che i due insiemi S ed N sono separati : 8qs 2 S; 8qn 2 N; qs < qn (19) In modo analogo si stabilisce la separazione (opposta) dei due insiemi S 0 e 0 N: 8qs0 2 S 0 ; 8qn0 2 N 0 ; qn0 < qs0 (20) Se si presume che una persona abbia idee abbastanza chiare sul proprio atteggiamento nei confronti dello scommettere, si è condotti a postulare il seguente Assioma 25 (di alta de…nizione) Fissato un qualunque evento E, gli insiemi S ed N (e gli insiemi S 0 ed N 0 ) delle quote per cui la persona A in qualità di scommettitrice (in qualità di banco) accetta, rispettivamente ri…uta, di stipulare scommesse su E che permettono di esigere l’importo unitario qualora E venga accertato vero, sono contigui: 8" 8" > > 0; 9qs 2 S; 9qn 2 N; qn qs < " 0; 9qs0 2 S 0 ; 9qn0 2 N 0 ; qs0 qn0 < " (21) (22) Una conseguenza dell’assioma appena postulato e di quello di completezza dell’insieme dei numeri reali è l’individuazione di una precisa ed unica soglia che separa le quote delle scommesse accettate da quelle delle scommesse ri…utate da 10 A, tanto quando si trovi ad agire in qualità di scommettitrice quanto quando si trovi ad agire in qualità di banco: 9p 9p : 8qs 2 S; 8qn 2 N; qs p qn : 8qs0 2 S 0 ; 8qn0 2 N 0 ; qn0 p qs0 (23) (24) Poiché non può ritenersi universalmente vero che una persona sia sempre dotata della capacità di (“mettersi nei panni degli altri”, cioè) assumere, relativamente ad una data transazione che la vede agire da un lato, il comportamento esattamente speculare a quello che assumerebbe se si trovasse nella stessa transazione ma dall’altro lato15 , non c’è motivo di assumere che la soglia p sia identica alla soglia p. E sul piano empirico non è a¤atto infrequente trovare persone per le quali vale una qualunque delle tre relazioni p < p, p = p, p > p. 1 È bene anche osservare a questo proposito che quando q è minore di , la scom2 mettitrice si espone ad una perdita (la quota) minore dell’eventuale guadagno (1 q), e ciò signi…ca che per il banco vale esattamente il contrario; mentre 1 la circostanza si inverte quando q è maggiore di . Questo potrebbe condurre 2 a distinguere soggetti caratterizzati da avversione, neutralità, amore per le scommesse secondo che per essi valga, rispettivamente, la prima, la seconda, o la terza condizione. Seguendo l’impostazione della scuola di pensiero soggettiva nella sua formulazione corrente, si postula il seguente Assioma 26 (di equità, o di neutralità) Fissato un qualunque evento E, se p e p sono gli elementi di separazione delle coppie di insiemi di quote (S; N ) e (N 0 ; S 0 ) de…nite nel precedente assioma 25, unici in virtù del medesimo assioma, si ha p=p (25) In virtù delle precedenti considerazioni, si può concludere che la de…nizione 24 fornisce una ben determinata probabilità pA (E) per ogni evento E e per ogni persona A le cui valutazioni soddis…no gli assiomi 25 e 26. Inoltre risultano veri i seguenti due lemmi. Lemma 27 Per qualunque evento E, in virtù degli assiomi 25 e 26, risulta: 0 pA (E) 1 (26) p (I) = 0 (27) e in particolare p (C) = 1 1 5 Non sto parlando qui di uno scambio di ruoli tra uno scommettitore occasionale che punta per svago (o - come sovente accade con le lotterie - per acquistare un sogno assolutamente vano ma che aiuta a sopportare una vita miserabile) ed un allibratore professionista che raccoglie puntate per vivere con (notevole) pro…tto; è chiaro che in questo scenario chi tentasse di immaginarsi per un istante nelle vesti dell’altro dovrebbe tener conto di godere (o so¤rire) di un intero stile di vita di¤erente, e di poter quindi guardare alla prospettiva di scommettere trovandosi sull’altro lato da un punto di vista divenuto assai diverso da quello che ha adesso. Sto invece parlando di una persona cui, senza che la propria vita sia cambiata in nulla, venga o¤erta una scommessa relativa allo stesso evento ma con gli importi di possibili perdite e guadagni scambiati. 11 Dimostrazione. Le due disuguaglianze (26) riferite a p e p (che esistono grazie all’assioma 25) seguono direttamente dall’assunzione esplicitamente presupposta - come pare di¢ cilmente discutibile, al punto che non ho ritenuto raccoglierla in un esplicito assioma - che ogni persona respinga una scommessa associata ad una quota che comporta perdite in ogni circostanza, e ne accetti una che comporta guadagni in ogni circostanza; tale assunzione ha permesso di scrivere le (18); l’assioma 26 semplicemente le trasforma in disuguaglianze riferite a pA (E). Le uguaglianze (27) nemmeno richiedono l’intervento dei due assiomi: quando E è certo l’incasso del banco I è sempre uguale a q 1, dunque negativo se e solo se q < 1, pertanto N 0 = ( 1; 1) e quindi p = p = 1; allo stesso modo, quando E è impossibile il guadagno della scommettitrice G è sempre uguale a q, dunque negativo se e solo se q > 0, pertanto N = (0; +1) e quindi p = p = 0. Tuttavia, ogni persona si trova nella condizione di dover formulare contemporaneamente gradi di giudizio concernenti molteplici eventi, variamente legati gli uni con gli altri, e gli assiomi postulati …no a questo punto non comportano una relazione precisa tra le probabilità attribuibili a questo o quell’evento separatamente. Il prossimo assioma, che ra¤orza l’assunzione ricordata nella precedente dimostrazione estendendola ad un arbitrario sistema articolato di scommesse, garantisce che l’insieme dei gradi di …ducia riposti da uno stesso soggetto in relazione a vari eventi non sia completamente arbitrario. Assioma 28 (di coerenza) Non è possibile coinvolgere una persona, né come scommettitrice né come banco, in un sistema di scommesse che le garantisca un guadagno non positivo in ogni eventualità, e strettamente negativo in almeno una di esse. La prima fondamentale conseguenza dell’assioma che ho appena enunciato concerne tutte le situazioni in cui una persona sia riuscita, in relazione ad uno speci…co (e delimitato) universo di discorso che la interessa in un determinato momento, a formulare la descrizione di ogni futura eventualità ripartendola in un insieme …nito di casi alternativi. De…nizione 29 Una famiglia di eventi E (Ei )i2n si dice alternativa se costituita da eventi a due a due incompatibili: 8i 2 n; 8j 2 n; E i Ej 0 (28) si dice completa se in ogni concepibile corcostanza almeno uno tra gli eventi della famiglia è certo doversi veri…care: W Ei ! C (29) i2n Una famiglia alternativa e completa si dice una partizione dell’evento certo. Lemma 30 Sia E una famiglia alternativa di eventi. Allora W P 8n 2 N; n 2; Ei i2n Ei = (30) i2n Dimostrazione. Per induzione su n. Se n = 2, l’asserto è già stato osservato subito dopo la de…nizione 23. Per ipotesi induttiva, sia n un numero naturale per cui l’asserto vale in relazione a qualunque famiglia di n eventi. Allora W W (proprietà associativa) i2(n+1) Ei = i2n Ei _ En+1 12 e i due eventi W i2n Ei ed En+1 sono incompatibili perchè il loro prodotto logico W W i2n Ei ^ En+1 ! i2n (Ei ^ En+1 ) risultando (proprietà distributiva) logicamente equivalente ad una somma logica di eventi impossibili è del pari evento impossibile. Ne segue (validità dell’asserto per n = 2) W i2(n+1) Ei W = = i2n Ei + En+1 P Ei + En+1 P Ei (ipotesi induttiva) i2n = i2(n+1) Teorema 31 (delle probabilità totali - partizioni dell’evento certo) Sia E (Ei )i2n una partizione dell’evento certo, e per ciascun evento Ei di E sia i la probabilità che una persona attribuisce al veri…carsi di Ei , in accordo con la de…nizione 24 e con gli assiomi 25, 26, e 28. Allora P (31) i =1 i2n Dimostrazione. Basta considerare il sistema di scommesse che ne prevede una per ciascun evento Ei , di premio unitario legato alla sua realizzazione, e quota pari a pi In virtù degli assiomi 25 e 26, ciascuna scommessa viene accettata, e quindi ciò avviene anche per il sistema nel suo complesso. Il guadagno complessivo che ne risulta è P P P G = Ei Ei i = i i2n = = W 1 P Ei P i2n i2n i2n i i2n i i2n ed è pertanto costante, cioè indipendente dalla particolare determinazione di P verità/falsità di ciascun evento della famiglia. Per l’assioma 28, 1 i non i2n può essere strettamente negativo, né strettamente positivo, ed è quindi nullo. Questo risultato si applica in particolare alla considerazione simultanea di un evento e del suo opposto, legandone strettamente le relative probabilità; e ciò permette di formularne un opportuna estensione a ogni situazione in cui una persona consideri un insieme …nito di eventualità mutuamente escludentisi, anche quando esse non esauriscano il campo di tutte le future eventualità. Corollario 32 Per qualunque evento E si ha p (E 0 ) = 1 13 p (E) (32) Dimostrazione. La coppia (E; E 0 ) è una partizione dell’evento certo; per il teorema 31, p (E) + p (E 0 ) = 1 Corollario 33 (delle probabilita’totali - famiglie alternative arbitrarie) Sia E (Ei )i2n una famiglia alternativa di eventi, e sia p ( i )i2n la n-pla delle probabilità che una persona attribuisce ai singoli eventi della famiglia, in accordo con la de…nizione 24 e con gli assiomi 25, 26, e 28. Allora W P p i2n Ei = (33) i i2n Dimostrazione. È su¢ ciente de…nire W En+1 F i2n Ei 0 (Ei )i2(n+1) per ottenere una partizione dell’evento certo. Infatti F è completa W W ! i2(n+1) Ei i2n Ei _ En+1 W W 0 = i2n Ei _ i2n Ei e alternativa 8i 2 n; ! Ei ^ Ei ^ En+1 V j2n ! (Ei ^ Ei0 ) ^ ! I Per il corollario 32, p e per il teorema 31, 1 W i2n p (En+1 ) = Ei = 1 P Ej0 V j2(n fig) Ej0 p (En+1 ) i p (En+1 ) = P i i2n i2(n+1) Anche quando il gruppo di eventualità che è preso inizialmente in considerazione non gode della proprietà di mutua incompatibilità, né di quella di esaustività, è possibile da questo ottenere in modo sistematico una famiglia di altri eventi che costituisce una partizione dell’evento certo, e che è strettamente legata agli eventi del gruppo, ottenendosi da questi con operazioni logiche elementari. Sia infatti E (Ei )i2n una famiglia arbitraria di eventi; poiché per ciascun evento Ei della famiglia la somma logica Ei _ Ei0 di Ei col suo opposto costituisce un evento certo, lo stesso accade per il prodotto logico di tutti gli eventi del genere e, per la proprietà distributiva del prodotto logico rispetto alla somma logica, è ancora evento certo lo sviluppo di quest’ultimo come disgiunzione delle 2n congiunzioni possibili di n eventi, l’i-esimo dei quali è scelto tra Ei e il suo opposto Ei0 C! V i2n (Ei _ Ei0 ) ! 14 W Xi 2fEi ;Ei0 g V i2n Xi (34) In altre parole, posto per ogni i 2 n fEi ; Ei0 g Xi e de…nito il prodotto cartesiano X degli n insiemi di eventi Xi , insieme alle n proiezioni su ciascun componente Q X Xi i2n : i X ! Xi ; X = (X1 ; : : : ; Xi ; : : : Xn ) 7! Xi si ha C! W V i (X) (35) i2n X2X Poiché jXi j = 2 per ogni i, jX j è uguale 2n ; inoltre i 2n disgiunti a secondo membro delle (34), (35) sono a due a due incompatibili, perché se X e Y appartengono entrambi a X e sono diversi, essi devono di¤erire in almeno una 0 componente; se questa è la j-esima, e per …ssare le idee Xj = Ej e Yj = Ej , allora ! V V V V 0 ! Ej ^ E j ^ i (X) ^ i (Y ) i (X) ^ i2n i2n i2(n fjg) ! I^ ! I V i ! (X) i2(n fjg) i2(n fjg) ^ V i2(n fjg) i ! (Y ) De…nizione 34 Data una arbitaria famiglia E (Ei )i2n di eventi, si chiama insieme dei costituenti elementari associato ad E, e si denota CE, l’insieme i cui elementi sono il prodottoQlogico delle n proiezioni di un qualunque elemento del prodotto cartesiano X fEi ; Ei0 g i2n CE E : 9X 2 Q i2n fEi ; Ei0 g ; E = V i (X) i2n In pratica si immaginano eliminati da CE tutti i costituenti elementari impossibili. De…nizione 35 Data una arbitaria famiglia E (Ei )i2n di eventi, si chiama insieme dei costituenti elementari possibili associato ad E, e si denota CEP, l’insieme i cui elementi sono il prodotto logico Q delle0 n proiezioni di un qualunque elemento del prodotto cartesiano X fEi ; Ei g, che non costituii2n scono un evento impossibile CEP E : 9X 2 Q i2n fEi ; Ei0 g ; E = V i2n i (X) e E 6! I Si può osservare che la famiglia E è completa se e solo se il costituente V 0 elementare Ei appartiene a CE ma non a CEP. Infatti per una delle due i2n leggi di De Morgan tale costituente è opposto alla somma logica degli n eventi di E, quindi impossibile se e solo se questa è evento certo. 15 i ! (Y ) De…nizione 36 Data una famiglia E (Ei )i2n di eventi, si dice logicamente dipendente da E un evento E la cui verità o falsità risulti univocamente determinata quando sia stata accertata, in qualunque modo possibile, la verità o falsità di ciascun evento di E. Si deve osservare che la presente de…nizione V non ha pressoché alcuna relazione con la circostanza che il prodotto logico Ei di tutti gli eventi della i2n famiglia E implichi logicamente E. Infatti il presentarsi di quest’ultima relazione semplicemente prescrive che nell’unica eventualità in cui ciascun evento di E risulti vero lo sia anche E; mentre quando E è logicamente dipendente da E non solo nella citata eventualità E può benissimo risultare falso, ma anche in qualunque altra eventualità l’accertamento del valore di verità attribuibile a ciascun Ei permette di concludere univocamente quale sia il valore di verità attribuibile senza ambiguità ad E. Persino quando la famiglia E è costituita da un solo evento E, ed F è un evento logicamente implicato da E, l’essere F vero è certamente una conseguenza dell’essere vero E, ma quando E risulta falso nulla si può in generale concludere su F . Invece, E è logicamente dipendente da E se ciascun costituente elementare in CEP implica logicamente uno dei due tra E ed E 0 . In particolare, ciascun evento Ei della famiglia E ne dipende logicamente. Queste ultime osservazioni illustrano l’opportunità di formulare opportuni indebolimenti della de…nizione di indipendenza. De…nizione 37 Data una famiglia E (Ei )i2n di eventi, un evento E si dice (logicamente) positivamente semidipendente da E se esiste almeno un costituente elementare possibile in CEP che implica logicamente E; si dice (logicamente) negativamente semidipendente da E se esiste almeno un costituente elementare possibile in CEP che implica logicamente E 0 ; si dice (logicamente) bilateralmente semidipendente da E se è semidipendente da E sia positivamente che negativamente; e si dice in…ne logicamente indipendente da E se tutti i costituenti elementari in CEP sono compatibili sia con E che con E 0 . A titolo di esempio si può immaginare che, avendo riunito (usando tanto per cambiare il femminile come universale) tutte le studentesse che frequentano il corso io abbia raccolto i libretti universitari di ciascuna; e che poi ne abbia aperto uno a caso fermandomi a guardare un (solo) voto tra quelli ricevuti dalla studentessa prescelta. Se de…nisco la famiglia E (Ei )i2n identi…cando l’evento Ei con l’enunciato “il titolare del libretto che ho aperto è la studentessa i”16 , e considero l’evento E de…nito dall’enunciato “il voto che osservo è superiore a 29”, allora i. E è positivamente semidipendente da E se qualche studentessa (ma non tutte) ha ricevuto solo 30 e 30l negli esami sostenuti ii. E è negativamente semidipendente da E se qualche studentessa (ma non tutte) non ha mai ricevuto voti superiori a 29; iii. E è logicamente dipendente da E se ogni studentessa rientra o nell’uno o nell’altro dei tipi appena descritti; 1 6 Rileva osservare che la famiglia E è nel caso presente una famiglia alternativa, circostanza che la pone in corrispondenza biunivoca con la famiglia CEP, solitamente più numerosa: sono possibili soltanto i costituenti elementari prodotto di un evento della famiglia con gli opposti di tutti gli altri. 16 iv. E è bilateralmente semidipendente da E se esistono studentesse di entrambi i tipi, ma la tipologia non esaurisce il complesso delle studentesse; v. E è logicamente indipendente da E se tutte le studentesse hanno ricevuto almeno una volta 30 o 30l, e almeno una volta un voto uguale a 29 o inferiore. Un altro evento logicamente dipendente da E è quello descritto dall’enunciato “il libretto aperto appartiene a persona anagra…camente registrata come maschio”, mentre quello descritto dall’enunciato “il capello caduto alla proprietaria che trovo nel libretto è bianco” è logicamente indipendente da E (che la circostanza piaccia o no). In generale, dovrebbe essere chiaro che ciascun evento di una famiglia E dipende logicamente dalla famiglia CEP; infatti un tale evento è in primo luogo logicamente equivalente alla somma logica di tutti i costituenti elementari che lo congiungono con gli altri eventi della famiglia o con i loro opposti, in un modo qualunque; e, in secondo luogo, lo è anche all’evento ottenuto dalla precedente somma logica sopprimendo tutti i costituenti elementari che sono impossibili, dato che tale alterazione non ne muta l’eventualità di risultare vera, o falsa, in una qualunque circostanza. Ma ancora più in generale, è possibile identi…care ciascun evento logicamente dipendente da una famiglia come somma logica di costituenti elementari. Proposizione 38 Sia E (Ei )i2n una famiglia di eventi per la quale il numero dei costituenti elementari possibili (la cardinalità di jCEPj) è pari ad s (1 s 2s 1), e sia CEP = (Cj )j2s . Gli eventi dipendenti logicamente da E sono tutti e soli quelli (in numero di 2s 1) che possono essere equivalentemente rappresentati dalla somma logica di k degli s costituenti elementari in CEP, dove k è uno qualunque degli interi strettamente maggiori di 0 e non superiori ad s. In particolare, a ciascun evento Ei della famiglia E corrisponde un ben determinato sottoinsieme Si di s tale che W Ei ! j2Si Cj Dimostrazione. In primo luogo, se E è logicamente equivalente ad una somma logica di costituenti, avere accertato in qualunque modo possibile la verità o falsità di ciascun evento di E corrisponde precisamente ad accertare la verità di un particolare costituente elementare Cj , quindi quella di E se Cj compare nella somma logica cui E è equivalente, e la falsità di E in caso contrario; pertanto E è logicamente dipendente da E. In secondo luogo, se E è logicamente dipendente da E, dire che risulta stabilita la sua verità o falsità non appena si accerti in qualunque modo possibile la verità o falsità di ciascun evento di E signi…ca dire che risulta stabilita la verità o falsità di E in corrispondenza di un qualunque costituente elementare; è allora su¢ ciente considerare la somma logica dei costituenti elementari possibili in corrispondenza dei quali E risulta vero per ottenere un evento logicamente equivalente ad E. Supponiamo di avere assegnato un sistema di probabilità coerenti p ( i )i2n a ciascun evento della famiglia E (Ei )i2n . Poiché ciascun evento Ei della famiglia E ne dipende logicamente, se c j j2s è il sistema di probabilità dei 17 costituenti elementari possibili, devono essere soddisfatte le seguenti condizioni: P (i 2 n) (n equazioni) j = i j2Si P j j2s =1 (1 equazione) 0 j (j 2 s) (36) (s disequazioni) Se si guarda a (36) come ad un sistema misto di n + 1 equazioni lineari ed s disequazioni lineari nelle s incognite j j2s , si osserva: Proposizione 39 l’insieme Sp delle soluzioni c del sistema (36), quando non vuoto, è (l’intersezione di un sottospazio a¢ ne con l’ortante positivo di Rs ) convesso e chiuso. Dimostrazione. Ogni equazione lineare de…nisce un iperpiano di Rs , che come ogni sottospazio a¢ ne è convesso e chiuso. L’ortante non negativo di Rs è anch’esso convesso e chiuso, ed entrambe le proprietà sono ereditate per intersezione …nita. Del pari si osserva: Proposizione 40 L’insieme P delle assegnazioni di probabilità p per cui Sp non è vuoto, ossia tali che il sistema (36) ammette soluzioni, è convesso e chiuso. Dimostrazione. Le disuguaglianze del sistema (36) sono tutte omogenee e non dipendono pertanto da p; l’ortante non negativo di Rs è un cono convesso e chiuso (quindi in particolare invariante per omotetie di modulo positivo). Se c 2 Sp e d 2 St allora, per qualunque 2 [0; 1], P P P (1 ) j + j = (1 ) ) i+ i (i 2 n) j = (1 j + j2Si P j2Si (1 ) j2s (1 P i2n ) [(1 j j + ) i + j = (1 ) P j2s j 0 + i] = (1 ) P j2Si j i + P j =1 + =1 j2s + i2n P (j 2 s) i 1 + =1 i2n e pertanto (1 ) p + t è una assegnazione di probabilitá ammissibile per E e (1 ) c + d appartiene a S(1 )p+ t . Tutte le uguaglianze e le disequazioni (che sono deboli) sono mantenute allorché si e¤ettua passaggio al limite in entrambi i membri per successioni p(l) l2N di probabilità assegnate ad E e per corrispondenti successioni c(l) l2N di soluzioni del sistema (36). È possibile e conveniente rappresentare il sistema (36) in forma compatta: Ac = p e0 c = 1 c 0(s) 18 dove A è la matrice di ordine n s le cui righe, a componenti tutte uguali a 0 o ad 1, forniscono ciascuna una rappresentazione dell’indicatore di un evento della famiglia E, e 2 Rn è un vettore interamente composto di numeri 1, e le proprietà (9), (10), (14), e (15) riferite agli indicatori mantengono la loro signi…catività e validità se riferite alle righe di A. In particolare, se un evento Ek della famiglia E è somma logica di altri due eventi Ei ed El di E, e Ei ed El sono tra loro incompatibili, allora la riga di A che concerne Ek è somma delle due righe che corrispondono ad Ei ed El 0 ka = i a0 + l a0 e la matrice A non ha rango di righe pieno, con una dipendenza lineare (di tipo particolarmente semplice) della riga k dalle righe i ed l. Se invece Ei ed El sono compatibili, ma non logicamente equivalenti, allora tale dipendenza lineare non sussiste, salvo nel caso banale in cui Ek è logicamente equivalente ad uno dei due. Infatti, poiché le righe i ed l non coincidono, vi è almeno una colonna, sia la j-esima, tale che 0 = i j < l j = 1 (o viceversa); e poiché i due eventi non sono incompatibili, vi è almeno una colonna, sia la j 0 -esima, tale che i j 0 = l j 0 = 1; da ciò, per qualunque combinazione lineare delle due righe i a + l a, si ha k j = k j 0 = 1 e quindi 1 = i j + l j = e 1 = i j 0 + l j 0 = + , da cui in…ne = 0. Sorge così il problema di identi…care un modo di comporre eventi che corrisponda, sul versante algebrico, a quanto appare come la concatenazione iterata delle due operazioni lineari di somma e prodotto, cui ci si riferisce col termine di “combinazione lineare”. De…nizione 41 Sia E (Ei )i2n una famiglia di eventi, sia p ( i )i2n la n-pla delle probabilità che una persona attribuisce ai singoli eventi della famiglia, in accordo con la de…nizione 24 e con gli assiomi 25, 26, e 28, e sia x ( i )i2n una n-pla di numeri reali. Un numero aleatorio semplice a valori in x associato alla famiglia E è la combinazione lineare della n-pla degli indicatori degli eventi di E mediante il vettore di coe¢ cienti x X (37) X i Ei i2n Si chiama previsione, o valore atteso, o speranza matematica di X il numero reale X E (X) (38) i i i2n Osservazione 42 Ciascuna componente i di x costituisce precisamente il valore assunto da X se è Ei l’evento di E che si realizza. Se x = e(i) , allora X = Ei e E (X) = i . Al …ne di precisare l’interpretazione della de…nizione, e per poter procedere negli sviluppi che seguiranno, stabilisco un ulteriore assioma. Assioma 43 (di omogeneità) In una scommessa relativa ad un qualunque evento E, la relazione tra premio esigibile in caso di realizzazione di E e quote 19 accettate o respinte (sia come banco che come scommettitrice) è di tipo positivamente omogeneo: 8 2 R++ , la quota q è accettata la quota q è accettata per esigere 1 se E si realizza m per esigere se E si realizza È quasi super‡uo osservare che il realismo di questo assioma è pienamente discutibile. Su di esso tuttavia si basano molti dei risultati che devono venire presentati. Assumendo la validità di questo assioma, il grado di …ducia (o probabilità soggettiva) che una persona attribuisce alla possibile realizzazione di un evento diviene un coe¢ ciente di trasformazione, per scommesse di importo esigibile arbitrario, tra importi esigibili e quote accettate. La previsione E (X) assume il signi…cato di quota complessiva massima pagabile dalla persona per accedere al sistema integrato di scommesse per e¤etto delle quali ella riceve xi se si realizza l’evento Ei . È importante osservare che la previsione E (X) non è altro che il prodotto scalare del vettore delle probabilità p con il vettore x degli importi esigibili. Come tale, la previsione è lineare separatamente rispetto a p (per ogni x …ssato) e rispetto a x (per ogni p …ssato). In particolare, per qualunque numero reale , E ( X) = E (X) (39) e, se anche Y è un numero aleatorio associato alla famiglia E, E (X + Y ) = E (X) + E (Y ) (40) Poiché inoltre valgono le (26) e (31), la previsione è una combinazione convessa degli importi. Pertanto si ha min ( i )i2n E (X) max ( i )i2n (41) È possibile estendere la de…nizione di numero aleatorio, associandolo ad una famiglia di eventi arbitraria. In tal caso, le possibili realizzazioni non sono più raccolte nel vettore dei coe¢ cienti x: potendosi veri…care più eventi della famiglia simultaneamente (o anche nessuno), gli importi concretamente esigibili nelle varie circostanze risultano dalla somma di talune componenti di x. Se si introduce però la famiglia CEP dei costituenti elementari possibili, si è in grado di dare al numero aleatorio X la cosiddetta rappresentazione canonica X X= vj Cj (42) j2s P nella quale ciascun vj è uguale a i2Si i (ricordando per la de…nizione di Sj la proposizione 38) e le possibili realizzazioni di X sono raccolte nel vettore y ( j )j2s . Coerentemente, la previsione di X prende la forma X E (X) = (43) j j j2s dove il vettore c j j2s per le probabilità dei costituenti elementari è una qualunque soluzione del sistema (36). 20 Esercizio 44 Veri…ca l’uguaglianza tra i valori forniti per la previsione E (X) dalla de…nizione (38) e dall’espressione (43), al variare di c nell’insieme delle soluzioni del sistema (36). Un’altra possibile estensione della de…nizione di numero aleatorio semplice si ottiene considerando una famiglia di eventi di cardinalità in…nita numerabile. De…nizione 45 Sia E (Ei )i2N una famiglia numerabile e alternativa di eventi, sia p ( i )i2N la successione delle probabilità che una persona attribuisce ai singoli eventi della famiglia, in accordo con la de…nizione 24 e con gli assiomi 25, 26, e 28, e sia x ( i )i2n una successione di numeri reali. Un numero aleatorio discreto a valori in x associato alla famiglia E è la somma della serie il cui termine generale i-esimo è l’indicatore dell’i-esimo evento di E moltiplicato per xi X X i Ei i2N e la sua previsione (o valore atteso, o speranza matematica) è X E (X) i i i2N purché la serie indicata sia convergente. Osservazione 46 Anche in questo caso ciascuna componente i di x costituisce precisamente il valore assunto da X se è Ei l’evento di E che si realizza. Esercizio 47 Ripercorri le argomentazioni che sostengono il lemma 30, il teorema 31 e il corollario 33 ed accertati della possibile validità di un’argomentazione sostenuta da un P procedimento di passaggio al limite che dimostri la convergenza ad 1 della serie i2N i . Ogni strumento di misura è caratterizzato da una precisione, un grado di risoluzione al di sotto del quale esso non è in condizione di fornire informazioni dotate di senso; pertanto ogni procedimento di misura fornisce come risultato un sottomultiplo dell’unità di misura scelta per la grandezza che viene misurata, e in de…nitiva un multiplo intero dell’unità di misura minima per la quale esso è tarato. Come tale, anche un numero aleatorio de…nito in termini di eventi la cui realizzazione deve essere accertata mediante procedimenti di misura non esula dalla categoria dei numeri aleatori discreti. Tuttavia, la numerosità e la variabilità delle misurazioni ottenibili può suggerire l’opportunità di descrivere l’insieme dei valori ammissibili di un numero aleatorio X come un sottoinsieme Z dell’insieme dei numeri reali, dotato anch’esso come R della potenza del continuo. In tal caso si deve tener conto adeguatamente del fatto che la posizione rivestita da un qualunque elemento di R nei confronti dell’insieme di cui fa parte è ben diversa da quella assunta da un elemento di un insieme numerabile. Da un lato si deve assumere che il valore assunto da X sia in ogni caso un numero reale, quindi che l’evento “X 2 Z” sia certo; dall’altro lato si deve ammettere che l’evento “X = ”abbia probabilità 0 per qualunque 2 Z, salvo al più per un sottoinsieme numerabile di Z, nel qual caso però si ricadrebbe nella considerazione di X come numero aleatorio discreto, o almeno parzialmente tale17 . 1 7 Il caso di numeri aleatori aventi caratteristiche miste non è infrequente nelle applicazioni, ma deve essere trattato in un momento successivo. 21 Nella maggior parte delle applicazioni in cui si è condotti per comodità a considerare certi numeri aleatori come numeri aleatori continui, si vuole avere al contempo che la probabilitá dell’evento “X = ”sia nulla per ogni 2 Z, e che la probabilità dell’evento “X 2 Z” sia uguale ad 1. Ciò si realizza mediante l’introduzione di una funzione di “densita di probabilità”f , de…nita su Z e a valori reali, tale per cui qualunque sia il sottoinsieme A di una opportuna famiglia di sottoinsiemi di Z valga Z Prob (“X 2 A”) = f( ) d A Dato dunque un qualunque 2 Z, l’interpretazione del valore f ( ), coerentemente col signi…cato dell’operatore di integrazione presente nella formula precedente, non è dunque espressa dall’a¤ermazione “la probabilità che X abbia valore è f ( )” (tale probabilità è infatti nulla) bensì dall’a¤ermazione “la probabilità che X abbia valore in un intervallo contenente e di lunghezza l è, in prima approssimazione locale, f ( ) l”. Qui l’espressione “in prima approssimazione locale”va intesa nel senso classico del calcolo di¤erenziale, precisamente “se I è un intervallo contenente di lunghezza l, il limite per l tendente a 0 del rapporto tra la probabilità che X appartenga ad I e la lunghezza di l è uguale a f ( )”. La condizione espressa nel teorema delle probabilità totali, ripresa nell’esercizio 47, prende adesso la forma Z f( ) d =1 Z e addirittura, supponendo la de…nizione di f estesa banalmente a tutto R con valore nullo al di fuori di Z, Z +1 f( ) d =1 (44) 1 Con questa impostazione, nel calcolo del valore atteso di un numero aleatorio continuo descritto dalla funzione di densità f , ciò che corrisponde al termine generale i i della serie che de…nisce la speranza matematica di X di un numero aleatorio discreto è il prodotto (“in…nitesimo”) (f ( ) dx) . Pertanto si dà la seguente De…nizione 48 Sia A una famiglia di sottoinsiemi di R, chiusa rispetto alle operazioni di unione, intersezione e complementazione, e sia f : R ! R+ una funzione non negativa ed integrabile sul suo dominio, soddisfacente la condizione (44).Un numero aleatorio continuo associato alla famiglia A è un numero non ancora noto, tale che per ogni insieme A di R appartenente alla famiglia A si ha Z Prob (“X 2 A”) = f( ) d A e la sua previsione (o valore atteso, o speranza matematica) è Z +1 E (X) f( ) d 1 purché l’integrale indicato sia …nito. 22 1.4 La media geometrica non supera quella aritmetica In un senso molto generale, col termine media si quali…ca un numero cui si vuol far svolgere - da solo - il ruolo di rappresentante tipico di un’intera messe di osservazioni quantitative. La media di un campione di numeri riassume in sè in estrema sintesi - o si vorrebbe che lo facesse - una speci…ca qualità della massa di informazioni di cui prende il posto. Il modo in cui questa sintesi si realizza e il tratto distintivo ch’essa principalmente descrive può variare, secondo gli scopi di chi intende servirsene, secondo il contesto in cui opera; ma in ogni caso questo precipuo carattere di rappresentatività si formula mediante la condizione che la media di un gruppo di numeri possa entrare nel calcolo d’interesse sostituendosi simultaneamente a ciascuno di essi senza alterare il risultato. Così si perviene alla seguente De…nizione 49 Sia g : Dg ! R una funzione reale di n variabili reali con il dominio Dg che contiene l’ortante strettamente positivo Rn++ . Se x ( i )i2n appartiene al dominio di g, il numero 2 R si dice g-media, o media secondo g, degli n numeri ( 1 ; : : : ; n ), e si scrive = M g (x), se vale g ( e) = g (x), ossia se g ( ; : : : ; ) = g ( 1; : : : ; n) In particolare, si chiama media aritmetica P M A (x) degli n numeri ( la media secondo la funzione x ! e0 x = i2n i : M A (x) 1P n i2n M G (x) i2n n) i si chiama media geometrica M G (x) degli n numeri ( Q secondo la funzione x ! i2n i : Q 1; : : : ; 1; : : : ; n) la media 1 n i si chiama media armonica M H (x) degli n numeri ( P condo la funzione x ! i2n i 1 : 1; : : : ; n) la media se- n M H (x) P i2n 1 i mentre la norma euclidea r P kxk2 di x è la media dei numeri ( 2 i2n i condo la funzione x ! n 1; : : : ; n) se- Tra la media aritmetica e la media geometrica intercorre una relazione sistematica. Proposizione 50 Qualunque sia n 2 N, e qualunque sia la n-pla di numeri positivi x ( 1 ; : : : ; n ), si ha M G (x) M A (x) con l’uguaglianza che vale se e solo se x = e = ( ; : : : ; ) è a componenti tutte uguali. 23 Dimostrazione. Sia P Pn : 8x 2 Rn++ ; Q (Pn )n2N la famiglia di a¤ermazioni così de…nita: i i2n P = 1 =) P n ^ i i2n i2n i =n,x=e L’antecedente della a¤ermazione Pn stabilisce che x appartiene al luogo di livello 1 della media geometrica; il suo conseguente a¤erma che in tal caso la media aritmetica di x non è inferiore a 1, e che vale 1 nel caso e solo nel caso in cui tutte le componenti di x sono uguali ad 1 Pn : 8x 2 Rn++ ; M G (x) = 1 =) [(M A (x) 1) ^ (M A (x) = 1 , x = e)] (45) Dalla verità di ciascuna a¤ermazioni della famiglia P (che dimostrerò più avanti) segue quella dell’enunciato della proposizione. Infatti, entrambe le medie sono funzioni omogenee di grado 1: 2 N; 8 2 R++ ; 8x 2 Rn++ ; = M A (x) M G ( x) = M G (x) 8n M A ( x) e pertanto la (45) si estende ad un vettore x appartenente ad un qualunque luogo di livello arbitrario L della media geometrica, “riportandolo” al vettore 1 z x (con ) di media geometrica unitaria M G (x) = , M G ( x) = M G (x) = M G (x) =1 =) M A ( x) 1 , M A (x) = M A ( x) e , M A ( x) = 1 , x=e , x= e M A (x) = Veri…co ora per induzione la verità di ciascuna a¤ermazione della famiglia P. (Passo iniziale) La verità di P1 è banale, ma è utile veri…care direttamente anche quella di P2 , perché è semplice e anticipa un dettaglio del successivo passo induttivo. Dalla condizione 1 2 = 1 segue 1 + 2 = 1 + 1 = 1 1 = 1 2 1 +1 1 2 1 2 1 1) + 2 1 +1+2 1 1 = 1 ( 2 1 2 e 1 + 2 =2 , 1 1 = 0; 2 = 1 1 24 =1 (Passo induttivo) Occorre dimostrare, per qualunque n 2, la verità dell’a¤ermazione Pn+1 P P Q n+1 ^ 8x 2 Rn+1 ++ ; i2n+1 i i2n+1 i = 1 =) i2n+1 i = n + 1 , x = e assumendoPquella di Pn . Sia x ( i )i2n+1 con M G (x) = 1. Se vale x = e, si ha anche i2n+1 i = n + 1, e non c’è altro da aggiungere (questo caso verrà ripreso al termine dell’argomentazione). Altrimenti,pper almeno un indice i si n ha i > 1 e per semplicità sia n+1 > 1. Posto " 1 > 0, si ha n+1 Q n n+1 = (1 + ") i2n i = 1 n (1 + ") Così il prodotto delle prime n componenti di x non è certo uguale ad 1; ma lo diviene se moltiplichiamo ciascuna di esse per (1 + "). Siano allora Rn++ 3 x e ( i )i2n e z = ( i )i2n (1 + ") x e. Vale Q Q nQ i2n i = i2n (1 + ") i = (1 + ") i2n i = 1 e pertanto M G (z) = 1. Per la prima parte del conseguente dell’ipotesi induttiva Pn , P n i2n i P P P i = i2n i , ed essendo i2n i = i2n 1+" 1+" P n i2n i 1+" In…ne P i2n+1 i = = = > P i2n i + n+1 n n + (1 + ") 1+" n + 1 + n" 1+" n + (1 + ") + n" (1 + ") 1+" n + 1 + " (n + 1) + n"2 1+" n+1 Poiché l’ultima disuguaglianza è stretta, ho dimostrato che quando M G (x) = 1 e le componenti di x non sono tutte uguali, la loro somma è strettamente maggiore di 1. Pertanto l’unica possibilità compatibile con l’uguaglianza ad 1 della somma delle componenti è quella esaminata all’inizio. 1.5 Disuguaglianze Lemma 51 (Disuguaglianza di Markov) Sia X un numero aleatorio, discreto o continuo, a valori non negativi, con previsione E (X) …nita. Allora per qualunque k > 0 E (X) Prob (X k) (46) k 25 Osservazione 52 Il lemma si trova enunciato anche nella forma equivalente Prob (X < k) 1 E (X) k Dimostrazione. Procedo parallelamente nei due casi per sottolinearne la completa analogia. Nel caso discreto, raccolgo gli indici i per cui i k in un sottoinsieme I di N. Si ha P P P * k = k Prob (X i2N E (X) = R +1 1 f( ) d = R +1 0 i i i2I f( ) d i i i2N R +1 f( ) d k i R +1 k kf ( ) d = k Prob (X Corollario 53 Sia X un numero aleatorio come nel lemma 51, ma non necessariamente non negativo, e sia g una funzione de…nita su R a valori non negativi. Allora per qualunque k > 0 Prob (g (X) k) E (g (X)) k (47) Dimostrazione. Esercizio Proposizione 54 (Disuguaglianza di Chebyshev) Sia X un numero aleatorio a valori reali, discreto o continuo, con previsione E (X) e varianza V ar (X) …nite. Allora per qualunque " > 0 h i p 1 Prob jX E (X)j " V arX (48) "2 Dimostrazione. È su¢ ciente applicare il corollario 53 alla funzione g : R ! R+ ; 7! [ 2 E (X)] che è a valori non negativi e possiede previsione uguale a V ar (X). Precisamente, p g (X) "2 V ar (X) () jX E (X)j " V arX e dalla (48) si evince Prob g (X) "2 V ar (X) E (g (X)) V ar (X) 1 = 2 = 2 2 " V ar (X) " V ar (X) " Osservazione 55 Il lemma si trova enunciato anche nella forma equivalente h i p 1 Prob jX E (X)j < " V arX 1 "2 Proposizione 56 (Disuguaglianza di Jensen) Sia X un numero aleatorio a valori reali, discreto o continuo, con previsione …nita E (X), e sia g : R ! R una funzione convessa. Allora E (g (X)) g (E (X)) 26 k) k) Dimostrazione. Sia P il punto del gra…co di g di coordinate (E (X) ; g (E (X))). L’epigra…co di g è convesso ed ha quindi una retta d’appoggio r in P ; sia = m + q l’equazione di r. Si ha 8 2 R; g( ) m +q e g (E (X)) = mE (X) + q Pertanto E (g (X)) E (mX + q) = mE (X) + q = g (E (X)) 27