ROMA DIREZIONE DEIJ GIORNALE DEGLI ECONOil1IS 1'1 ' j\{ON7'ru SAVELLO - PALAZZO ORSINI 1907 ."/ CORRADO GINI LA .LEGGE DEI P1CCOLI NUMERI Dal GIORNALE DEGLi EOONOMISTI (VoI. xxxv, 1;erìe 2", Settembr<' lQ07) ROMA DIREZIONE DEL GIONNALE DEGLi EOONOJnS'Tl MON1'B SAvELLO PAf,AZZO ORSINI 1907 I l I l , I i cl DIRITTI n'AU'I'ORE RISERVATI ~ In un ar~icolo apparso di recente sul Giornale degli Economisti (1), U. Broggi rimproverava al prof. R. Benini di non aver ritratto esattamente (2) il carattere e la portata della « legge dei piccoli numeri » di L. von Bortkewitsch. Se con ciò il Broggi intendeva che il Benini aveva accennato ad un fondamento della legge dei piccoli numeri diverso da quello assegnatole dal Bortkewitsch, egli aveva ragione. Ma era piuttosto da esaminarsi se la spiegazione datane dal Bortkewitsch era esatta. Ora, a mio modo di vedere, non solo ciò è discutibile, ma è pure discutibile se si possa parlare di una legge speciale per i piccoli numeri e perfino se le applicazioni matematiche ai fenomeni rari fornite dal Bortkewitsch possano autorizzare una conch;lsione sulla regolarità della loro frequenza. Il presente articolo si propone appunto di esaminare la porta,ta della cosÌ detta legge dei piccoli numeri di L. von Bortkewitsch. In quel tratto di tempo che corse fra i lavori di Giacomo Bernouilli e quelli del Poisson e che può ben definirsi il pe- .. riodo d'oro della teèria delle probabilità, i concetti dominanti intorno alla base filosofica della probabilità facevano sì che, dal semplice fatto che un fenomeno appariva con una data frequenza, ci si ritenesse autorizzati, nell' ignoranza di ogni altra (1) Note (tlla stai/dica metoilolo.lJìca del prof. BENINI. Gìo/'lul1e deglì Economisti, mal'ZO, 1907. (2) PrìJtcìjJl dì statìstica metodolopìca. Torino, Unione tipogmfico-edi· tI'ice, 1906. Roma - 'l'ipografia Nazionale di Gc Bertero e C. 5 CORRADO GINI LA LEGGE DEI PICOOLI NUMERI circostanza, di attribuirgli una probabilità matematica corrispondente. CosÌ i Bernonilli (l), Condorcet (2), Laplace (3), Black (4), Poisson (5), Quetelet (6), Herschell (7), applicavano senz'altro il calcolo delle probabilità a prevedere la frequenza dei sessi nelle nascite o a misurare l'influenza del caso nelle elezioni,· nei verdetti delle giurie o nei risultati di una cura medica, nell'identico modo con cui lo applicavano a determinare la probabilità delle varie combinazioni nei giochi di azzardo. La reazione contro la scuola classica, che il Cournot (8) e il Fries (9) iniziarono e che ottenne la sua più alta espressione nell'opera del von Kries (lO), mise in luce i difetti di un tale ingenuo procedimento. Il Dormoy (Il) e il Lexis (12) additarono il metodo corretto che si doveva sostituirgli. Non sulla base del concetto di probabilità, nè su quella del suo principio fondamentale - insisteva il Lexis - si può ritenere che la frequenza di un fenomeno si uniformi alle regole teoriche del calcolo; ma solo sulla base della nostra esperienza, la quale ci mostri che effettivamente essa si comporta come i risultati di un gioco puramente di azzardo. Essi aprivftno cosÌ la via a quelle applicazioni del calcolo delle probabilità che si potrebbero bene qualificare investigatrici, essendo dirette ad investigare se ed in quallto un fenomeno si conforma alle norme teoriche del calcolo. Il metodo è semplice. Si suppone che la probabilità semplice sconosciuta di un fenomeno A rimanga costante durante tutto il corso dell' osservazione. Allora il teorema di ,Bayes permette di indurre codesta sua probabilità semplice dalla sua frequenza. Il valore più probabile della probabilità di A è dato dal numero dei casi, in cui esso si è avverato, diviso per il numero complessivo dei casi osservati; e la probabilità che. codesto valore differisca dalla probabilità vera meno di una quantità assegnata, cresce col crescere del numero dei casi osservati. Determinata cosÌ con sufficiente approssimazione su un gran numero (n m) di casi la probabilità semplice del fenomeno A, il <'alcolo combinatorio insegna che la probabilità 9-e11e varie combinazioni di questo fenomeno A e del suo contrario B, in un numero di casi m, è data, dai singoli termini di sviluppo del binomio (p + q) m, dove p indica la probabilità del fenomeno considerato, q = l - P la probabilità del suo contrario. Divisi poi gli n m oasi complessivamente os~ servati in n gruppi ciascuno di m casi, si riscontra se le varie combinazioni dei fenomeni A e B compaiono in questi n gruppi con una frequenza corrispondente alle loro probabilità calcolate dalla teoria. Se sì, si conclude che l'ipotesi da cui si era partiti si può ritenere formalmente esatta, vale a dire che le proporzioni del fenomeno A negli n gruppi di m casi oscillano come se il fenomeno A 'fosse dotato di una probabilità semplice costante in tutti gli n m casi bsservati. Si intende però agevolmente quale enorme complicazione di calcoli importerebbe lo sviluppo del binomio (p + q) m, non appena il numero m dei casi dei singoli gruppi fosse appena un poco elevato. 4 (1) G. BERNOUILLT. Al's cO/liectandi. 1713 (Op.·postumn). D. BERNOUILLL Specimen tlteoriae riovae de mensul'{l ,90l'tiS. 1730 o 1731. (2) Ess(d sm' l'applicatioll cle l'(t}wlgse à la pl'obabilité cles t!écisiolls l'emllles à la pllll'alité des l'O ix. 1785. (3) 'l'Mol'ie mwllltifJue cles Jll'obabilftr!s. 1812. - Essai pltilosophiqlW cles jil'obabilités. (4,) Analyse ttl'it/wlIJtique et mr!dicale des maladies et de la mOl'taliN de l'espèce humail1e. 1789. (5) Rec1terc1tes Slll' la jJl'obabilitl! cles jUi/ements. 1837. (6) 'l'hr!orie cles pl'obabilith. 1845. (7) SUI' la tlzéorie cles pl'obabitités et ses (t]Jjllicatiolls au;, scìences plty. siques et sociales. 1850. (8) EXj!osition de la tltéorie des chm/ces et des pl'obabilités. 1843. t9) Versuch eiJwl' ]{l'itik del' Pl'iT/cipien del' Wrt1tl'sc1teinlicltkeitsl'ech· liIut/J. 1842. (10) Die Pl'incipien del' WaltrsclteinlicJtkeitsl'ecltmwg. 1886. (li) l'ltéol'ie matltématìqlte des a8B1l1'{/.IICeS sm' la vie. 1878. Lo stosso idoo furono prima esposto dal DOR~(OY sul Jo/tl'na.l des act;wil'cs franrais, 1876. (12) Das GcscJtlcc/i.tslJel'fliìltl!iss del' GebOl'enen IlIlil die Waltl'sclteilltic/t· keilsl'ecltltl!ng. 1874. 2111' 'l'heol'ie del' lJ1assenerscltci!mllgeli. 1877. Uebel' clie 'l'lteorie del' Stabilitiil del' statistiscltell Reilten. 1879. 6 7 CORRADO GINl LA LEGGE DEI PICOOLl NUMERr Si imponeva perciò una semplificazione del metodo. Si osservò che si ha la probabilità Y2 che, nei singoli gruppi di m' casi, il fenomeno A mostri una frequenza che non si discosta dalla sua frequenza più probabile (uguale alla probabilità semplice) di una quantità superiore a Q > 1 è indice di dispersione più che normale, Q' <. 1 è indice di dispersione meno che normale. Il confronto può stabilirsi, invece che tra gli scostamenti probabili, tra qu~ntità ehecon lo scostamento probabile stanno in relazione costante; tali ad esempio lo scostamento q uadra~ tico medio (f) l' = + 0.4769 ... \/2 ~.!l (l) Si chiamò tale 8costamento, SGostamento (od errore) probabile; e il metodo, col quale lo si determina, combinatorio, statistico (Lexis) o 'indiretto (Bortkewitscb). Dal confronto di questo scostamento teorico collo scostamento che nel fatto si trova oltrepassato in metà degli n gruppi considerati (determinazione empirica dello scostamento probabile), si ha un primo criterio sommario per decidere se la frequenza del fenomeno A sia regolata dal caso. Questo confronto richiede però che il numero (n) dei gruppi considerati sia notevòlmente grande. Per ovviare a tale inconveniente, si pensò di paragonare lo 8COstamento probabile l' coll' altro R=+0.4769 ... ,,~ o la precisione (h) Questi confronti, mediante lo scostamento probabile, lo scost:).mento quadratico medio o la precisione, sono validi qualunque sia il va10re di p ed m, ma sono molto sommarl:. Si usa procedere a confronti più accurati fra la frequenza effettiva delle varie .combinazioni e la; loro probabilità teorica mediante la formula v-_·· l '!f"[d2] V n dedotto, col metodo dei minimi quadrati, dagli scostàmenti d effetbivamente verificati negli n gruppi: metodo fisico (Lexis) o diretto (Bortkewitsch). Il quoziente R Q=-, r detto coefficiente di divergenza (Dormoy) o 1'elazione degli scostamenti (Bortkewitsch), può venir preso come indice della regolarità della proporzione del fenomeno A o, come suoI dirsi, della sua dispersione. Q = 1 significa che le oscillazioni che la proporzione del fenomeno A mostra negli n gruppi sono puramente casuali, e si dice indice di dispersione normale. - e - h"z" . h:1x, (3) 1[ dove è il solito numero di Lud?lph, e la base eli logaritmi naturali (= 2. 71828), h la precisione dedotta col metodo diretto o indiretto, :1 x la differenza x' -:1:: fra due scostamenti. La formula (3) dà appunto la probabilità che uno scosta mento cada, entro i limiti x' - X,' e, poichè in essa ogni quan~ tità è costante tranne X e h, si costruirono tavole dalle quali, conoscendo quef'ti due termini, si deduce immediatamen~e la probabilità ricercata. Però la formula (3) è valida fin tanto che il prodotto m p q sia un numero sufficientemente elevato Essa non può più servire quindi per fenomeni molto rari, in cui p si avvicini sensibilmente allo O. 1[ 8 I.A LEGGE DEI l'ICCOLf NUMERI CORRADO GINI c) dei suicidi di fanciulli dei due sessi,della età suddetta, in Prussia nel medesimo periodo; d) dei suicidi di donne in otto piccoli Stati tedesehi negli anni 188F1894; e) degli infortuni sul lavato seguiti da morte, registrati da undici Leghe professionali (1886-1894); f) dei soldati prussiani uccisi da un calcio di cavallo (1875-1894) ; g) dei soldati prussiani di alcuni Corpi d'esercito (esclusi . i Corpi d'esercito I, II, XI, e la Guardia) uccisi da un calcio di cavallo (1875-1894). La coincidenza fra i dati dedotti dalla formula (5) e quelli riscontrati empiricamente è sempre soddisfacentissima. Per darne la misura il Bortkewitsch ricorse al confronto fra l'errore medio di K, calcolato col metadò indiretto, e quello A completare questa lacuna si rivolse il Bortkewitsch (l). Egli osservò che il termine generale di sviluppo del binomi (p + q)m m(m-l) 1.2 (m-x+l) p q x (4) il quale dà la probabilità che un fenomeno A dotato di una probabilità p si avveri x volte su m casi, tende a divenire re- 1:"2 K 00 . . . . . . x (5) qualora m tenda all'infinito, p a O ed m p = K rimanga costante (2). Basta però praticamente che m raggiunga il migliaio e p non superi il lO, per che la formula (5) possa servire. Sulla sua base si costruiscono tavole dalle quali, conoscendo la frequenza' media J( di un fenomeno A, si deduce immediatamente la probabilità che esso si avveri un determinato numero di volte. Non è necessario, invece, conoscere il numero (m) dei casi possibili, nè la probabilità (p) del fenomeno A, m e p non oomparendo nella formulà (5). Si oonfronta poi se nel 'fatto il fenomeno considerato si presenta con nna data frequenza tante volte quante secondo la formula (5) sarebbe da attendersi. Il Bortkewitsch esaminò così la regolarità della frequenza di parecchi fenomeni rari.; e precisamente: a) dei suicidi di fanciulli maschi al di sotto di lO anni in Prussia 0$69-1893); b) dei suicidi di fanciulle, pure al di sotto di lO anni, in Prussia (1869-1893); (l) Das Gesetz del' kleinen Zahlen. Leipr.ig, Teubnel' 1898. (2) Vedi la dimostrazione di questo pass>tggio nei BENINI, op. citata, pago 337, nota. 9 calcolato col metodo diretto. Il primo (f) è uguale a V rrl:pq; e, poichè q= l -:- p è sensibilmente uguale a l, ed è mp=k, t si .1 potrà ritenere uguale a' V'l{ Il secondo =\/n~1 i '1I \ '!f! è . r[azT j dove n indica il numero dei gruppI In oui si sono suddivisi gli n m casi possibili del fenomeno considerato (negl; esempi del Bortkewitsch n è il numero degli anni), e d le diffél'enze fra la frequenza media annuale del fenomeno considerato e la freqùenza effettiva riscontrata nei singoli anni. •Q= Tha nei vari esempi trattati dal guenti valori: a) 1.12 b) O. 8R c) 0.99 d) 1.15 e) 1. 12 f) 1. 01 (I) 1.00 * Bortkewitsch se· 10 CORRADO GIN! I fenomeni rari, conclude il Bortkewitsch, mostrano dunque regolarmente una dispersione assolutamente normale, mentre ciò non si avvera che in via di eccezione per i fenomeni più frequenti. Precisamente, il solo rapporto sessuale delle nascite mostra, fra questi, una dispersione normale; in tutte le altre serie di rapporti statistici, gli scostamenti effettivi sono molto maggiori dei teorici. Quale la ragione di questa differenza? Il Lexis aveva già fatto notare che negli scostamenti effettivi dei singoli rapporti statistici dal rapporto statistico medio, si possono distinguere due componenti, di cui 1'una rappresenta le cause accidentali degli scostamenti e 1'altra le cause non accidentali. La prima (componente normale) sta in ragione inversa del quadrato del numero dei casi (m) sucui ciascun rapporto statistico si fonda; la seconda (componente fisica) rimane invariata, qualunque sia 1'ammontare della prima. Perciò, col cresbere del numero (m) dei casi su cùi i singoli rapporti si basano, 'gli scostamenti teorici diminuiranno più rapidamente degli effettivi; crescerà quindi 1'ammontare di Q, ciò è a dire risalterà maggiormente ii carattere più che normale della dispersione. Il Bortkewitsch fa notare che ciò, come è vero per gli scostamenti dei singoli rapporti statistici dal rapporto statistico medio, cosÌ lo è per gH scostamenti della frequenza di un fenomeno nei singoli gruppi, dalla sua frequenza media; e ciò indipendentemente dal valore p delle probabilità dei fenomeni considerati, e quindi anche se essa è molto piccola. Si spiega quindi - egli conclude - la regolarità eccezionale delle serie sopra esaminate; ciò si deve al fatto che si tratta di fenomeni per cui è ristretto il campo d'osservazione, di fenomeni che si avverano raramente. A designare il fatto del loro uniformarsi tutto particolare alle norme del calcolo si può usare la denominazione speciale di « legge dei piccoli numeri ». 11 LA LEGGE DEI PICCOLT NUMERI *** E' evidente l'equivoco nel quale il Bortkewitsch è incorso in questa conclusione. La rarità dei fenomeni dipende non dalla ristrettezza del campo di osservazione, ma dalla loro piccola probabilità; K è piccolo, non m; anzi, per passare dalla formula (4) alla (5), si suppone che 171, sia un numero molto elevato -- teoricamente infinitamente elevato, praticamente non inferiore al migliaio. Vampiezza delle singole rilevazioni è così una condizione non meno per la formula (5), usata dal Bortkewitsch, che per la formula (3), adoperata per le serie di comuni rapporti statistici. Non vi è dunque nessuna ragione di parlare per i fenomeni l'ari di una legge dei piccoli numeri, se per piccoli numeri si intendono i numeri delle osservazioni su cui si basano i singoli termini delle serie. Così nel caso di fenomeni l'ari, nel quale si fa uso della formula (5), come nel caso di fenomeni più frequenti, nel quale si usa la formula (3), questi numeri devono essere grandi, benchè per diverse ragioni: nel caso che p e q non siano molto diversi, perchè il prodotto mpq sia sufficientemente elevato; nel caso che p sia prossimo allo zero, perche sia approssimativamente (l) (l' \ m e K)m _-e -m m-l -K m-x+l m.::.g . m~=X"'" -- m-o K = l Giova anche notare che in ambedue i casi la ragione per la quale il numero delle osservazioni deve essere grande non ha nulla a che fare colla ragione per la quale deve esserlo in quella estensione del teorema di Bernouilli, che il Poisson battezzò legge dei grandi numeri. (lI Ofto. BENINl. Op. citata. Luogo citato. 12 CORRADO GIN! Quella dunque che il Bortkewitsch impropriamente chiamò legge dei piccoli numeri non si poteva in nessun senso Dontrapporre, come il nome avrebbe ben potuto far credere, alla legge dei grandi numeri del Poisson. Ancor meno si può parlare di una .legge dei piccoli numeri, se per piccoli numeri si intendono non i numeri (m) dei casi possibili su cui si fondano i singoli termini della serie, ma i piccoli numeri (X) dei casi in cui il fenomeno si è avv~rato. Infatti, da una parte, la piccolezza di tali numeri non porta, come notavamo, alcuna conseguenza sulla regolarità delle serie, in modo da autorizzare un nome speciale per designare il fatto di tale regolarità; dall'altra, ad ogni fenomeno raro fa riscontro un fenomeno complementare frequentissimo; ai suicidi di persone al di sotto dei lO anni fanno riscontro, ad esempio, i suicidi di persone ald~ sopra di lO anni, aIe morti di persone al di sotto di lO anni per causa non volontaria, secondo che si considera la frequenza dei suicidi di bambini in rapporto a tutti i suicidi o in rapporto a tutte le morti infantili. Ora i due fenomeni complementari sono regolati, come è noto, dalla stessa formula; la regolarità che mostra l'uno di essi è tutt'una colla regolarità che mostra l'altro; perciò se per piccoli numeri si intendono i numeri X,· che esprimono la frequenza dei fenomeni rari, la legge che li riguarda - se potesse costituire una legge a parte - si potrebbe, con altrettanta ragione, chiamare legge dei numeri grandissimi. Noi dobbiamo anche insistere qui su unaoircostanza che il Bortkewitsch nel suo opuscolo passa sotto silenzio. Non si deve punto ritenere che, mediante la formula (5), si esamini la regolarità del numero d,i volte assoluto in cui si avvera un fenomeno raro; si esamina sempre e solo la regolarità del numero di volte in cui esso si avvera in rapporto a un altro fenomeno, la regolarità In altre parole del q.uoziente del numero di volte in cui si avvvera per il numero di volte in cui si potrebbe avverare. Non si tratta della dispersione del numero medio assoluto J(; ma della di- LA LEGGE DEI PICCOU NUMERI , d el rapporto .J( ' l'l val01'1 ' x, ch e per sperSlOne -, l smgo m 13 aSCI'11 a,· zioni accidentali si ottengono nei termini della serie in luogo del valore medio K, sono soltanto il mezzo per decidere della regolarità del rapporto ~. Per convincersene, basta pensare che la formula (5) è un caso particolare della (4), la quale dà le probabilità delle varie combinazioni dei due fenomeni complementari che costiK tuiscono precisamente la dispersione teorica del rapporto-. m Il numero m dei casi considerati in ogni termine della serie sparisce nella formala (5); ma nòn per ciò si deve ritenere che la formula (5) ne sia indipendente: essa vale anzi solo per il caso che, m sia molto grande. In conseguenza, la l'ego· larità che sulla sua base si deduce non è la regolarità del numero assoluto K di volte in cui un fenomeno si avvera; ma la regolarità del rapporto X . m fra questo numero assoluto e il numero di volte - molto elevato .- in cui esso si' poteva avverare. Per es., non si può parlare, in base alle applicazioni del Bortkewitsch, di una regolarità del numero annuale dei suicidi di fanciulle al disotto dei lO anni; ma solo della regolarità della frequenza di questi suicidi in rapporto ad un fenomeno più generale molto frequente nei singoli anni; tale, ad es., il numero dei suicidi di femmine di tutte le età o il numero di fanciulle al di sotto dei lO anni che possono teoricamente suicidarsi. Sarebbe invece errato considerare come regolare la frequenza dei· suicidi di fanciulle al di sotto dei lO anni in rapporto ai suicidi di fanciulli dei due sessi della stessa età, perchè il numero annuale di questi ultimi suicidi è ben lungi diI raggiungere quell'altezza a cui deve rispondere 'In per rendere possibile il passaggio dalla formula (4) alla (5). Resta dunque stabilito che dalle applicazioni del Bortkewitsch non si può risalire alla regolarità del numero assoluto 14 CORRADO GINI di volte in cui un fenomeno raro si avvera; ma solo alla regolarità di questa sua frequenza in rapporto ad un fenomeno più generale, i cui casi siena molto numerosi. Se non che si dirà: ma come mai si può affermare sulla base di' un solo computo che un fenomeno mostri una frequenza regol~re relativa~ente a pa1'ecchi alt1·i fenomeni più generali? Prendiamo il caso dei suicidi di fanciulli al di sotto dei lO anni in Prussia; come mai potremo credere che lo stabilire la regolarità del rapporto di, tali suicidi al numero dei suicidi compleasivi sia tutt'uno collo stabilire la regolarità del rapporto di tali suicidi al numero di tutti i fanciulli che teoricamente avrebbero potuto suicidarsi, e similmente del rapporto di tali suicidi al numero di tutte le morti di fanciulli di codesta età o ancora al numero delle morti di persone di una età qual. siasi? Siamo ora giunti al punto capitale nella considerazione dei calcoli del Bortkewitsch. Codeste domande non restano senza risposta; ma la risposta è tale che toglie alle applicazioni del Bortkewitsch quasi ogni importanza. Nel passaggio dalla formula (4) alla (5), .si su ppone la costanza del prodotto p m = K; ora è già implicita nella formula (4) la costanza di p; ma la costanza di m è il frutto di un'ipotesi che nulla nella formula (4) autorizza. Il conformarsi della Ireq uenza del fenomeno considerato alla formula (5) non prova, per ciò, incondizionatamente il suo conformarsi alla formula (4); ma lo prova solo sull' ipotesi che m sia costante in tutti i termini della serie. Si intende, per ciò, co~e da un solo computo si possa affermare la rego-' larità della frequenza di un fenomeno relativamente a parecchi altri fenomeni più generali molto frequenti. Ciò avviene perchè tutti questi altri fenomeni generali sono supposti di una freq uenza invariabile in tutto il corso dell' osservazione: il fatto che l'uno sia più frequente dell'altro non ha praticamente, come si è visto, nessuna importanza quando tutti si &,vverano più di 1000 volte per ogni termine della serie. LA LEGGE DEI PICCOLI NUi\'lERI 15 Ma si intende anche che questa ipotesi dell'invariabilità di m è assolutamente gratuita. In fatto, essa non si avvera mai. Nel caso, ad es., dei suicidi annui di fanciulli al di sotto di lO anni, è evidente che il numero dei fanciulli prussiani al di sotto dei lO anni teoricamente esposti al suicidio, o il numero complessivo dei suicidi, o alfcora l'ammontare delle morti di fanciulli al di sotto dei lO anni, o· infine il totale di tutte le morti, varia di a·nno in anno. Ora quale importanza può avere il conoscere che la proporzione di un fenomeno A entro fenomeni più generali C, D, E sarebbe costante, se i fenomeni C, D, E mantenessero la stessa frequenza, quando si sa che effettivamente la frequenza dei fE'nomeni C, D, E è variabile ~ Quale interesse, ad esempio, possiamo annettere alla conclusione che il numero annuo degli infortuni mortali sul lavoro sarebbe costante rispetto al numero totale degli operai esposti, se ,questo non avesse variato di anno in anno, quando si sa a priori che questo numero totale varia? Evidentemente, l'importanza è nulla finchè non si conosca in quale maniera queste variazioni del fenomeno più generali si compiano. Invece, se si conosce ad esempio che il numero toti:j,le degli operai esposti a morire è andato aumentando, può avere un certo valore il risultato che la proporzione degli infortuni sul lavoro mortali sarebbe rimasta la stessa qualora codesto numero fosse stato stabile, perchè da ciò si può dedurre che effettivaUlente la frequenza degli infortuni mortali è diminuita. Similmente, se si conosce che la frequenza del fenomeno p:iù generale è andata diminuendo, si potrà dedurre che la proporzione' del fenomeno raro è cresciuta; e se infine si sa che il fenomeno più generale varia solo accidentalmente, si potrà concludere che veramente anche la proporzione che in esso rappresenta il feno~eno raro non subisce che oscilla7.ioni accidentali. Ma è chiaro che in tutti questi casi bisogna conoscere precisamente l'ammontare di m e misurare il senso 16 CORRADO GINI e l' intensità delle sue oscillazioni; così che viene a mancare quella semplicità che era la dote apparente delle applicazioni matematiche del Bortkewitsch. Per trarre, in fatti, una qualunque conclusione intorno alla regolarità o alla irregolarità di un fenomeno raro è necessario non solo conoscere la sua frequenza assoluta, ma anche la frequenza assoluta del fenomeno più generale, di cui quello non è che una modalità, e indagare se essa varia o no accidentalmente. La sicurezza delle conclusioni intorno alla regolarità del fenomeno raro dipende, d'altra parte, direttamente dalla sicurezza colla quale fu aceertata la regolarità del fenomeno più generale. Par questo matematicamente col metodo dei minimi quadrati, importerebbe una COID"f)licatezza di calcoli - dato l'ammont~re necessariamente grandissimo di m certo non corrispondente all'utilità dei risultati. Parlo approssimativamente, significa togliere alle conclusioni sulla regolarità del fenomeno raro quel valore obbiettivo che ci si propone nelle applicazioni del calcolo della probabilità. In un solo caso l'applicazione della formula (5) può essere raccomandabile: nel caso che vi sia la certezza a priori che m non vari o vari pochissimo e accidentalmente. Ciò può avvenire tutte le volte che m per legge debba avere una data altezza ed una grande altezza. I membri della Camera, ad esempio, sono in un numero prestabilito; tuttavia mediante la formula (5) non si potrebbe esaminare la regolarità del numero annllO delle condanne dei deputati, perohè il numero (m) dei deputati è troppo piccolo. E' invece press' a pooo fisso e molto alto il numero dei soldati che in ogni corpo di esercito sono addetti ai cavalli e restano quindi esposti a morire in seguito ad un caloia. Per ciò dalla corrispondenza, trovata dal Bortkewitsch, nella frequenza assoluta dei soldati prussiani che negli anni 1875-1894 fecero una tale fine, coi dati teorici derivati dalla formula (5), si potrà indurre che in codesto ventennio la probabilità piccolissima di morire in seguito a un calcio di cavallo rimase la stessa per ogni soldato prussiano. 1\1a sarebbe invece inesattqlndurne la costanza della pro- LA LEGGE DEI PICCOLI NUMERI 17 babilità che la morte di un soldato prussiano sia dipesa da un calcio di cavallo, fintanto che non si sia dimostrato ohe le oscillazioni che di anno in anno subisce il numero com· plessivo delle morti nei sin~oli corpi di esercito furono in codesto ventennio perfettamente accidentali, ciò che è già a prim'i poco probabile. S'intende, da questo, quanto si debba ridurre la portata delle su riferite applicazioni matematiche del Bortkewitsch. Dagl' indici di dispersione normale, per esempio, da lui trovati per i suicidI di fanciulli e di donne, e per gl' infortunI mortali sul lavoro, nessuna conclusione si può trarre riguardo alla regolarith di questi fenomeni, poichè non è, dato scorgere un fenomeno più generale (di cui questi fenomeni rappresenterebbero una modalità) la cui frequenza (m) sia costante nei singoli anni. E dagl'indici di dispersione normale per le morti dei soldat,i prussiani in seguito ad un calcio di oavallo si può indurre non la regolarità della frequenza assoluta di queste morti, ma solo la regolarità della proporzione di queste morti al numero dei soldati prussiani che vi sono esposti. Ed è chiaro anche perchè dalle a.pplicazioni matematiohe del Bortkewitsoh debba risultare una minore dispersione che .nelle consuete ed esatte applicazioni del oalcolo della probabilità. Tanto nelle applicazioni dona formula (5) quanto nell' esame dello scostamento medio di J(, si prescinde dalla incostanza di m, _che pure esiste. L'indice di dispersione di X, ohe cosÌ si~t~non è per ciò paragonabile coll'indice di dispersione di una serie di rapporti statistici; sarebbe necessario prima moltiplioarlo per l'indice di dispersione della frequenza assoluta di m, certo superiore normalmente all'unità. Soltanto per l'indioe di dispersione normale delle propor~ zioni dei soldati prussiani uccisi da un calcio di cavallo a tutti i soldati esposti a tale morte, non si può far valere co~ desta oonsiderazione, m essendo in questo caso costante. Ci si deve meravigliare che la proporzione di tali morti rare oscilli solo accidentalmente, mentre la proporzione del 19 CORRADO GINI LA LEGGE DEI PICCOLI NUMERI numero complessivo delle morti alla popolazione complessiva è notoriamente molto più variabile? Si avrebbe torto. Conviene considerare che non tutti i soldati prussiani esposti a morire per un calcio di cavallo vi sono esposti ugv.,almente; i soldati di cavalleria, ad esempio, lo saranno più, di quelli di artiglieria e, in una stessa arma, i. contabili lo saranno meno dei soldati di truppa e, ha questi, i graduati meno dei soldati semplici. D'altra parte, le proporzioni dei graduati. e dei contabili fra i soldati di un corpo, e dei soldati dei vari corpi. fra tutti i soldati delle armi a ca-vallo, sono .fissate dagli organici; non variano accidentalmente. La probabilità che un soldato prussiano resti vittima del calcio di un cavallo è dunque una probabil'ità media fra le differenti probabilità parziali che hanno di fare una tal fine i soldati dei vari corpi, dei vari gradi, dei vari utUci; e il peso di queste differenti probabilith parziali è costante, Il Bortkewitsch (l) chiama tali probabilità probabilità medie composte. Ora è noto che la precisione teorica di una probabilità media composta è maggiore (2) 'di quella data dalla formula: N el caso nostro, l'indice di dispersione normale della freq uenza media, colla q uale i soldati prussiani restano vittime di un caloio di cavallo, sta a mostrare che la frequenza di una tale fine nei singoli corpi, nei singoli impieghi, nei sin goli gradi oscilla più di quanto dovrebbe accadere per puro effetto ,del oaso. Anche questo fenomeno raro non presenta dunque alcun grado eooezionale di regolarità, ma si accorda oolla massima parte dei fenomeni - rari o frequenti - finora esaminati dagli statistici nel mostrare, attraverso il tempo, oscillazioni più forti delle acoidentali. 18 Non si tenga conto di tale circostanza, e si calcoli la precisione teorica, o lo scostamento q uadratico medio o lo scostamento probabile, come si trattas~è'èli una probabilità elementa1'e: si otterrà un indice di dispersione meno che nor~ale, qualora le probabilità parziali sieno costanti. Se ne deduce che, se si ottiene un indice di dispersione normale, ciÒ significa che le probabilità parziali variano durante il oorso della osservazione. *** .Riassumendo le nostre osservazioni intorno alla legge « dei piccoli numeri » del Bortkewitsch, possiamo dire: L Le applioazioni della formula KZe- K 1.2 .•.. x non autorizzano alcuna conclusione sul carattere accidentale o fisico delle oscillazioni a cui è soggetta la frequenza asso~ Iuta (K) di un fenomeno raro. II. Esse non autorizzano nemmeno, di per sè, una con· clusione sul carattere accidentale o fisico delle oscillazioni a . cui è soggetta la proporZIOne -K d'l un f enomeno ma lt o raro m a un altro fenomeno molto frequente, del quale il primo rappresenta una modalità. III. Tali applicazioni mostrano solo quando le oscillazioni della proporzione!f del primo fenomeno al secondo si po- (i) J{l"itische Betl'achlllltfjell ,elll" tlteoretisc/uJII Statistik. Arslel' Arlikel, Ja/trblicher Iii,. NatiulJalMollomie li. Stat., 1804, (2) So ne può vodet'e la dimostrazione nello OZUBE1~, op. cito (p. 130), El nell'art. qui sopr<1- citato del BORTlmwlTscH. m trebbero riguardare come accidentali, e quando si dovrebbero invece considerare come fisiche, am messo sempre che la frequenza assoluta (m) del secondo fenomeno fosse costante o va v 20 CORRADO GINI riasse accidentalmente. Esse perciò sono praticamente racco· mandabili nei rari casi in cui sia noto, a priori, che codesto secondo fenomeno debba raggiungere una frequenza (m) costante ed altissima. IV. Dal fatto che nelle applicazioni della formula !C'e - K ~~' come nel calcolo dello scostamento medio ](, si astrae dalle oscillazioni non accidentali della frequenza assoluta (m) del fenomeno generale" di cui il fenomeno raro (K) non costituisce che una modalità, deriva la fallace apparenza di ùna singolare regolarità della frequenza relativa K dei fenomeni m rari. V. Effettivamente, non vi ha alcun risultato che permetta di attribuire a q,uesti una regolarità superiore a quella degli altri rapporti statistici; ed in ogni modo è certo .che tale maggiore regolarità, ave si avverasse, non sarebbe punto la conseguenza della rarità dei fenomeni considerati. Non esiste quindi una legge dei piccoli numeri. CORRADO GINI. ERRATA-CORRIGE all' articolo sul 1'as80 di sconto dellet Brt!tw di Frfllitiet. Pago 725, linee 10 e 13: n mutamento del tasso è del 21 mm'30 () non del 20 maggio. Pago 722, linea 13: L'a,amento dol tasso di sconto è di y~ % c non di 2%.