ROMA
DIREZIONE DEIJ GIORNALE DEGLI ECONOil1IS 1'1
'
j\{ON7'ru SAVELLO - PALAZZO ORSINI
1907
."/
CORRADO GINI
LA .LEGGE DEI P1CCOLI NUMERI
Dal GIORNALE DEGLi EOONOMISTI
(VoI.
xxxv,
1;erìe 2", Settembr<' lQ07)
ROMA
DIREZIONE DEL GIONNALE DEGLi EOONOJnS'Tl
MON1'B SAvELLO
PAf,AZZO ORSINI
1907
I
l
I
l
,
I
i
cl
DIRITTI n'AU'I'ORE RISERVATI
~
In un ar~icolo apparso di recente sul Giornale degli Economisti (1), U. Broggi rimproverava al prof. R. Benini di non
aver ritratto esattamente (2) il carattere e la portata della
« legge dei piccoli numeri » di L. von Bortkewitsch.
Se con ciò il Broggi intendeva che il Benini aveva accennato ad un fondamento della legge dei piccoli numeri diverso
da quello assegnatole dal Bortkewitsch, egli aveva ragione.
Ma era piuttosto da esaminarsi se la spiegazione datane
dal Bortkewitsch era esatta. Ora, a mio modo di vedere, non
solo ciò è discutibile, ma è pure discutibile se si possa parlare di una legge speciale per i piccoli numeri e perfino se le
applicazioni matematiche ai fenomeni rari fornite dal Bortkewitsch possano autorizzare una conch;lsione sulla regolarità
della loro frequenza.
Il presente articolo si propone appunto di esaminare la porta,ta della cosÌ detta legge dei piccoli numeri di L. von Bortkewitsch.
In quel tratto di tempo che corse fra i lavori di Giacomo
Bernouilli e quelli del Poisson e che può ben definirsi il pe- ..
riodo d'oro della teèria delle probabilità, i concetti dominanti
intorno alla base filosofica della probabilità facevano sì che,
dal semplice fatto che un fenomeno appariva con una data frequenza, ci si ritenesse autorizzati, nell' ignoranza di ogni altra
(1) Note (tlla stai/dica metoilolo.lJìca del prof. BENINI. Gìo/'lul1e deglì
Economisti, mal'ZO, 1907.
(2) PrìJtcìjJl dì statìstica metodolopìca. Torino, Unione tipogmfico-edi·
tI'ice, 1906.
Roma - 'l'ipografia Nazionale di Gc Bertero e C.
5
CORRADO GINI
LA LEGGE DEI PICOOLI NUMERI
circostanza, di attribuirgli una probabilità matematica corrispondente.
CosÌ i Bernonilli (l), Condorcet (2), Laplace (3), Black (4),
Poisson (5), Quetelet (6), Herschell (7), applicavano senz'altro
il calcolo delle probabilità a prevedere la frequenza dei sessi
nelle nascite o a misurare l'influenza del caso nelle elezioni,·
nei verdetti delle giurie o nei risultati di una cura medica,
nell'identico modo con cui lo applicavano a determinare la
probabilità delle varie combinazioni nei giochi di azzardo.
La reazione contro la scuola classica, che il Cournot (8) e
il Fries (9) iniziarono e che ottenne la sua più alta espressione nell'opera del von Kries (lO), mise in luce i difetti di un
tale ingenuo procedimento. Il Dormoy (Il) e il Lexis (12) additarono il metodo corretto che si doveva sostituirgli. Non sulla
base del concetto di probabilità, nè su quella del suo principio fondamentale - insisteva il Lexis - si può ritenere che
la frequenza di un fenomeno si uniformi alle regole teoriche
del calcolo; ma solo sulla base della nostra esperienza, la
quale ci mostri che effettivamente essa si comporta come i
risultati di un gioco puramente di azzardo. Essi aprivftno
cosÌ la via a quelle applicazioni del calcolo delle probabilità
che si potrebbero bene qualificare investigatrici, essendo dirette ad investigare se ed in quallto un fenomeno si conforma
alle norme teoriche del calcolo.
Il metodo è semplice. Si suppone che la probabilità semplice sconosciuta di un fenomeno A rimanga costante durante
tutto il corso dell' osservazione. Allora il teorema di ,Bayes
permette di indurre codesta sua probabilità semplice dalla sua
frequenza. Il valore più probabile della probabilità di A è
dato dal numero dei casi, in cui esso si è avverato, diviso per
il numero complessivo dei casi osservati; e la probabilità che.
codesto valore differisca dalla probabilità vera meno di una
quantità assegnata, cresce col crescere del numero dei casi osservati. Determinata cosÌ con sufficiente approssimazione su
un gran numero (n m) di casi la probabilità semplice del
fenomeno A, il <'alcolo combinatorio insegna che la probabilità 9-e11e varie combinazioni di questo fenomeno A e del suo
contrario B, in un numero di casi m, è data, dai singoli termini di sviluppo del binomio (p + q) m, dove p indica la probabilità del fenomeno considerato, q = l - P la probabilità del
suo contrario. Divisi poi gli n m oasi complessivamente os~
servati in n gruppi ciascuno di m casi, si riscontra se le varie
combinazioni dei fenomeni A e B compaiono in questi n gruppi
con una frequenza corrispondente alle loro probabilità calcolate dalla teoria. Se sì, si conclude che l'ipotesi da cui si era
partiti si può ritenere formalmente esatta, vale a dire che le
proporzioni del fenomeno A negli n gruppi di m casi oscillano
come se il fenomeno A 'fosse dotato di una probabilità semplice costante in tutti gli n m casi bsservati.
Si intende però agevolmente quale enorme complicazione
di calcoli importerebbe lo sviluppo del binomio (p + q) m,
non appena il numero m dei casi dei singoli gruppi fosse appena un poco elevato.
4
(1) G. BERNOUILLT. Al's cO/liectandi. 1713 (Op.·postumn).
D. BERNOUILLL Specimen tlteoriae riovae de mensul'{l ,90l'tiS. 1730
o 1731.
(2) Ess(d sm' l'applicatioll cle l'(t}wlgse à la pl'obabilité cles t!écisiolls
l'emllles à la pllll'alité des l'O ix. 1785.
(3) 'l'Mol'ie mwllltifJue cles Jll'obabilftr!s. 1812. - Essai pltilosophiqlW cles
jil'obabilités.
(4,) Analyse ttl'it/wlIJtique et mr!dicale des maladies et de la mOl'taliN de
l'espèce humail1e. 1789.
(5) Rec1terc1tes Slll' la jJl'obabilitl! cles jUi/ements. 1837.
(6) 'l'hr!orie cles pl'obabilith. 1845.
(7) SUI' la tlzéorie cles pl'obabitités et ses (t]Jjllicatiolls au;, scìences plty.
siques et sociales. 1850.
(8) EXj!osition de la tltéorie des chm/ces et des pl'obabilités. 1843.
t9) Versuch eiJwl' ]{l'itik del' Pl'iT/cipien del' Wrt1tl'sc1teinlicltkeitsl'ech·
liIut/J. 1842.
(10) Die Pl'incipien del' WaltrsclteinlicJtkeitsl'ecltmwg. 1886.
(li) l'ltéol'ie matltématìqlte des a8B1l1'{/.IICeS sm' la vie. 1878. Lo stosso idoo
furono prima esposto dal DOR~(OY sul Jo/tl'na.l des act;wil'cs franrais, 1876.
(12) Das GcscJtlcc/i.tslJel'fliìltl!iss del' GebOl'enen IlIlil die Waltl'sclteilltic/t·
keilsl'ecltltl!ng. 1874.
2111' 'l'heol'ie del' lJ1assenerscltci!mllgeli. 1877.
Uebel' clie 'l'lteorie del' Stabilitiil del' statistiscltell Reilten. 1879.
6
7
CORRADO GINl
LA LEGGE DEI PICOOLl NUMERr
Si imponeva perciò una semplificazione del metodo. Si osservò che si ha la probabilità Y2 che, nei singoli gruppi di m'
casi, il fenomeno A mostri una frequenza che non si discosta
dalla sua frequenza più probabile (uguale alla probabilità semplice) di una quantità superiore a
Q > 1 è indice di dispersione più che normale, Q' <. 1 è indice
di dispersione meno che normale.
Il confronto può stabilirsi, invece che tra gli scostamenti
probabili, tra qu~ntità ehecon lo scostamento probabile stanno
in relazione costante; tali ad esempio lo scostamento q uadra~
tico medio (f)
l'
= + 0.4769 ...
\/2
~.!l
(l)
Si chiamò tale 8costamento, SGostamento (od errore) probabile; e il metodo, col quale lo si determina, combinatorio, statistico (Lexis) o 'indiretto (Bortkewitscb). Dal confronto di
questo scostamento teorico collo scostamento che nel fatto si
trova oltrepassato in metà degli n gruppi considerati (determinazione empirica dello scostamento probabile), si ha un primo
criterio sommario per decidere se la frequenza del fenomeno
A sia regolata dal caso. Questo confronto richiede però che il
numero (n) dei gruppi considerati sia notevòlmente grande.
Per ovviare a tale inconveniente, si pensò di paragonare lo 8COstamento probabile l' coll' altro
R=+0.4769 ...
,,~
o la precisione (h)
Questi confronti, mediante lo scostamento probabile, lo scost:).mento quadratico medio o la precisione, sono validi qualunque sia il va10re di p ed m, ma sono molto sommarl:. Si usa
procedere a confronti più accurati fra la frequenza effettiva
delle varie .combinazioni e la; loro probabilità teorica mediante
la formula
v-_··
l
'!f"[d2]
V
n
dedotto, col metodo dei minimi quadrati, dagli scostàmenti d
effetbivamente verificati negli n gruppi: metodo fisico (Lexis)
o diretto (Bortkewitsch).
Il quoziente
R
Q=-,
r
detto coefficiente di divergenza (Dormoy) o 1'elazione degli scostamenti (Bortkewitsch), può venir preso come indice della regolarità della proporzione del fenomeno A o, come suoI dirsi,
della sua dispersione. Q = 1 significa che le oscillazioni che
la proporzione del fenomeno A mostra negli n gruppi sono
puramente casuali, e si dice indice di dispersione normale.
-
e
-
h"z" .
h:1x,
(3)
1[
dove è il solito numero di Lud?lph, e la base eli logaritmi
naturali (= 2. 71828), h la precisione dedotta col metodo diretto o indiretto, :1 x la differenza x' -:1:: fra due scostamenti.
La formula (3) dà appunto la probabilità che uno scosta
mento cada, entro i limiti x' - X,' e, poichè in essa ogni quan~
tità è costante tranne X e h, si costruirono tavole dalle
quali, conoscendo quef'ti due termini, si deduce immediatamen~e la probabilità ricercata.
Però la formula (3) è valida fin tanto che il prodotto m p q
sia un numero sufficientemente elevato
Essa non può più servire quindi per fenomeni molto rari,
in cui p si avvicini sensibilmente allo O.
1[
8
I.A LEGGE DEI l'ICCOLf NUMERI
CORRADO GINI
c) dei suicidi di fanciulli dei due sessi,della età suddetta,
in Prussia nel medesimo periodo;
d) dei suicidi di donne in otto piccoli Stati tedesehi negli
anni 188F1894;
e) degli infortuni sul lavato seguiti da morte, registrati
da undici Leghe professionali (1886-1894);
f) dei soldati prussiani uccisi da un calcio di cavallo
(1875-1894) ;
g) dei soldati prussiani di alcuni Corpi d'esercito (esclusi
. i Corpi d'esercito I, II, XI, e la Guardia) uccisi da un calcio
di cavallo (1875-1894).
La coincidenza fra i dati dedotti dalla formula (5) e quelli
riscontrati empiricamente è sempre soddisfacentissima.
Per darne la misura il Bortkewitsch ricorse al confronto
fra l'errore medio di K, calcolato col metadò indiretto, e quello
A completare questa lacuna si rivolse il Bortkewitsch (l).
Egli osservò che il termine generale di sviluppo del binomi
(p + q)m
m(m-l)
1.2
(m-x+l)
p q
x
(4)
il quale dà la probabilità che un fenomeno A dotato di una
probabilità p si avveri x volte su m casi, tende a divenire
re-
1:"2
K
00
. . . . . .
x
(5)
qualora m tenda all'infinito, p a O ed m p = K rimanga costante (2).
Basta però praticamente che m raggiunga il migliaio e p
non superi il lO, per che la formula (5) possa servire.
Sulla sua base si costruiscono tavole dalle quali, conoscendo
la frequenza' media J( di un fenomeno A, si deduce immediatamente la probabilità che esso si avveri un determinato numero di volte.
Non è necessario, invece, conoscere il numero (m) dei casi
possibili, nè la probabilità (p) del fenomeno A, m e p non oomparendo nella formulà (5).
Si oonfronta poi se nel 'fatto il fenomeno considerato si
presenta con nna data frequenza tante volte quante secondo
la formula (5) sarebbe da attendersi.
Il Bortkewitsch esaminò così la regolarità della frequenza
di parecchi fenomeni rari.; e precisamente:
a) dei suicidi di fanciulli maschi al di sotto di lO anni
in Prussia 0$69-1893);
b) dei suicidi di fanciulle, pure al di sotto di lO anni,
in Prussia (1869-1893);
(l) Das Gesetz del' kleinen Zahlen. Leipr.ig, Teubnel' 1898.
(2) Vedi la dimostrazione di questo pass>tggio nei BENINI, op. citata,
pago 337, nota.
9
calcolato col metodo diretto. Il primo (f) è uguale a V rrl:pq; e,
poichè q= l -:- p è sensibilmente uguale a l, ed è mp=k, t si
.1
potrà ritenere uguale a' V'l{ Il secondo
=\/n~1
i
'1I
\
'!f! è
. r[azT
j
dove n indica il numero dei gruppI In oui si sono suddivisi
gli n m casi possibili del fenomeno considerato (negl; esempi
del Bortkewitsch n è il numero degli anni), e d le diffél'enze
fra la frequenza media annuale del fenomeno considerato e
la freqùenza effettiva riscontrata nei singoli anni.
•Q=
Tha nei vari esempi trattati dal
guenti valori:
a) 1.12
b) O. 8R
c) 0.99
d) 1.15
e) 1. 12
f) 1. 01
(I) 1.00
*
Bortkewitsch
se·
10
CORRADO GIN!
I fenomeni rari, conclude il Bortkewitsch, mostrano dunque
regolarmente una dispersione assolutamente normale, mentre
ciò non si avvera che in via di eccezione per i fenomeni più
frequenti.
Precisamente, il solo rapporto sessuale delle nascite mostra,
fra questi, una dispersione normale; in tutte le altre serie di
rapporti statistici, gli scostamenti effettivi sono molto maggiori dei teorici.
Quale la ragione di questa differenza?
Il Lexis aveva già fatto notare che negli scostamenti effettivi dei singoli rapporti statistici dal rapporto statistico
medio, si possono distinguere due componenti, di cui 1'una
rappresenta le cause accidentali degli scostamenti e 1'altra
le cause non accidentali. La prima (componente normale) sta in
ragione inversa del quadrato del numero dei casi (m) sucui ciascun rapporto statistico si fonda; la seconda (componente fisica)
rimane invariata, qualunque sia 1'ammontare della prima.
Perciò, col cresbere del numero (m) dei casi su cùi i singoli
rapporti si basano, 'gli scostamenti teorici diminuiranno più
rapidamente degli effettivi; crescerà quindi 1'ammontare di Q,
ciò è a dire risalterà maggiormente ii carattere più che normale della dispersione.
Il Bortkewitsch fa notare che ciò, come è vero per gli
scostamenti dei singoli rapporti statistici dal rapporto statistico medio, cosÌ lo è per gH scostamenti della frequenza
di un fenomeno nei singoli gruppi, dalla sua frequenza media;
e ciò indipendentemente dal valore p delle probabilità dei
fenomeni considerati, e quindi anche se essa è molto piccola.
Si spiega quindi - egli conclude - la regolarità eccezionale delle serie sopra esaminate; ciò si deve al fatto che si
tratta di fenomeni per cui è ristretto il campo d'osservazione,
di fenomeni che si avverano raramente. A designare il fatto
del loro uniformarsi tutto particolare alle norme del calcolo
si può usare la denominazione speciale di « legge dei piccoli
numeri ».
11
LA LEGGE DEI PICCOLT NUMERI
***
E' evidente l'equivoco nel quale il Bortkewitsch è incorso
in questa conclusione.
La rarità dei fenomeni dipende non dalla ristrettezza del
campo di osservazione, ma dalla loro piccola probabilità; K è
piccolo, non m; anzi, per passare dalla formula (4) alla (5), si
suppone che 171, sia un numero molto elevato -- teoricamente
infinitamente elevato, praticamente non inferiore al migliaio.
Vampiezza delle singole rilevazioni è così una condizione non
meno per la formula (5), usata dal Bortkewitsch, che per la
formula (3), adoperata per le serie di comuni rapporti statistici.
Non vi è dunque nessuna ragione di parlare per i fenomeni
l'ari di una legge dei piccoli numeri, se per piccoli numeri si
intendono i numeri delle osservazioni su cui si basano i singoli termini delle serie.
Così nel caso di fenomeni l'ari, nel quale si fa uso della formula (5), come nel caso di fenomeni più frequenti, nel quale
si usa la formula (3), questi numeri devono essere grandi,
benchè per diverse ragioni: nel caso che p e q non siano
molto diversi, perchè il prodotto mpq sia sufficientemente
elevato; nel caso che p sia prossimo allo zero, perche sia approssimativamente (l)
(l'
\
m
e
K)m _-e
-m
m-l
-K
m-x+l
m.::.g . m~=X"'" -- m-o K =
l
Giova anche notare che in ambedue i casi la ragione per
la quale il numero delle osservazioni deve essere grande non
ha nulla a che fare colla ragione per la quale deve esserlo
in quella estensione del teorema di Bernouilli, che il Poisson
battezzò legge dei grandi numeri.
(lI Ofto.
BENINl.
Op. citata. Luogo citato.
12
CORRADO GIN!
Quella dunque che il Bortkewitsch impropriamente chiamò
legge dei piccoli numeri non si poteva in nessun senso Dontrapporre, come il nome avrebbe ben potuto far credere, alla
legge dei grandi numeri del Poisson.
Ancor meno si può parlare di una .legge dei piccoli numeri,
se per piccoli numeri si intendono non i numeri (m) dei casi
possibili su cui si fondano i singoli termini della serie, ma i
piccoli numeri (X) dei casi in cui il fenomeno si è avv~rato.
Infatti, da una parte, la piccolezza di tali numeri non porta,
come notavamo, alcuna conseguenza sulla regolarità delle serie,
in modo da autorizzare un nome speciale per designare il
fatto di tale regolarità; dall'altra, ad ogni fenomeno raro fa
riscontro un fenomeno complementare frequentissimo; ai suicidi
di persone al di sotto dei lO anni fanno riscontro, ad esempio,
i suicidi di persone ald~ sopra di lO anni, aIe morti di persone al di sotto di lO anni per causa non volontaria, secondo
che si considera la frequenza dei suicidi di bambini in rapporto a tutti i suicidi o in rapporto a tutte le morti infantili.
Ora i due fenomeni complementari sono regolati, come è noto,
dalla stessa formula; la regolarità che mostra l'uno di essi è
tutt'una colla regolarità che mostra l'altro; perciò se per piccoli numeri si intendono i numeri X,· che esprimono la frequenza dei fenomeni rari, la legge che li riguarda - se potesse
costituire una legge a parte - si potrebbe, con altrettanta
ragione, chiamare legge dei numeri grandissimi.
Noi dobbiamo anche insistere qui su unaoircostanza che il
Bortkewitsch nel suo opuscolo passa sotto silenzio.
Non si deve punto ritenere che, mediante la formula (5),
si esamini la regolarità del numero d,i volte assoluto in cui
si avvera un fenomeno raro; si esamina sempre e solo la regolarità del numero di volte in cui esso si avvera in rapporto a un altro fenomeno, la regolarità In altre parole del
q.uoziente del numero di volte in cui si avvvera per il numero di volte in cui si potrebbe avverare. Non si tratta
della dispersione del numero medio assoluto J(; ma della di-
LA LEGGE DEI PICCOU NUMERI
,
d el rapporto .J(
'
l'l val01'1
' x, ch e per
sperSlOne
-, l smgo
m
13
aSCI'11 a,·
zioni accidentali si ottengono nei termini della serie in luogo
del valore medio K, sono soltanto il mezzo per decidere della
regolarità del rapporto
~.
Per convincersene, basta pensare che la formula (5) è
un caso particolare della (4), la quale dà le probabilità delle
varie combinazioni dei due fenomeni complementari che costiK
tuiscono precisamente la dispersione teorica del rapporto-.
m
Il numero m dei casi considerati in ogni termine della serie
sparisce nella formala (5); ma nòn per ciò si deve ritenere
che la formula (5) ne sia indipendente: essa vale anzi solo
per il caso che, m sia molto grande. In conseguenza, la l'ego·
larità che sulla sua base si deduce non è la regolarità del
numero assoluto K di volte in cui un fenomeno si avvera;
ma la regolarità
del rapporto X
.
m fra questo numero assoluto e
il numero di volte - molto elevato .- in cui esso si' poteva
avverare. Per es., non si può parlare, in base alle applicazioni
del Bortkewitsch, di una regolarità del numero annuale dei
suicidi di fanciulle al disotto dei lO anni; ma solo della regolarità della frequenza di questi suicidi in rapporto ad un
fenomeno più generale molto frequente nei singoli anni; tale,
ad es., il numero dei suicidi di femmine di tutte le età o il
numero di fanciulle al di sotto dei lO anni che possono teoricamente suicidarsi. Sarebbe invece errato considerare come
regolare la frequenza dei· suicidi di fanciulle al di sotto dei
lO anni in rapporto ai suicidi di fanciulli dei due sessi
della stessa età, perchè il numero annuale di questi ultimi
suicidi è ben lungi diI raggiungere quell'altezza a cui deve
rispondere 'In per rendere possibile il passaggio dalla formula (4)
alla (5).
Resta dunque stabilito che dalle applicazioni del Bortkewitsch non si può risalire alla regolarità del numero assoluto
14
CORRADO GINI
di volte in cui un fenomeno raro si avvera; ma solo alla
regolarità di questa sua frequenza in rapporto ad un fenomeno più generale, i cui casi siena molto numerosi.
Se non che si dirà: ma come mai si può affermare sulla
base di' un solo computo che un fenomeno mostri una frequenza
regol~re relativa~ente a pa1'ecchi alt1·i fenomeni più generali?
Prendiamo il caso dei suicidi di fanciulli al di sotto dei lO anni
in Prussia; come mai potremo credere che lo stabilire la regolarità del rapporto di, tali suicidi al numero dei suicidi compleasivi sia tutt'uno collo stabilire la regolarità del rapporto
di tali suicidi al numero di tutti i fanciulli che teoricamente
avrebbero potuto suicidarsi, e similmente del rapporto di tali
suicidi al numero di tutte le morti di fanciulli di codesta età
o ancora al numero delle morti di persone di una età qual.
siasi?
Siamo ora giunti al punto capitale nella considerazione dei
calcoli del Bortkewitsch.
Codeste domande non restano senza risposta; ma la risposta
è tale che toglie alle applicazioni del Bortkewitsch quasi ogni
importanza.
Nel passaggio dalla formula (4) alla (5), .si su ppone la
costanza del prodotto p m = K; ora è già implicita nella formula (4) la costanza di p; ma la costanza di m è il frutto
di un'ipotesi che nulla nella formula (4) autorizza.
Il conformarsi della Ireq uenza del fenomeno considerato
alla formula (5) non prova, per ciò, incondizionatamente il
suo conformarsi alla formula (4); ma lo prova solo sull' ipotesi
che m sia costante in tutti i termini della serie. Si intende,
per ciò, co~e da un solo computo si possa affermare la rego-'
larità della frequenza di un fenomeno relativamente a parecchi
altri fenomeni più generali molto frequenti. Ciò avviene perchè
tutti questi altri fenomeni generali sono supposti di una freq uenza invariabile in tutto il corso dell' osservazione: il fatto
che l'uno sia più frequente dell'altro non ha praticamente,
come si è visto, nessuna importanza quando tutti si &,vverano
più di 1000 volte per ogni termine della serie.
LA LEGGE DEI PICCOLI NUi\'lERI
15
Ma si intende anche che questa ipotesi dell'invariabilità di
m è assolutamente gratuita.
In fatto, essa non si avvera mai. Nel caso, ad es., dei
suicidi annui di fanciulli al di sotto di lO anni, è evidente
che il numero dei fanciulli prussiani al di sotto dei lO anni
teoricamente esposti al suicidio, o il numero complessivo dei
suicidi, o alfcora l'ammontare delle morti di fanciulli al di
sotto dei lO anni, o· infine il totale di tutte le morti, varia
di a·nno in anno.
Ora quale importanza può avere il conoscere che la proporzione di un fenomeno A entro fenomeni più generali C, D,
E sarebbe costante, se i fenomeni C, D, E mantenessero la
stessa frequenza, quando si sa che effettivamente la frequenza
dei fE'nomeni C, D, E è variabile ~
Quale interesse, ad esempio, possiamo annettere alla conclusione che il numero annuo degli infortuni mortali sul lavoro sarebbe costante rispetto al numero totale degli operai
esposti, se ,questo non avesse variato di anno in anno, quando
si sa a priori che questo numero totale varia?
Evidentemente, l'importanza è nulla finchè non si conosca
in quale maniera queste variazioni del fenomeno più generali
si compiano. Invece, se si conosce ad esempio che il numero
toti:j,le degli operai esposti a morire è andato aumentando, può
avere un certo valore il risultato che la proporzione degli
infortuni sul lavoro mortali sarebbe rimasta la stessa qualora
codesto numero fosse stato stabile, perchè da ciò si può dedurre
che effettivaUlente la frequenza degli infortuni mortali è diminuita.
Similmente, se si conosce che la frequenza del fenomeno
p:iù generale è andata diminuendo, si potrà dedurre che la
proporzione' del fenomeno raro è cresciuta; e se infine si sa
che il fenomeno più generale varia solo accidentalmente,
si potrà concludere che veramente anche la proporzione che
in esso rappresenta il feno~eno raro non subisce che oscilla7.ioni accidentali. Ma è chiaro che in tutti questi casi bisogna
conoscere precisamente l'ammontare di m e misurare il senso
16
CORRADO GINI
e l' intensità delle sue oscillazioni; così che viene a mancare
quella semplicità che era la dote apparente delle applicazioni
matematiche del Bortkewitsch. Per trarre, in fatti, una qualunque conclusione intorno alla regolarità o alla irregolarità
di un fenomeno raro è necessario non solo conoscere la sua
frequenza assoluta, ma anche la frequenza assoluta del fenomeno più generale, di cui quello non è che una modalità, e
indagare se essa varia o no accidentalmente.
La sicurezza delle conclusioni intorno alla regolarità del
fenomeno raro dipende, d'altra parte, direttamente dalla sicurezza colla quale fu aceertata la regolarità del fenomeno
più generale. Par questo matematicamente col metodo dei
minimi quadrati, importerebbe una COID"f)licatezza di calcoli
- dato l'ammont~re necessariamente grandissimo di m certo non corrispondente all'utilità dei risultati. Parlo approssimativamente, significa togliere alle conclusioni sulla regolarità
del fenomeno raro quel valore obbiettivo che ci si propone
nelle applicazioni del calcolo della probabilità.
In un solo caso l'applicazione della formula (5) può essere
raccomandabile: nel caso che vi sia la certezza a priori che
m non vari o vari pochissimo e accidentalmente. Ciò può avvenire tutte le volte che m per legge debba avere una data
altezza ed una grande altezza. I membri della Camera, ad
esempio, sono in un numero prestabilito; tuttavia mediante
la formula (5) non si potrebbe esaminare la regolarità del numero annllO delle condanne dei deputati, perohè il numero (m)
dei deputati è troppo piccolo. E' invece press' a pooo fisso
e molto alto il numero dei soldati che in ogni corpo di esercito sono addetti ai cavalli e restano quindi esposti a morire
in seguito ad un caloia. Per ciò dalla corrispondenza, trovata
dal Bortkewitsch, nella frequenza assoluta dei soldati prussiani
che negli anni 1875-1894 fecero una tale fine, coi dati teorici
derivati dalla formula (5), si potrà indurre che in codesto
ventennio la probabilità piccolissima di morire in seguito a un
calcio di cavallo rimase la stessa per ogni soldato prussiano.
1\1a sarebbe invece inesattqlndurne la costanza della pro-
LA LEGGE DEI PICCOLI NUMERI
17
babilità che la morte di un soldato prussiano sia dipesa da
un calcio di cavallo, fintanto che non si sia dimostrato ohe
le oscillazioni che di anno in anno subisce il numero com·
plessivo delle morti nei sin~oli corpi di esercito furono in codesto ventennio perfettamente accidentali, ciò che è già a
prim'i poco probabile.
S'intende, da questo, quanto si debba ridurre la portata
delle su riferite applicazioni matematiche del Bortkewitsch.
Dagl' indici di dispersione normale, per esempio, da lui trovati per i suicidI di fanciulli e di donne, e per gl' infortunI
mortali sul lavoro, nessuna conclusione si può trarre riguardo
alla regolarith di questi fenomeni, poichè non è, dato scorgere
un fenomeno più generale (di cui questi fenomeni rappresenterebbero una modalità) la cui frequenza (m) sia costante nei
singoli anni. E dagl'indici di dispersione normale per le morti
dei soldat,i prussiani in seguito ad un calcio di oavallo si può
indurre non la regolarità della frequenza assoluta di queste
morti, ma solo la regolarità della proporzione di queste morti
al numero dei soldati prussiani che vi sono esposti.
Ed è chiaro anche perchè dalle a.pplicazioni matematiohe
del Bortkewitsoh debba risultare una minore dispersione che
.nelle consuete ed esatte applicazioni del oalcolo della probabilità. Tanto nelle applicazioni dona formula (5) quanto
nell' esame dello scostamento medio di J(, si prescinde dalla
incostanza di m, _che pure esiste. L'indice di dispersione
di X, ohe cosÌ si~t~non è per ciò paragonabile coll'indice di dispersione di una serie di rapporti statistici; sarebbe
necessario prima moltiplioarlo per l'indice di dispersione della
frequenza assoluta di m, certo superiore normalmente all'unità.
Soltanto per l'indioe di dispersione normale delle propor~
zioni dei soldati prussiani uccisi da un calcio di cavallo a
tutti i soldati esposti a tale morte, non si può far valere co~
desta oonsiderazione, m essendo in questo caso costante.
Ci si deve meravigliare che la proporzione di tali morti
rare oscilli solo accidentalmente, mentre la proporzione del
19
CORRADO GINI
LA LEGGE DEI PICCOLI NUMERI
numero complessivo delle morti alla popolazione complessiva
è notoriamente molto più variabile?
Si avrebbe torto.
Conviene considerare che non tutti i soldati prussiani esposti
a morire per un calcio di cavallo vi sono esposti ugv.,almente;
i soldati di cavalleria, ad esempio, lo saranno più, di quelli di
artiglieria e, in una stessa arma, i. contabili lo saranno meno
dei soldati di truppa e, ha questi, i graduati meno dei soldati semplici. D'altra parte, le proporzioni dei graduati. e dei
contabili fra i soldati di un corpo, e dei soldati dei vari corpi.
fra tutti i soldati delle armi a ca-vallo, sono .fissate dagli organici; non variano accidentalmente.
La probabilità che un soldato prussiano resti vittima del
calcio di un cavallo è dunque una probabil'ità media fra le
differenti probabilità parziali che hanno di fare una tal fine
i soldati dei vari corpi, dei vari gradi, dei vari utUci; e il
peso di queste differenti probabilith parziali è costante, Il
Bortkewitsch (l) chiama tali probabilità probabilità medie
composte. Ora è noto che la precisione teorica di una probabilità media composta è maggiore (2) 'di quella data dalla
formula:
N el caso nostro, l'indice di dispersione normale della freq uenza media, colla q uale i soldati prussiani restano vittime
di un caloio di cavallo, sta a mostrare che la frequenza di
una tale fine nei singoli corpi, nei singoli impieghi, nei sin
goli gradi oscilla più di quanto dovrebbe accadere per puro
effetto ,del oaso.
Anche questo fenomeno raro non presenta dunque alcun
grado eooezionale di regolarità, ma si accorda oolla massima
parte dei fenomeni - rari o frequenti - finora esaminati dagli
statistici nel mostrare, attraverso il tempo, oscillazioni più
forti delle acoidentali.
18
Non si tenga conto di tale circostanza, e si calcoli la precisione teorica, o lo scostamento q uadratico medio o lo scostamento probabile, come si trattas~è'èli una probabilità elementa1'e: si otterrà un indice di dispersione meno che nor~ale,
qualora le probabilità parziali sieno costanti. Se ne deduce
che, se si ottiene un indice di dispersione normale, ciÒ significa che le probabilità parziali variano durante il oorso della
osservazione.
***
.Riassumendo le nostre osservazioni intorno alla legge « dei
piccoli numeri » del Bortkewitsch, possiamo dire:
L Le applioazioni della formula
KZe-
K
1.2 .•.. x
non autorizzano alcuna conclusione sul carattere accidentale
o fisico delle oscillazioni a cui è soggetta la frequenza asso~
Iuta (K) di un fenomeno raro.
II. Esse non autorizzano nemmeno, di per sè, una con·
clusione sul carattere accidentale o fisico delle oscillazioni a
.
cui è soggetta la proporZIOne
-K d'l un f enomeno ma lt o raro
m
a un altro fenomeno molto frequente, del quale il primo rappresenta una modalità.
III. Tali applicazioni mostrano solo quando le oscillazioni
della proporzione!f del primo fenomeno al secondo si po-
(i) J{l"itische Betl'achlllltfjell ,elll" tlteoretisc/uJII Statistik. Arslel' Arlikel,
Ja/trblicher Iii,. NatiulJalMollomie li. Stat., 1804,
(2) So ne può vodet'e la dimostrazione nello OZUBE1~, op. cito (p. 130),
El nell'art. qui sopr<1- citato del BORTlmwlTscH.
m
trebbero riguardare come accidentali, e quando si dovrebbero
invece considerare come fisiche, am messo sempre che la frequenza assoluta (m) del secondo fenomeno fosse costante o va
v
20
CORRADO GINI
riasse accidentalmente. Esse perciò sono praticamente racco·
mandabili nei rari casi in cui sia noto, a priori, che codesto
secondo fenomeno debba raggiungere una frequenza (m) costante
ed altissima.
IV. Dal fatto che nelle applicazioni della formula
!C'e -
K
~~'
come nel calcolo dello scostamento medio ](, si astrae dalle
oscillazioni non accidentali della frequenza assoluta (m) del
fenomeno generale" di cui il fenomeno raro (K) non costituisce che una modalità, deriva la fallace apparenza di ùna
singolare regolarità della frequenza relativa K dei fenomeni
m
rari.
V. Effettivamente, non vi ha alcun risultato che permetta
di attribuire a q,uesti una regolarità superiore a quella degli
altri rapporti statistici; ed in ogni modo è certo .che tale
maggiore regolarità, ave si avverasse, non sarebbe punto la
conseguenza della rarità dei fenomeni considerati. Non esiste
quindi una legge dei piccoli numeri.
CORRADO GINI.
ERRATA-CORRIGE
all' articolo sul 1'as80 di sconto dellet Brt!tw di Frfllitiet.
Pago 725, linee 10 e 13: n mutamento del tasso è del 21 mm'30 () non
del 20 maggio.
Pago 722, linea 13: L'a,amento dol tasso di sconto è di y~ % c non di 2%.
Scarica

DIREZIONE DEIJ GIORNALE DEGLI ECONOil1IS ` 1`1