C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
Capitolo 6. Il problema dei fondamenti. 1
6.1. Il metodo assiomatico.
Il maggiore lascito greco in Matematica è consistito nel metodo ipotetico-deduttivo per il trattamento della Geometria. Per più di duemila anni questo paradigma è rimasto invariato e quindi è stato
una pietra di paragone per l’evoluzione delle altre scienze. Solo quando, alla fine del Rinascimento,
si realizza la cosiddetta rivoluzione scientifica, le scienze sperimentali propongono una ‘ribellione’
motivata contro il metodo ipotetico-deduttivo, che apparentemente sconfitto, attende tempi migliori. Ma saranno tempi che verranno perché il metodo rimarrà una
sorta di ideale da perseguire quando le scienze, uscite dalla tumultuosa infanzia,
cercheranno di darsi un ‘abito’ di migliore qualità e ‘rispettabilità’. In certo senso
questa affermazione parafrasa alcune idee di Comte sull’evoluzione delle scienze.
Auguste Comte
(1798 – 1857)
Conseguenza del metodo proposto dai Greci è che la conoscenza si articola sotto
forma di dimostrazioni, che si avvalgono di una impostazione logica spesso basata sul linguaggio
comune e non esente da pecche, in sostanza non chiarita fino in fondo. Alla base di tutto il sistema,
c’è il buon senso e l’ovvietà che forniscono le garanzie necessarie per non cadere in contraddizione
(ed anche un continuo controllo semantico dato dalle figure). Questo metodo non è prerogativa esclusiva della Geometria, perché altre discipline se ne avvalgono o tentano di avvalersene.
Il ruolo delle Geometrie non-euclide (e proiettive) è stato determinante nel cambiamento di sensibilità matematica. Di fronte alla necessità di accettarle come Geometrie, è stato necessario modificare
il metodo ipotetico deduttivo, ma c’erano due possibilità: o cercarne nuove basi definendo diversamente ‘ovvietà’ e ‘buonsenso’ oppure rinunciarvi. Ma, in ogni modo, i matematici non hanno voluto rinunciare ai teoremi, vale a dire al modello proposizionale della conoscenza. Si è, allora, trasformato il metodo ipotetico deduttivo in metodo assiomatico, eliminando il riferimento all’esterno
e divenendo una costruzione matematica per i concetti matematici.
Del vecchio impianto sono rimasti i concetti primitivi, quelli che si accetta di non definire, e gli assiomi, cioè gli enunciati che si accetta di non dimostrare. Resta il problema di come sceglierli. Mancando l’ovvietà, le scelte possono essere ispirate da criteri di comodità, di convenzione, di minimalità, di flessibilità espressiva, ecc. Gli assiomi non sono più i ‘depositari della verità’ ma divengono
1 In questo capitolo ed anche nei successivi, si utilizzerà ampiamente il testo di Borga & Palladino (1997), già citato
157
Capitolo 6
Il problema dei fondamenti
ipotesi che reggono le dimostrazioni (come conferma anche un brano di Peano, citato in seguito).
Non sono quindi affermazioni vere o false di per sé, ma solo scelte opportune.
6.1.1. Hilbert e le Grundlagen. L’opera che ha dato impulso a questo modo di intendere la conoscenza matematico è stata pubblicata nel 1899, da Hilbert, le Grundlagen der Geometrie. Proprio
per la sua collocazione temporale (assieme ai Grundgesetze der Aritmetik di Frege) si può considerare come la conclusione di un secolo iniziato con forti dubbi sulla correttezza
del procedere matematico, tanto da richiedere una prima opera di rigorizzazione sui fondamenti dell’Analisi (le Leçons d’Analyse di Cauchy, 1821).
D’altra parte, proprio per i contenuti delle due opere citate di fine secolo, esse
si collocano come ideali ‘apripista’ di un nuovo modo di intendere la Logica e
Agostino Luigi Cauchy
(1789 – 1857)
la Matematica nel loro complesso. L’opera di Hilbert ebbe una risonanza
mondiale immediata e di essa furono approntate immediatamente traduzioni
in numerose lingue, ad eccezione dell’Italiano. Infatti, la prima traduzione nel nostro paese è del
1970! Il testo ha avuto, inoltre, molte edizioni e revisioni da parte dell’autore, negli anni.
Vediamo un breve ritratto di Hilbert. È nato a Königsberg e ivi si è iscritto all’università, laureandosi a 22 anni nel 1884. Dieci anni dopo è ordinario nella stessa università, ma poi si trasferisce nel
1895 a Gottinga. Dal 1892 al 1909 la sua produzione è indirizzata a vari campi della matematica e
all’interno di questo periodo si può individuare negli anni dal 1893 al 1904 un particolare interesse
per la Geometria. Dopo il 1909 si interessa di Fisica teorica e dopo il 1916 il suo campo di indagine
è relativo ai fondamenti della Matematica. Il livello della sua fama come matematico si può ‘misurare’ dal fatto che nel 1900, a 38 anni, viene invitato ad aprire il Congresso Internazionale dei Matematici con una relazione sulle possibili linee di ricerca che a suo parere avrebbero fatto avanzare
lo studio della Matematica nel XX secolo.
Con le Grundlagen Hilbert si assume il compito di collocare in un unico quadro le varie concezioni
geometriche, a partire da quella euclidea e tiene conto anche delle ‘novità’ che erano maturate nel
XIX secolo, anche alla luce del Programma di Erlangen di Klein proposto nel 1872.
Per raggiungere lo scopo ritiene indispensabile un approccio ‘conservatore’ e ‘rivoluzionario’.
6.1.1.1. Le idee di fondo delle Grundlagen. Un primo quesito cui rispondere era se esistesse
un’unica Geometria o Geometrie diverse tra di loro ed una seconda domanda, altrettanto scomoda,
se fossero da mantenere i contatti con la realtà fisica oppure privilegiare solo l’aspetto deduttivo. Le
idee gruppali di Klein, mettevano già in luce come fosse possibile determinare legami di natura al-
158
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
gebrica tra le varie Geometrie che si erano affermate. Quindi la vera domanda era quale fosse la natura degli enti di cui queste teorie si occupavano.
Pasch nel 1882 con le Vorlesungen über die neuer Geometrie aveva espresso
l’opportunità di evitare il ‘significato’ dei termini primitivi e delle loro ‘relazioni’ e
data, inoltre, un’impostazione logico-deduttiva alla Geometria proiettiva. Peano e
la sua scuola aveva ripresentato le idee di Pasch in termini ancor più caratterizzati
Moritz Pasch
(1843 – 1930)
logicamente (I principi della geometria logicamente esposti, Peano,1889). La corrente culturale, allora assai attiva, sui fondamenti della Geometria aveva avanzato
l’idea che la disciplina oggetto della ricerca fosse un sistema puramente logico, anche se nessuno si
sentiva di negare la necessità di un ‘nuovo’ collegamento con la realtà.
Hilbert nelle Grundlagen raccoglie questi suggerimenti e li mette in pratica. Ed è questo l’aspetto
più innovativo del testo. Assumendo l’aspetto logico invece che quello del contenuto esperienziale
non è più richiesta l’esistenza di una realtà di riferimento, o meglio di un’unica realtà che costituisca il modello della Geometria. Il matematico tedesco accetta che il sistema non esprima altro che
quello che è previsto dagli assiomi, creando così un primo ed importante esempio di sistema assiomatico inteso in senso moderno. Egli afferma:
«si deve essere in grado di dire ogni volta, invece di “punti, rette e piani”, “tavoli, sedie e boccali di birra”»
a rimarcare la ‘arbitrarietà’ dei termini della Geometria in sé e la possibilità di diverse interpretazioni.
Ma l’impostazione adottata richiedeva di passare in rassegna le opere geometriche per desumere da
esse quali fossero i principi esplicitati o impliciti utilizzati nella dimostrazione delle proprietà. Anche su questi aspetti, Hilbert poteva utilizzare i risultati di ricerche critiche raffinate e, ad esempio,
colmare alcune lacune di Euclide, relativamente agli ordinamenti utilizzati ma non esplicitati. In
questo modo c’era da aggiungere ai vari termini primitivi ed ai vari postulati tradizionali proposti
anche nuovi termini e nuovi postulati, cosa che appunto Hilbert fa, abbandonando un modo di vedere la Geometria dei suoi predecessori come un ‘corpus’ di conoscenze matematiche aventi un’origine empirica. Scrive ad esempio Peano in Sui fondamenti della geometria, 1894:
«Certo è permesso a chiunque di premettere quelle ipotesi che vuole, e lo sviluppare le conseguenze logiche
contenute in quelle ipotesi. Ma affinché questo lavoro meriti il nome di geometria, bisogna che quelle ipotesi o
postulati esprimano il risultato delle osservazioni più semplici ed elementari delle figure fisiche. »(da Borga &
Palladino, 1997)
6.1.1.2. L’impianto assiomatico delle Grundlagen. Di fatto questo è, sicuramente l’aspetto più tradizionale del trattato. I concetti primitivi vengono presentati con i nomi di “punti”, “rette” e “piani”.
Questi enti formano tre “sistemi” disgiunti, ma per altro non precisati. Gli assiomi successivi specificheranno che qui ‘retta’ non vuol dire ‘segmento’, come in Euclide perché Hilbert non ‘teme’
159
Capitolo 6
Il problema dei fondamenti
l’infinito come il grande Greco. I punti vengono indicati con lettere maiuscole (retaggio euclideo),
le rette con lettere minuscole e i piani con lettere minuscole dell’alfabeto greco, poi, conformandosi
alla tradizione geometrica, le rette vengono anche indicate con i nomi di due punti e i piani con tre
punti, una volta assunti i postulati che permettano in modo non equivoco queste notazioni.. Tra questi enti si postula l’esistenza di relazioni come quella di collegamento ovvero lo “essere incidenti”,
“essere congruenti”, “stare tra”. La prima di queste è la più tradizionale, trattata in termini diversi
anche da Euclide. La seconda è presente in Euclide soprattutto nel cosiddetto primo criterio di congruenza dei triangoli, che purtroppo negli Elementi viene presentato in modo da generare molte
perplessità. Hilbert la esplicita proprio per questi motivi. La terza, desunta da Pasch, è motivata dalla necessità di esplicitare l’ordinamento, usato ma senza alcuna attenzione, da Euclide.
Per il matematico tedesco le relazioni ed i “sistemi” hanno un aspetto astratto, ma le modalità delle
loro applicazioni all’interno della teoria sono descritte in modo esaustivo dagli assiomi. Non c’è
dunque una pretesa di ovvietà o ‘verità’ e neppure un lontano riferimento alla esperienza fisica, nella scelta delle basi su cui costruire l’edificio, ma considerazioni di tipo metateorico per garantire che
il tutto ‘funzioni’ in modo adeguato.
La relazione di incidenza è quella che connette i tre sistemi, nel senso che sussiste tra punto e retta,
tra punto e piano e tra retta e piano e nella tradizione viene espressa con parole diverse: ‘un punto
sta’ o ‘giace su’ o ‘appartiene ad una retta’, ‘una retta passa per un punto’; ‘un punto sta’ o ‘giace
su’ o ‘appartiene ad un piano’, ‘un piano passa per un punto’ ed infine ‘una retta giace su un piano’,
oppure ‘un piano contiene una retta’ o ‘passa per una retta’.
La relazione “stare tra” è una relazione ternaria che ha come argomenti tre punti, mediante la quale
si definiscono correttamente i segmenti, si distingue così tra i concetti ‘retta’ e ‘segmento’, cosa che
non compare in Euclide. Il ruolo fondamentale che le fa assumere Hilbert è un esempio di una cosa
sotto agli occhi di tutti (matematici e non) per più di duemila anni, senza che nessuno prima di
Pasch si accorgesse della sua fondamentale importanza nella costruzione della Geometria
La congruenza, connotata con ‘≡’, viene introdotta tra segmenti e poi la si estende agli angoli, opportunamente definiti.
Si colgono da questa breve elencazione importanti aspetti logici e metodologici:
•
Il calcolo necessario per trattare la situazione è a più sorte, qui (almeno) tre primitive e poi
altre definite. Le relazioni primitive non sono quindi solo tre, in quanto la relazione di incidenza ne richiede complessivamente sei, rispettivamente, con segnatura (P,r) e (r,P), (P,π) e
(π,P), (r,π) e (π,r). La relazione ‘stare tra’ ha segnatura (P,P,P).
•
La presentazione dei termini primitivi non è ‘sincronica’, ma è ‘diacronica’, pertanto
l’assiomatizzazione è vista in modo ‘genetico’ come avviene in Euclide.
160
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
L’atteggiamento genetico è confermato dallo stile di presentazione del testo, dato che Hilbert distingue 5 gruppi di assiomi, presentati uno dopo l’altro, solo quando dagli assiomi del gruppo precedente sono stati ottenuti nuove definizioni e nuovi teoremi. Capita inoltre che nel primo gruppo
c’è un’ulteriore distinzione tra assiomi ‘piani’ e ‘spaziali’. Si fornisce qui una presentazione degli
assiomi ricavata da Mangione & Bozzi (1993), sulla base della decima edizione delle Grundlagen.
Si presti attenzione che avendo qui riportato solo il testo degli assiomi, proprio per il modo di procedere genetico, possono venire a mancare definizioni che sono date nel testo e che possono rendere
difficile la lettura degli assiomi stessi.
Il Gruppo I è quello degli assiomi di collegamento, tre piani e cinque spaziali.
«I 1. Per due punti A e B c’è sempre una retta che appartiene ad ognuno dei due punti A e B.
I 2. Per due punti A e B c’è al massimo una retta che appartiene ad ognuno dei due punti A e B.
I 3. Su una retta ci sono sempre almeno due punti. Ci sono almeno tre punti che non giacciono su una retta.
I 4. Per tre punti qualsiasi A, B, C, che o giacciono su una stessa retta, c’è sempre un piano α che appartiene ad
ognuno dei tre punti A, B, C. Per ogni piano c’è sempre un punto che gli appartiene.
I 5. Per tre punti qualsiasi A, B, C che non giacciono su una medesima retta c’è al massimo un piano che appartiene a ciascuno dei tre punti A, B, C.
I 6. Se due punti A, B di una retta a giacciono in un piano α, allora ogni punto di a è nel piano α.
I 7. Se due piani α, β hanno in comune un punto A, allora hanno in comune almeno un altro punto B.
I 8. Ci sono almeno quattro punti che non stanno su un piano.»
Il Gruppo II presenta 4 assiomi di ordinamento
«II 1. Se un punto B giace fra un punto A ed un punto C, allora A, B, C sono tre punti distinti di una retta e B giace pure fra C ed A
II 2. Per ogni due punti A e C, c’è sempre almeno un punto B, sulla retta AC, tale che giace fra A e B.
II 3. Di tre punti qualsiasi di una retta ce n’è al massimo uno che giace fra gli altri due.
II 4 Siano A, B, C tre punti non allineati ed a una retta del piano ABC che non passi per alcuni dei punti A, B, C;
allora, se la retta A passa per un punto del segmento AB, essa passa certamente anche per un punto del segmento
AC, ovvero per un punto del segmento BC. »
Il Gruppo III presenta 5 assiomi di congruenza
«III 1. Se A, B sono due punti di una retta a ed inoltre A’ è un punto sulla stessa retta ovvero su un’altra a’, si
può sempre trovare un punto B’, da una data parte della retta a’ rispetto ad A’, tale che il segmento AB sia congruente, ovvero uguale, al segmento A’B’, in simboli: AB ≡ A’B’.
III 2. Se un segmento A’B’ ed un segmento A”B” sono congruenti ad uno stesso segmento AB, allora anche il
segmento A’B’ è congruente al segmento A”B”, ovvero brevemente: se due segmenti sono congruenti ad un terzo, essi sono congruenti fra loro.
III 3. Siano AB e BC due segmenti senza punti in comune su una retta a ed A’B’ e B’C’ due segmenti sulla medesima retta o su un’altra retta a’, sempre senza punti in comune, allora se è AB ≡ A’B’ e BC ≡ B’C’, è pure AC ≡
A’C’
III 4. Siano dati un angolo <(h,k) 2 in un piano α ed una retta a’ in un piano α’ come pure un determinato lato di
a’ in α’. Si indichi con h’ una semiretta della retta a’, che abbia origine nel punto O’: c’è allora nel piano α’ una
ed una sola semiretta k’, tale che l’angolo <(h,k) è congruente ovvero uguale all’angolo <(h’,k’) ed allo stesso
tempo tutti i punti interni all’angolo <(h’,k’) stanno dalla parte di a’, in simboli: <(h,k) ≡ <(h’,k’). Ogni angolo è
sempre congruente a se stesso, cioè è sempre <(h,k) ≡ <(h,k).
III 5. Se per due triangoli ABC e A’B’C’ valgono le congruenze: AB ≡ A’B’, AC ≡ A’C’, <BAC ≡ <B’A’C’, allora
è sempre valida anche la congruenza <ABC ≡ <A’B’C’. »
Il Gruppo IV è costituito dal solo assioma delle parallele.
«Siano a una qualsiasi retta ed A un punto fuori di a: allora c’è nel piano definito da A e da a, al massimo una
2 Il simbolo usato dal testo è diverso, più simile a
una sorta di ‘minore’ con un arco di circonferenza. Ma non è nella disponibilità
del mio computer, pertanto ho usato un simbolo abbastanza simile.
161
Capitolo 6
Il problema dei fondamenti
retta che passa per A e che non interseca la a»
Il Gruppo V è costituito da due assiomi detti di continuità.
«V 1. (Assioma della misura, ovvero assioma archimedeo) Se AB e CD sono due segmenti qualsiasi, c’è un numero n tale che il trasporto del segmento CD reiterato n volte da A sulla semiretta passante per B, porta al di là
del punto B.
V 2. (Assioma di completezza lineare) Il sistema dei punti della retta con le sue relazioni di ordinamento e congruenza non è suscettibile di un ampliamento per il quale rimangano inalterate le relazioni sussistenti tra gli elementi precedenti come pure le proprietà fondamentali di ordinamento lineare che seguono dagli assiomi I –III ed
anche V 1.»
6.1.1.3. Alcuni commenti agli assiomi. Con 19 assiomi si riottiene la Geometria euclidea, mentre
negli Elementi, Euclide esplicita 5 nozioni comuni (la numero 1 delle quali riecheggia nell’assioma
III 2) e 5 postulati (il primo di Euclide e l’assioma I 1 hanno molti punti in comune). Poi nel libro V
degli Elementi si presenta, sotto forma di definizione l’analogo dell’assioma V 1 ed infine sotto
forma di proposizioni utilizza altri principi relativi allo spazio nel Libro XI. Ma sono numerose le
definizioni – postulati e le proposizioni – postulati, un esempio delle quali è la Proposizione I.4, il
primo criterio di congruenza dei triangoli, qui ripreso sotto forma di Assioma III 5 e la Proposizione
XI.1 che qui si ritrova nell’assioma I 6, la Proposizione XI.2 come assioma I 5 e l’assioma I 7, strettamente legato alla Proposizione XI. 3.
Di fatto con i 19 assiomi di Hilbert si ottiene ben di più della Geometria euclidea, in quanto con gli
assiomi di congruenza prepara il terreno per la metrica e con l’assioma V 2. finisce con lo stabilire
una corrispondenza biunivoca tra l’insieme dei punti di una retta e l’insieme dei numeri reali, corrispondenza che va molto al di là delle possibilità di Euclide, che deve arrampicarsi sugli specchi nel
libro X per trattare anche semplici radicali.
In tutto il testo di Hilbert si usa costantemente la parola “sistema” e mai insieme, come se l’autore
non conoscesse il concetto. Ma così non era, come mostra la conferenza dell’anno successivo a Parigi, la scelta quindi è motivata da ragioni che non sono del tutto chiare, forse una cautela nei riguardi di quei problemi che erano apparsi sulla scena matematica con il Paradosso di Burali-Forti o
le molteplicità contraddittorie di Schröder e Cantor. O anche la sensazione che il linguaggio degli
insiemi, che in quegli anni era trattato in connessione ad argomenti logici, non fosse idoneo (anche
per differenziazione di sorte) agli argomenti geometrici. Forse se avesse accettato di inglobare
l’idea di insieme avrebbe potuto definire rette e piani (e figure varie) come insiemi di punti, cosa
che non avviene.
Altri due punti sono interessanti, spicca la mancanza della specificazione di numero naturale
nell’assioma V 1. Il secondo punto di interesse è offerto dal rapporto tra uguaglianza e congruenza.
Negli assiomi III 1 e III 4 si tiene in conto che potrebbe accadere che le costruzioni suggerite portino a segmenti o angoli identici, cioè coincidenti, ma mentre nella III 4 si chiarisce che l’identità o
162
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
uguaglianza per angoli è una congruenza, ciò non viene messo in luce nell’assioma analogo per i
segmenti, il III 1.
L’assioma II 4 viene detto anche assioma di Pasch, in quanto fu da lui messo in evidenza come carenza della postulazione euclidea. Il lettore potrà ricercare la corrispondenza tra gli altri assiomi non
citati i questo breve confronto, coi risultati presentati negli Elementi.
6.1.1.4. Lo sviluppo delle Grundlagen. Ovviamente uno sviluppo approfondito di quest’opera fondamentale per la Matematica richiede un corso intero, per sviscerarne gli aspetti innovativi, ma credo che ad essa siano dedicati altri corsi universitari. Con gli assiomi di ordinamento si riesce a definire ordinamenti su ogni retta, senza doverne fissare uno a priori con cui confrontarsi. Gli oggetti
quali semirette, intervalli ed in generale figure chiuse per cui distinguere il dentro ed il fuori sono
conseguenza di questi assiomi. Non è che in geometria prima del XIX secolo non si considerassero
questi aspetti, ma essi erano assunti in modo intuitivo, come il fatto che una retta che entri in un
triangolo ne deve uscire,che di fatto, come mostrato da Pasch non era deducibile dai postulati di Euclide.
Gli assiomi di congruenza sono strumento per evitare di introdurre la ‘sovrapposizione’ e lo stesso
giungere a parlare di congruenza. Essi comprendono una forma apparentemente indebolita del primo principio di congruenza dei triangoli, ma sotto l’assioma delle parallele si giunge a considerare
anche il terzo angolo del triangolo e di qui il terzo lato di cui non si fa menzione esplicita
nell’assioma.
Gli assiomi più ‘lontani’ dall’intuizione sono quelli di continuità. Il Principio di Eudosso – Archimede è fondamentale nel libro V degli Elementi per definire il concetto di grandezze omogenee e di
lì i rapporti e l’uguaglianza dei rapporti su cui si basa tutta la similitudine. Viene detto da Hilbert
assioma della misura perché permette di ‘misurare’ nel senso di Euclide e di Aristotele un segmento
con un altro. Nel seguito si mostra come con questo assioma non basti ad identificare il continuo dei
numeri reali, perché è possibile costruire un’interpretazione della geometria in un campo numerico
di numeri algebrici in cui non tutti i numeri hanno radice quadrata e in esso soddisfare l’assioma V
1. Tuttavia basta l’assioma archimedeo per ‘ricostruire’ i numeri razionali mediante segmenti; è allora compito dell’assioma V 2 di permettere costruzioni simili alle sezioni di Dedekind per giungere
ad un campo ordinato completo in cui i razionali sono densi. Hilbert risolve il problema di esprimere in termini geometrici il continuo. In realtà era disponibile un’altra forma, più geometrica
dell’assioma di continuità, dovuto a Cantor che ha il ‘difetto’ di considerare esplicitamente un insieme infinito di intervalli ‘inscatolati’ e di concludere che esiste un punto comune a tutti gli intervalli considerati (riconducendosi quindi alle classi contigue). Nella forma dell’assioma V 2 rappre163
Capitolo 6
Il problema dei fondamenti
senta un compromesso accettabile anche se di fatto non si tratta di proposizione geometrica, ma di
una richiesta metamatematica. La formulazione qui presentata non è quella originale, perché Hilbert
giunge all’espressione geometrica della continuità con lo scritto Über den Zahlbegriff (1900) e in
questa forma sarà presente a partire dalla seconda edizione delle Grundlagen. Con l’assioma V 2. si
impone che i modelli del sistema assiomatico non siano ulteriormente ampliabili
mantenendo la verità degli altri assiomi, quindi, nei termini introdotti da Veblen
nel 1905, che la teoria sia categorica, e quindi caratterizzabile in termini di isomorfismi. Questo tipo di esigenza sarà sentito anche in altri campi e porterà al
Oswald Veblen
(1880 – 1960)
concetto più debole di categoricità in potenza per le teorie assiomatiche.
La riflessione metamatematica, che tanta parte avrà nel problema dei fondamenti
del XX secolo, entra così in scena in modo naturale. Per Hilbert questo è un merito della presentazione assiomatica delle teorie, perché gli assiomi fissano i dati dell’intuizione e i vari gruppi di assiomi rappresentano aspetti diversi di tale intuizione. Alcuni aspetti di questo campo erano esigenze
che sentite anche nell’antichità: trovare un equilibrio tra il numero e la forma dei termini primitivi e
degli assiomi in modo che non siano ‘troppi’ e che permettano di far giungere senza troppe complicazioni ai risultati ritenuti importanti. Anche su questi aspetti ci sarebbe da precisare meglio: se, ad
esempio, per ricavare certi risultati sui numeri primi bastassero 12.000 esempi di applicazione del
principio di induzione con 12.000 ‘proprietà’ diverse, considerare questi 12.000 casi come assiomi
mi permetterebbe di evitare di assumere il principio di induzione, che essendo uno schema in sé
comprende infiniti casi. Avrei una teoria con un numero finito di assiomi, ma per procedere in essa
dovrei padroneggiare molto bene questi 12.000 assiomi e forse per dimostrare un nuovo risultato sarei costretto a controllarli tutti per vedere se non mi potrebbe servire un ulteriore nuovo assioma.
Quindi in questo caso è più ‘economico’ lo schema di induzione degli esempi specifici.
Un altro importante tema metamatematico è quello dell’indipendenza degli assiomi, esigenza che ha
portato alla scoperta / invenzione delle Geometrie non euclidee.
In Hilbert queste suggestioni sono assai rilevanti. Si occupa infatti di varie possibilità, vale a dire di
cercare quali fossero i principi che servivano per ottenere alcuni risultati, anticipando così i temi
della reverse mathematics degli anni ’80 del XX secolo. Il problema della compatibilità e della dipendenza degli assiomi viene visto dal matematico tedesco come una analisi logica dell’intuizione
spaziale. Hilbert indagò in modo sistematico il ruolo
dell’assioma archimedeo e la possibilità di sviluppare la Geometria proiettiva a partire dai teoremi di Desargues e di Pascal, provando che il teorema di Pascal si può dimostrare senza l’assioma
Girard Desargues
(1591 – 1661)
di Archimede, ma con gli assiomi di congruenza (che sono di ca164
Blaise Pascal
(1623- 1662)
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
rattere metrico) e la contemporanea presenza di questi tipi di assiomi indispensabile. Invece il teorema di Desargues per il piano si può ottenere con gli assiomi di congruenza, ma anche senza a patto di richieder la presenza dello spazio a tre dimensioni.
Questi esempi convinsero il mondo matematico che l’approccio assiomatico non era un’esigenza di
chiarezza e di eleganza, ma la sola sua presenza apriva inaspettati problemi in campo metamatematico che portavano che avevano ricadute matematiche importanti.
Le proposte di Hilbert nelle Grundlagen, partite dal problema geometrico hanno avuto conseguenze
sull’intera Matematica per il ruolo esemplificato dei sistemi assiomatici. Oggi possiamo affermare
che il sistema assiomatico ha svolto due ruoli rilevanti: ha permesso la formulazione precisa e poi
condivisa socialmente di teorie in cui non ci sia un riferimento privilegiato , come può essere il caso
dei gruppi, ed in questa opzione esso si offre come metodo principe che permette di studiare il concetto prescindendo dalle realizzazioni particolari,
Oppure il metodo assiomatico ha posto in luce i problemi fondazionali ed anche filosofici insiti nelle teorie specifiche in cui si trattano concetti di base come numeri e spazi.
6.1.1.5. Coerenza. Proprio perché col metodo assiomatico si perde il contatto con la ovvietà è necessario un criterio di “verità” o forse solo di “affidabilità”. Hilbert lo trova nella coerenza sintattica. Ciò significa che nella teoria non è possibile dimostrare, a partire dagli assiomi della teoria stessa un enunciato scritto nel linguaggio mediante il quale è espressa la teoria ed anche la negazione
dell’enunciato stesso. C’è un altro tipo di coerenza, la coerenza semantica, caratteristica che una teoria assiomatica ha se essa ha modello, cioè se si possono interpretare in un certo dominio i simboli
che costituiscono l’alfabeto mediante il quale è scritta la teoria ed in questa interpretazione tutti gli
assiomi sono veri. Per un motivo ovvio, una sorta di principio di realtà, la coerenza semantica implica quella sintattica.
Chiaramente la non coerenza sintattica fa un po’ paura. Infatti per un risultato che ci proviene dal
Medioevo, da Giovanni di Cornovaglia, più noto come Pseudo-Scoto (XIII sec.), la cosiddetta legge
ex absurdo quodlibet, se in una teoria assiomatica è possibile dimostrare una contraddizione, allora
è possibile dimostrare ogni formula. Quindi, mentre sembrerebbe assai comodo trovare dimostrazioni in condizioni di non coerenza sintattica, una teoria di questo tipo sarebbe prova di interesse.
La richiesta di Hilbert che il sistema assiomatico sia privo di contraddizioni, sembra una sorta di requisito minimale per una teoria assiomatica, per permetterle di ‘esprimere’ qualcosa di sensato.
Sembra, dunque, una richiesta di funzionalità della teoria.
165
Capitolo 6
Il problema dei fondamenti
La non coerenza semantica richiederebbe che non ci sia una interpretazione del linguaggio della teoria in cui siano veri gli assiomi, contravvenendo ad una richiesta di corrispondenza della teoria con
una qualche ‘realtà’.
Guardiamo un poco più da vicino queste richieste partendo dagli aspetti semantici. Come si fa in
pratica a provare che una teoria non è semanticamente coerente? Il fatto di avere provato con una
decina di possibili interpretazioni e di non riusciti in esse a provare che gli assiomi della teoria sono
veri, ci permette di concludere che la teoria assiomatica non ha la coerenza semantica?
E per la coerenza sintattica, come si fa a provare che una teoria assiomatica gode di questa proprietà? Bisognerebbe controllare tutte le possibili dimostrazioni condotte a partire dagli assiomi e verificare che nessuna di esse si conclude con un assurdo (cioè provare un enunciato e la sua negazione), oppure provare che almeno un enunciato non è dimostrabile.
Da questa semplice analisi si vede che si tratta in entrambi i casi di verifiche che rischiano di essere
impossibili, perché richiedono infinite verifiche o la dimostrazione di infiniti teoremi.
Sorprendentemente, questo compito così difficile è stato il centro della Metamatematica (o Teoria
della Dimostrazione) proposta da Hilbert già al Congresso di Parigi e in qualche caso è stato risolto,
ma sono risultati importanti della Logica e per studio dei Fondamenti.
6.1.2. Gli assiomi come definizioni. L’idea che gli assiomi servano per definire i concetti primitivi
può apparire una sorta di circolo vizioso, dato che gli assiomi, ora, non sono che delle ipotesi e i termini primitivi, di per sé, non sono definibili. Ma il problema è che di definizioni ce ne sono di vari
tipi ed uno di questi è dato dalle definizioni implicite.
Le definizioni esplicite hanno varie funzioni. Talvolta sono utili abbreviazioni che agevolano le
considerazioni, quelle che nella Scolastica si definivano definitio quid nominis. Altre volte si vedono definizioni che servono a ‘mettere in chiaro’ un concetto, definitio quid rei. Talvolta hanno una
funzione di descrizione, ma non un vero ruolo definitorio, ne è un esempio la definizione di punto
negli Elementi di Euclide: “Punto è ciò che non ha parti” che non serve a nulla in tutto il trattato, ma
può servire al lettore per farsi un’utile immagine mentale.
Può darsi che il modo di vedere le definizioni implicite come definizione dei termini primitivi sia
stato assunto implicitamente da Hilbert, ma egli non ne fa mai oggetto di riflessione, forse perché
questo atteggiamento era riscontrabile anche in Pasch e Peano ed altri e quindi lo assume come un
dato di fatto. Nelle Grundlagen afferma
«Gli assiomi di questo gruppo [II] definiscono il concetto di ‘fra’ e rendono possibile, sulla base di questo concetto, l’ordinamento dei punti su una retta, in un piano e nello spazio. […] gli assiomi di questo gruppo [III] definiscono il concetto di congruenza e quindi anche quello di movimento. » (da Borga e Palladino, 1997)
166
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
Bisogna però aspettare Pieri che è il primo che descrive questo ruolo del sistema assiomatico. Conseguenza di questa posizione è un semplice criterio per saggiare in modo superficiale e veloce, se il
sistema assiomatico è dato correttamente. Come si è detto un tale sistema (dopo Frege) deve essere
scritto usando simboli di un alfabeto opportuno, simboli che riflettono il concetto di ‘ente primitivo’. Basta allora verificare che ciascuno dei simboli compaia in almeno uno degli assiomi: Se infatti
così non fosse è probabile che i simboli non utilizzati negli assiomi siano evitabili. Questo tipo di
verifica è estendibile alle definizioni. Una definizione che introduca un termine (oggetto o relazione) dovrà essere accompagnata da un teorema che giustifichi l’importanza o l’uso del nuovo termine. Da questo si coglie una cosa che solitamente non viene messa in luce: nel contesto dei sistemi
assiomatici, una definizione è un fatto sintattico e non semantico.
Alla luce di queste considerazioni, se un argomento matematico può essere trattato con diversi sistemi assiomatici, quello che richiede il linguaggio con alfabeto contenente minor numero di termini primitivi, è probabile che abbia il minor numero di assiomi.
Nella letteratura filosofica il ruolo delle definizioni è stato oggetto di grande attenzione, anche se
trattato in relazione a problemi non matematici. In quella matematica è, invece, una argomento che
non ha avuto molti studiosi. La Logica, territorio in cui si incontrano/scontrano da tempo esigenze
filosofiche e matematiche si trovano opere che trattano il tema. Ad esempio le definizioni implicite
sono state introdotte (come nome, ma non in rapporto al loro ruolo nelle teorie assiomatiche) da un
saggio apparso nel 1818 da Gergonne, Essai sur la théorie des définitions. Si tratta di un’opera abbastanza oscura, ma anticipatrice, in cui il matematico francese insiste sulla necessità di sviluppare
un linguaggio simbolico per trattare le scienze esatte (idea da lui sfruttata in seguito, 1826, per proporre e giustificare la dualità in ambito di geometria proiettiva) e propone
«…un tipo di proposizioni che danno… la comprensione di uno dei termini di cui esse si compongono per mezzo del significato noto degli altri [e…] potrebbero essere chiamate definizioni implicite in contrapposizione alle
definizioni ordinarie che vengono dette definizioni esplicite. Si comprende così che… due proposizioni che contengono due parole nuove combinate con parole già note possono spesso determinare il senso delle prime.» (da
Mangione & Bozzi, 1993).
L’esempio che Gergonne riporta è quello di chi conoscesse il significato delle parole ‘triangolo’ e
‘quadrilatero’, ma non conoscesse quello di ‘diagonale’ (di un quadrilatero). Allora la frase ‘ciascuna diagonale di un quadrilatero divide il quadrilatero stesso in due triangoli’ è sufficiente per fare
capire il concetto di diagonale (ma dovrebbero essere noto anche cosa voglia dire segmento, estremi, lati del quadrilatero, quadrilatero convesso).
Secondo il matematico francese, la differenza tra definizioni implicite ed esplicite è la stessa che
sussiste tra un’equazione non risolta e l’equazione risolta. Giunge anzi a proporre una sorta di calcolo di sistemi di definizioni implicite esemplificato sui sistemi di equazioni.
167
Capitolo 6
Il problema dei fondamenti
La proposta di Gergonne, per quanto suggestiva, non è facilmente accostabile al
problema degli assiomi di una teoria, perché rimane difficile pensare ai termini
primitivi come incognite/variabili dato che, a priori in un sistema assiomatico ciascun termine è privo di significato in sé, quindi non c’è un punto di partenza pregresso su cui costruire la nuova conoscenza.
Ma anche l’idea, seppur utile degli assiomi come definizioni implicite è oggi supe-
Paul Bernays
(1888 – 1977)
rata, dall’interpretazione fornita da Bernays , uno dei più stretti collaboratori di Hilbert. A suo parere, a parte la necessità di studi di carattere storico-critico, la nozione di definizione implicita è superata dal fatto che sarebbe necessario un unico modo per intendere i sistemi assiomatici. Proviamo a
confrontare due esempi noti, la Geometria e la Teoria dei gruppi. Dopo Hilbert e anche studi successivi, entrambe sono presentate come sistemi assiomatici, ma gli assiomi di gruppo vengono considerati come la definizione esplicita del concetto di gruppo e non la definizione implicita dei suoi
elementi. Così gli assiomi della Geometria possono essere considerati alla stregua di una definizione esplicita del concetto di spazio euclideo, invece di ritenere che essi definiscano implicitamente la
natura dei punti, delle rette e dei piani, nonché delle relazioni tra essi.
Mi pare di poter dire che questo approccio, possibile solo dopo l’introduzione dei sistemi assiomatici, semplifica molto i problemi che le definizioni portano con sé, ma rischia di ‘cancellare’, di fatto,
l’elaborazione critica e storica che ha condotto ad occuparsi di Geometria ed Aritmetica nella storia
della Matematica.
Il problema ed i modi della definizione (in un sistema assiomatico) vengono affrontati, in tempi più vicini a noi, e risolti
mediante una riflessione della scuola polacca, in particolare
Alfred Tarski
(1902 – 1983)
da Tarski e Leśniewski.
Stanislaw Leśniewski
(1886 – 1939)
6.2. Un periodo di crisi.
Anche se non è completamente corretto dal punto di vista cronologico, si può prendere l’anno 1900
come la data in cui la ricostruzione matematica e logica della Matematica, resa possibile dalle opere
di Cantor, Frege e Hilbert, entra in crisi. Ciò è anche conseguenza della posizioni di Hilbert che aveva posto come criterio per i sistemi assiomatici di essere (sintatticamente) coerenti, posizione per
altro ampiamente accettata anche sulla scorta del valore matematico del suo proponente. Allo stesso
modo era diffusa l’idea che la Matematica si potesse esprimere con un metodo ed un linguaggio più
rigoroso di quanto fatto nelle epoche precedenti e questo spiega la penetrazione del linguaggio formale, nella presentazione di Peano, non in quella di Frege.
168
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
Che l’edificio avesse dei punti da sistemare meglio, era anche accettabile, ma d’altronde (quasi) tutto il secolo precedente aveva acquisito un approccio possibilista nei confronti di apparentemente
piccoli problemi, situazione che aveva motivato Cauchy ad iniziare un’opera di rigorizzazione, a
cercare di definire i numeri, lo spazio, sanando in modo locale o globale situazioni di per sé non
completamente corrette. Quindi ad un primo momento gli scricchiolii presentiti da Cantor erano stati valutati in modo ‘bonario’ con la speranza che un approfondimento dei concetti avrebbe potuto
sistemare adeguatamente la situazione.
6.2.1. Le antinomie. Lo sviluppo della conoscenza si è da sempre accompagnato con paradossi. Lo
testimonia oggi anche un sito http://it.wikipedia.org/wiki/Elenco_di_paradossi in cui si trova un elenco abbastanza aggiornato di paradossi, di varia natura.
Nell’antichità greca essi erano ben presenti e, quelli che interessano l’ambito matematico, sono nati
ben presto, se è possibile attribuire a Epimenide (uno dei Sette Saggi) e a Zenone i più famosi (ma
non unici). Anche se alcuni paradossi di Zenone hanno dato origine alla teoria delle serie e quindi
hanno ispirato risultati di Analisi matematica, risultandone risolti, altri, quelli di tipo ‘Sorite’, sono
rimasti insoluti, come pure il paradosso del mentitore. Ciò non ha però fermato né favorito la speculazione matematica. I paradossi citati sono stati visti come ‘stranezze’, anche perché
non minavano direttamente gli argomenti matematici, ma avevano
aspetti di carattere linguistico che facevano pensare che i problemi
fossero insiti nel linguaggio stesso.
La situazione si modifica con la presentazione da parte di Ruggero
Ruggero Bacone
(1214 – 1292)
Bacone, ripreso poi da Galilei, del paradosso dei quadrati perfetti.
Questa antinomia (che poi paradosso non è) richiede la nozione di
Galileo Galilei
(1564 – 1642)
insieme e un chiarimento delle proprietà dell’infinito e l’argomentazione sarà assunta da Dedekind
proprio come definizione di insieme infinito, risolvendo il problema. A Galilei si deve anche il paradosso della ruota, da alcuni attribuito ad Aristotele, argomento che ha fatto introdurre un nuovo
tipo di movimento dei corpi, il rotolamento con strisciamento.
Nel 1897, sui Rendiconti del Circolo Matematico di Palermo, Burali-Forti pubblica Una questione
sui numeri transfiniti, dieci paginette in cui vuole provare che per i numeri ordinali (non proprio gli
stessi di Cantor, anche se non si rende conto della differenza di definizione) transfiniti non è dimostrabile la tricotomia. Per fare ciò procede per assurdo assumendo la tricotomia e con un ragionamento abbastanza complesso giunge alla considerazione della totalità dei numeri ordinali, ottiene
una contraddizione perché a tale totalità dovrebbe essere associato un numero ordinale e questo do-
169
Capitolo 6
Il problema dei fondamenti
vrebbe essere propriamente minore di se stesso. A questo punto Burali-Forti ritiene di avere provato
l’asserto che si proponeva per assurdo, vale a dire che non è dimostrabile la tricotomia.
A parte la differenza di definizione di numero ordinale, il risultato paradossale sussiste anche per gli
ordinali di Cantor, e Cantor se ne era accorto, come rivela una lettera a Dedekind.
Solo dopo la presentazione del suo Paradosso, Russell metterà in luce che assumere che la totalità
degli ordinali, assunta come insieme, porta a paradossi.
È importante osservare che con il ragionamento di Burali-Forti si rimane all’interno della matematica, così come col Paradosso di Russell (e quello di Cantor sui cardinali). Tuttavia, in un primo tempo il Paradosso del massimo ordinale passò quasi inosservato, ma poi, assieme agli altri paradossi
ed alla rivalutazione dell’opera di Frege ed alla loro rilevanza in campo anche filosofico, la situazione mutò, anche grazie all’opera di Russell. Diventò allora indispensabile chiarire la situazione e
risolvere i problemi posti dai paradossi.
6.2.2. Il Paradosso di Russell. Russell era un giovane di famiglia nobile, nipote di un primo ministro inglese, sotto la Regina Vittoria, perde la madre a 2 anni e il padre a 4. Assieme al fratello viene allevato dai nonni e cresce in ambiente colto, con un nonno che discuteva con lui di Matematica
e Filosofia in tenera età, che conosceva varie lingue straniere. Nella sua autobiografia aggiunge:
«At the age of eleven, I began Euclid, with my brother as my tutor. This was one of the great events of my life,
as dazzling as first love. I had not imagined there was anything so delicious in the world. From that moment until
I was thirty-eight, mathematics was my chief interest and my chief source of happiness.»
Dopo l’istruzione privata approda al Trinity College di Cambridge nel 1890 dove si laurea in Matematica ed anche in Scienze Morali, dove, dopo la laurea, resta come docente, fino al suo allontanamento nel 1916 per la posizione pacifista contro la prima Guerra mondiale. Prende parte al Convegno Internazionale di Matematica e a quello di Filosofia, svoltisi entrambi a Parigi a pochi giorni
di distanza, ed in quell’occasione conosce Peano e il suo simbolismo e lui dirà poi che tale linguaggio permetteva di chiarire molti aspetti e per questo lo adottò nelle sue opere. Probabilmente il confronto con il simbolismo delle opere di Frege, che stava studiando, fece pendere la bilancia a favore
delle proposte dell’italiano.
La sua opera come filosofo, come matematico, come letterato (vincitore di un Nobel per la letteratura, caso forse unico tra i matematici) e come pacifista è di rilievo. In questi appunti ci soffermiamo
solo sugli aspetti relativi ai Fondamenti della Matematica ai quali ha contribuito con una pars destruens ed una pars construens, in particolare dell’approccio logicista. L’impatto sulla matematica
di inizio XX secolo della sua antinomia è stato grande e per questo essa merita di essere trattata con
una certa estensione.
170
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
6.2.2.1. La lettera di Russell. Quando Frege era convinto di avere trovato una presentazione completa dell’Aritmetica all’interno della Logica, ed in procinto di completare la sua opera pubblicando
il secondo volume dei Grundgesetze der Aritmetik, Russell gli scrive una breve lettera, il 16 giugno
1902, per presentargli una perplessità che gli era sorta leggendo (e studiando, si vede, in modo approfondito) il primo volume (1893), in preparazione di un suo testo. Riportiamo per intero la lettera
che ha avuto così tanta influenza sulla storia della Matematica.
«
Friday’s Hill, Haslemere, 16 giugno 1902
Caro collega,
Per un anno e mezzo ho familiarizzato con i vostri Grundgesetze der Arithmetik, ma è solo adesso che sono riuscito a trovare il tempo per lo studio approfondito che intendevo fare sul vostro lavoro. Mi sono riconosciuto
completamente d’accordo con voi su tutti i punti essenziali, in particolare laddove rigettate ogni elemento psicologico in logica e quando ponete grande valore su una ideografia per i fondamenti della matematica e della logica formale, i quali, incidentalmente, possono difficilmente essere distinti. Rispetto a molte questioni particolari,
ho trovato nel vostro lavoro discussioni, distinzioni e definizioni che uno cerca invano nelle opere di altri logici.
Specialmente per quanto riguarda ciò che concerne la funzione (§ 9 del vostro Begriffsschrift), sono stato condotto autonomamente a punti di vista che sono gli stessi, anche nei dettagli. C’è solo un punto in cui ho incontrato
una difficoltà. Voi stabilite (pag. 17) che una funzione può agire anche come elemento indeterminato. Ciò è
quanto io credevo precedentemente, ma ora questo punto di vista mi sembra dubbioso a causa della seguente
contraddizione. Sia w il predicato: essere un predicato che non può essere predicato di se stesso. Può w essere
predicato di se stesso? Da ogni risposta [a questa domanda] segue la sua opposta. Pertanto dobbiamo concludere
che w non è un predicato. Similmente non c’è una classe (come una totalità) di quelle classi che, ciascuna presa
come una totalità, non appartengono a se stesse. Da questo concludo che sotto certe circostanze una collezione
definibile non forma una totalità.
Sto finendo un libro sui principi delle matematica e in esso discuterei il vostro lavoro in modo molto approfondito. Ho già i vostri libri o li comprerò al più presto, ma vi sarei molto grato se poteste inviarmi copia dei vostri articoli apparsi su vari periodici. In caso ciò non fosse possibile, cercherò di ottenerli da qualche biblioteca.
Il trattamento esatto della logica in questioni fondamentali, laddove i simboli falliscono, è rimasto molto indietro: nelle vostre opere ho trovato il meglio di quanto conosca per i giorni nostri. È un vero peccato che non siate
riuscito ancora a pubblicare il secondo volume dei vostri Grundgesetze. Spero ancora che ciò sia fatto.
Rispettosamente vostro,
Bertrand Russell
La precedente contraddizione, una volta espressa nell’ideografia di Peano, si può leggere come segue:
w = cls ∩x ∋ (x ∼ε x). ⊃: wεw .=. w∼εw.
Ho scritto a Peano su ciò, ma mi deve ancora rispondere.» (tradotto da Van Heijenoort, 1967) 3
6.2.2.2. Il ruolo della relazione di appartenenza. Cerchiamo di analizzare meglio la situazione, girandoci un attimo attorno, per metter in mostra come sia possibile dare una presentazione didattica
chiara di questo complesso argomento.
Spesso sui manuali si esplicita che un insieme può venire rappresentato mediante elencazione dei
suoi elementi, oppure per (proprietà caratteristica). Frequentemente viene anche detto che ogni proprietà individua un insieme, riprendendo alcune idee di Cantor (Principio di comprensione, detto
anche di astrazione). Entra così in gioco la rappresentazione per caratteristica degli insiemi che è
quella con la quale si esprimono elegantemente le operazioni, e che coinvolge più strettamente la
Logica dato che un insieme viene individuato da una ‘proprietà’. La precisazione di cosa sia una
proprietà è stata proposta da Frege, sostituendo al concetto vago, quello più preciso, ma forse troppo
3 Van Heijenoort, J. (1967). From Frege to Gödel – A Source Book in Mathematical Logic, 1879 – 1931. Cambridge (Massachus-
setts): Harvard University Press.
171
Capitolo 6
Il problema dei fondamenti
limitativo, di una formula del linguaggio in cui si sta studiando la teoria, quindi in questo caso, il
linguaggio degli insiemi. Si parla in questo caso dell’insieme ottenuto come della estensione della
formula, mentre la formula è l’intensione dell’insieme. Questa posizione assunta acriticamente porta a paradossi. Qui si mostra in che modo ciò avviene.
Si accetti, per momento il Principio di comprensione, cioè l’affermazione che ogni proprietà individui un insieme. In questa presentazione il Principio di estensionalità, afferma che due insiemi sono
eguali se e solo se le formule che li descrivono sono logicamente equivalenti.
Si pone il problema di vedere quando un oggetto è elemento di un insieme così rappresentato. Qui
non ci sono elenchi da consultare per decidere dell’appartenenza. C’è però una proprietà. Se si considera a = {x | φ(x)}, questa scrittura viene letta come
a è l’insieme degli x tali che φ(x).
Non interessa qui cosa dica φ(x). Solitamente la dicitura “a è l’insieme degli x tali che …” viene interpretata come
a è l’insieme di tutti e soli gli x tali che…,
pertanto, se φ(y), allora y∈a, dato che tutti gli oggetti che soddisfano φ sono elementi di a. Viceversa se z∈a, dato che gli elementi di a sono solo quelli che soddisfano φ allora si ha φ(z). Riassumendo se a = {x | φ(x)} si ha
w∈a ↔ w∈{x | φ(x)} ↔ φ(w).
Per motivi logici, si ottiene la condizione di non appartenenza ad a come
w∉a ↔ w∉{x | φ(x)} ↔ ¬ φ(w).
Si tratta ora il semplicissimo caso dato dalla formula x∈y. È una formula del linguaggio degli insiemi che parla di due enti, cioè due insiemi, x e y; qui si vuole analizzare tale formula e le sue estensioni concentrando l’attenzione ora su uno ora sull’altro degli enti coinvolti. Il primo caso è
quello della proprietà α(x) data da x∈y, in cui si considera l’indeterminata y fissa, come un parametro. Per il principio di astrazione esiste un insieme caratterizzato da questa proprietà, {w | α(w)} =
{w | w∈y}. Si ha
x∈{w | α(w)} ↔ α(x) ↔ x∈y.
Guardando al primo ed all’ultimo membro di questa catena di equivalenze si scopre che gli insiemi
y e {w | α(w)} hanno gli stessi elementi, quindi
y = {w | α(w)} = {w | w∈y}
Ciò mostra che ogni insieme può essere rappresentato per caratteristica, assumendo come proprietà
quella di appartenergli. Si neghi ora la proprietà, cioè si consideri la formula β(x) data da x∉y, in
cui, come prima, si tiene fisso il parametro y. Sempre per il principio di astrazione esiste un insieme
{z | β(z)} = {z | z∉y}. Si ha
172
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
x∈{z | β(z)} ↔ β(x) ↔ x∉y;
x∉{z | β(z)} ↔ ¬β(x) ↔ ¬(x∉y) ↔ x∈y
Guardando al primo ed all’ultimo membro di entrambe le catene di equivalenze si scopre che gli insiemi y e {z | β(z)} sono legati tra loro dalla proprietà che un elemento appartiene all’uno se e solo
se non appartiene all’altro. Questa situazione viene descritta con l’operazione di complementazione
di un insieme, dunque
Cy = {z | β(z)} = {z | z∉y}.
Si ritornerà in seguito su questa operazione insiemistica, qui basta osservare che se y è dato per elencazione, il suo complementare non può essere espresso con la stessa rappresentazione. Inoltre
qui al complementare si attribuisce il significato dell’insieme degli insiemi che non appartengono
ad y. Per esempio se y = {a,b}, ove a,b sono a loro volta insiemi, non ha senso dire che un elefante
appartiene al complementare di y, dato che non è presente nell’elenco di y, in quanto un elefante
non è un insieme, invece ha senso affermare che l’insieme degli elefanti africani è elemento del
complementare dato che è un insieme.
Si scambino ora i ruoli di x e y. Sia γ(y) la proprietà x∈y, in cui si fissa l’indeterminata x. Come fatto prima si considera l’insieme {t | γ(t)} = {t | x∈t} e si ha:
y∈{t | γ(t)} ↔ γ(y) ↔ x∈y
y∉{t | γ(t)} ↔ ¬γ(y) ↔ ¬(x∈y) ↔ x∉y
In questo caso non si ha una costruzione insiemistica ‘interessante’ che serva da identificare il caso
in cui un insieme abbia o non abbia per elemento un insieme fissato.
6.2.2.3. I casi ‘riflessivi’ della relazione di appartenenza. Sempre sulla base della stessa proprietà,
si identificano ora le due indeterminate, si considera cioè la formula δ(x) data da x∈x. Forse questa
formula può causare qualche dubbio di carattere epistemologico. È un esempio di formula impredicativa. Solitamente si cerca di evitare tali tipi di formule per il sospetto di circolarità che portano
con sé. Nella matematica tradizionale vi sono molti casi di situazioni analoghe. 4 Per chiarire: si è
detto prima che un insieme è dato quando si esibisce una lista dei suoi elementi o si trova una proprietà che caratterizza tutti e soli i suoi elementi. Ora porre x∈x fa nascere il sospetto di una sorta di
circolo vizioso: per dare x si devono dare prima i suoi elementi ma tra essi c’è proprio x e quindi
questa assegnazione non è possibile. Ovviamente se x è dato con una proprietà può essere banale
provare che x∈x; anzi il circolo vizioso può non apparire tale. In questa posizione c’è una compo-
4 Per approfondimenti si veda Marchini C.: (1992). Le definizioni e le notazioni, un problema didattico, su Marchini C. ed, Q.1 Qua-
derni Dip. Mat. Univ. Lecce, Seminari di Didattica A.A. 1990/91 e 1991/92, 125 - 143.
173
Capitolo 6
Il problema dei fondamenti
nente ontologica da discutere: se esistono solo gli insiemi che si sanno costruire mediante formule
del linguaggio adeguato, x∈x è una formula scorretta; se gli insiemi hanno una loro esistenza indipendente dalle strategie rappresentative utilizzate, la formula x∈x rappresenta solo la descrizione di
un fatto, quindi non è scorretta. Non ci sono motivi puramente logici per escludere x∈x, anche se
tale esclusione può essere utile. Facendo riferimento all’esperienza comune, l’insieme delle seggiole contenute in un’aula non è una seggiola, quindi non appartiene a se stesso. Verrebbe voglia di dire che non si ha mai x∈x, ma è sempre x∉x. D’altra parte l’insieme dei concetti astratti è un concetto astratto (ammesso che si trovi un accordo su che cosa sia un concetto astratto). Trascurando, per
il momento questi aspetti, si analizza se la considerazione della formula x∈x, può dare luogo ad inconvenienti. Come prima si considera l’insieme ottenuto per il principio di astrazione, individuato
dalla formula e sia a = {z | δ(z)} = {z | z∈z}. Si ha così, per il generico w,
w∈a ↔ w∈{z | δ(x)} ↔ δ(w) ↔ w∈w.
Le considerazioni precedenti invitano ora ad analizzare se a∈a oppure a∉a. Nel primo caso, a∈a,
a∈a ↔ a∈{z | δ(z)} ↔ δ(a) ↔ a∈a,
ottenendo in tal modo una banalità; nel secondo caso, a∉a, si ha
a∉a ↔ a∉{z | δ(z)} ↔ ¬δ(a) ↔ a∉a,
quindi ancora una banalità. Sarà soltanto con la richiesta esplicita di un assioma
specifico della teoria degli insiemi, l’assioma di fondazione nel sistema di Zermelo-Fraenkel, (dal nome di Zermelo che propose un sistema assiomatico per la
Teoria degli Insiemi, in seguito integrato da Fraenkel) che si esclude l’esistenza
Abraham Fraenkel
(1891 - 1965)
di a, o meglio si otterrà {z | z∈z } = ∅, in accordo con l'intuizione di cui si diceva prima.
Russell, nella lettera a Frege, accentrava l'attenzione su un tipo diverso di problema, che però oggi
possiamo presentare come la formula x∉x. Questa è una proprietà più ‘ragionevole’ della precedente almeno alla luce del problema della definizione. Ad esempio l'insieme delle seggiole gode di
questa proprietà, così come l'insieme dei bambini in un'aula, eccetera.
6.2.2.4. Russell e i barbieri. Seguendo l'argomentazione precedente, sia ρ(x) la formula x∉x. Per il
principio di comprensione esiste un insieme r = {x | ρ(x)} = {x | x∉x}. Si ha così
y∈r ↔ y∈{x | ρ(x)} ↔ ρ(y) ↔ y∉y.
In questo caso interessa esprimere anche quando y∉r. Si ha
y∉r ↔ y∉{x | ρ(x)} ↔ ¬ ρ(y) ↔ ¬(y∉y) ↔ y∈y.
174
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
La domanda che pose Russell a Frege si può parafrasare sostanzialmente come segue: cosa capita se
nelle formule precedenti pongo r in luogo di y? Eseguendo la sostituzione letterale si ha:
r∈r ↔ r∈{x | ρ(x)} ↔ ρ(r) ↔ r∉r;
r∉r ↔ r∉{x | ρ(x)} ↔ ¬ρ(r) ↔ ¬(r∉r) ↔ r∈r. 5
Quindi se si assume che r∈r, si ottiene r∉r, negazione della ipotesi; se si assume r∉r, si ottiene la
negazione di questa seconda ipotesi, cioè r∈r. In entrambi i casi si ottiene un assurdo, ma i due casi
r∈r e r∉r sono esaustivi, almeno secondo la logica classica. La conclusione è che siamo in presenza
di un paradosso, quello noto appunto col nome di Paradosso di Russell.
Si mostra in modo analogo che se il complementare di un insieme è un insieme e se una collezione
contenuta in un insieme sia a sua volta un insieme, allora si ottengono affermazioni paradossali. Infatti si consideri l’insieme vuoto: ∅, se il suo complementare è un insieme, C∅ = {x | x∉∅}. Ma in
tal caso si ha r = {x | x∉x} ⊆ C∅, quindi r è un insieme, riottenendo così il Paradosso di Russell.
Talvolta i testi per evitare queste difficoltà introducono il concetto di universo, concetto non precisato e che, ad un’analisi più approfondita pone più problemi di quanti non ne voglia risolvere.
Si potrebbe tentare di risolvere il paradosso mettendo in dubbio che esista l’insieme r definito precedentemente, e quindi interpretare la dimostrazione conclusasi con un assurdo, come dimostrazione che l’insieme r non esiste.
Ma tra le proposizioni primitive del sistema di Frege ce n’è una, indicata col nome di Principio V
che è un principio che combina assieme estensionalità e comprensione. In simboli consueti tale
principio si può scrivere
{x | P(x)} = {x | Q(x)} ↔ ∀x(P(x) ↔ Q(x))
ove P e Q sono proprietà arbitrarie. Questo principio stabilisce come è possibile controllare le
estensioni mediante le intensioni. In tale principio V è implicito il fatto che data una proprietà
esiste la sua estensione, il principio di comprensione o astrazione, mediante il quale esiste
l’insieme ‘incriminato’.
Frege palesa qualche difficoltà ad accettare tale principio perché nella prefazione del primo volume
dei Grundgesetze, scrive
«A quanto mi è dato vedere, una questione può sorgere soltanto a proposito del mio principio V […] Io ritengo
quel principio solamente logico. Comunque sia con ciò viene indicato il luogo dove deve cadere la decisione »
(da Borga & Palladino, 1997)
5 Questa sostituzione è stata eseguita graficamente ricopiando la formula precedente e dando al calcolatore il comando "search and
replace", presente, con vari nomi in ogni word-processor. Il calcolatore non si è ‘spaventato’, forse il lettore sì, o meglio si è ‘spaventato’ Frege!
175
Capitolo 6
Il problema dei fondamenti
Se si pensasse che il Paradosso di Russell sia la dimostrazione che non esiste un insieme come r, la
dimostrazione è comunque presente, perché dal principio di astrazione si ha, in ambito insiemistico,
il teorema
∃y∀x (x∈y ↔ x∉x)
mentre è un teorema logico (dimostrato per assurdo), vale a dire senza che intervengano proprietà
degli insiemi, che per ogni predicato binario P,
¬∃y∀x(P(x,y) ↔ ¬P(x,x)).
Infatti se si assume che esista a tale che ∀x(P(x,a) ↔ ¬P(x,x)), allora particolarizzando con a, si avrebbe P(a,a) ↔ ¬P(a,a) e, quindi, un assurdo, in quanto si ripeterebbe la conclusione vista nel paradosso, in quanto si può leggere l’ultima formula come P(a,a) → ¬P(a,a) e ¬P(a,a) →P(a,a). È
ovvio che se P(x,y) è x∈y, si ottiene come teorema logico e, pertanto, anche come teorema della
Teoria degli insiemi, la negazione dell’esistenza di un insieme ‘di Russell’, garantita dall’assioma di
comprensione.
Queste considerazioni forniscono strumenti per distinguere il paradosso di Russell dal cosiddetto
paradosso del barbiere o altre versioni analoghe, in cui non compare l’appartenenza, ma relazioni di
altra natura: “--- fa la barba a …”. Il paradosso del barbiere dice che il barbiere fa la barba a se stesso se e solo se non egli non fa la barba a se stesso. La conclusione in questo caso è la inesistenza del
barbiere o di un paese in cui la situazione è descritta dal paradosso del barbiere, non l’assurdo che
Russell mostra ‘connaturato’ alla teoria di Frege (e degli insiemi), quindi porterebbe a dire che stavolta non esista la Matematica!
6.2.2.5. La reazione di Frege. Frege, messo di fronte ai problemi sollevati dalla lettera di Russell,
dopo pochi giorni, Frege risponde:
«
Jena, 22 giugno 1902
Caro collega,
Tante grazie per la vostra interessante lettera del 16 giugno. Mi compiaccio che voi siate d’accordo con me su
molti punti e che abbiate intenzione di discutere approfonditamente la mia opera. In risposta alla vostra richiesta
vi mando le seguenti pubblicazioni:
Kritische Beleuchtung,
Über die Begriffsscrift des Herrn Peano
Über Begriff und Gegenstand
Über Sinn und Bedeutung
Über die formale Theorien der Aritmetik.
Ho ricevuto una busta vuota che mi sembra sia stata indirizzata a me dalla vostra mano. Suppongo voleste inviarmi qualcosa che sia stato accidentalmente perso. Se questo è il caso, vi ringrazio per la vostra gentile intenzione. Allego il frontespizio della busta. Quando ho riletto il mio Begriffsschrift, di nuovo, ho trovato che ho
cambiato il mio punto di vista su vari argomenti, come potrete vedere se paragonerete la mia opera precedente
con i miei Grundgesetze der Arithmetik. Vi invito a cancellare il paragrafo che inizia con “Nicht minder erkennt
man” a pagina 7 di Begriffsschrift, perché non è corretto; per inciso, questo non ha effetti sul resto dei contenuti
del libretto.
La vostra scoperta della contraddizione mi ha causato una grande sorpresa e, oserei dire, costernazione, in quanto
essa ha scosso le basi su cui intendevo costruire l’Aritmetica. Sembra allora che, trasformare la generalizzazione
176
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
di un’uguaglianza in un’uguaglianza sul decorso dei valori (§9 dei miei Grundgesetze) non sia sempre permesso,
che la mia regola V (§20, p. 36) sia falsa, e che le mie spiegazioni nel § 31 non siano sufficienti ad assicurare che
le mie combinazioni di segni abbiano significato in ogni caso. Devo riflettere ulteriormente sulla questione. Con
la perdita della Regola V, la situazione diviene complicata, non solo per la fondazione della mia aritmetica, ma
anche la sola fondazione dell’Aritmetica, sembra svanire. Ancora, dovrei pensarci, sarebbe possibile mettere a
punto condizioni per la trasformazione di una generalizzazione di un’uguaglianza in una uguaglianza sul decorso
dei valori in modo che gli aspetti essenziali delle mie dimostrazioni restino intatti. In ogni caso la vostra scoperta
è assai notevole e ne risulterà un grande vantaggio per la logica, anche se ad un primo sguardo potrebbe sembrare una iattura.
Incidentalmente, mi sembra che l’espressione “un predicato è predicato di se stesso” non sia esatta. Un predicato
è come una regola, una funzione di primo livello, e questa funzione richiede un oggetto per argomento e non può
avere se stesso come argomento (soggetto). Pertanto preferirei dire: “una nozione è predicata della sua propria
estensione”. Se la funzione Φ(ξ) è un concetto, io denoto sua estensione (o la classe corrispondente) con “εΦ(ε)”
(per essere sicuri, la giustificazione per questo è diventata dubbia per me). In “Φ(ε
Φ(ε))” oppure in
“εΦ(ε)∩εΦ(ε)” 6 allora abbiamo un caso in cui il concetto Φ(ξ) è predicato della sua stessa estensione.
Il secondo volume dei miei Grundgesetze apparirà tra breve: non dubito che dovrò aggiungere un’appendice in
cui si terrà conto della vostra scoperta. Se solo avessi già un punto di vista chiaro per essa!
Molto rispettosamente vostro
G. Frege » (tradotto da Van Heijenoort, 1967).
Frege aveva due possibilità: la prima, che probabilmente rispecchierebbe certi atteggiamenti
dell’odierno ambiente accademico, era quella di cestinare la lettera del giovanotto in quanto esponente non ancora affermato di un ambiente universitario straniero e continuare sulla sua strada, ma
abituato, come era da tanti anni di polemiche, sostenute spesso dalla sua capacità di analizzare in
modo approfondito le proposte altrui, si rende conto che non è possibile fare finta di niente e quindi
adotta la seconda possibilità, assai più difficile da accettare: quella di dichiarare pubblicamente
l’errore commesso. Anche qui avrebbe potuto scegliere di pubblicare una dichiarazione su un giornale scientifico poco importante, solo per mettersi la coscienza in pace. Ma preferisce fare diversamente. Stava per uscire la seconda parte del suo trattato Grundgesetze der Aritmetik, che pubblicherà nel 1903. Rendendosi conto dell’importanza della scoperta di Russell, prima tenta di risolvere il
problema presentatosi, pronto ad effettuare cambiamenti sull’opera che aveva in bozze, ma si rende
conto che non si tratta di un ‘aggiustamento’ locale possibile, perché l’argomentazione propostagli,
va ad incidere in profondità sui principi logici che avevano in sé un alto grado di evidenza (e di
condivisione nel mondo scientifico del tempo, come prova il fatto che anche Cantor ne faceva uso).
L’idea di Frege era quella d’indebolire il principio di comprensione. Ma non poteva andar bene, in
quanto Leśniewski nel 1938, proverà che il tentativo intrapreso portava comunque a contraddizione.
Ed allora Frege decide di pubblicare il volume che aveva in preparazione, così come lo aveva pensato, ma aggiunge un’appendice in cui scrive un brano esemplare per onestà intellettuale, ma in cui
è presente il suo stato d’animo che trapassa dalla sorpresa alla costernazione:
«A uno scrittore di scienza ben poco può giungere più sgradito del fatto che, dopo avere completato un lavoro,
venga scosso uno dei fondamenti della sua costruzione. Sono stato messo in questa situazione da una lettera del
signor Bertrand Russell, quando la stampa di questo volume stava per essere finita. Si tratta del mio principio
(V). Non mi sono mai nascosto che esso non è così evidente come tutti gli altri e come propriamente si deve esigere da una legge logica. E infatti ho accennato a questa debolezza anche a pagina VII della prefazione del primo
volume. Avrei volentieri rinunciato a questo fondamento se avessi saputo come sostituirlo. E ancora adesso non
6 Il simbolo ∩ è usato da Frege per ridurre le funzioni di secondo livello a funzioni di primo livello.
177
Capitolo 6
Il problema dei fondamenti
comprendo come l’aritmetica possa venire fondata scientificamente, e come i numeri possano venire afferrati e
inseriti nella trattazione come oggetti logici, se non ci è permesso – almeno in modo condizionale –passare da un
concetto alla sua estensione. Posso parlare in ogni caso dell’estensione di un concetto, ossia posso in ogni caso
parlare di una classe? E se no, in che modo si riconoscono i casi che fanno eccezione? Dal fatto che l’estensione
di un concetto coincide con quella di un altro, si può sempre concludere che ogni oggetto che cade sotto il primo
concetto, cade pure sotto il secondo? Tali questioni vengono sollevate dalla comunicazione di Russell.» (da
Borga & Palladino, 1997).
Di fatto, dopo la pubblicazione del secondo tomo dei Grundgesetze, Frege interrompe la sua ricerca
sui fondamenti della Matematica ed anche Dedekind che aveva condiviso in parte l’approccio logicista, si oppone alla ripubblicazione di Was sind und was sollen die Zahlen? Solo più tardi Gödel
osserverà che il paradosso di Russell non è un problema della teoria degli insiemi, bensì una carenza della teoria delle proprietà.
Ha anticipato queste posizioni Schönflies sostenendo la necessità di distinguere chiaramente tra Matematica e Logica, per cui
Kurt Gödel
(1906 – 1978)
riteneva che i paradossi fossero conseguenza di aspetti filosofici
e non avessero conseguenze matematiche.
Arthur Schönflies
(1853 – 1928)
6.2.3. Altre antinomie. Lo stesso anno 1903 in cui appare la ‘confessione’ di Frege, Russell pubblica
The Principles of Mathematics, in cui professa la sua fiducia nel logicismo con la frase:
«The fact that all Mathematics is Symbolic Logic is one of the greatest discoveries of our age; and when this fact
has been established, the remainder of the principles of mathematics consists in the analysis of Symbolic Logic
itself.»
Nel testo, oltre alla prima versione pubblicata del suo paradosso, Russell propone anche i paradossi
di Cantor (sul numero cardinale massimo) ed una versione modificata, rispetto all’originale di Burali-Forti (sul numero ordinale massimo). Queste due ultime antinomie richiedono la conoscenza dei
concetti di numero cardinale ed ordinale, così come introdotti da Cantor. Ma era possibile dare una
‘versione’ diversa del paradosso di Cantor, utilizzando l’insieme di tutti gli insiemi (provando così
che si tratta di un esempio di molteplicità contraddittoria). Sia quindi V tale insieme. Se ne considera l’insieme della parti, P(V) i cui elementi sono insiemi. Si ha pertanto che P(V) ⊆ V. D’altra parte
la funzione ‘singoletto’, {⋅}: V → P(V) è iniettiva. Per il teorema di Cantor (si veda 5.1.3.), non esiste una biezione tra V e P(V), ma per il teorema di Cantor-Schröder-Bernstein avendosi tra i due insiemi le opportune iniezioni (una realizzata dall’inclusione), tra i due insiemi vi è una biezione, in
contrasto con il citato teorema di Cantor.
Si è discusso sul ruolo avuto dalla pubblicazione del testo di Russell sul successivo ‘fiorire’ di antinomie. Nel giro di pochi anni compaiono vari paradossi: nel 1904 quello di G. Berry, bibliotecario
all’Università di Oxford, comunicato per lettera a Russell che lo presenterà nel 1906 e poi nel 1908,
attribuendolo al suo autore. Nel 1905 viene presentata l’antinomia di Richard.
178
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
Nel 1908 Russell pubblica il corposo articolo Mathematical Logic
as based on the Theory of Types, sull’American Journal of Mathematics, in cui ripresenta i paradossi già noti ed a questi ne aggiunge altri, tra i quali anche il paradosso di König, riadattando un
Jules Richard
(1862 – 1956)
argomento che König stesso aveva utilizzato nel 1904 per dimostrare che non è possibile bene ordinare l’insieme dei numeri reali.
Julius König
(1949 – 1913)
6.2.3.1. Il Paradosso di Berry. Si consideri uno specifico dizionario della lingua italiana. In esso vi
sono parole di uso matematico, è possibile che vi si trovi una voce relativa alla parola ‘tre’. Altre
volte si possono trovare parole che hanno un significato quotidiano, ma che vengono utilizzate con
altro significato in Matematica, ad esempio l’aggettivo ‘integrale’ che diviene un sostantivo nella
scienza con significato diverso da quello usato quando si parla di pane integrale. In altri casi ci possono essere frasi che servono a definire dei numeri, ad esempio ‘il numero dei giorni di un anno bisestile’ o ‘il rapporto tra la lunghezza di una circonferenza e quella del suo diametro’. Si considerino ora le frasi che definiscono univocamente dei numeri naturali. Queste costituiscono un sottinsieme proprio dell’insieme delle frasi della lingua italiana che possono costruirsi con il dizionario
specificato. Siccome l’alfabeto della lingua italiana è costituito da un numero finito di lettere alle
quali si possono aggiungere i segni di interpunzione, anche il numero di parole che sono riportate
sul dizionario considerato sono un numero finito, mentre le successioni finite di parole tratte dal dizionario (con o senza significato) sono infinite, ma sono numerabili, cioè esiste una corrispondenza
biunivoca tra numeri naturali e frasi.
Si considerino ora tutte le frasi che definiscono univocamente dei numeri naturali e le si dispongano
per numero di parole usate. È possibile che due frasi definiscano lo stesso numero. Si fissi adesso
un numero abbastanza grande, ad esempio diecimila (una miriade) e si individuino tutti i numeri naturali che si possono descrivere con frasi della lingua italiana composte con non più di diecimila parole tratte dal dizionario. L’insieme delle frasi considerate è finito e quindi sarà pure finito il numero cardinale dei numeri naturali definibili in questo modo. Non si riesce, pertanto ad esaurire
l’intero insieme dei numeri naturali. Pertanto esisteranno dei numeri naturali che non sono definibili
con diecimila parole tratte dal dizionario. Dato che l’insieme dei numeri naturali è bene ordinato,
esisterà un minimo numero che non è descrivibile con frasi contenenti diecimila parole tratte dal dizionario.
Il brano precedente dal titolo del sottoparagrafo fino al punto è una frase che definisce un numero
naturale. Il numero delle parole utilizzate è 346 e 2.217 i caratteri impiegati (spazi inclusi). Quindi
179
Capitolo 6
Il problema dei fondamenti
abbiamo una definizione con meno di diecimila parole del più piccolo numero naturale non descrivibile con diecimila parole. In ciò consiste l’assurdo.
6.2.3.2. Il paradosso di Richard. Anche questa antinomia e si basa sempre sulle frasi della lingua
italiana che si possono scrivere usando le parole tratta da un fissato dizionario. Si è visto prima che
esiste una corrispondenza biunivoca tra i numeri naturali e le frasi siffatte che individuano numeri
naturali. Si possono, pertanto, enumerare le frasi che esprimono proprietà dei numeri naturali, stavolta non definizioni, anche se le frasi che definiscono univocamente un numero le consideriamo
come esprimenti proprietà dei numeri naturali. Si hanno quindi frasi che non si prendevano in considerazione nella presentazione del paradosso di Berry. Egualmente l’insieme delle frasi che si considerano ora, essendo un sottinsieme infinito di un insieme numerabile è anch’esso numerabile.
Quindi esiste una corrispondenza biunivoca tra i numeri naturali e le frasi che esprimono proprietà
dei numeri naturali. La cosa può essere fatta in infiniti modi. Fissiamone uno, per altro arbitrario,
associando ad ogni frase considerata un numero naturale che diremo indice della frase. Con la scelta
fatta può accadere che il numero di indice di una frase soddisfi la proprietà descritta dalla frase. In
questo caso si dirà che il numero è non richardiano. Se invece l’indice della frase non soddisfa la
proprietà descritta dalla frase, il numero si dice richardiano.
Ma anche in questo caso il brano descritto è una frase che descrive una proprietà dei numeri naturali, il fatto di ‘essere richardiano’. Pertanto, nella fissata corrispondenza biunivoca tale frase ha un
indice r. Il problema è decidere se il numero naturale r è un numero richardiano oppure no. Anche
in questo caso sono possibili due casi: r è richardiano oppure r non è richardiano. Nel primo caso
essendo r richardiano, r non soddisfa la proprietà di essere richardiano, quindi se r è richardiano
non è richardiano. Ma se r non è richardiano non soddisfa la proprietà di essere richardiano e quindi
è richardiano. E si cade così ancora in assurdo.
6.2.3.3. Il paradosso di Zermelo – König. Al terzo congresso internazionale dei matematici, svoltosi
ad Heidelberg nel 1904, furono presentati due contributi che avevano entrambi per oggetto il buon
ordinamento sull’insieme R dei numeri reali, uno di Zermelo e l’altro di König. Le conclusioni cui
giungevano erano opposte. Per Zermelo tale buon ordinamento esisteva, per König non poteva esistere. Entrambi avevano ragione, ma entrambi nella presentazione commettevano errori, che si affrettarono a correggere. Per König la non esistenza del buon ordine sull’insieme dei numeri reali si
dimostrava per assurdo, nel modo seguente. Si considerino le frasi della lingua italiana che definiscono numeri reali (se ne è visto un esempio in 6.2.3.1.) Per il fatto che l’insieme delle frasi è numerabile e l’insieme dei numeri reali no, stante il risultato di Cantor (si veda 5.1.3.), esistono allora
180
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
numeri reali che non possono essere descritti con frasi della lingua italiana. Se si assumesse che
l’insieme R è bene ordinato, allora esisterebbe un minimo numero naturale che non può essere descritto con una frase della lingua italiana, ma il brano sopra riportato è esattamente una definizione
di tale numero non definibile. Di qui König conclude che il buon ordine su R non è possibile.
L’ipotesi assurda è però esattamente la tesi che Zermelo dimostra. Quindi se si considera solo il
contributo di König, non c’è assurdo, ma questo nasce se assieme si considera quanto provato da
Zermelo. La sorte ha voluto così che i due contendenti fossero ricordati assieme per tale paradosso.
6.2.4. Le analisi dei paradossi. Poco dopo la presentazione del testo di Russell, altri paradossi vennero posti all’attenzione dei logici e dei matematici.
Un ulteriore esempio di antinomia è dovuta a Kurt Grelling (1886 – 1942) Leonard Nelson (1882 –
1927) che pubblicano assieme Bemerkungen zu den Paradoxien von Russell und Burali-Forti sulle
Abhandlungen der Fries’schen Schule del 1907/1908. Il paradosso è ‘poco naturale’, essendo costruita una situazione linguistica apposita per giungere ad un paradosso e in questo senso è poco interessante. Si definisce autologico un aggettivo che si applica a se stesso, ed eterologico un aggettivo che non si applica a se stesso. Gli aggettivi ‘piano’ e ‘polisillabo’ sono autologici, l’aggettivo
‘tronco’ è eterologico. Presentate in questo modo le definizioni rilevanti, la domanda è se ‘eterologico’ è eterologico o no. La conclusione è che se ‘eterologico’ fosse eterologico, allora sarebbe autologico, mentre se fosse autologico, dovrebbe essere eterologico.
La rilevanza di questo paradosso è che, come nel caso dell’antinomia di Russell,
per presentarlo non si fa riferimento all’infinito, come invece avviene per altri paradossi illustrati in precedenza.
Un altro motivo di interesse è che Ramsey , di cui avremo modo di parlare in seFrank P. Ramsey
(1903 - 1930)
guito, attribuisce questo paradosso a Weyl, il quale, a sua volta nel volume Das
Kontinuum (1918) lo attribuisce a Russell, in quanto il paradosso più famoso,
prima di essere esposto mediante le classi e l’appartenenza, era formulato in termini di predicati: detto impredicabile un predicato che non si applica a se stesso, allora “essere impredicabile” fornisce il paradosso.
Per tale fiorire di antinomie la situazione diveniva insostenibile, in quanto sembrava che dietro ad ogni argomento matematico e si celasse o si potesse celare una
contraddizione. Il congresso di Heidelberg e le analisi di vari matematici, avevano
Hermann Weyl
(1885 – 1955)
messo in luce che un altro principio che Cantor aveva accettato come intuitivo, cioè l’assioma della
scelta, era anch’esso causa di perplessità. Pian piano si iniziava anche a riconoscere che tale principio ‘sospetto’ non era solo una richiesta da utilizzare nella abbastanza ‘esotica’ teoria dei numeri
181
Capitolo 6
Il problema dei fondamenti
cardinali, ma la riflessione su di esso iniziava a mostrare risultati in vari campi (Analisi. Algebra,
Topologia, Ordine) che direttamente o indirettamente ne facevano uso, in varie forme.
Una conclusione fu quella che non ci si potesse fidare degli insiemi e dell’infinito, e quindi si dovessero cercare altrove i fondamenti della Matematica.
Sotto questo rifiuto si rivela una vena kantiana, a volte celata, a volte scoperta. La ‘realtà’ degli insiemi richiede un approccio di tipo realista – platonico e questo fa ricorso alla Metafisica, collocando le idee in un mondo iperuranio. In tal modo la matematica assume posizioni che Kant e i suoi seguaci avevano rifiutato, dopo la cosiddetta ‘rivoluzione copernicana’ del filosofo di Königsberg.
6.2.4.1. Circolo vizioso e autoriferimento. Si incominciò, allora, a vedere che le antinomie avevano
alcune caratteristiche comuni. Russell propose che la causa dei paradossi fosse una sorta di “autoriferimento” e proprio per evitare ciò, propose una teoria dei tipi, nell’articolo del 1908. Tale proposta
verrà poi rielaborata e presentata assieme a Whitehead nei Principia Mathematica, a partire dal 1910.
La posizione di Poincaré è diversa. Per lui i paradossi sono un segnale che affidarsi alla sola logica
può essere pericoloso, ed il pericolo lo individua nel fatto che non basterebbe la definizione per individuare un ente matematico. Bisogna che gli enti siano definiti in modo contenutisticamente sensato, perché per poter definire un ente come un insieme, bisogna prima di tutto avere gli oggetti di
cui questo insieme sarà poi l’astrazione. Così la definizione sarà possibile come atto mentale che
individua una totalità di enti già dati indipendentemente dalla totalità stessa o da altri enti la cui esistenza dipenda dalla totalità da definire. Questo viene proposto da Poincaré con il nome di Principio
del circolo vizioso. La sua accettazione dà origine ad una corrente di pensiero detta Predicativismo.
La critica che Poincaré presenta si basa su un assunto epistemologico da chiarire: la Matematica si
scopre o si inventa? La sua risposta, e con lui un buon numero di studiosi, tra cui quelli dell’allora
importante scuola francese di Analisi matematica, era la seconda. Sotto questa ipotesi la richiesta di
Poincaré è corretta, ma non ci sono ragioni logiche per dire che non si possa dare una definizione
impredicativa, perché se la definizione è descrizione di una realtà (metafisica) da scoprire, eventuali
manchevolezze della definizione stessa non influiscono sugli oggetti in sé.
Quindi la nozione di definibilità formale ha pienamente senso e legittimità negli approcci di Frege e
del Logicismo, e parzialmente anche per Cantor, perché non si preoccupa di un altro aspetto, quello
della costruibilità a partire ‘dal basso’. Probabilmente si potrebbe osservare che questa fiducia nella
definizioni formali si basa su una fiducia che il fatto linguistico sia adeguato a descrivere la ‘realtà’
fisica e metafisica e i paradossi hanno scosso proprio tale fiducia.
La corrente del Predicativismo si è coniugata in alcuni studiosi con aspetti diversi, ma ha avuto il
merito di mettere in luce che molti concetti della nostra materia si avvalgono di definizioni impredi182
C. Marchini – Appunti delle lezioni di Fondamenti della Matematica
Anno Accademico 2009/2010
cative. Questo deve fare riflettere il matematico sulla sua epistemologia implicita, avendo ‘a disposizione’ almeno le seguenti alternative:
–
accettare un punto di vista strettamente realista-platonico e quindi non riservare attenzione alla
‘qualità’ delle definizioni, oppure
–
dare maggiore rilievo ad aspetti empirici e ad un contatto con la realtà, per cui la matematica è
frutto di invenzione o di convenzioni e, così, rinunciare agli elementi neutri dei gruppi, alla moltiplicazione dei numeri naturali, agli estremi superiori di insiemi di numeri reali superiormente
limitati, ecc.; oppure ancora
–
fare sforzi per evitare le definizioni impredicative e cercare ‘sostitute’ predicative che permettano risultati abbastanza prossimi a quelli ‘standard’.
6.2.4.2. “Exemplo de Richard non pertine” – Ramsey. Nel 1906 Peano scrive (nel suo latino) Super
theorema de Cantor-Bernstein et Additione. In tale opera fa un’osservazione:
«Exemplo de Richard non pertine ad mathematica sed ad linguistica»
Con questa frase Peano vuole significare che l’origine del paradosso di Richard, anche se
l’argomentazione tratta numeri naturali, non va cercata nell’aritmetica (sulla cui coerenza non aveva
dubbi), ma nelle frasi di contorno: ‘definibile’, ‘proprietà’ ‘soddisfare’. È ben vero che sono parole
usate in Matematica ed anche in Logica, ma per vari motivi, mancano di esse definizioni precise. In
questa stessa situazione è il paradosso di Berry.
Quando Peano scrive il suo articolo, Ramsey ha tre anni e non credo fosse interessato ai problemi
fondazionali. Venti anni dopo la situazione è cambiata e proprio quella frase fa scattare nel giovane
inglese l’idea di una possibile classificazione dei paradossi in due classi: i paradossi sintattici e
quelli semantici. Forse sarebbe più corretto parlare dei paradossi matematici e linguistici, per riprendere la frase di Peano. Una tabella individua tale partizione:
Paradossi sintattici Paradossi semantici
o matematici
o linguistici
Mentitore
Russell
Berry
Cantor
Richard
Burali-Forti
Grelling – Nelson
…..
Questa elencazione non comprende il paradosso di Zermelo-König, perché esso è causato dalla adozione/non adozione dell’assioma di scelta: in una teoria in cui si assume l’assioma di scelta si ha il
buon ordinamento di ogni insieme, quindi anche dell’insieme dei numeri reali, ed allora si ha un paradosso di tipo semantico (per l’uso delle definizioni). Se non si assume l’assioma di scelta König
dimostra che l’insieme dei numeri reali non è bene ordinabile. In altro modo ancora, ma questo ri-
183
Capitolo 6
Il problema dei fondamenti
chiederà un ulteriore approfondimento, l’eventuale buon ordinamento dei numeri reali non è costruttivo.
I paradossi semantici mostrano, precipuamente quello del mentitore, una commistione - confusione
tra linguaggio e metalinguaggio, ma per chiarire la situazione ci vorrà Tarski.
La prima fase degli studi dei fondamenti è stata concentrata, generalmente, sulla soluzione o la rimozione dei paradossi matematici. Un primo accenno dell’importanza dei paradossi semantici si
avrà con Tarski e porterà alla ‘invenzione’ della semantica. Ma se si vuole assistere ad una sensata
‘rimozione’ o ‘risoluzione’ dei paradossi semantici, bisogna aspettare il 1979 e la matematica alternativa.
Altra storia, diversa anche se spesso intrecciata con quella dei fondamenti, sarà quella relativa
all’assioma di scelta.
Al primo apparire dei problemi e dei tentativi di soluzione, non si farà netta distinzione tra cosa
comportava l’assioma di scelta e come agissero i paradossi. Solo più tardi la matassa si dipana chiaramente nel 1965.
Oggi il periodo immediatamente a ridosso della scoperta dei paradossi e dei primi tentativi di soluzione degli stessi prende il nome di “Crisi dei fondamenti della Matematica”, dal titolo di un articolo di Weyl: Über die neue Grundlagenkrisis der Mathematik, apparso nel 1921 su Mathematische
Zeitschrift.
184
Scarica

Capitolo 6. Il problema dei fondamenti. 1