L’ANALISI REALE NEL 19° SECOLO 1. Osservazioni introduttive. Il 19° secolo è stato spesso chiamato l’epoca del rigore nella matematica. La ricerca del rigore non si limitò a chiarire alcuni concetti essenziali e a migliorare la dimostrazione di alcuni teoremi fondamentali, ma riguardò ogni aspetto dell’analisi, fornendole le basi e uno stile che ancora oggi è considerato soddisfacente e viene insegnato nelle Università. Inoltre, questa tendenza al rigore portò alla creazione di nuovi ambiti disciplinari, generando in particolare nuovi concetti, quali: continuità (e convergenza) puntuale e uniforme, compattezza, completezza, ecc.. Nondimeno, sarebbe sbagliato dedurne che, nel 19° secolo la maggior parte dei matematici considerasse la ricerca del rigore come il problema più urgente dell’analisi. La grande maggioranza dei matematici dell’epoca, come avevano fatto i loro predecessori, continuava a lavorare principalmente su problemi tecnici. Infatti, furono alcuni sviluppi tecnici della matematica quelli che offrirono una delle ragioni principali per affrontare con impegno le questioni fondazionali. La teoria delle serie di Fourier svolse un ruolo particolarmente importante in questo senso, poiché mise in crisi le vecchie idee sui concetti di funzione, integrale, convergenza, continuità, ecc., ma anche altri ambiti contribuirono al processo di ricerca del rigore: le equazioni differenziali, la teoria del potenziale, le equazioni ellittiche. (v. equazioni differenziali ordinarie, calcolo delle variazioni, calcolo di più variabili). L’insegnamento costituì un’altra motivazione verso la ricerca del rigore nell’analisi. Fu la premessa per le riforme di Chauchy e di Weierstrass e per la costruzione dei numeri reali di Dedekind e di Méray. Esse emersero dall’insoddisfacente situazione in cui si venivano a trovare questi matematici quando dovevano insegnare i fondamenti dell’analisi. Infine, il deciso progresso di emancipazione della matematica dalla scienza, rafforzò il convincimento che i fondamenti dell’analisi dovessero essere rivisti. 2. Il lavoro di Cauchy. È possibile dividere il processo di ricerca del rigore nell’analisi in due periodi: un periodo francese, dominato da Augustin-Louis Cauchy (1789-1857) e un periodo tedesco, dominato da Karl Weierstrass (1815-1897). Cominciamo quindi con la Francia e con la figura dominante di Cauchy (v. Belhoste, 1 1991). Cauchy studiò ingegneria a Parigi, alla Ecole Polytechnique e alla Ecole des Ponts e Chaussées, ma dopo la restaurazione della monarchia, nel 1815, cominciò ad insegnare analisi alla Ecole Polytechnique. Il suo lavoro sui fondamenti dell’analisi reale cominciò durante i 15 anni di insegnamento del Cours d’analyse alla Ecole Polytechnique. Era norma che un corso presso l’Ecole Polytechnique dovesse essere scritto e pubblicato, cosicché la diffusione delle idee di Cauchy sull’analisi reale procedette più speditamente del successivo lavoro sull’analisi complessa. Nel 1821 Cauchy pubblicò la prima parte del Cours d’analyse. L’anno successivo alla pubblicazione, il programma dei corsi fu modificato radicalmente, e Cauchy pubblicò il Resumé des leçons données a l’Ecole royale polytechnique sur le calcul infinitésimal, [tome premier] (1823), e finalmente, nel 1829, le Leçons sur le calcul différentiel (v. Gilain, 1989). Il successo di Cauchy come insegnante fu limitato. La maggior parte dei suoi studenti e perfino dei suoi colleghi, chiedevano una matematica più applicabile e una minore insistenza sui fondamenti. Eppure, è proprio l’insistenza sui fondamenti che ha reso famoso Cauchy come iniziatore del movimento verso il rigore. La definizione di Cauchy dei concetti fondamentali dell’analisi sono più descrittive e meno formali di quelle moderne ma, come è stato fatto osservare da Grabiner (1981), tutti gli elementi formali sono presenti quando Cauchy comincia ad utilizzare questi concetti nelle dimostrazioni. Infatti, come hanno fatto notare Grabiner, 1981, Bottazzini, 1990, Dhombres, 1992, e altri, è l’architettura complessiva dell’analisi di Cauchy, piuttosto che i singoli elementi, che la rende così diversa da quella dei suoi predecessori. Diversamente da loro, Cauchy fece uso effettivo dei nuovi concetti; così, per esempio, la definizione di continuità interviene in modo preciso in molte dimostrazioni, come quella dell’esistenza dell’integrale e la soluzione di equazioni funzionali. Nonostante ciò, l’uso che fece delle nuove idee risultò talvolta impreciso, e certi problemi in alcune delle sue dimostrazioni principali furono risolti solamente dal lavoro di matematici posteriori, ispirati da ciò che lui aveva cominciato. Passeremo ora in rassegna i concetti fondamentali di Cauchy, e gli usi, non sempre completamente soddisfacenti, che ne fece. Limiti e variabili: Già nella definizione di quantità variabile, Cauchy prese le distanze da Leonhard Euler (1707-1783). Secondo Cauchy, le variabili assumono valori diversi, ma non necessariamente tutti i valori, vale a dire, si possono limitare ad un dato 2 intervallo. È interessante osservare che le variabili, secondo Cauchy, possono avere limiti. Questa è una stranezza per il lettore moderno, abituato all'affermazione composta f(x) →b per x→a ma non, separatamente, alle affermazioni f(x)→b o x→a. La differenza tra la concezione di Cauchy e quella moderna però, svanisce quasi completamente quando si considera il modo in cui Cauchy faceva uso del concetto di limite. In tal caso entrano in gioco generalmente due variabili, una delle quali è funzione dell'altra, e il suo concetto viene a coincidere con il nostro. Nonostante alcuni autori del 18° secolo, per esempio Jean D'Alembert (1717-1783), avessero già stabilito a fondamento dell'analisi il concetto di limite di grandezze o di variabili, il lavoro di Cauchy fu molto importante, contribuendo a chiarire le idee dei suoi predecessori, modificandole in alcuni casi in modo sostanziale. Per esempio, era pratica comune ribadire che una variabile non potesse superare né uguagliare il suo limite. Cauchy eliminò tali restrizioni non necessarie. Quantità infinitamente piccole: Cauchy considerava variabili dotate di limiti, e questo gli permetteva di affermare che una variabile con limite zero diventa “infinitamente piccola”. Questo naturalmente non definisce in modo preciso che cosa sia una quantità infinitamente piccola (un infinitesimo). Cauchy assumeva semplicemente che un infinitesimo è una variabile che tende a zero (v. Cauchy, 1821, p.37). Egli fece uso degli infinitesimi in numerosi passi del Cours d'analyse e in altri libri di testo (per esempio nella definizione di continuità), e anche nei suoi articoli di ricerca. Uno dei suoi obiettivi dichiarati era quello di offrire una trattazione rigorosa di questi oggetti euristici (Cauchy, 1823, Avertissement). Per i lettori posteriori, il problema fu che questo rendeva ambigua in modo cruciale la sua definizione di continuità. Continuità: La nozione di continuità è il concetto più innovativo, e probabilmente il concetto centrale, del Cours d'analyse di Cauchy. Questa nozione differisce in modo sostanziale da quella euleriana, allora ampiamente accettata. In verità, era più vicina a quella proposta da Joseph-Louis Lagrange (1736-1813). Scriveva Cauchy: Sia f(x) una funzione della variabile x, e supponiamo che, per ogni valore di x compreso tra due valori limite fissati, questa funzione ammetta un unico valore finito. Se in corrispondenza di un valore di x compreso tra questi limiti si attribuisce alla variabile x un incremento infinitesimo α, la 3 funzione stessa riceverà un incremento pari a f(x+α)-f(x) che dipenderà sia dalla nuova variabile α che dal valore di x. Ciò posto, la funzione f(x) sarà, tra i due limiti assegnati alla variabile x, funzione continua di tale variabile, se per ogni valore di x compreso tra questi limiti, il valore univocamente determinato della differenza f(x+α)-f(x) decresce indefinitamente con quello di α In altri termini, la funzione f(x) si dirà continua rispetto a x entro i limiti assegnati se, tra questi limiti, un incremento infinitesimo del valore produce sempre un analogo incremento infinitesimo della funzione stessa. [Cauchy, 1821, p. 43]. Se si interpreta “accroisement infiniment petit” come “tende ad un limite”, quest'ultima frase significa che se x converge ad un valore limite appartenente al dato intervallo, allora anche f(x) converge. Le motivazioni di Cauchy per la sua definizione di continuità traevano origine dall'importanza che questa nozione assumeva nella dimostrazione del teorema fondamentale del calcolo, che asserisce che differenziazione e integrazione sono processi inversi: ∫ab f’(x) dx = f(b)-f(a), dove f’ è la derivata della funzione f. Egli aveva notato, in un lavoro precedente, che questo teorema non vale se la funzione presenta dei salti. Anche se questo avrebbe potuto condurre Cauchy a definire il concetto di continuità in un punto, egli non introdusse questo concetto nel Cours d'analyse. Egli riteneva che una discontinuità potesse apparire in un punto, mentre la continuità fosse definita su un intervallo. In questo modo Cauchy mantenne alcuni aspetti dell'idea intuitiva di continuità, caratterizzandola però in modo sufficientemente preciso da poterne fare un uso effettivo in molte delle sue dimostrazioni successive. Questa ambiguità fu accentuata dall'uso che egli fece degli infinitesimi. Tuttavia, non è chiaro se per Cauchy la continuità dovesse essere uniforme su un intervallo, oppure puntuale. Nella definizione citata in precedenza, sono presenti infatti due definizioni di continuità, una senza e una con gli infinitesimi. Nel primo caso sembra proprio trattarsi di continuità puntuale. Nel secondo è possibile ritenere che si tratti di continuità uniforme (questa distinzione verrà discussa più avanti). Egli utilizzò la continuità uniforme nella dimostrazione dell'esistenza dell'integrale di una funzione continua, ma questa ambiguità fece sorgere ulteriori problemi nella presentazione dell'analisi fatta da Cauchy. 4 Somma di una serie: Le novità nella definizione di Cauchy di somma di una serie, risiedono nell’uso attento, in molte delle sue dimostrazioni, di una caratterizzazione formale e quasi completamente simbolica della nozione di convergenza. In particolare, egli insisteva che una serie divergente non dovesse avere una somma. Cauchy sapeva molto bene che ciò avrebbe scosso la comunità matematica (v. Introduzione al Cours d’Analyse, Cauchy, 1821, p. iv). Questa affermazione fondamentale obbligava Cauchy a stabilire la convergenza delle serie prima di calcolarne le somme. A tal fine egli stabilì numerosi criteri di convergenza. Il suo lavoro manca di rigore solo nel punto in cui si rende necessaria una definizione precisa di numero reale, ma tralasciando questo problema (v. oltre, paragrafo 6), la trattazione di Cauchy dei criteri di convergenza è esemplare. Non si può dire altrettanto della seguente affermazione, che collega il concetto di convergenza di una serie con quello di continuità di una funzione (Cauchy, 1821, p. 120): una serie convergente di funzioni continue converge ad una funzione continua. La prima “dimostrazione” di Cauchy procedeva così: si rappresenti la somma della serie s come s=sn+rn, dove sn è la somma dei primi n termini. Allora, se la variabile x cresce di una quantità infinitesima, l’incremento in sn deve essere infinitesimo, e quando n → ∞ i valori di rn devono diventare arbitrariamente piccoli. Quindi, la somma s è continua. Questa affermazione è falsa secondo la nozione moderna di continuità, ma se Cauchy si riferiva a serie che convergono uniformemente in un intorno di x, l’affermazione è vera (v. Giusti, 1984). Questo è in accordo con la seconda versione proposta da Cauchy, in cui egli affermava che il teorema “non potrà essere assunto senza restrizionii”, rispondendo, in questo modo, ad alcune critiche al suo lavoro. La conclusione che possiamo trarne è che la continuità è un concetto così difficile da aver messo in difficoltà persino il suo ideatore. Derivata: Cauchy scelse di utilizzare il termine “derivata” e la notazione f’ proposti da Lagrange, ma rifiutò la sua definizione di questa funzione, basata sulle serie di potenze. Egli fece osservare che la serie di Taylor di una funzione non converge necessariamente, e anche quando converge, non rappresenta necessariamente la funzione sviluppata. A titolo di esempio citò la funzione e − 1 x2 (a cui attribuì valore 0 per x=0). Tutte le sue derivate si annullano per x=0, e quindi la serie di Taylor è ovunque nulla. Pertanto, la serie è ovunque convergente, ma coincide con la funzione 5 data solo quando x=0 (Cauchy, 1823, pp. 229-230). Per questa ragione Cauchy rinviò la trattazione della serie di Taylor fino a quando fu in grado di fornire un’espressione per il resto, cosa che gli fu possibile dopo aver introdotto la nozione di integrale. Cauchy seguì invece il suo predecessore francese Sylvestre Francois Lacroix (17651843) nel definire la derivata come il limite del rapporto incrementale (il suo contributo originale consistette nella riformulazione con gli infinitesimi). Si ispirò a Lacroix anche per il significato da attribuire al differenziale df(x), sebbene ne desse una definizione leggermente diversa, come lim α →0 f ( x + αh) − f ( x) = df ( x) , dove h è una α costante finita, non specificata. Questo permetteva a Cauchy di far uso della conveniente notazione introdotta da Gottfried Wilhelm Leibniz (1646-1716), pur trattando i differenziali come quantità finite e non infinitesime. Integrale: Con la definizione di integrale Cauchy ruppe radicalmente con i suoi predecessori e seguì una strada aperta dal suo contemporaneo più anziano, Joseph Fourier (1768-1830), il quale aveva capito che per calcolare i coefficienti di Fourier di funzioni arbitrarie, non era più possibile assumere che queste fossero derivate di altre funzioni. Fourier perciò si concentrò sull’integrale definito ∫abf(x) dx (mettere i limiti di integrazione sopra e sotto il segno di integrale era un’idea di Fourier) insistendo che questo simbolo indicasse l’area della regione compresa tra la curva e l’asse (Fourier, 1822 § 229). Cauchy si ispirò a Fourier, ma invece di basarsi sulla nozione vaga di area, introdusse l’integrale definito come il limite di una successione di somme approssimanti. Questa definizione era molto più precisa e gli permise di dimostrare che ogni funzione continua ha un integrale, un tour de force che va considerato come uno dei capolavori dell’Analisi di Cauchy. Tracce delle argomentazioni di Cauchy si ritrovano in alcuni lavori di Lagrange (v. Grabiner, 1981, capitolo 6), ed è molto plausibile che Cauchy abbia fondato la sua teoria su queste fonti. Tuttavia la trattazione di Cauchy è molto più chiara e, cosa ben più importante, egli modificò l’uso della tecnica del passaggio al limite; da procedura di approssimazione numerica a definizione. Questo esemplifica ciò che Grabiner ha enfatizzato, che le origini del rigore di Cauchy nell’analisi non vanno cercate nella metafisica algebrica formale del 17° secolo, ma nelle procedure numeriche di questo periodo, che diedero origine ad un’“algebra delle disuguaglianze”. Queste tecniche di approssimazione antecedenti suggerirono a Cauchy una definizione che gli permise di 6 dimostrare l’esistenza dell’integrale di una classe determinata di funzioni. Sembra che nessuno avesse sollevato prima questo problema di esistenza, che, in effetti, non avrebbe potuto essere dimostrata utilizzando la precedente definizione. Queste ricerche si possono considerare come l’inizio di un nuovo orientamento qualitativo nell’analisi. Invece di chiedersi come integrare una particolare funzione o come risolvere una particolare equazione differenziale, Cauchy cercò di dimostrare l’esistenza dell’integrale per una vasta classe di funzioni (o equazioni differenziali). Questo processo fu portato avanti dalla teoria di Sturm-Liouville, e da Henri Poincaré (18541912) (v. equazioni differenziali). Equazioni funzionali e teorema del binomio: Per dare un’idea della struttura fortemente unitaria del Cours d’analyse di Cauchy daremo uno sguardo alla sua dimostrazione del teorema del binomio (v. Dhombres, 1992, e Bottazzini, 1990, LXXIV): (1 + x) µ = 1 + µ µ ( µ − 1) 2 x+ x +! 1 2! che è uno dei pilastri della “analyse algebrique”; l’altro è il teorema fondamentale dell’algebra (v. Cauchy, 1821, pp. 141-152). Cauchy dimostrò innanzitutto che la serie è convergente nell’intervallo (-1,1). Per x fissato Cauchy indicava la somma di questa serie con φ(µ). Il problema consisteva nel dimostrare l’uguaglianza φ(µ)=(1+x)µ. Cauchy fece uso dei suoi risultati sulla moltiplicazione delle serie per stabilire la seguente equazione per φιι: φ(µ+µ’)=φ(µ)φ(µ’). Quindi, nel capitolo V del Cours d’analyse, dimostrò che la sola soluzione continua di questa equazione è φ(µ)=Aµ, con A costante arbitraria. Ne segue che φ(µ)=φ(1)µ=(1+x)µ, prima quando µ è intero, poi quando µ è un numero razionale, e infine, essendo φ(1)µ una funzione continua di µ, l’uguaglianza continua a valere, prima per ogni µ positivo e poi per ogni µ. Il passaggio dai razionali ai reali era quello decisivo. Qui la definizione di continuità introdotta da Cauchy si dimostrò essere il concetto operativo cruciale, e di conseguenza, egli fu il primo a trattare questo punto in maniera soddisfacente. Questo conclude la dimostrazione di Cauchy, estremamente originale, del teorema del binomio. 7 3. L’impatto delle serie di Fourier. Fin dall’invenzione dell’arithmetica infinitorum ad opera di Isaac Newton (1642-1727), il teorema del binomio ha continuato a svolgere un ruolo fondamentale nell’analisi, aprendo la strada allo studio delle funzioni sviluppabili in serie di potenze. Nel frattempo Fourier aveva studiato un altro metodo, introdotto nel 18° secolo, per sviluppare le funzioni, le serie trigonometriche. Le proprietà di convergenza di tali serie erano molto meno ovvie di quelle relative alle serie di potenze, anche se la rappresentazione di una data funzione era facile, in genere, da trovare. Infatti, poiché 2π ∫ cos(nx) cos(nx)dx = π , ma 0 2π ∫ cos(nx) cos(mx)dx = 0 se m≠n, iii 0 e 2π ∫ cos(nx) sen(mx)dx = 0 per tutti gli m ed n, 0 sembrava essere ovvio che se l’equazione f ( x) = ∑n=0 an cos(nx) + ∑n=0 bn sin(nx) ∞ ∞ veniva moltiplicata per cos(x) e sen(x)iv, rispettivamente, e il risultato integrato termine a termine tra 0 e 2π, si otteneva la seguente espressione per i coefficienti della serie: an = 1 π 2π ∫ f ( x) cos(nx)dx e b 0 n = 1 π 2π ∫ f ( x) sen(nx)dx 0 Questi coefficienti furono subito chiamati i coefficienti di Fourier. Fourier affermava che quando le espressioni per an, bn venivano sostituite nella serie, questa convergeva alla funzione f tra 0 e 2π, anche se la funzione non era periodica. Naturalmente, dopo Cauchy, tali affermazioni non potevano più essere accettate incondizionatamente. Avendo a disposizione, non solo una definizione nuova e flessibile di integrale, ma anche una visione della matematica secondo cui i risultati potevano essere veri solo entro certe limitazioni, queste affermazioni dovevano essere dimostrate. È difficile credere che tra i matematici ci fosse qualcuno che, al principio di questo filone di ricerca, si fosse reso vagamente conto di dove esso avrebbe condotto. Il primo a raccogliere la sfida fu Pierre Gustave Lejeune Dirichlet (1805-1859), un matematico tedesco che soggiornò a Parigi dal 1822 al 1825, e ritornò in Germania con un gusto maturo per la precisione nell’analisi. Egli fu in grado di dimostrare che la serie di Fourier converge quando la funzione f è continua e ha solo un numero finito di 8 massimi e di minimi tra 0 e 2π. Quando Dirichlet divenne professore ordinario a Göttingen nel 1855, aveva già trovato un ardente seguace in Bernhard Riemann (18261866). L’anno precedente, Riemann aveva scritto infatti un articolo che estendeva le idee di Dirichlet alle serie trigonometriche (Riemann 1854). Queste sono le serie della forma f ( x) = ∑n=0 an cos(nx) + ∑n=0 bn sin(nx) ∞ ∞ dove l’assunto che an = 1 π 2π ∫ f ( x) cos(nx)dx e b 0 n = 1 π 2π ∫ f ( x) sen(nx)dx 0 viene lasciato cadere. Una funzione siffatta era necessariamente integrabile? Quali funzioni erano rappresentabili come serie trigonometriche? Evidentemente, le funzioni continue con un numero finito di salti verificavano entrambe le richieste. Potevano esistere funzioni con infiniti salti in un intervallo arbitrario? Riemann scoprì che in effetti ci potevano essere, ma che alcune di esse erano ancora integrabili e potevano essere rappresentate da una serie trigonometrica (ma non da una serie di Fourier) Così facendo egli sostituì la definizione di integrabilità di Cauchy con una definizione più flessibile, e alcune varianti del concetto di integrale di Riemann che ne scaturì sono utilizzate ampiamente ancora oggi. Dopo svariate discussioni ulteriori, principalmente sulla nozione di misurav di un sottoinsieme dell’insieme dei numeri reali, questa nozione di integrale fu sostituita, all’inizio del 20° secolo, da una nozione dovuta a Henri Lebesgue (1875-1941). L’integrale di Lebesgue ha numerosi vantaggi tecnici ma è più difficile da descrivere (v. gli articoli nel volume sul 20° secolo; per una dettagliato resoconto della transizione, v. Hawkins, 1974). Le indagini sulle serie di Fourier si ramificarono ulteriormente quando venne posto e affrontato il problema dell’unicità della rappresentazione di una funzione per mezzo delle serie di Fourier, da due matematici della piccola città universitaria tedesca di Halle, Eduard Heine (1821-1881) e Georg Cantor (1845-1918). Ne seguì che una trattazione di questo problema (ancora oggi non risolto completamente) richiedeva non solo una definizione rigorosa di numero reale ma anche una teoria raffinata dei sottoinsiemi dei numeri reali, aprendo così la strada alla teoria di Cantor degli insiemi transfiniti (v. l’articolo sulla topologia generalevi). 9 4. Il problema della convergenza uniforme. La situazione a cavallo tra il 1840 e il 1850 era che il nuovo stile rigoroso di Cauchy era stato ormai accettato dai migliori analisti del tempo, ma proprio loro erano coscienti che qualcosa ancora non era a posto tra i concetti di convergenza e di continuità. Questa difficoltà fu messa in rilievo da diversi matematici: Ludwig v. Seidel (1821-1896) in Germania, George Gabriel Stokes (1819-1903) in Gran Bretagna, lo stesso Cauchy, e Weierstrass in Germania. La matematica è una disciplina tecnica, e le questioni storiche di priorità e di influenza reciproca sono difficili da dipanare. La più semplice affermazione inconfutabile è che negli anni 60 del 19° secolo, Weierstrass insegnava analisi a Berlino ad un pubblico in continua crescita, e che le sue notazione precise e i suoi argomenti rigorosi risolsero il problema. Da quel momento l’idea di continuità e di convergenza uniforme si separarono da quelle di continuità e di convergenza ordinaria (puntuale). Inoltre si comprese che l’uniformità avrebbe garantito ai matematici i teoremi che essi desideravano mentre la sua assenza avrebbe causato problemi. Piuttosto che definire questi termini, affrontiamo il problema. Consideriamo la successione delle funzioni sn(x), n=1,2, …, definite come nella figura seguente. x < −1 / n − 1 se Grafico della funzione s n ( x) = nx se − 1 / n ≤ x ≤ 1 / n 1 se x > 1/ n Consideriamo le differenze un(x)= sn+1(x)- sn(x). Abbiamo che s1(x)= u1(x), s2(x)= u1(x)+ u2(x), s3(x)= u1(x)+u2(x)+u3(x), e così via, vale a dire, che le funzioni sn(x) sono le somme parziali della serie che si ottiene sommando le un(x). Le figure che 10 seguono mostrano il grafico di una funzione un(x) e i grafici delle funzioni sn(x) e sn+1(x). Grafico della funzione un(x)= sn+1(x)-sn(x) Grafico delle funzioni sn(x) e sn+1(x) La sola candidata per la funzione limite s(x) e per la somma della serie s1(x)+∑nun(x) è la funzione s ( x) = − 1 se 0 se 1 se x<0 x =0. Cauchy prendeva in x>0 considerazione la funzione resto rn(x) definita da s(x)=sn(x)+rn(x), che nell’esempio ha il grafico seguente (si noti che passa attraverso l’origine) 11 Grafico delle funzione rn(x) =s(x)-sn(x) È chiaro che le funzioni un(x) e le somme parziali sn(x) sono tutte continue, ma che non è continua la funzione limite s(x). Il grafico della funzione resto chiarisce che sebbene questa differenza tra le somme parziali e la funzione limite converga a zero per ogni x, esso presenta due punte spezzate sempre più aguzze attorno all’origine, e quindi la successione converge in modo non uniforme. Questa è la sottigliezza che viene colta distinguendo il concetto di convergenza uniforme da quello di convergenza non uniforme. Non è vero che la differenza tra le somme parziali e il limite si può rendere più piccola di ogni specificata quantità ε , per tutti i valori di x, semplicemente specificando un N=N(ε). È vero invece che per ogni x e per ogni ε si può trovare un N=N(ε,x) tale che n>N implica |rn(x)|<ε, ma questo N dipende da x. Perciò la convergenza si dice non uniforme; la convergenza per cui l’indice critico N non dipende da x ma solo da ε si dice uniforme. Da questa distinzione si potevano trarre molte conseguenze. Innanzitutto che esistevano oggetti definiti da processi non uniformi che potevano manifestare proprietà inaspettate. Molte serie trigonometriche erano di questo genere. Su questo tema si sviluppò un’ampia letteratura, che avrebbe potuto rimanere confinata nell’ambito della matematica pura se il moto browniano e i processi di diffusione non avessero messo in luce l’utilità di questo lavoro. 5. Proprietà delle funzioni. Le osservazioni conclusive del paragrafo precedente appartengono alla storia del 20° secolovii, così sarà sufficiente concludere con un’ulteriore osservazione. A lungo si era creduto che ogni funzione fosse 12 sostanzialmente differenziabile. Nel corso del 19° secolo tale opinione venne raffinata. La funzione doveva essere, almeno, continua (una funzione ovunque discontinua fu esibita da Dirichlet: assume valore 0 per ogni valore razionale di x e valore 1 per ogni valore irrazionale di x). Se il grafico di una funzione presenta un brusco cambiamento di direzione in un punto, la funzione non è differenziabile in quel punto (per esempio la funzione f(x)=x se x≥0 e f(x)=-x se x<0, è differenziabile ovunque eccetto che nell’origine). Ma a parte tali banalità si credeva che una funzione continua fosse altrimenti differenziabile, e André Marie Ampère (1775-1836) diede anche una pseudo dimostrazione di questa affermazione. Talvolta gli scienziati definivano addirittura la continuità in modo che implicasse quella che noi chiameremmo continua differenziabilità a tratti (un caso emblematico a riguardo è il fisico matematico James Clerk Maxwell (1831-1879), v. Maxwell, 1873). In effetti, una volta che le nozioni fondamentali furono ridefinite secondo l’insegnamento di Cauchy e di Weierstrass, si scoprì che niente era più lontano dal vero. Nelle sue lezioni di Berlino, Weierstrass discusse addirittura esempi di funzioni ovunque continue ma ovunque non differenziabili. Non è sorprendente che tali esempi furono costruiti usando le serie trigonometriche, e non c’è da meravigliarsi se tali funzioni “mostruose” venivano guardate con sospetto da quei matematici e da quegli scienziati che continuavano a vedere l’analisi in modo tradizionale. (v. Volkert, 1986). A partire dalla metà degli anni settanta del 19° secolo però, la scuola di Weierstrass aveva stabilito, per mezzo di opportuni esempi, un’intera gerarchia di proprietà delle funzioni reali, delle quali nessuna implicava la successiva, mentre ognuna implicava la precedente: funzioni arbitrarie, integrabili, continue, differenziabili, analitiche (le funzione analitiche sono quelle che possono essere rappresentate da una serie di potenze) (v. du Bois Reymond, 1875). La discussione che precede può dare solo un’idea del cambiamento della natura dell’analisi reale nel 19° secolo. I fondamenti della disciplina cambiarono completamente grazie all’introduzione di definizioni precise, di una notazione adeguata e di un numero sempre maggiore di dimostrazioni rigorose. In particolare, venne ampliato il mondo delle funzioni con l’invenzione di nuove classi con nuove proprietà (per esempio, proprietà intermedie tra la continuità e la differenziabilità). Il giardino delle funzioni del 18° secolo, alle quali si applicavano tutti i processi dell’analisi 13 (integrazione, differenziazione, formazione di somme infinite), venne sostituito con una giungla di classi diverse, molte delle quali richiedevano trattazioni molto delicate. Una conseguenza di ciò fu che la fiducia nei vecchi metodi di lavoro diminuì e crebbe l’apprezzamento per i nuovi metodi. Questo fu un processo lento, e una parte importante di esso fu determinata dalla crescente sfiducia attribuita all’intuizione, specialmente a quella geometrica. Il nodo della questione fu il raggiungimento della consapevolezza che Cauchy e i suoi immediati seguaci non avevano chiarito in modo sufficiente la natura dei numeri reali. Dagli anni sessanta del 19° secolo in poi, l’analisi si era andata caratterizzando come lo studio delle funzioni di variabile reale. Una crescente chiarezza sulle proprietà delle funzioni non era stata affiancata però da altrettanta chiarezza su ciò di cui esse erano funzioni. Il tragitto da compiere per risolvere la difficoltà, e così terminare la creazione dell’analisi reale come disciplina indipendente dalla geometria (o dalla dinamica), è l’ultimo argomento che affronteremo. 6. Il chiarimento del concetto di numero reale. Nell’anno 1872, il pubblico matematico tedesco fu testimone della pubblicazione di almeno quattro articoli in cui fu proposta una definizione “aritmetica” di numero reale. (Cantor, 1872; Heine, 1872; Dedekind, 1872; Kossak, 1872). Come abbiamo già detto in precedenza, i primi due di questi articoli furono scritti da colleghi che agivano in stretta collaborazione e presentavano più o meno la stessa definizione. Gli altri due proponevano definizioni diverse e indipendenti. L’opuscolo di Kossak presentava una definizione di numero reale che egli aveva imparato alle lezioni di Weierstrass. Sia il suo approccio che quello di Richard Dedekind (1831-1916) erano più vecchi di almeno un decennio. Esisteva anche una proposta pubblicata precedentemente, a cura del matematico parigino Charles Méray (1835-1911), simile a quella di Heine e Cantor (Méray, 1869). L’articolo di Méray, formulato nella terminologia di Cauchy, non raggiunse però, apparentemente, gli autori tedeschi. Tutte queste proposte avevano una evidente caratteristica comune: definivano i numeri reali a partire da insiemi infiniti di numeri razionali. Nell’approccio di Dedekind, concepito, secondo le sue stesse parole, nel 1858 durante la preparazione di un corso di lezioni per studenti di ingegneria al politecnico di Zurigo, un numero reale era definito come un concetto associato a quelle che egli chiamava “sezioni”, ovvero 14 decomposizioni dell’insieme dei numeri razionali in due sottoinsiemi A1, A2 con la proprietà che a1<a2 per tutti gli a1 in A1 e per tutti gli a2 in A2. Se né A1, ammette massimo né A2 ammette minimo, allora, scriveva Dedekind, “creiamo un numero irrazionale α” associato a questa particolare sezione. A partire dal 1863, Weierstrass presentava nelle sue lezioni una definizione in cui i numeri reali positivi erano introdotti attraverso una relazione di equivalenza tra aggregati di numeri razionali positivi la cui somma fosse convergente. La relazione di equivalenza era tale che la differenze tra le somme parziali di aggregati equivalenti converge a zero (per i dettagli, v. Dugac, 1973) L’opuscolo di Kossak diffuse ampiamente questo punto di vista. Il terzo approccio, che include le definizioni di Méray, Cantor e Heine, era ancora diverso. Cantor e Heine avevano partecipato entrambi ad alcune delle lezioni di Weierstrass, cosicché potrebbero aver sviluppato le loro idee sulla base del suo approccio. In un certo senso, la loro definizione era la più generale. Era basata sull’espediente tecnico che oggi noi (ma non loro) chiamiamo successioni di Cauchy, una nozione che continua ad aver senso non solo nel sistema dei numeri razionali ma anche in molti altri domini. Secondo una prospettiva moderna, la proposta di MérayCantor-Heine appare come un procedimento di “completamento” di uno spazio metrico. Per la proposta originale, si veda il riquadro seguente. Sulla base di ognuna di queste definizioni, i teoremi principali sulle funzioni reali potevano essere (ri)-dimostrati. L’articolo di Heine, per esempio, aveva l’intenzione esplicita di rimuovere alcuni dubbi che ancora esistevano sulla validità di affermazioni del tipo che le funzioni continue possono non essere differenziabili (v. sopra, paragrafo 5). Sia Dedekind che i matematici influenzati da Weierstrass riconobbero che il lemma cruciale per molte di queste dimostrazioni era che ogni insieme infinito e limitato di numeri reali ha un punto di accumulazione (o, alternativamente, che ogni successione limitata e crescente di numeri reali ammette un limite). I numeri reali secondo Cantor e Heine (Heine, 1872): Siano dati “il sistema delle operazioni e il sistema dei segniviii” dei numeri razionali. Una successione infinita a1, a2, a3, … di numeri razionali si dice “successione numeroix” “se per ogni numero razionale positivo η, comunque piccolo, esiste un 15 valore n tale che per tutti gli interi positivi ν, |an-an+ν| è minore di η”. Se a1, a2, a3, … e b1, b2, b3, … sono successioni numero, allora anche a1 ±b1, a2 ±b2, a3 ±b3, … sono successioni numero. Una successione numero convergente a 0 si dice “successione elementare”. Le successioni numero a1, a2, a3, … e b1, b2, b3, … si considerano uguali se e solo se la successione a1 -b1, a2 -b2, a3 -b3, … è elementare. Ad ogni successione numero è assegnato un “segno numero” in modo tale che: (i) i segni associati a successioni numero “uguali” sono uguali; (ii) il segno associato ad ogni successione costante q, q, q, … con q razionale è q. Per il nuovo sistema di segni, le operazioni aritmetiche vengono reintrodotte applicando le corrispondenti operazioni già definite per i numeri razionali ad ogni termine delle successioni numero associate con i nuovi segni. Si può dimostrare che queste definizioni sono indipendenti dalle particolari successioni numero scelte. Analogamente è possibile introdurre una relazione d’ordine. Avendo a disposizione la definizione di numero reale e questo lemma, la definizione di continuità secondo la riformulazione di Weierstrass assumeva un senso tecnico preciso. Negli appunti di Adolf Hurwitz (1859-1919) di una lezione che Weierstrass tenne nel 1878 si legge “dire che una quantità variabile x diventa infinitesima assieme ad un’altra quantità y, significa: «data una quantità ε arbitrariamente piccola, è possibile assegnare una limitazione δ per x tale che, per ogni valore di x per cui |x|<δ, si ha |y|<ε»”. [Weierstrass, 1988, p.57.] Il fatto importante non è tanto che questa è la definizione moderna di continuità, ma che essa fu presentata, come risulta evidente, come una reinterpretazione di quella proposta da Cauchy. Gli appunti della medesima lezione documentano anche in modo impressionante l’architettura rigidamente strutturata di teoremi e dimostrazioni che Weierstrass era ora in grado di presentare, che spaziava dai fondamenti, ai teoremi cruciali sulle serie di potenze, fino ai delicati teoremi sulle funzioni analitiche complesse. Nella presentazione, Weierstrass si preoccupò costantemente di evitare ogni appello all’intuizione, sostituendola utilizzando, oltre agli ingredienti già citati, l’algebra e la teoria delle serie di potenze. 16 Un’ultima osservazione sul “rigore secondo Weierstrass”. Ci si potrebbe chiedere per esempio se non si possa parlare con ugual diritto di “rigore secondo Dedekind”. Dopotutto la sua definizione di numero reale era probabilmente precedente, anche lui era orientato verso l’aritmetica e l’algebra, e anche il suo stile di elaborazione di una teoria era bastato sulla combinazione elaborata di passi rigorosi di definizioni e dimostrazioni. (v. Dugac, 1976). La differenza tra Weierstrass e Dedekin va analizzata a livello di fenomeno sociale. Mentre Dedekind era un artista della elaborazione teorica che lavorava in un isolamento scelto liberamente presso istituti politecnici, Weierstrass attraeva un numero sempre crescente di studenti che poi diffondevano il suo vangelo attraverso la Germania e addirittura l’Europa. Tra coloro che partecipavano alle sue lezioni ci furono, in tempi diversi: Hermann Hankel (1839-1873), Cantor, Heine, Paul du Bois-Reymond (1831-1889), Hurwitz, Johannes Karl Thomae (1840-1921), Sofia Kovalevskaya (1850-1891), Gösta Mittag Leffler (1846-1927) e molti altri. I primi trattati di analisi basati sui nuovi approcci (per esempio Dini, 1878; Stolz, 1885-86; Tannéry, 1886) riflettevano questa situazione. Alla fine, perciò, il matematico berlinese fu chiamato a buon diritto il re dell’analisi del 19° secolo. 7. Problemi sui fondamenti. Per apprezzare la novità delle definizioni aritmetiche dei numeri reali è molto istruttivo un confronto con il lavoro di Hankel Theorie der complexen Zahlsysteme, pubblicato nel 1867: Hankel, anch’egli studente di Weierstrass per qualche tempo, distingueva tra una concezione formale e una concezione concreta dei numeri, basata sull’idea intuitiva di grandezza continua. Henkel era convinto che la concezione formale (secondo cui bisognava definire solo un sistema logicamente consistente di segni e operazioni) era il modo migliore per introdurre i numeri razionali; ma pensava anche che un tale approccio non avrebbe permesso di trattare l’irriducibile ricchezza dei numeri irrazionali. La ragione più profonda di questo punto di vista risiedeva nella sua convinzione che le procedure formali avrebbero permesso alla mente di lavorare solo con domini discreti o al più numerabili. Qui troviamo un primo accenno alle complicate discussioni semantiche, ontologiche ed epistemologiche che accompagnarono le nuove basi aritmetiche dell’analisi reale. Certamente i nuovi approcci furono pagati a caro prezzo se confrontati con la tradizione. Parte di questo prezzo consisteva nella necessità di considerare gli insiemi 17 infiniti come oggetti matematici legittimi. Questo, in sé, non era un piccolo passo, e causò forti reazioni. Uno sguardo alla protesta di Leopold Kronecker (1823 – 1891) contro la nuova analisi (che causò col tempo una completa rottura tra lui e il suo collega di Berlino, Weierstass) mostra che egli concepiva l’aritmetizzazione in un senso molto più ristretto: “Credo che ad un certo punto sarà possibile <aritmetizzare> il contenuto completo di tutte […] le discipline matematiche [eccetto la geometria e la meccanica], in altre parole, sarà possibile fondarle sulla nozione di numero, presa nel senso più ristretto, lasciando così da parte tutte le modifiche e le estensioni di questo concetto.” La precisazione decisiva fu aggiunta in una nota: “Con questo intendo, in particolare, l’introduzione delle grandezze irrazionali e continue.” [Kronecker, 1887, p. 338]. Date le definizioni disponibili dei numeri reali, questo implica che Kronecker si opponeva all’uso dell’infinito che tali definizioni comportavano inevitabilmente. Inoltre, non era più chiaro quale relazione ci fosse tra la nuova nozione di numero reale e il continuo geometrico intuitivo. Certamente, sia Dedekind che Cantor affermavano con chiarezza che la corrispondenza biunivoca tra i punti della retta e i numeri reali dovesse essere postulata assiomaticamente invece di essere un teorema dimostrabile (come tale appariva ancora nelle lezioni di Weierstrass). Ma le cose erano ancora più complicate. In quale senso si poteva dire di “conoscere”, per esempio, il numero reale associato ad un’“arbitraria” successione di Cauchy o l’estremo superiore di un “arbitrario” insieme limitato di numeri reali? Certamente non nel senso in cui si può dire di conoscere un particolare oggetto, esattamente determinato, del mondo reale. Questo potrebbe essere il caso dei numeri (1 + 1 / n) n ), o anche da una irrazionali definiti da leggi particolari (per esempio e := lim n→∞ costruzione geometrica, dalla quale si potrebbe estrarre una legge (per esempio π ), ma come cogliere l’“arbitrario” in un’arbitraria successione di Cauchy? Nel corso del diciannovesimo secolo questo punto rimase oscuro, portando molti matematici a pensare erroneamente che tutti i numeri reali potessero essere definiti da successioni governate da leggi matematiche esplicite. Un’acuta critica contemporanea a questa visione si può trovare nel lavoro sui numeri reali del logico Gottlob Frege (1848 – 1925) (v. Frege, 1903, libro III). Nel ventesimo secolo, questa punto di vista portò alla formulazione di una teoria interamente nuova, quella dei “numeri costruibili”. 18 Analogamente, non era chiara l’ontologia dei nuovi numeri, che inoltre era trattata in modo piuttosto differente dai vari autori. Mentre Weierstrass cercò di rimanere il più fedele possibile al punto di vista tradizionale secondo cui i numeri erano aggregati di unità di un certo tipo e, come dovette aggiungere, frazioni di queste unità, Dedekind e Cantor concepivano i loro “reali” come concetti creati dalla mente umana. (Dedekind insistette su questo punto anche quando Heinrich Weber (1842 – 1913) una volta gli chiese perché non aveva definito i numeri reali semplicemente come le sezioni stesse: se gli esseri umani, esseri di genere divino, sono stati in grado di creare le ferrovie e i telefoni, come si può negare che siano stati capaci di creare oggetti del pensiero? v. Dedekind, 1932, p. 488 e seg.). Nel lavoro di Heine abbiamo visto un’altra scelta ancora: i “reali” erano un sistema di “segni” (ma Heine non fece niente per spiegare cosa potesse essere un sistema di segni non numerabile). Ancora, il logico Ferge puntò il dito spietatamente, e senza alcun rispetto per l’autorità di matematici come Weirstrass, contro le numerose incongruenze filosofiche di tutte le proposte avanzate fino alla conclusione del secolo (v. Frege, 1903, Libro III). Sfortunatamente anche la sua proposta per una definizione dei numeri reali in termini puramente logici si rivelò insoddisfacente quando crollò il suo intero sistema logico. Negli ultimi anni, Ferge ritornò ad una visione fortemente tradizionalista dei fondamenti della matematica, argomentando che anche il concetto di numero avrebbe dovuto essere fondato sull’intuizione. Una soluzione filosoficamente radicale di questo dilemma emerse gradualmente durante l’ultimo ventennio del diciannovesimo secolo. Essa era legata alle idee di Hankel e di Heine sui sistemi di segni e di operazioni, ma in seguito si sviluppò in una forma più raffinata e sostanzialmente diversa. Lo studioso della teoria delle funzioni Thomae, collega di Ferge a Jena e anche lui studente di Weierstrass, si proclamò portavoce di questo cosiddetto “primo formalismo”x. Ciò di cui si ha bisogno in matematica, egli sosteneva, non è un fondamento filosofico particolare dei concetti di base come “numero intero” o “numero reale”, ma piuttosto la conoscenza delle regole che governano il loro uso nelle teorie matematiche. Così la migliore introduzione dei numeri reali dovrebbe essere l’enunciazione di tutte le regole che governano le proprietà matematiche e le relazioni che si vuole che valgano nel sistema dei numeri reali (v. Thomae, 1898, §§1 e seg.). Per fissare il “significato” di un numero reale non era necessario indicare un referente nel mondo reale, ma piuttosto spiegare 19 come questo numero si comporta nei calcoli e nelle dimostrazioni. Restava solo un piccolo passo per arrivare alla definizione assiomatica dei numeri reali di Hilbert (Hilbert, 1900). Secondo questo punto di vista, le precedenti definizioni aritmetiche mostravano solo, “costruendolo”, che un sistema con le proprietà richieste di fatto “esiste”. Certamente, come Frege puntualmente fece, si potrebbero ripetere le critiche filosofiche a questo nuovo stadio. Cosa si intendeva veramente con “costruzione” ed “esistenza”? Il dibattito sui fondamenti, che iniziò al termine del diciannovesimo secolo, nonostante molti cambiamenti di direzione , non è mai terminato. Forse, come molti altri concetti matematici che fanno intervenire la nozione di infinito, il concetto di “numero reale” non ha un non referente ben definito nel mondo reale. Ancor meno ha un referente che noi possiamo afferrare con la stessa chiarezza con cui percepiamo una tazza di caffè davanti a noi. Ma ha ancora un significato nella matematica che facciamo. Ironicamente, fu proprio abbandonando l’apparente ma illusoria evidenza di quella parte delle idee sulle quantità continue che erano più intuitive, che divenne possibile la complicata costruzione dell’analisi moderna. Nota. Questo articolo è stato scritto con la collaborazione di Jesper Luetzen, che ringrazio per il prezioso aiuto. 20 NOTE i Ne saurait e’tre admis sans restriction Nell’originale c’è f invece di φ. Credo che sia un errore di battitura iii Più avanti vengono utilizzate anche le relazioni ii 2π 2π 0 0 ∫ sen(nx) sen(nx)dx = π , ma ∫ sen(nx) sen(mx)dx = 0 se m≠n che forse bisognerebbe introdurre. iv Secondo me, cos(x) e sen(x) vanno sostituiti con cos(nx) e sen(nx) rispettivamente,. v Ho tradotto il termine content con misura. Non sono certo di aver rispettato l’originale, ma è l’unica traduzione matematicamente sensata che ho trovato. vi Bisogna sapere come verrà tradotto “point set topology” nell’articolo cui l’autore si riferisce. vii L’originale mi sembra troppo brusco come inizio di paragrafo. viii Il termine originale impiegato da Heine è “Zeichen”. ix Ho preferito successione numero a successione numerica. Il termine originale impiegato da Heine è “Zahlenreihe”. x Early formalism ??? 21