APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE LUCA LUSSARDI 1. Il problema delle quadrature dall’Antichità al Rinascimento Uno dei primi problemi matematici dell’Antichità legati allo sviluppo del calcolo infinitesimale consiste calcolo delle aree di figure piane, o del volume di figure solide. Il classico problema della quadratura ha le sue origini nell’antica Grecia, e in generale esso consisteva nel determinare, con il solo uso della riga e del compasso, un quadrato equivalente ad una figura piana assegnata; uno si può anche porre il problema della cubatura, ovvero della determinazione, sempre con riga e compasso, di un cubo con lo stesso volume di una figura spaziale assegnata. La necessità di poter effettuare la costruzione limitandosi all’uso esclusivo di riga e compasso riflette il fatto che per gli antichi greci la geometria era un sapere costruttivo, oltre che teorico. La teoria della quadratura delle figure piane notevoli si può inquadrare come applicazione di varie proposizioni contenute negli Elementi di Euclide (300 a.C. circa), opera monumentale composta tra il IV e il III sec. a.C. Ad esempio, è facile decomporre un triangolo in un rettangolo ad esso equivalente, ed ancora un rettangolo in un quadrato ad esso equivalente. Avendo quindi compreso come trasformare un triangolo in un quadrato equivalente, risultava allora semplice la trattazione di un poligono generale: prima va suddiviso in triangoli, ogni triangolo viene quindi trasformato in quadrato, e alla fine basta “sommare” i quadrati cosı̀ ottenuti applicando, in modo opportuno, il teorema di Pitagora. Tutto questo meccanismo funziona fino a che uno si limita alle figure poligonali, ma i problemi cominciano a diventare più seri di fronte alle figure curve, ad esempio il cerchio. È ormai entrato nel linguaggio comune l’uso dell’espressione quadrare il cerchio per caratterizzare l’impossibilità di una prova. Infatti, la costruzione di un quadrato equivalente ad un cerchio assegnato, con uso esclusivo di riga e compasso, è impossibile, anche se questo fatto è stato rigorosamente dimostrato molti anni più tardi rispetto alla civiltà greca antica, ed anzi è una conquista della matematica moderna. Per i greci quindi problemi come la quadratura del cerchio con riga e compasso, o la rettificazione della circonferenza, restarono senza soluzione, e per questo motivo la teoria della quadratura delle figure piane nel senso costruttivo del termine fu abbandonata, limitandosi a fornire semplicemente un modo che consentisse perlomeno il calcolo dell’area di una figura piana, o del volume di un solido. Tuttavia, 1 2 LUCA LUSSARDI anche il problema, apparentemente più facile, di trovare formule per il calcolo di aree o volumi presenta delle insidie, soprattutto quando uno affronta le figure curve: il calcolo dell’area del cerchio, la figura curva più semplice che uno possa tracciare nel piano, presenta già notevoli difficoltà. Bisogna quindi ideare un metodo che va oltre l’applicazione immediata degli assiomi più elementari della geometria euclidea. 1.1. Il metodo di esaustione. Allo scopo di dimostrare la validità di una formula che consentisse il calcolo dell’area di un cerchio, i greci idearono un opportuno strumento di approssimazione che rientra nella teoria delle grandezze omogenee, misurabili e continue. L’idea parte dallo studio della nozione di lunghezza di un segmento; è infatti possibile un criterio di confronto tra segmenti, un’operazione di addizione tra segmenti, una proprietà di divisibilità, ovvero un segmento si può dividere in un numero arbitrario di parti uguali tra loro, e la cosiddetta proprietà di Eudosso-Archimede, individuata da Eudosso di Cnido (400 a.C. circa), e che si può trovare anche negli Elementi: se le due lunghezze A e B sono tali per cui, ad esempio, 0 < A < B allora esiste un naturale n tale che nA > B. Ci sono altri esempi di grandezze per le quali valgono queste proprietà: la misura degli angoli nel piano, l’area delle figure piane, o ancora il volume delle figure solide. Il metodo di esaustione è una significativa applicazione della proprietà di Eudosso-Archimede, ed è fondato sul seguente teorema: Teorema 1.1. (Proposizione I, Libro X degli Elementi) Se A e B sono due grandezze omogenee, misurabilie continue tali che 0 < A < B, se da B viene sottratta una grandezza maggiore della sua metà, se da ciò che resta viene sottratta ancora una quantità maggiore della sua metà, e ripetendo continuamente questo procedimento, allora prima o poi resta una quantità minore di A. Il metodo di esaustione rappresenta, in un certo senso, il primo metodo di integrazione della storia: diciamo subito che il rigore assoluto che tale metodo possiede si rivedrà solo nel XIX secolo con l’integrale di Cauchy. Nonostante ciò, è troppo difficile da applicare, e soprattutto possiede un grosso svantaggio, rispetto al moderno calcolo integrale; non si tratta infatti di uno strumento di calcolo, bensı̀ di un metodo puramente dimostrativo: esso dimostra in modo rigoroso la validità di certe uguaglianze tra aree o volumi, dedotte per altra via. Tipicamente, il metodo di esaustione procede, come dice il nome stesso, esaurendo una figura con una successione di figure all’interno di essa: da una figura si sottrae una parte maggiore della sua metà, dalla figura restante si sottrae ancora una parte maggiore della sua metà e cosı̀ via, e si arriva quindi ad una figura più “piccola” di ogni figura arbitrariamente fissata. Il rigore dei greci sfiora per un attimo la definizione APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 3 di limite, nozione che troveremo formalizzata ben duemila anni più tardi. In modo completamente rigoroso, dunque, lo sfruttamento dell’infinito potenziale (una grandezza non è mai infinita, ma può diventare arbitrariamente piccola o arbitrariamente grande) permise ai greci di determinare aree e volumi di figure curve. La più classica applicazione del metodo di esaustione è la determinazione dell’area del cerchio. La procedura si avvale del seguente teorema: Teorema 1.2. (Proposizione I, Libro XII degli Elementi) Le aree di due poligoni simili inscritti in due distinte circonferenze stanno tra loro come i quadrati dei rispettivi raggi. Tale teorema permette di dedurre il seguente fatto definitivo: Teorema 1.3. (Proposizione II, Libro XII degli Elementi) Le aree di due cerchi stanno tra loro come i quadrati dei rispettivi diametri. Dimostrazione. Per dimostrare questo teorema Euclide mette in atto il metodo di esaustione. Prima di tutto facciamo un’osservazione che sarà utile strada facendo, e precisamente, riferendoci alla figura 1, consideriamo una corda AB di una data circonferenza, e il punto C sulla circonferenza di modo tale che il triangolo ABC sia isoscele sulla base AB. Allora è facile verificare che l’area di ABC è maggiore della metà dell’area del settore circolare circoscritto ad ABC: infatti, se uno costruisce il rettangolo ABED come in figura si ha che l’area S del settore circolare ABC è minore dell’area di tale rettangolo, che vale il doppio dell’area del triangolo ABC. Questa idea sta alla base del procedimento di esaustione ideato da Euclide. Figura 1. L’area di ABC vale più della metà dell’area del settore circolare ABC. Siano infatti dati due cerchi C1 e C2 di raggi R1 e R2 e siano A1 e A2 le rispettive aree. Va mostrato che R12 A1 = . 2 R2 A2 4 LUCA LUSSARDI Sia A1 R22 . R12 Supponiamo, per assurdo, che sia A < A2 . Cominciamo a inscrivere nel cerchio C1 un A= quadrato. Si vede subito che l’area di tale quadrato, che vale 2R12 , è maggiore di A1 . 2 Infatti, il lato del quadrato circoscritto a C1 vale 2R1 , per cui si ha A1 < 4R12 da cui 2R12 > A1 . 2 Mettiamo ora quindi in atto l’idea osservata precedentemente, e costruiamo l’ottagono regolare che ha quattro vertici pari a quelli del quadrato e gli altri quattro nei punti medi degli archi di C1 sottesi dai lati del quadrato. Iterando questo ragionamento si arriva dunque ad un poligono inscritto in C1 di 2n lati, di area che denotiamo con (1) (2) Pn . Ripetiamo la stessa costruzione sul cerchio C2 e denotiamo con Pn le aree dei corrispondenti poligoni inscritti in C2 . Avendo poligoni simili per ogni scelta di n si ha allora, grazie al teorema precedentemente dimostrato, che (1) Pn (2) Pn R12 A1 = 2 = . R2 A (1) Essendo Pn < A1 , deve quindi essere Pn(2) < A. (1.1) (2) Ma, per esaustione A2 − Pn risulta minore di ogni area arbitrariamente fissata, a patto di prendere n abbastanza grande, e dunque esiste un intero positivo n̄ tale che (2) A2 − Pn̄ < A2 − A (2) ovvero Pn > A che contraddice la (1.1). Invertendo i ruoli tra C1 e C2 e ponendo ora B= A2 R12 R22 segue che non può essere B < A1 . Supponiamo quindi che sia A > A2 . Allora si avrebbe subito A2 R12 A1 A2 = < A1 2 R2 A che abbiamo mostrato non sussistere. Ne segue che deve essere A = A2 che conclude la B= verifica. APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 5 Figura 2. Particolare dell’esaustione del cerchio. Grazie a questo teorema è possibile il calcolo dell’area del cerchio di raggio R: infatti, basta considerare l’area c del cerchio di raggio 1, per avere che l’area A del cerchio di raggio R soddisfa A = R2 c da cui A = cR2 . La costante c è quella che fu poi denotata con il simbolo π, di valore 3.14 circa, calcolato con considerazioni empiriche; ne segue la formula oggi nota per l’area del cerchio di raggio R, ovvero A = πR2 . 1.2. Archimede: rigore e ingegno. Per quanto riguarda la determinazione dell’area del cerchio ce la siamo cavata appoggiandoci a teoremi intuitivi, dal momento che il cerchio è la figura curva più semplice, ma per curve più complesse? Come intuire le formule corrette per le quadrature da dimostrare poi per esaustione? Archimede di Siracusa (250 a.C. circa) ci mostra dei bellissimi esempi di come dedurre formule da dimostrare da considerazioni di tipo meccanico: questo trucco di Archimede è stato scoperto solo ai primi del Novecento quando il filologo danese Heiberg scoprı̀ in un palinsesto1 conservato a Costantinopoli un’opera di Archimede fino a quel momento sconosciuta, battezzata poi come Metodo. Archimede quindi, nel Metodo, mostrerà come ha dedotto la validità di certe formule geometriche, che dimostrò con il metodo di esaustione: sono ad esempio 1In filologia, un palinsesto è un supporto, tipicamente una pagina manoscritta, che è stata scritta, cancellata e poi riscritta. 6 LUCA LUSSARDI Figura 3. Equilibrio di una leva e segmento parabolico. trattate la quadratura del segmento parabolico e la determinazione del volume della sfera. Osserveremo in particolare l’uso combinato di metodi meccanici, come l’equilibrio delle leve, e di metodi che molto assomigliano a ciò che 1700 anni più tardi saranno gli indivisibili di Cavalieri. Analizziamo, per esempio, come Archimede riuscı̀ a giungere alla formula corretta che fornisce l’area di un segmento parabolico, la cui dimostrazione per esaustione si trova nell’opera Quadratura della parabola. Consideriamo la figura 3 di riferimento per tutto quello che segue. Sia dato quindi l’arco di parabola AC: Archimede intendeva scoprire la formula che fornisce l’area del segmento parabolico determinato da tale arco, ovvero l’area della regione sottesa da tale arco di base il segmento AC; useremo un linguaggio matematico moderno, ma le stesse idee e le stesse costruzioni di Archimede. L’equazione della parabola è data da |OP | = m|AO|(|AC| − |AO|) per un certo coefficiente m > 0. Sia t la tangente all’arco di parabola nel punto C; allora l’equazione di t è data, utilizzando le notazioni in figura, da |OM | = m|AC|(|AC| − |AO|). Archimede sapeva tracciare le tangenti alla parabola, problema risolto da Apollonio, limitatamente alle coniche, alla fine del III secolo a.C., sul quale ritorneremo in seguito. APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 7 Ne segue che (1.2) |OP | |AC| = |OM | |AO| e questa relazione vale per ogni punto P dell’arco di parabola. Precisamente in questo punto arriva il colpo di genio: Archimede nella relazione (1.2) non vide solo della geometria, bensı̀ la condizione di equilibrio di una leva. Infatti, la (1.2) esprime la condizione di equilibrio di una leva con peso |OP | in un estremo e braccio |AC|, e peso |OM | nell’altro estremo, con braccio |AO|. Il genio siracusano piazzò questa ipotetica leva nel modo più furbo tra tutti, secondo il seguente ragionamento: se F è il punto di intersezione tra la tangente t e la retta ortogonale ad AO e K è il punto medio di AF , allora K è il fulcro della leva che si trova lungo il segmento N H, essendo |AD| = |AC|. Il punto N sarà dunque il punto medio di OM , e rappresenta l’estremo della leva dove è applicato il peso materializzato dal segmento OM . Allo stesso modo, il punto H è l’altro estremo dell’asta dove viene applicata la materializzazione del segmento OP . Si osservi ora che il segmento OM può essere pensato concentrato in N , suo punto medio. Dunque, la totalità dei segmenti OM viene ad essere concentrata lungo il segmento CK. Cosı̀ facendo, la totalità di questi pesi può essere pensata come applicata nel baricentro G del triangolo AF C. Quindi la leva HKG, con la totalità dei segmenti parabolici in H e la totalità dei segmenti OM in G, è in equilibrio. Essendo |AF | = m|AC|2 si ha m AAF C = |AC|3 2 e quindi, se denotiamo con S l’area del segmento parabolico, l’equilibrio della leva fornisce m m |AC| S|AC| = |AC|3 = |AC|4 . 2 3 6 In definitiva, la formula trovata da Archimede dice che l’area S del segmento parabolico vale m |AC|3 . 6 Archimede osservò che la formula trovata si può scrivere in modo più semplice, in termini S= del triangolo isoscele ABC inscritto nel segmento parabolico assegnato, come in figura 4. Infatti, si ha 1 m m T = AABC = |AC| |AC|2 = |AC|3 2 4 8 da cui la più semplice formula: 4 S = T. 3 È stata trovata una formula candidata ad essere l’area del segmento parabolico dato. Archimede ora procederà dimostrando per esaustione il risultato ottenuto per via empirica; non entriamo nel dettaglio della dimostrazione di Archimede, ma illustriamo solamente 8 LUCA LUSSARDI Figura 4. L’area del segmento parabolico è in funzione dell’area di ABC. a grandi linee la procedura utilizzata. Anzitutto, va costruita un’opportuna esaustione del segmento parabolico, come in figura 5. Si può verificare che la successione delle aree cosı̀ determinate vale T+ T T T + + ··· + n + ··· 4 16 4 Figura 5. Particolare dell’esaustione applicata al segmento parabolico. Archimede a questo punto sfruttò l’identità, da lui dimostrata rigorosamente, data da 1 1 1 4 1 (1.3) 1+ + + ··· + n + = n 4 16 4 3·4 3 per concludere che T T T 4 T+ + + ··· + n + ··· = T 4 16 4 3 che è la tesi. 1.3. La ripresa del XVI secolo. La ripresa lenta e faticosa della matematica nel tardo medioevo è principalmente dovuta all’invenzione della stampa a caratteri mobili: tale scoperta impresse un’accelerazione spaventosa alla diffusione della conoscenza in generale. Una delle prime opere matematiche ad essere messa a stampa fu ovviamente data dagli Elementi di Euclide. La stampa delle opere di Archimede avvenne invece solo verso la fine del XVI secolo, a Basilea, e questo contribuı̀ al rifiorire dell’interesse verso i problemi lasciati aperti; ricordiamo però che il Metodo, nel quale Archimede APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 9 spiega le considerazioni sulle leve e sui baricentri, verrà scoperto solo nel Novecento, per cui i matematici del XVI secolo dovettero riscoprire gli strumenti che fossero in grado di arrivare ai risultati descritti da Archimede. Va ricordato l’italiano Francesco Maurolico (1494-1575) che riuscı̀ a ricostruire la teoria dei centri di gravità dei solidi corredando il tutto con numerose dimostrazioni per esaustione, metodo che resisteva ancora a quel tempo, non avendo i matematici alternative. Tra gli scritti dell’italiano Luca Valerio (1552-1618) troviamo una prima importante novità: per la prima volta infatti vengono trattate classi generali di figure, invece che curve o solidi particolari. Questo fatto rappresenta il primo tentativo di abbandono della matematica classica, che aveva sempre distinto tra figure geometriche dichiarate, con tanto di nome, da altre figure geometriche di scarso interesse. Valerio infatti, nel suo trattato De centro gravitas solidorum oltre a riprendere solidi ben noti, fornı̀ una trattazione anche per una classe generale di figure, le figure decrescenti, mostrando che gli stessi strumenti si applicano molto più in generale. Queste considerazioni sono l’inizio di una serie di ricerche sulle quadrature e sul calcolo dei volumi che, per la prima volta, abbandoneranno il metodo di esaustione, per andare alla ricerca di metodi di calcolo. 1.4. Gli indivisibili di Cavalieri. La direzione di ricerca intrapresa sfocerà nell’ultimo vano tentativo: la teoria degli indivisibili geometrici chiude la ricerca sulle quadrature prima che il calcolo degli integrali, molti anni più tardi, possa essere sviluppato. Bonaventura Cavalieri (1598-1647), allievo di Galileo, cercò di considerare in che rapporto stanno i volumi dei solidi di rotazione a partire dal rapporto tra le figure piane che li generano, ma trovò subito delle incongruenze: ad esempio, il cilindro è il triplo del cono inscritto, ma è generato, per rotazione, da un rettangolo che è il doppio del triangolo che genera il cono. Cavalieri si accorse che l’apparente errore viene aggirato cambiando il punto di vista: mettendo cioè i due solidi con la stessa altezza uno accanto all’altro, con le basi su uno stesso piano, e affettandoli con una famiglia di piani paralleli alla base. Nella sua opera Geometria indivisibilibus continuorum nova quadam ratione promota, pubblicata nel 1635, Cavalieri espose il seguente teorema, oggi noto anche come Principio di Cavalieri: Teorema 1.4. (Teorema IV, Libro II della Geometria indivisibilibus) Se due superfici piane disgiunte intercettate dallo stesso fascio di rette parallele formano corde tra loro proporzionali a due a due con lo stesso fattore di proporzionalità, allora le due superfici stanno in quello stesso rapporto. Analogamente, se due solidi disgiunti intercettati dallo stesso fascio di piani paralleli formano superfici proporzionali a due a due con 10 LUCA LUSSARDI lo stesso fattore di proporzionalità, allora i due solidi stanno in quello stesso rapporto. Stando alle attuali conoscenze matematiche, è da osservare che il Principio di Cavalieri è una semplice conseguenza del teorema di Fubini-Tonelli per gli integrali multipli. Il principio di Cavalieri è tuttavia fondato sul concetto poco chiaro e non classico di indivisibile geometrico e si contrappone al metodo di esaustione: è teoricamente più debole, ma è più versatile, perlomeno si tratta quasi di uno strumento di calcolo. C’è quindi un ritorno all’infinito attuale, bandito dai greci perché fonte inesorabile di guai, ma è comunque un passo in avanti; nonostante ciò, il problema delle quadrature non può essere trattato meglio di cosı̀ ormai, e per fare il passo decisivo bisogna aspettare Newton e Leibniz. Consideriamo, come unico esempio di applicazione del Principio di Cavalieri, il problema della determinazione del volume della sfera di raggio R. Allo scopo, osserviamo la costruzione della figura 6, dove l’arco di curva rappresenta un quarto di circonferenza. Figura 6. Determinazione del volume della sfera con il Principio di Cavalieri. Una rotazione completa attorno al segmento AD dell’arco BD genera quindi una superficie semisferica. Immaginiamo ora di prendere un piano ortogonale al segmento AD che scorra da A verso D. Esso interseca la semisfera generata dalla rotazione del settore ABD lungo EG, interseca il cilindro generato dalla rotazione del quadrato ABCD lungo EH ed interseca il cono generato dalla rotazione del triangolo ACD lungo il segmento EF . Applicando il teorema di Pitagora si ha |EH|2 = |AG|2 = |AE|2 + |EG|2 = |EF |2 + |EG|2 . APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 11 Quindi il fascio di piani paralleli interseca i tre solidi ottenuti, cilindro C, semisfera S e cono Q, lungo tre superfici le cui aree stanno in una certa relazione. Un’applicazione un po’ spinta del principio di Cavalieri spaziale dice allora che deve essere VC = VQ + VS da cui π 3 2 3 R = πR . 3 3 Ne segue che il volume della sfera di raggio R vale VS = VC − VQ = πR3 − 4 3 πR . 3 2. Il problema delle tangenti dall’Antichità al Rinascimento L’altro grande problema classico dal quale si originano ragionamenti di natura infinitesimale è il problema delle tangenti ad una curva piana. 2.1. Le tangenti nell’antica Grecia: Apollonio. Non troviamo molto nell’antichità su questo problema: probabilmente ciò è dovuto al fatto che per i classici le sole curve di interesse erano le curve dichiarate con tanto di nome, mentre curve generiche erano pressoché inutili. La parola tangente non venne utilizzata dai Greci: essa è infatti il participio presente del verbo di origine latina tàngere, che vuol dire toccare. In effetti, pare che sia Euclide sia Apollonio usassero proprio il termine toccare per denotare la proprietà che una retta tangente ha rispetto alla curva per la quale è tangente. Euclide, nei suoi Elementi, limita la sua trattazione al caso della circonferenza, ma illustra con profondità la caratteristica della tangente ad una circonferenza. Nella prossima proposizione è anzitutto racchiusa la definizione di tangente ad una circonferenza: è la retta ortogonale al diametro nel punto di tangenza. Euclide è ben consapevole che questo fatto è più profondo di quanto sembri, e per caratterizzare la tangenza dimostra che il cosiddetto angolo di contingenza è nullo: non esiste un’altra retta che si possa mettere tra la tangente e la circonferenza e che continui a incontrare la circonferenza in un solo punto. Teorema 2.1. (Proposizione XVI, Libro III degli Elementi) Quella retta che, dalle estremità del diametro di un cerchio viene condotta ad angolo retto, cadrà al di fuori del cerchio stesso; nello spazio compreso tra la stessa linea retta e la periferia non cadrà altra retta; e invero l’angolo del semicerchio è maggiore di qualsivoglia angolo acuto rettilineo, il rimanente è minore. 12 LUCA LUSSARDI Dimostrazione. Mostriamo prima di tutto che ogni altra retta diversa dall’ortogonale al diametro deve incontrare la circonferenza in un altro punto diverso dal punto di tangenza: ci riferiamo alla figura 7. Figura 7. La tangente r tocca la circonferenza solo nel punto di tangenza A. Infatti, supponiamo, per assurdo, che la retta s per A ortogonale al raggio OA in A incontri la circonferenza anche nel punto B diverso da A. Essendo il triangolo OAB isoscele sulla base AB, deve essere OÂB = OB̂A. Ma l’angolo OÂB è retto e un triangolo non può avere più di un angolo retto, e dunque si ha una contraddizione. Supponiamo ora che ci sia un’altra retta s che si infila nella regione compresa tra la circonferenza e r, ovvero che forma un angolo di contingenza rs ˆ 6= 0; si veda la figura 8. Figura 8. L’angolo di contingenza è nullo. APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 13 Tracciamo il segmento OH perpendicolare a s in H. Allora deve essere |OA| > |OH| dal momento che l’ipotenusa di un triangolo rettangolo è sempre maggiore di ciascuno dei due cateti. Ma |OA| = |OB| da cui |OB| > |OH| che è assurdo. La trattazione dell’angolo di contingenza è un fatto molto importante per la matematica. Infatti, Euclide stesso rileva, attraverso la sua dimostrazione, che gli angoli di contingenza curvilinei non costituiscono una famiglia di oggetti per i quali le corrispondenti misure soddisfano la proprietà di Eudosso-Archimede. Figura 9. Angoli di contingenza curvilinei. Noi abbandoniamo ora gli Elementi e proseguiamo con l’evoluzione del concetto di tangente. Se infatti per una circonferenza è addirittura troppo facile parlare di tangente, visto che la nozione di tangenza si traduce in una semplice proprietà di ortogonalità tra la retta e il diametro, cosı̀ non fu per curve leggermente più complicate: le coniche. Il primo trattato sistematico sulle coniche risale ad Apollonio di Perga (250 a.C. circa), ed è intitolato appunto Le coniche. Non entriamo nel dettaglio della teoria delle tangenti secondo Apollonio, ma accenniamo almeno alla sua costruzione nel caso di un’ellisse; considerazioni analoghe valgono per iperbole e parabola. La nozione di tangente ad una conica viene data, da Apollonio, all’interno della teoria dei diametri: un diametro d di una conica C è una corda che biseca un fascio di corde parallele. Figura 10. d è un diametro per la conica C. 14 LUCA LUSSARDI La nozione successiva è quella di diametri coniugati; la relazione di coniugio tra diametri oggi viene presentato usando la polarità indotta da una conica. Riferendoci alla figura 11 diciamo che il diametro d è coniugato al diametro o se d biseca il fascio di corde parallele a o: si dimostra che allora o biseca il fascio di corde parallele a d. Nella situazione descritta dalla figura 11, Apollonio introdusse i termini ascissa e ordinata per denotare rispettivamente il diametro d e il diametro o, passanti entrambi per il loro punto in comune, punto medio di entrambi: i termini che usiamo noi oggi per la geometria delle coordinate hanno quindi origine da opportuni riferimenti obliqui sulle coniche. Finalmente, nella stessa figura 11 appare chiaro come tracciare la tangente t alla conica C nel punto P : se P è estremo del diametro d allora si traccia per P la parallela al diametro coniugato a d. Apollonio dimostrò che t non può incontrare la conica C in un altro punto, e la dimostrazione ricalca quella data da Euclide per la circonferenza; inoltre, dimostra che anche per le coniche l’angolo di contingenza è nullo. La teoria delle tangenti è dunque squisitamente geometrica, e null’altro del resto ci si poteva aspettare dai classici. In particolare, non vi è quindi nessun riferimento al fatto che la tangente raccoglie in sè un’intersezione doppia con la curva, ma non dobbiamo sorprenderci di questo fatto: infatti, Apollonio si è limitato a studiare le sezioni coniche, e sappiamo che una retta generica ha al più due intersezioni con una conica, e quindi appare ridondante contare la molteplicità di intersezione nel caso delle coniche, basta semplicemente dire che una tangente ad una conica è una retta che interseca la conica solo in un punto, che è il punto di tangenza. Figura 11. Diametri coniugati e retta tangente a C in P . APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 15 Ma appena la curva si complica tutta la teoria cade a pezzi: il problema delle tangenti resta senza soluzione fino alla grande svolta del XVI secolo, quando l’algebra viene in aiuto della geometria. 2.2. Il metodo del cerchio tangente di Cartesio. Il primo grande punto di svolta nella storia dell’intera matematica, ma anche nella storia della scienza in generale, sta nell’introduzione delle coordinate, ovvero nell’algebrizzazione della geometria: la geometria analitica, che oggi si studia anche a scuola, ha infatti rivoluzionato il modo di fare matematica, creando connessioni molto feconde tra algebra e geometria. Negli antichi greci la geometria era il sapere autentico, mentre l’aritmetica dei numeri razionali era discussa in chiave geometrica anch’essa. Con Cartesio (1596-1650) il punto di vista viene capovolto: l’algebra viene in aiuto della geometria, si mette come fondamento ad essa, e i problemi geometrici vengono tradotti in termini di equazioni. Lo scopo del metodo cartesiano era quindi soprattutto quello di liberare la geometria dal ricorso alle figure, mediante i procedimenti dell’algebra. Cosı̀ facendo, Cartesio nella sua Géométrie, edita per la prima volta nel 1637, rivisitò molti problemi geometrici più o meno classici, come ad esempio un celebre problema di Pappo, aperto da mille anni circa e agevolmente risolto con l’uso del metodo delle coordinate cartesiane. Con la scoperta della geometria analitica ritorna l’antico problema delle tangenti, risolto, come già sappiamo, limitatamente alle coniche, da Apollonio nel III secolo a.C. La situazione generale nella quale lo stesso Cartesio si mise è quella della curva espressa come luogo dei punti del piano le cui coordinate x, y risolvono un’equazione P (x, y) = 0. Cartesio chiamò tangente una retta che ha intersezione almeno doppia con la curva nel punto di tangenza. Invece che cercare la tangente in un punto della curva, Cartesio si propose di cercare un cerchio tangente alla curva in quel punto; tracciando poi la retta per il punto della curva e il centro del cerchio si trova la normale alla curva, che è perpendicolare alla tangente. Precisamente, egli scrisse: “ Bisogna considerare che se questo punto C, il centro del cerchio cercato, è come lo desideriamo, il cerchio di cui sarà il centro e che passerà per B vi toccherà la curva senza intersecarla. Al contrario, se C è un po’ più vicino o un po’ più lontano di quel che deve essere, il cerchio intersecherà la curva non solo nel punto B ma necessariamente anche in qualche altro B1 però tanto più questi due punti B e B1 sono vicini, tanto minore sarà la differenza che sussiste tra le radici dell’equazione. Infine, se questi punti giacciono ambedue in uno, cioè se il cerchio che passa per B vi tocca la curva senza intersecarla, queste radici saranno assolutamente uguali.” Fissata in O l’origine degli assi cartesiani, Cartesio decise di trovare il cerchio tangente alla curva in B che ha 16 LUCA LUSSARDI centro sull’asse x, nel punto C, come in figura 12: in B devono quindi essere riunite due intersezioni. Figura 12. Cerchio tangente in B alla curva assegnata. Sia B = (x0 , y0 ), e poniamo OC = d e BC = r. Allora, l’equazione della circonferenza incognita sarà data da (x − d)2 + y 2 = r2 . Intersechiamo ora la curva con la circonferenza; abbiamo (x − d)2 + y 2 = r2 P (x, y) = 0. Eliminando y, e supponendo quindi di poterlo sempre fare in pratica, si arriva all’equazione risolvente Q(x) = 0 che dunque, per tangenza, deve dare il punto B contato almeno due volte, ovvero deve essere Q(x) = (x − x0 )2 R(x) per un certo R(x). Esempio 2.2. Vediamo ad esempio come trovare la generica tangente alla parabola di equazione y − x2 = 0. Sia B = (x0 , y0 ). Dobbiamo quindi risolvere il sistema di equazioni (x − d)2 + y 2 = r2 y − x2 = 0 eliminando y. Si trova subito l’equazione (x − d)2 + x4 = r2 APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 17 cioé x4 + x2 − 2dx + d2 − r2 = 0. Il polinomio risolvente, che è di quarto grado, deve quindi essere della forma (x − x0 )2 (ax2 + bx + c) per opportuni numeri reali a, b, c. A conti fatti, deve quindi essere x4 + x2 − 2dx + d2 − r2 = ax4 + (b − 2ax0 )x3 + (ax20 + c − 2bx0 )x2 + (bx20 − 2cx0 )x + x20 c per ogni x reale. Ne segue che a=1 b − 2ax0 = 0 ax20 + c − 2bx0 = 1 bx2 − 2cx0 = −2d x2 c0 = d2 − r2 . 0 Il precedente sistema ha la soluzione data da a=1 b = 2x0 c = 1 + 3x20 d = x0 + 2x30 r2 = x4 (1 + 4x2 ). 0 0 Ne segue che C ha coordinate (x0 + 2x30 , 0) e dunque la retta CB ha equazione cartesiana y − y0 = − y0 1 (x − x ) = − (x − x0 ), 0 2x30 2x0 x0 6= 0. L’ortogonale alla retta CB ha dunque equazione cartesiana y − y0 = 2x0 (x − x0 ) che dunque è l’equazione della tangente alla parabola di equazione y = x2 nel punto (x0 , y0 ). Il caso x0 = 0 si tratta a parte e la tangente risulta avere equazione y = 0. Il metodo proposto da Cartesio appare quindi abbastanza complesso anche in casi molto semplici: esso diventa infatti computazionalmente pesante quando l’equazione della curva è un polinomio di grado elevato. In particolare, osserviamo che il procedimento può funzionare praticamente solo se l’equazione che esprime la curva assegnata è polinomiale: in altre parole, il metodo di Cartesio è sostanzialmente limitato alle sole curve algebriche. 18 LUCA LUSSARDI 2.3. Il metodo delle adequazioni di Fermat. Cercando di risolvere il problema delle tangenti ad una curva piana, un matematico dilettante francese sfiora, almeno formalmente, la nozione di derivata come limite del rapporto incrementale. Pierre de Fermat (1601-1665) non è certo passato alla storia per questo, ma compı̀ un passaggio importante, poiché effettuò il primo tentativo, ovviamente del tutto inconsapevole, di un passaggio al limite. L’idea di fondo su cui si basa Fermat è l’uso delle cosiddette adequazioni, utilizzate nell’opera Methodus ad disquierendam maximam et minimam del 1637 per la determinazione dei massimi e minimi di una funzione. Fermat osservò anzitutto una cosa già ben nota a quel tempo, e cioé che se una funzione ha un massimo, o minimo, in un certo punto, allora essa è stazionaria nelle vicinanze di quel punto, ovvero varia poco se ci si sposta poco dal punto di massimo, o dal punto di minimo. Dunque, ad esempio, se f ha massimo in x0 , deve essere vera l’adequazione f (x0 + e) ≈ f (x0 ) per e quantità abbastanza piccola ma non nulla. Ma Fermat capı̀ che è necessaria una maggiore precisione; siccome quindi f (x0 + e) − f (x0 ) deve essere già approssimativamente nullo anche per un e 6= 0, seguendo Fermat, deve valere anche l’adequazione f (x0 + e) − f (x0 ) ≈0 e che è la prima apparizione di un rapporto incrementale. Si semplifica quindi l’adequazione e si pone alla fine e = 0: in questo modo l’adequazione finale diventa un’equazione in x0 , dalla quale si trovano i punti che rendono f stazionaria. Esempio 2.3. Vediamo a titolo di esempio la determinazione dei punti di massimo e di minimo, locali, della funzione f (x) = x2 (3 − x). Si ha f (x + e) − f (x) = (x + e)2 (3 − x − e) − x2 (3 − x) = −e3 − 3e2 x − 3ex2 + 3e2 + 6xe per cui l’adequazione f (x + e) − f (x) ≈0 e diventa −e2 − 3ex − 3x2 + 3e + 6x ≈ 0. L’adequazione diviene equazione ponendo e = 0, e quindi si trova −3x2 + 6x = 0 APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 19 da cui due soluzioni possibili, x = 0 e x = 2. Seguendo i possibili ragionamenti di Fermat, osserviamo che f (2 + e) = 4 − 3e2 − e3 = f (2) − 3e2 − e3 . Essendo e3 trascurabile rispetto ad e2 , notiamo che si avvertiva già una primordiale idea di confronto di infinitesimi, si avrà che per e molto piccolo f (2 + e) < f (2) per cui x = 2 è il punto di massimo locale cercato, ed il valore massimo vale f (2) = 4. In modo analogo, si ha f (e) = 3e2 − e3 = f (0) + 3e2 − e3 per cui argomentando allo stesso modo si avrà che x = 0 è stavolta il punto di minimo locale cercato, ed il valore minimo vale 0. Nel successivo manoscritto De tangentibus linearum curvarum, Fermat risolse il problema della determinazione delle tangenti come applicazione del metodo per i massimi e minimi. Illustriamo il procedimento utilizzato da Fermat per una funzione concava y = f (x) facendo riferimento alla figura 13, in cui F è l’origine degli assi; in particolare, il problema si riconduce a quello di determinare la cosiddetta sottotangente t = |GE|. Denotiamo con g(x) l’equazione della retta tangente GA e consideriamo la differenza h(x) = g(x) − f (x). Grazie alla concavità di f si ha h ≥ 0 sempre e h(x0 ) = 0, essendo A = (x0 , f (x0 )). Ne segue che h ha un minimo per x = x0 , e dunque deve essere vera l’adequazione h(x0 + e) − h(x0 ) ≈0 e per e = |ED| piccolo, che si riduce a (2.1) h(x0 + e) ≈ 0. e Osserviamo ora che i triangoli GEA e GDB sono simili, da cui AE : GE = BD : GD da cui |BD| = |AE| |GD| . |GE| Ne segue che h(x0 + e) + f (x0 + e) = g(x0 + e) = |BD| = |AE| |GD| f (x0 )(t + e) = |GE| t 20 LUCA LUSSARDI Figura 13. Determinazione della sottotangente alla curva data in A. da cui h(x0 + e) + f (x0 + e) f (x0 )(t + e) = e te cioé h(x0 + e) f (x0 )(t + e) f (x0 + e) = − . e te e Dal momento che vale l’adequazione (2.1), deve essere f (x0 )(t + e) f (x0 + e) − ≈0 te e che è un’adequazione dalla quale si ricava t, ovvero la sottotangente. (2.2) Il caso in cui la funzione sia localmente convessa si tratta in modo analogo. Esempio 2.4. Andiamo a cercare l’equazione della retta tangente alla funzione y = √ x nel generico punto A = (x0 , y0 ), con x0 > 0. Si tratta di una funzione concava, per cui si può utilizzare direttamente l’adequazione (2.2) che permette di trovare la sottotangente t. Precisamente, la (2.2) diventa √ √ x0 (t + e) x0 + e − ≈ 0. te e Si ha quindi √ √ √ x0 x0 x0 + e + − ≈0 e t e che fornisce la soluzione √ √ √ √ e x0 e x0 ( x0 + e + x0 ) √ √ √ t≈ √ = x0 ( x0 + e + x0 ). √ = e x0 + e − x0 Mettendo e = 0 si ha l’equazione t= √ √ √ x0 ( x0 + x0 ) = 2x0 . APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 21 Ne segue che l’equazione della retta tangente in A = (x0 , y0 ) è data da √ x0 y − y0 = (x − x0 ) 2x0 ovvero 1 y − y0 = √ (x − x0 ) 2 x0 e invero, procedendo come faremmo oggi, si ha proprio 1 √ = y 0 (x0 ). 2 x0 Osserviamo che per risolvere il problema delle tangenti si potrebbe anche utilizzare direttamente la teoria delle adequazioni, senza ricondursi ad un problema di minimo o di massimo. Infatti, se dobbiamo cercare l’equazione della retta tangente alla funzione y = f (x) nel suo punto A = (x0 , y0 ) allora potremmo impostare direttamente l’adequazione f (x0 + e) − f (x0 ) ≈m e nella variabile m, da cui la retta tangente in A di equazione (2.3) y − y0 = m(x − x0 ). Esempio 2.5. Vediamo ad esempio come funziona la (2.3) per la funzione y = xk con k > 1 intero, esempio fondamentale per gli ciò che vedremo successivamente. Dobbiamo risolvere l’adequazione (x0 + e)k − xk0 ≈m e Essendo noto che k−2 2 2 k−2 (x0 + e)k = xk0 + kxk−1 + kx0 ek−1 + ek 0 e + ak−2 x0 e + · · · + a2 x0 e per certi coefficienti aj , per j = 2, . . . , k − 2, si trova l’adequazione k−1 ≈m kxk−1 + ak−2 xk−2 0 e + ··· + e 0 che diventa equazione ponendo e = 0, da cui m = kxk−1 0 . Dunque, la tangente alla curva data nel punto (x0 , y0 ) ha equazione y − y0 = kxk−1 0 (x − x0 ) e invero, procedendo come faremmo oggi, si ha proprio kx0k−1 = y 0 (x0 ). 22 LUCA LUSSARDI Il metodo di Fermat potenzialmente si applica anche alle curve non algebriche, ma diventa molto complesso anche solo con la presenza di parecchi radicali, e presenta ostacoli insuperabili quando l’equazione che descrive la curva è trascendente. 2.4. La costruzione cinematica delle tangenti. Accenniamo ad un ultimo metodo per la ricerca delle tangenti, che nasce dall’esigenza di considerare anche le curve descritte da movimenti meccanici. L’idea risale al matematico francese Gilles Personne de Roberval (1602-1675), e venne ripresa anche dall’italiano Evangelista Torricelli (1608-1647), e consiste nello scomporre il moto del punto che descrive la curva in moti semplici per i quali sia possibile determinare la direzione della velocità, ovvero la tangente, e quindi, ricomponendo le direzioni, si ottiene la direzione della tangente alla curva assegnata. Il punto essenziale di partenza è quindi quello di capire come una curva possa venir generata in modo meccanico, e anche varie curve algebriche ben note possono essere trattate. Infatti, ad esempio, si dimostra che la parabola è descritta da un punto mobile che si allontana da un punto fisso, il fuoco, con la stessa velocità con cui si allontana da una retta fissa, la direttrice; oppure, l’ellisse è generata da un punto mobile che si avvicina ad un fuoco con la stessa velocità con cui si allontana dall’altro fuoco; od ancora, l’iperbole è descritta dal punto che si avvicina ai fuochi, o si allontana da essi, con la stessa velocità; infine, per fare un esempio che non sia una conica, la spirale di Archimede è descritta da un punto mobile che ruota attorno ad un punto fisso con la stessa velocità cui si allontana dal punto stesso. Si potrebbe continuare a fare esempi di curve a quel tempo note, ve ne sono molte altre. Esaminiamo più nel dettaglio solamente un esempio, e precisamente la cicloide, ovvero la curva descritta da un punto che sta sul bordo di un cerchio il quale rotola senza strisciare su una guida rettilinea: si veda la figura 14. Dopo aver descritto la costruzione per punti della curva, Roberval descrive la costruzione della tangente inFigura un punto E14. qualsiasi sulla basecinematica della scomposizione nei due moti Costruzione della tangente alla simultanei. cicloide. Per questo, si tracci il cerchio generatore EBC in modo che passi per il punto E, si prenda un arbitrario segmento orizzontale EF (direzione della velocità del moto traslatorio) e sulla tangente al cerchio Il moto di E della è dato dalladelcomposizione seguenti due moti: (direzione velocità moto rotatorio) dei si prenda un segmento EG, uguale ad EF perché le due velocità di rotazione e di traslazione sono uguali. Il segmento EH, diagonale del parallelogrammo • la circonferenza ruota attorno al suo centro; EFHG, sarà la direzione della velocità del moto composto che genera la cicloide, e quindi sarà tangente alla cicloide. 2.4. Successi e limiti dei metodi per le tangenti. Prima di proseguire nella nostra storia, soffermiamoci per un momento a ricapitolare i successi e ad esaminare i limiti dei metodi per le tangenti precedenti all’invenzione del calcolo. I tre metodi che APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 23 • il centro della circonferenza si muove di moto rettilineo uniforme. Più precisamente, siccome c’è rotolamento senza strisciamento, quando il cerchio ha fatto un giro completo, esso si è mosso di un segmento AD pari alla lunghezza della circonferenza. Ne segue che il moto di traslazione del centro del cerchio avviene con la stessa velocità, in modulo, del moto di rotazione della circonferenza attorno al suo centro. Dunque è facile costruire le due velocità, la cui somma sarà la velocità di E, generico −→ punto della cicloide come in figura: la velocità EF è dovuta al moto di traslazione, che −−→ è orizzontale, mentre la velocità EG, uguale in modulo, è dovuta alla rotazione ed è −→ −−→ −−→ tangente alla circonferenza. Sommando i due vettori EF ed EG si ha la velocità EH che risulta essere tangente alla cicloide in E. 2.5. Ulteriori considerazioni sul problema delle tangenti. Siamo giunti alla conclusione della prima parte della storia del calcolo. Per il problema delle tangenti abbiamo tre principali tentativi di soluzione: il metodo di Cartesio del cerchio tangente è lungo e complicato e va bene solo per le curve algebriche; il metodo delle adequazioni di Fermat avvicina considerazioni più fini ma fallisce quando l’espressione della curva è troppo complicata; infine, il metodo cinematico richiede di conoscere perlomeno da che movimenti è composto il moto lungo la curva. Tutti i metodi fino a questo momento ideati hanno varie caratteristiche comuni: si tratta di metodi globali, cioé considerano la curva nella sua globalità, mentre la tangente è un concetto locale, e inoltre, a parte il metodo cinematico per certi aspetti, si propongono di determinare la sottotangente, che permette di risolvere il problema. La svolta decisiva si avrà solo quando si riuscirà a capire che le difficoltà del problema vanno spezzate: va ideato quindi un calcolo che permetta di separare le difficoltà. Nonostante le difficoltà, si può comunque dire che i fondamenti concettuali del calcolo differenziale siano però stati compresi, anche se manca il passaggio decisivo che avrebbe permesso di creare un calcolo generale vero e proprio. Quello che invece manca del tutto, e che sarà invece un contributo essenziale che daranno Newton e Leibniz, è la comprensione del fatto che il problema delle quadrature è l’inverso del problema delle tangenti, che quindi, non a caso, sarà battezzato teorema fondamentale del calcolo, nome che si usa ancora oggi. 3. Newton: il calcolo delle flussioni Isaac Newton nasce a Woolsthorpe, in Inghilterra, il 25 dicembre 1642, giorno che corrisponde al 4 gennaio 1643 secondo l’attuale calendario gregoriano, a quel tempo non ancora entrato in vigore in Inghilterra. Nel 1653 comincia gli studi alla King’s School nella città di Grantham e durante questo periodo mostra già particolari doti di inventore, 24 LUCA LUSSARDI costruendo orologi e modelli funzionanti di mulini. Nel 1661 Newton entra nel prestigioso Trinity College di Cambridge: qui studia principalmente Aristotele, ma ben presto sposta la sua attenzione verso letture più moderne, ovvero Cartesio, Galileo, Copernico e Keplero. Attorno a 23 anni di vita interrompe gli studi al college a causa di un’epidemia di peste originatasi a Londra: in questo periodo, che trascorre a casa in campagna, inizia l’invenzione del calcolo infinitesimale e la scoperta della teoria della gravitazione universale. Diventa dunque professore di matematica a Cambridge nel 1669. Nel 1670 inizia l’attività di ricerca vera e propria di Newton, e fino al 1672 lo studio dell’ottica lo tiene impegnato: sono ormai celebri i suoi studi sulla rifrazione della luce e sulla scomposizione della luce bianca; a tal proposito, nel 1704 pubblica l’Opticks. Negli stessi anni porta a compimento la teoria della gravitazione universale e dietro consiglio di Edmund Halley, nel 1684 pubblica la sua prima opera su tale argomento, il De Motu Corporum, mentre tre anni più tardi pubblica i Philosophiae Naturalis Principia Mathematica, comunemente chiamati Principia: questo capolavoro è considerato un pilastro della storia della scienza, con esso Newton stabilisce le tre leggi universali della dinamica, che ancora oggi si studiano in un corso di fisica generale, e tratta nel dettaglio la teoria della gravitazione universale dimostrando, in particolare, che le orbite dei pianeti soggetti alla sola forza di gravità sono necessariamente ellittiche, con il sole in uno dei due fuochi. Con la pubblicazione dei Principia, Newton entra nella storia, inizia una profonda amicizia con vari scienziati importanti dell’epoca e arrivano successivamente i riconoscimenti ufficiali: Newton diviene, nel 1699, direttore della Zecca Reale, nel 1703 diventa quindi presidente della Royal Society di Londra e due anni dopo viene investito del titolo di cavaliere dalla Regina Anna. Ricordiamo infine che Newton non ha dedicato la sua vita solamente alla scienza, ma si è occupato, con altrettanto vivo interesse, anche di alchimia e di teologia. Isaac Newton muore a Londra il 20 marzo 1727 e viene sepolto nell’Abbazia di Westminster. Newton, come abbiamo accennato nella sua breve biografia, comincia i suoi studi di calcolo infinitesimale durante gli anni in cui fugge dalla peste scoppiata a Londra, quindi tra il 1665 e il 1666. Il calcolo infinitesimale, o calcolo delle flussioni seguendo la terminologia che Newton utilizza, ha quindi inizio molto prima del fatidico 1684, anno in cui appare la prima opera di Leibniz sul calcolo differenziale. Non abbiamo in verità prove inconfutabili che Newton effettivamente era a conoscenza del suo calcolo delle flussioni già negli anni 1665/66, dal momento che egli non pubblicherà mai nulla di tutto ciò: il lavoro The Method of Fluxions and Infinite Series, che presenta gli studi di calcolo infinitesimale di Newton, viene infatti composto nel 1671 ma edito a Londra solo nel 1736, quindi postumo. Nonostante questo, tanti APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 25 risultati, ad esempio presenti nei Principia, potevano essere trovati solamente ricorrendo al calcolo infinitesimale, per cui questo suggerisce che Newton doveva in effetti essere in possesso del calcolo almeno al momento della stesura dei Principia. In effetti, è vero che nei Principia non si trova traccia del calcolo delle flussioni, ma Newton vi espone invece una teoria sulla quadratura delle regioni piane attraverso un procedimento di approssimazione per eccesso e per difetto che è sostanzialmente l’idea che usiamo ancora oggi per definire l’integrale di Riemann. Egli chiama questo modo di ragionare come metodo delle prime e ultime ragioni, e cosı̀ si esprime in proposito: “Queste ultime ragioni con cui le quantità divengono evanescenti non sono realmente le ragioni di quantità ultime, bensı̀ limiti verso cui le ragioni delle quantità, decrescendo oltre ogni limite, sempre convergono, e ai quali si avvicinano più di ogni differenza data, senza mai oltrepassarle, né mai raggiungerle effettivamente prima che le quantità siano diminuite all’infinito.” In altre parole, Newton ha afferrato il concetto di passaggio al limite ma non è pienamente consapevole del fatto che proprio su esso si possa fondare in modo rigoroso il calcolo infinitesimale. Esiste in ogni caso anche un motivo ben preciso per il quale Newton decide di non pubblicare i suoi risultati di calcolo infinitesimale. Infatti, egli è ancora molto legato al mondo classico, ed in particolare alla geometria greca: in un certo senso è l’ultimo dei classici, dal momento che Leibniz invece avrà il coraggio di esporre le sue idee non classiche e di abbandonare dunque definitivamente il punto di vista classico, ormai destinato a tramontare. Newton è quindi dell’idea che una dimostrazione corretta e rigorosa di un fatto matematico debba necessariamente essere condotta utilizzando gli strumenti classici. 3.1. Il calcolo delle flussioni. Il metodo delle flussioni corrisponde al moderno calcolo delle derivate rispetto al tempo: Newton ha infatti una concezione cinematica del calcolo infinitesimale. Per questo motivo, egli considera le variabili geometriche come variabili fluenti, cioé che variano nel tempo, e le indica con le lettere x, y, z, v, . . . , e considera poi le velocità con cui le variabili fluenti variano nel tempo, e chiama queste velocità flussioni, indicate rispettivamente con ẋ, ẏ, ż, v̇, . . . , notazione ancora oggi in uso in meccanica razionale; infine vengono anche usate le lettere a, b, c, . . . per denotare quantità fisse, ovvero le costanti. Newton fissa quindi un incremento infinitesimo temporale, che indica con o, e chiama momento della variabile x la quantità ẋo, che corrisponde ad un incremento infinitesimo della variabile x. Tutto è pronto per impostare il primo problema che Newton si pone: da una relazione tra variabili fluenti, trovare la relazione tra le flussioni. Supponiamo quindi che sia data una relazione P (x, y, z, . . . ) = 0 tra variabili 26 LUCA LUSSARDI fluenti x, y, z . . . . Seguendo Newton, si legge che siccome i momenti di x, y, z, . . . , dati rispettivamente da ẋo, ẏo, żo, . . . sono molto piccoli rispetto a x, y, z, . . . , allora deve valere anche P (x + ẋo, y + ẏo, z + żo, . . . ) = 0. Dopo aver rimaneggiato la relazione precedente, Newton conclude dicendo che siccome o è infinitamente piccolo, allora si può considerare nullo e quindi deduce cosı̀ la relazione tra le flussioni ẋ e ẏ. Notiamo che quindi i ragionamenti di Newton non si allontanano molto dai ragionamenti dei matematici che lo hanno preceduto, ad esempio dal metodo delle adequazioni di Fermat. Esempio 3.1. Consideriamo l’equazione x2 − axy = 0. (3.1) Operando come detto si ha (x + ẋo)2 − a(x + ẋo)(y + ẏo) = 0 che diventa x2 + 2xẋo + ẋ2 o2 − axy − axẏo − ay ẋo − aẋẏo2 = 0 ovvero, siccome per il momento o 6= 0, 2xẋ + ẋ2 o − axẏ − ay ẋ − aẋẏo = 0. Ponendo ora o = 0 si trova la relazione voluta tra le flussioni ẋ e ẏ: 2xẋ − axẏ − ay ẋ = 0 (3.2) che effettivamente coincide con la derivazione rispetto al tempo della (3.1). Newton si rende quindi conto che può assegnare una regola algoritmica, e precisamente afferma, nel caso in cui si abbiano espressioni polinomiali, di procedere come segue: 1) Ordinare la relazione assegnata secondo le potenze decrescenti di una variabile fluente, ad esempio x. 2) Moltiplicare i termini cosı̀ ordinati uno per volta per il relativo esponente di x. 3) Moltiplicare quindi tutti i termini per ẋ/x e semplificare. 4) Rifare tutto il procedimento per tutte le altre variabili. 5) Sommare tutte le relazioni trovate e uguagliare a 0 la somma cosı̀ ottenuta. Newton ci mostra anche come trovare la relazione tra le flussioni anche nel caso di relazioni irrazionali, e questo esempio fa vedere quanto il metodo delle flussioni sia migliore dei metodi precedenti: è finalmente un vero strumento di calcolo. APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 27 Esempio 3.2. Ad esempio, consideriamo la relazione x− √ b − y + x = 0. a+y Basta effettuare dei cambi di variabile, ponendo b = z, a+y √ y+x=v per avere la nuova relazione x − z − v = 0 dalla quale si ricava, applicando la regola, ẋ − ż − v̇ = 0. Dalla posizione su z si ricava invece az + yz − b = 0 che fornisce aż + ẏz + y ż = 0 mentre dalla posizione su v si ricava invece y + x − v 2 = 0 che fornisce ẏ + ẋ − 2v v̇ = 0. Abbiamo dunque il sistema di relazioni tra le flussioni ẋ − ż − v̇ = 0 aż + ẏz + y ż = 0 ẏ + ẋ − 2v v̇ = 0. Eliminiamo ora le variabili ausiliarie ż e v̇ si trova facilmente ẋ + ẏ + ẋ bẏ − √ =0 2 (a + y) 2 y+x che è la relazione cercata. Ovviamente la teoria non procede solo per esempi, ma Newton osserva alcune proprietà che si deducono dalla sua procedura, e che quindi forniscono delle vere regole di calcolo. Ad esempio: z = x ± y =⇒ ż = ẋ ± ẏ, z = xy =⇒ ż = ẋy + xẏ, z= x ẋy − xẏ =⇒ ż = , y y2 z = xk =⇒ ż = kxk−1 ẋ. Siamo quindi nella direzione giusta: le difficoltà adesso sono state spezzate e sono state individuate le regole del calcolo. Il calcolo delle flussioni è quindi pronto per essere applicato. 28 LUCA LUSSARDI 3.2. Sui problemi di massimo e minimo. Una delle prima applicazioni del calcolo delle flussioni che Newton ci offre è rappresentata dalla risoluzione di problemi di massimo e di minimo. Più precisamente, è data la solita relazione tra fluenti, P (x, y, z, . . . ) = 0. Newton osserva che se la variabile x, per esempio, in quanto fluente, assume massimo o minimo in un certo istante temporale, in questo stesso istante essa inverte la sua flussione, per cui nell’istante di inversione deve essere ẋ = 0. Lo stesso discorso vale chiaramente per ogni altra variabile presente nella relazione. Dunque, in definitiva, se ad esempio la variabile x va massimizzata o minimizzata, basta ricavare la relazione tra le flussioni delle variabili date, porre ẋ = 0, e semplificare le eventuali altre flussioni restanti in modo da arrivare ad una relazione tra le sole fluenti, relazione che va messa in sistema con la relazione assegnata. Esempio 3.3. Consideriamo la relazione x − y 2 + 1 = 0 e ci chiediamo i valori massimi o minimi assunti dalle variabili x, y. Scriviamo subito la relazione tra le flussioni, ovvero (3.3) ẋ − 2y ẏ = 0. Iniziamo dalla variabile y. Ponendo ẏ = 0 si avrebbe ẋ = 0, soluzione che Newton esclude, ed invero y è una variabile illimitata; si veda la figura 15. Figura 15. La relazione x − y 2 + 1 = 0. Cercando invece di estremizzare la variabile x si ha, mettendo ẋ = 0 nella (3.3), l’equazione −2y ẏ = 0 dalla quale, eliminando la soluzione inaccettabile ẏ = 0, si deduce che y = 0, e dunque stavolta si trova il sistema x − y2 + 1 = 0 y=0 APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 29 che ha come soluzione x = −1. Riscriviamo ora che la (3.3) come ẋ = 2y ẏ e cerchiamo di ragionare ora come avrebbe potuto ragionare Newton. Mettiamoci nel punto (−1, 0): osserviamo quindi che se y parte da 0 e cresce, allora la sua flussione diventa positiva, per cui y ẏ ≥ 0 da cui ẋ ≥ 0 mentre se y parte da 0 e decresce, allora la sua flussione diventa negativa, e resta dunque sempre y ẏ ≥ 0 da cui ancora ẋ ≥ 0. In ogni caso quindi x fluisce crescendo dal valore x = −1, per cui x = −1 è il valore minimo per x. 3.3. Le tangenti. Vediamo come il metodo delle flussioni possa essere applicato per la risoluzione del problema delle tangenti. Newton considera le stesse situazioni geometriche dei suoi predecessori, quindi analizza la figura 16. Sia fissata in O l’origine degli assi cartesiani e sia data la curva OBE come in figura, descritta dalla relazione tra le variabili x e y, diciamo, al solito, P (x, y) = 0. Allo scopo di determinare la tangente in B Newton sposta ancora graficamente la sua attenzione alla sottotangente, ma stavolta le regole del calcolo delle flussioni permettono di agevolare i conti anche su espressioni complicate. Infatti, poniamo |OA| = x e |AB| = y e diamo un incremento temporale infinitamente piccolo, ovvero |AC| = oẋ e |DE| = oẏ. Figura 16. La tangente T B alla curva OBE nel punto B. Essendo l’incremento temporale o molto piccolo, il punto E sarà approssimativamente sulla tangente T B e dunque Newton scrive la proporzione che esprime la similitudine tra il triangolo T AB e il “triangolo” BDE, ovvero T A : AB = BD : DE 30 LUCA LUSSARDI da cui |T A| oẋ = y oẏ e quindi ẋ ẏ che permette di determinare il punto T , e quindi la retta tangente T B semplicemente |T A| = y (3.4) come retta passante per due punti, T e B. 3.4. Centri di curvatura. Una significativa applicazione del calcolo delle flussioni è rappresentata dalla determinazione dei centri di curvatura delle curve piane. Seguiamo il ragionamento di Newton analizzando la figura 17. Proponiamoci quindi di determinare il centro di curvatura C della curva assegnata, nel suo punto D. Tracciamo per prima cosa la tangente T D, che sappiamo già come determinare. Il segmento DC è quindi perpendicolare a T D. Costruiamo quindi il punto G intersecando la parallela ad AB condotta da D con la parallela a BD condotta da C, e consideriamo un generico punto g sul segmento CG. Tracciamo la parallela ad AB passante per g, che interseca DC in δ. Si ha subito una prima proporzione, che discende dalla similitudine tra il triangolo Cgδ ed il triangolo T BD: (3.5) Cg : gδ = T B : BD. Muoviamo ora il punto D facendogli fare un incremento infinitesimo che lo porta nel punto d: se C è il centro di curvatura in D allora il segmento dC deve essere ortogonale a Dd in d. Tracciamo l’altezza de e sia F il punto di intersezione tra dC e DG; sia inoltre f il punto di intersezione tra dC e gδ. Ponendo |AB| = x e |BD| = y, possiamo allora scrivere (3.6) |De| = ẋo, |de| = ẏo, ˙ |δf | = −(gδ)o. Per il secondo teorema di Euclide si ha poi, essendo de altezza relativa all’ipotenusa DF , |de|2 |eF | = |De| da cui |de|2 (3.7) |DF | = |De| + |eF | = |De| + . |De| Potendo porre quindi, per arbitrarietà, |Cg| = 1 e ponendo |gδ| = z, la (3.5) diventa 1 : z = |T B| : |BD| = |De| : |de| = ẋ : ẏ, cioé z= ẏ . ẋ APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 31 Figura 17. Determinazione del centro di curvatura C. Tenuto conto poi delle (3.6), la (3.7) può essere riscritta come |DF | = ẋo + ẏ 2 o ẋ e dunque si ha che la proporzione geometrica 1 : |CG| = |δf | : |DF | fornisce ẋ2 + ẏ 2 . ẋż Potendo ora scegliere ẋ = 1 possiamo quindi scrivere, siccome diventa z = ẏ, |CG| = − 1 + z2 |CG| = − . ż Notiamo che la formula precedente ha senso dal momento che ż < 0. È ora semplice determinare anche il raggio di curvatura DC: infatti, ancora per similitudine si ha |DG| : |gδ| = |CG| : |Cg| da cui |DG| = − z(1 + z 2 ) . ż 32 LUCA LUSSARDI e quindi, per il teorema di Pitagora, √ 2 p 1 + z2 (1 + z ) |DC| = |DG|2 + |CG|2 = . |ż| Newton a questo punto estrae una regola operativa: l’obiettivo è determinare z e ż in funzione di x e y in modo tale da poter determinare poi la quantità 1 + z2 ż che si traccia graficamente scendendo da D lungo la perpendicolare ad AB; basta poi |DH| = − condurre da H la parallela ad AB fino al punto C di modo tale che z(1 + z 2 ) ż trovando cosı̀ il centro di curvatura C. Il problema è dunque risolto se determiniamo z |HC| = − e ż in funzione di x e y, ricordando che durante il ragionamento fatto abbiamo posto ẋ = 1 e di conseguenza ẏ = z. Osserviamo che tutto questo ragionamento vale per una configurazione come nella figura 17; altre configurazioni si trattano in modo analogo. Descriviamo quindi, in modo algoritmico, qual è la procedura da seguire. Sia quindi data la relazione P (x, y) = 0. 1) Per prima cosa troviamo la nuova relazione R(x, y, ẋ, ẏ) = 0. 2) Poniamo ẋ = 1 e ẏ = z, avendo cosı̀ S(x, y, z) = R(x, y, 1, z) = 0. 3) Troviamo dunque la relazione T (x, y, z, ẋ, ẏ, ż) = 0. 4) Poniamo ancora ẋ = 1 e ẏ = z, avendo cosı̀ U (x, y, z, ż) = T (x, y, z, 1, z, ż) = 0. 5) Il sistema S(x, y, z) = 0 U (x, y, z, ż) = 0 ci fornisce z e ż in funzione di x e y. 6) Con z e ż possiamo quindi determinare 1 + z2 , ż che forniscono la posizione di C. |DH| = − |HC| = − z(1 + z 2 ) ż Prima di passare alla procedura inversa, ovvero da una relazione tra flussioni alla relazione tra le fluenti, e vederne qualche applicazione, facciamo un’importante osservazione legata proprio alla determinazione dei centri di curvatura. Come è ben noto oggi, infatti, la curvatura di una curva è una quantità legata alla derivata seconda della parametrizzazione, mentre Newton se la cava sempre e solo con una sola flussione: il trucco consiste nel passare alla variabile z, che infatti è stata posta pari a ẏ, e dunque ż sarebbe ÿ. Newton non introduce mai una accelerazione delle fluenti, quindi per Newton il calcolo APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 33 infinitesimale è solo al primo ordine, piuttosto introduce nuove variabili fluenti, come appena visto per la determinazione dei centri di curvatura. 3.5. Il metodo delle serie infinite. Fino a questo momento, come il lettore avrà certamente osservato, abbiamo quasi sempre trattato esempi di curve descritte da equazioni algebriche; è pur vero che Newton descrive, mediante opportuni cambi di variabili, come, ad esempio, trovare la relazione tra le flussioni se la relazione tra le fluenti contiene radicali anche complicati, e inoltre illustra le regole di calcolo che permettono di analizzare una difficoltà alla volta. Nonostante questo passo in avanti però restano escluse dal discorso, ad esempio, le curve trascendenti, che rappresentavano un problema anche per tutti i predecessori di Newton. Per questo tipo di curve Newton fa un’assunzione che oggi ci appare drastica, ma che può essere compresa se pensiamo che a quel tempo il concetto generale di funzione come legge di corrispondenza tra variabili non era ancora presente: Newton assume che tutte le funzioni, sostanzialmente, siano esprimibili come sviluppi in serie di potenze, eventualmente anche a esponenti negativi. Certamente per molte funzioni trascendenti, come esponenziali o funzioni circolari questa procedura è corretta, ma per altre no: l’analisi di Newton quindi non è completa se pensiamo al concetto di funzione inteso come oggi lo intendiamo, ma risulta sufficientemente esausitva relativamente alle conoscenze dell’epoca. La teoria delle serie infinite ideata da Newton costituisce il punto di forza, secondo Newton stesso, del suo calcolo: infatti, come vedremo, Newton riesce sempre, in ogni caso, a invertire la procedura che fa passare dalla relazione tra le fluenti alla relazione tra le flussioni, che quindi è una sorta di integrazione delle relazioni tra le flussioni: per fare questo però è necessario ricondursi sempre a serie, infinite in generale, di potenze e quindi poi operare su queste, praticamente, come diremmo oggi, integrando per serie, cioé termine a termine. In questo modo Newton riuscirà a risolvere completamente i problemi che si era posto: dalle fluenti alle flussioni e viceversa dalle flussioni alle fluenti; ma il risultato di quest’ultima operazione resta solo teorico poiché Newton non è poi in grado di identificare, in generale, il risultato di un’integrazione di una relazione tra flussioni, che resta quindi solamente scritto come formale sviluppo in serie di potenze. Per inciso, non esiste ovviamente ancora alcun concetto di convergenza delle serie, cosa che arriverà molti anni dopo. Newton mostra anche come sia possibile riscrivere varie operazioni come divisioni ed estrazioni di radici, per sviluppi in serie. Uno dei primi esempi che Newton fa è la divisione a2 b+x 34 LUCA LUSSARDI che sviluppa come a2 a2 a2 x a2 x 2 a2 x 3 a2 x 4 = − 2 + 3 − 4 + 5 − ... b+x b b b b b In particolare, viene dedotto l’importante sviluppo in serie 1 = 1 − x2 + x4 − x6 + x8 − · · · 1 + x2 Successivamente, passa ad esaminare come sviluppare una radice quadrata, trovando, per esempio, che √ x2 x4 x6 + =a+ − + − ··· 2a 8a3 16a5 Non andiamo oltre questo argomento e torniamo al calcolo delle flussioni. a2 x2 3.6. Dalle flussioni alle fluenti. Il passaggio da una relazione P (x, y, z, . . . , ẋ, ẏ, ż, . . . ) = 0 ad una relazione del tipo R(x, y, z, . . . ) = 0 è ben più problematico del passaggio opposto già analizzato: infatti, stavolta si tratta di effettuare, come diremmo oggi, un’integrazione di una relazione tra flussioni. Proprio per questo problema Newton sfrutta il suo metodo delle serie infinite: in questo modo, in linea teorica, Newton riesce a integrare ogni relazione tra flussioni. Analizziamo un esempio solo nel caso più significativo che Newton tratta, ovvero il caso in cui si abbia una relazione assegnata del tipo P (x, y, ẋ, ẏ) = 0 che possa essere messa in una delle seguenti forme: ẋ ẏ = Q(x, y), = S(x, y) ẋ ẏ essendo Q(x, y), S(x, y) polinomiali in x e y, eventualmente anche uno sviluppo in serie infinita. Allora, in questo caso Newton trova un algoritmo che consente di ricavare la relazione y = T (x), con T (x) eventualmente serie infinita di potenze di x. Esempio 3.4. Supponiamo sia data la relazione ẏ = 1 − 3x + y + x2 + xy. ẋ Anzitutto, va spezzata la parte che contiene solo x dal resto della relazione, ottenendo ẏ = (1 − 3x + x2 ) + (y + xy). ẋ Costruiamo ora una tabella come segue: 1 y ∗ xy ∗ somma 1 y= ... −3x +x2 ... ... ∗ ... ... ... ... ... 0 ... ... ... ... ... ... ... ... ... APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 35 Compiliamo ora la tabella. Consideriamo l’1 sulla prima riga della tabella; moltiplichiamolo per x ottenendo x = x1 e dividiamolo quindi per 1, il suo esponente visualizzato esplicitamente, ottenendo x. Quest’ultimo x lo mettiamo al posto di y nelle due espressioni che ci sono in colonna a sinistra, ottenendo rispettivamente x e x2 . Mettiamo questi ultimi due termini in tabella come segue: 1 y ∗ ∗ xy somma 1 y= ... −3x +x2 x ... ∗ x2 ... ... ... ... 0 ... ... ... ... ... ... ... ... ... Ora ripartiamo con lo stesso ragionamento dal termine −3x, secondo termine della prima riga. Questo lo sommiamo all’x sottostante, trovando −2x, moltiplichiamo per x, ottenendo −2x2 , che va diviso per l’esponente di x, cioé 2, da cui troviamo −x2 ; infine mettiamo −x2 al posto di y nelle due espressioni che ci sono in colonna a sinistra, ottenendo rispettivamente −x2 e −x3 : mettiamo questi ultimi due termini in tabella come segue: 1 y ∗ xy ∗ somma 1 y= ... −3x +x2 0 2 x −x . . . ∗ x2 −x3 ... ... ... ... ... ... ... ... ... ... ... Facciamo ancora un passaggio solo, quindi ripartiamo con lo stesso ragionamento dal termine +x2 , terzo termine della prima riga. Questo lo sommiamo ai sottostanti, trovando x2 , moltiplichiamo per x, ottenendo x3 , che va diviso per l’esponente di x, cioé 3, da cui troviamo x3 /3; infine mettiamo x3 /3 al posto di y nelle due espressioni che ci sono in colonna a sinistra, ottenendo rispettivamente x3 /3 e x4 /3: mettiamo questi ultimi due termini in tabella come segue: 1 y ∗ xy ∗ somma 1 y= ... −3x +x2 0 ... x −x2 x3 /3 . . . ∗ x2 −x3 x4 /3 ... ... ... ... ... ... ... ... E cosı̀ via, la procedura in generale non ha termine. Compiliamo ora la riga della somma semplicemente sommando in colonna: 36 LUCA LUSSARDI 1 y ∗ xy ∗ somma 1 y= ... −3x +x2 0 ... 2 3 x −x x /3 ... 2 3 ∗ x −x x4 /3 −2x +x2 −2x3 /3 + · · · ... ... ... ... Infine, per trovare l’ultima riga è sufficiente moltiplicare ogni addendo per x e dividerlo per l’esponente relativo alla x; abbiamo quindi finalmente 1 −3x +x2 0 ... 2 3 y ∗ x −x x /3 ... 2 3 xy ∗ ∗ x −x x4 /3 2 3 somma 1 −2x +x −2x /3 + · · · 2 3 y= x −x +x /3 −x4 /6 + · · · da cui la soluzione x3 x4 − + ··· y =x−x + 3 6 2 3.7. La quadratura delle curve. Finalmente Newton, dopo aver analizzato il problema che consiste nel passare da una relazione assegnata tra flussioni alla corrispondente relazione tra le fluenti, applica questa procedura alla quadratura delle curve piane: concludiamo la nostra analisi sul lavoro di Newton proprio con la prima apparizione di quello che sarà noto poi come teorema fondamentale del calcolo integrale, ovvero la comprensione che quadratura e calcolo delle flussioni sono due problemi l’uno inverso dell’altro. Analizziamo la seguente figura. Figura 18. Quadratura della curva ADE. APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 37 È assegnata la curva ADE come in figura, dunque una relazione P (x, y) = 0 avendosi |AB| = x e |BD| = y. Poniamo z = Area (ABD). Diamo quindi un incremento temporale infinitesimo o: si avrà |BC| = ẋo e |F E| = ẏo. Essendo o infinitamente piccolo si ha che il momento della variabile z può essere scritto, ricordando la formula che fornisce l’area di un trapezio, come żo = (y + y + ẏo)ẋo ẏ ẋo2 (|BD| + |CE|)|DF | = = y ẋo + 2 2 2 da cui ż = y ẋ + ẏ ẋo 2 e dunque, ponendo o = 0, si giunge a (3.8) ż = y ẋ. Potendosi scegliere ẋ = 1, la (3.8) diventa la fondamentale (3.9) ż = y che rappresenta la versione newtoniana del teorema fondamentale del calcolo integrale. Il problema della quadratura della curva ADE si risolve dunque trovando, dalla relazione P (x, y) = 0 la relazione tra z e x, ottenuta “integrando” la relazione (3.9). 4. Leibniz: il calcolo differenziale Gottfried Wilhelm Leibniz nasce a Lipsia, in Germania, il 1◦ luglio 1646. Figlio di un professore universitario di diritto, entra all’Università di Lipsia nel 1661 e prende la laurea in Giurisprudenza nel 1666; in questo stesso anno pubblica anche i suoi primi lavori di logica matematica. Dal 1668 comincia a viaggiare attraverso l’Europa per missioni diplomatiche e proprio durante i periodi che trascorre a Parigi, in Olanda e a Londra conosce personalità di spicco del mondo scientifico: in particolare entra in contatto epistolare con Oldenburg, il segretario della Royal Society di Londra, e quindi, indirettamente, anche con Newton. Nel 1676 rientra in Germania, ad Hannover, e nel 1680 comincia a dedicarsi agli studi e alla stesure di molte delle sue opere, che spaziano dalla filosofia alla logica, e in particolare le opere matematiche. Sulla rivista Acta Eruditorum, da lui fondata nel 1682, pubblica, nel 1684, l’articolo che fissa le notazioni e le regole definitive del calcolo differenziale, ovvero Nova Methodus pro Maximis et Minimis. L’ultima parte della vita di Leibniz è contrassegnata dalla disputa sorta tra lui e Newton per l’attribuzione dell’invenzione del calcolo infinitesimale. Leibniz passa gli ultimi anni della sua vita nella disgrazia a causa delle accuse di plagio e muore ad 38 LUCA LUSSARDI Hannover il 14 novembre 1716. L’anno 1684 rappresenta quindi la nascita ufficiale del calcolo infinitesimale, dal momento che solo in quest’anno per la prima volta appaiono pubblicati, con l’uso delle notazioni definitive, metodi propri del calcolo differenziale e del calcolo integrale: ricordiamo infatti che Newton non pubblicherà nessun risultato sul calcolo delle flussioni, nonostante ne fosse già in possesso nel 1666. Leibniz viene in contatto indiretto con Newton negli anni del suo soggiorno a Parigi prima e a Londra poi: in questo periodo infatti Leibniz intrattiene una notevole corrispondenza epistolare con Barrow, Collins Oldenburg, e quest’utlimo, a sua volta, gira le lettere a Newton. In queste lettere, divenute più tardi tristemente famose per via della disputa che scoppierà, Newton espone in modo chiaro il metodo delle serie infinite e dichiara di possedere il calcolo delle flussioni, che però non esplicita mai: Leibniz dunque sa che Newton è già in possesso del calcolo infinitesimale, ma la diversità notevole dell’approccio di Leibniz rispetto a quello di Newton ci porta a pensare che egli non abbia carpito in nessun modo il calcolo delle flussioni, ma che abbia invece sviluppato in modo autonomo il calcolo differenziale. Infatti, mentre per Newton le variabili dipendono da una variabile temporale fittizia, Leibniz ha una concezione statica del calcolo, quindi, a prima vista, più classica, per certi versi, di quella di Newton. Il concetto fondamentale su cui fa perno il calcolo leibniziano è il concetto di differenziale di una variabile, tipicamente geometrica, ovvero la differenza tra due valori assunti dalla variabile e infinitamente vicini tra loro. Leibniz, a differenza di Newton, comprende meglio il fatto che in realtà le quantità di interesse sono i rapporti tra differenziali e non i differenziali in sé; c’è inoltre un netto miglioramento nella comprensione del teorema fondamentale del calcolo integrale: Leibniz arriva addirittura a dire che si potrebbe definire l’integrale come l’operatore inverso del differenziale. Le ricerche di Leibniz sul calcolo differenziale conducono alla pubblicazione dei primi manoscritti del 1673: egli riprende le ricerche di Fermat, di Pascal e di altri e si propone soprattutto di determinare delle regole di calcolo e delle notazioni idonee. Questo progetto arriva lentamente a compimento con la già più volte citata pubblicazione del 1684, Nova Methodus pro Maximis et Minimis. 4.1. Il differenziale. Leibniz concepisce il calcolo dei differenziali come estrapolazione di un calcolo su variabili discrete: infatti, egli considera prima di tutto la situazione in cui è data la variabile x che non forma un continuo geometrico, ma bensı̀ forma una successione, o progressione, come viene chiamata dallo stesso Leibniz. Precisamente quindi la variabile x assume valori discreti {xi }, in generale infiniti. Leibniz introduce quindi l’operatore differenza ∆ che opera su x come segue: ∆i x = xi+1 − xi . APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 39 L’operatore ∆ trasforma quindi progressioni in progressioni: esso trasforma la progressione {xi } nella progressione degli incrementi {∆i x}. Per “estrapolazione” di ∆, viene quindi definito l’operatore differenziale d il quale stavolta agisce sulla variabile continua x pensata come progressione infinita dei suoi valori infinitamente vicini tra loro: Leibniz insiste molto sul fatto che dx è una quantità infinitamente più piccola rispetto alla variabile x, considerazione che tornerà utile molto spesso. Osserviamo ora alcune proprietà dell’operatore differenza ∆. Ad esempio, ∆i a = a − a = 0, se a è una costante, xi = yi =⇒ ∆i x = ∆i y ∆i (x + y) = xi+1 + yi+1 − xi − yi = xi+1 − xi + yi+1 − yi = ∆i x + ∆i y, ∆i (x − y) = xi+1 − yi+1 − xi + yi = xi+1 − xi − (yi+1 − yi ) = ∆i x − ∆i y. Queste formule, estrapolando l’operatore ∆, diventano rispettivamente da = 0, se a è una costante, x = y =⇒ dx = dy e d(x + y) = dx + dy, d(x − y) = dx − dy. Passiamo ora ad esaminare invece le due ultime proprietà meno ovvie. Anzitutto, si ha ∆i (xy) = xi+1 yi+1 − xi yi = yi+1 (xi+1 − xi ) + xi (yi+1 − yi ) = yi+1 ∆i x + xi ∆i y dalla quale, per estrapolazione, segue che (4.1) d(xy) = (y + dy)dx + xdy = ydx + xdy + dxdy. Osservando bene la relazione (4.1) Leibniz si accorge che qualcosa non torna tra membro di sinistra e membro di destra: a sinistra infatti vi è una quantità infinitamente più piccola di xy mentre a destra vi è, oltre alla somma ydx + xdy che è dello stesso ordine di infinitesimo del membro di sinistra, anche la quantità dxdy che invece è un infinitesimo di ordine più elevato rispetto a ydx + xdy, dal momento che è prodotto di due infinitesimi. Per far tornare un bilancio di ordini di infinitesimo deve quindi essere d(xy) = ydx + xdy che è la definitiva regola di differenziazione del prodotto. Infine, per quanto riguarda il quoziente di due variabili si ha x xi+1 xi xi+1 yi − xi yi+1 yi (xi+1 − xi ) − xi (yi+1 − yi ) ∆i = − = = y yi+1 yi yi+1 yi yi+1 yi 40 LUCA LUSSARDI da cui (4.2) x ydx − xdy ydx − xdy d = = 2 . y (y + dy)y y + ydy Anche qui, dal momento che ydy è una quantità infinitamente più piccola rispetto a y 2 la (4.2) diventa la definitiva regola di differenziazione del quoziente data da ydx − xdy x = d . y y2 Quella appena presentata è la teoria dei differenziali primi: in questo Leibniz giunge a conclusioni corrette, nel senso che se prendiamo la relazione y = f (x) allora il rapporto dy dx calcolato usando le regole di Leibniz coincide con la derivata prima di f . Difatti, secondo le regole di Leibniz, differenziando la relazione y = f (x) si trova dy = f 0 (x)dx essendo f 0 la “nostra” derivata prima, e dunque dy = f 0 (x). dx 4.2. Differenziali di ordine più elevato. Il prossimo step è il passaggio ai differenziali di ordine più elevato, primo vero elemento di novità rispetto al calcolo newtoniano. Leibniz infatti osserva che una volta assegnata la progressione della variabile x, anche dx è una variabile, e ricordiamo anche infinitamente più piccola di x, che forma una progressione infinita, e dunque ha senso considerare ddx, denotato anche con d2 x, e quindi per ricorsione d3 x, d4 x, . . . Cosı̀ come dx è una quantità infinitamente piccola rispetto a x, il differenziale secondo d2 x è una quantità infinitamente piccola rispetto a dx, il differenziale terzo d3 x è una quantità infinitamente piccola rispetto a d2 x, e cosı̀ via. Sfruttando il calcolo dei differenziali successivi, che obbediscono alle stesse leggi dei differenziali primi, Leibniz afferma che è dunque possibile scrivere infinite equazioni differenziali a partire dall’equazione di una curva, differenziando ripetutamente l’espressione assegnata: siccome vengono usate solo le regole principali del calcolo differenziale, segue che tutte le relazione via via trovate sono indipendenti dalla scelta delle progressioni delle variabili in gioco. Se ad esempio differenziamo due volte la relazione y = f (x) otteniamo, introducendo le nostre notazioni per le derivate prima e seconda di f , dy = f 0 (x)dx, da cui d2 y = f 00 (x)dx2 + f 0 (x)d2 x d2 y d2 x 00 0 = f (x) + f (x) . dx2 dx2 APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 41 Dunque il rapporto d2 y dx2 calcolato usando le regole di Leibniz, non coincide, in generale, con la derivata seconda di f : per ottenere la derivata seconda a partire dai differenziali secondi occorre quindi che si consideri la variabile d2 x costante, ed effettivamente questa è una scelta che Leibniz fa spesso quando tratta i differenziali successivi: in tal caso si ha proprio d2 y = f 00 (x) dx2 che è la notazione che si usa ancora oggi. 4.3. Tangenti. Anche Leibniz, come Newton e altri prima, applica il calcolo differenziale per risolvere il classico problema delle tangenti: facciamo riferimento alla figura 19. Leibniz osserva, come del resto abbiamo visto era già ben noto, che approssimativamente si ha BD : DE = T A : AB. Se quindi la curva assegnata ha equazione P (x, y) = 0 allora si ha la relazione dx : dy = |T A| : y Figura 19. La tangente T B alla curva OBE nel punto B. da cui si ricava la sottotangente (4.3) |T A| = y dx dy 42 LUCA LUSSARDI che è la perfetta analoga della (3.4) di Newton. La (4.3) è esattamente quello che scriveremmo oggi: la differenza che c’è tra la (4.3) e il nostro modo di concepire la (4.3) risiede nel fatto che per noi la scrittura dx dy è una notazione unica, mentre per Leibniz è un vero rapporto algebrico di differenziali. 4.4. L’integrale e le quadrature. In analogia a quanto fatto per il differenziale, Leibniz introduce l’operatore integrale, al quale dedica comunque molto meno spazio, estrapolando un opportuno operatore definito su progressioni discrete delle variabili: va comunque precisato che Leibniz non usa ancora il termine “integrale”, questo nome verrà dato pochi anni dopo da Jacob Bernoulli. Data la variabile discreta y = {yi }, Leibniz considera stavolta l’operatore somma Σi y = i X yj = y1 + y2 + · · · + yi . j=1 Passando ora alla variabile continua l’operatore Σ diventa l’operatore integrale Z y che stavolta è una variabile infinitamente più grande rispetto alla variabile y. Osserviamo ora che se y è una variabile discreta allora si ha, per definizione, X X i i+1 i X ∆i Σi y = ∆i yj = yj − yj = yi+1 j=1 j=1 j=1 da cui, per estrapolazione alle variabili continue, si avrebbe Z d y = y + dy. Ancora una volta usiamo un discorso di omogeneità degli ordini di infinitesimo/infinito: affinché il bilancio sia corretto occorre trascurare il termine dy a destra, trovando Z (4.4) d y = y. La (4.4) rappresenta la versione leibniziana del teorema fondamentale del calcolo integrale, in analogia alla (3.9) di Newton. Tutto è quindi pronto quindi per risolvere anche il problema della quadratura: l’area Q della regione delimitata dalla variabile y, “funzione” di x, è data da Z Q= ydx poiché si ottiene sommando le aree dei rettangoli di base dx e altezza y. Leibniz osserva che Q stessa può essere anche definita come variabile tale che dQ = ydx e quindi APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 43 sottolinea che l’operatore integrale potrebbe essere anche definito semplicemente come l’inverso dell’operatore d. 4.5. Newton e Leibniz a confronto. Come già osservato in vari punti, Newton non utilizza mai derivazioni di ordine superiore al primo, sebbene talvolta se ne presentasse la necessità, come ad esempio nella determinazione dei centri di curvatura; Leibniz invece introduce anche i differenziali di ordine superiore al primo, anche se non li comprende completamente, in quanto sembra che questi ultimi abbiano un vero significato solamente quando si assume costante la progressione dei differenziali primi di una delle variabili. Le procedure di Newton appaiono molto algoritmiche: lo scienziato inglese ogni volta fornisce una regola ben precisa che si può applicare a tutti i casi che sta discutendo, quasi automatica, che permette anche di dimenticarsi della teoria puramente formale che c’è dietro; il lavoro di Leibniz è invece più astratto e sintetico. Abbiamo osservato più volte che in Newton talvolta si è costretti, come nel caso della quadratura, a imporre come unitaria, o in generale nota, la flussione di una delle variabili in gioco: Newton non è pienamente consapevole del fatto che in realtà le quantità che interessano veramente non sono le flussioni, bensı̀ i rapporti tra di esse; questo fatto invece è compreso meglio da Leibniz, anche se il fatto che Newton fissa come unitarie certe flussioni quando gli fa comodo riflette la scelta delle progressioni costanti di Leibniz. Newton crede fino alla fine della sua vita che il suo calcolo delle flussioni, accompagnato al metodo delle serie infinite, sia il fecondo strumento di calcolo che permetterà nel futuro uno sviluppo dell’analisi; la storia smentirà Newton: infatti, è pur vero che combinando calcolo delle flussioni e serie infinite si arriva sempre ad una soluzione, ma solo ad una soluzione teorica, perdendo spesso di vista altri importanti aspetti della problematica. Questo punto sarà il tallone d’Achille del calcolo newtoniano, e invero sarà il calcolo differenziale di Leibniz a essere sviluppato da tutti i grandi matematici del continente, a cominciare dai fratelli Bernoulli. 4.6. La disputa sull’invenzione del calcolo. Abbiamo già accennato a questo fatto discutendo della vita di Newton. Pubblicazioni alla mano, la priorità di invenzione del calcolo infinitesimale spetterebbe a Leibniz, dal momento che egli è il primo che pubblica risultati definitivi di calcolo differenziale, nel 1684. Nonostante questo, come abbiamo già più volte detto, Newton era in possesso del calcolo delle flussioni, che però non pubblica, fin dal 1666. È doveroso precisare sin da subito che oggi viene riconosciuta ad entrambi la scoperta del calcolo infinitesimale: infatti, data la diversità notevole dei due approcci, è molto probabile che Newton e Leibniz abbiano sviluppato in modo autonomo il loro calcolo; ricordiamo altresı̀ che Leibniz pubblica svariati articoli sin dal 1675 44 LUCA LUSSARDI relativi a quello che poi sarebbe divenuto il calcolo differenziale, ma con notazioni via via da raffinare che diventano definitive solo col Nova Methodus. In realtà, abbiamo già accennato al fatto che c’è stato un notevole scambio epistolare tra Newton e Leibniz tra gli anni 1672 e 1676, anche se mai diretto ma mediante i corrispondenti Collins, Barrow e Oldenburg. In queste lettere Newton espone parecchi suoi risultati che potevano essere compresi solo con l’uso del calcolo delle flussioni, o comunque solo essendo a conoscenza del calcolo infinitesimale: in particolare, l’argomento principale delle lettere è il metodo delle serie infinite, ma Newton cela dietro difficili anagrammi il suo calcolo delle flussioni. Leibniz viene quindi a conoscenza di questi risultati proprio nel periodo in cui pubblica i primi tentativi di edificazione del calcolo differenziale, ma è difficile credere che possa aver tratto delle idee utili a partire dalla vaghezza delle esposizioni di Newton, per cui appare abbastanza convincente il fatto che Leibniz abbia comunque sviluppato il calcolo in modo autonomo. Il fatto che ha scatenato la disputa risale al 1704, anno in cui, come appendice dell’Opticks di Newton, appare il Tractatus de quadratura curvarum: una recensione di questo lavoro, anonima ma notoriamente dovuta a Leibniz, dice infatti che Newton nel tal lavoro si serve sostanzialmente del metodo differenziale di Leibniz ma con le notazioni del calcolo delle flussioni. Questa citazione suscita l’ira dei seguaci di Newton che accusano una prima volta Leibniz di plagio. Nel 1710 il matematico scozzese John Keill conclude un articolo sulle forze centrifughe dichiarando esplicitamente che si è avvalso del metodo delle flussioni, scoperto da Newton molti anni prima e poi pubblicato invece da Leibniz con altre notazioni. Leibniz chiede dunque rettifica di una seconda accusa di plagio cosı̀ pesante, e si rivolge direttamente alla Royal Society di Londra, in quegli anni presieduta proprio da Newton. La società decide di nominare una commissione che chiarisca definitivamente la priorità sull’invenzione del calcolo; paradossalmente, il caso viene messo in mano a persone poco competenti in materia, le quali si limitano a esaminare le lettere scambiate tra Newton e Leibniz e pubblicando, nel 1713, il Commercium epistolicum, ovvero proprio la raccolta commentata dello scambio epistolare tra Newton e Leibniz. La commissione stabilisce che Leibniz aveva appreso il calcolo dalle lettere di Newton e se ne era impadronito pubblicandolo a proprio nome e con le proprie notazioni: Leibniz viene cosı̀ accusato ufficialmente di plagio. Siamo nel 1713 e Leibniz conclude gli ultimi tre anni della sua vita nella disgrazia a causa dell’accusa ufficiale di plagio. È curioso osservare che questa disputa sfiora appena quelli che dovrebbero essere i due veri protagonisti: Newton infatti, da una parte, tace fino a quando i suoi seguaci cominciano ad accusare Leibniz di plagio, mentre Leibniz non mette mai in discussione la priorità a Newton per la teoria delle serie infinite, ma rivendica a sé stesso la scoperta del APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 45 calcolo differenziale, calcolo del quale non trova nessuna traccia negli scritti dell’avversario inglese. Nel momento in cui l’accusa di plagio diventa ufficiale, l’Europa si divide in due: da una parte la comunità inglese prosegue sulla strada delineata da Newton, il calcolo newtoniano consente, come abbiamo visto, di arrivare sempre ad una soluzione, ma purtroppo una soluzione spesso teorica e non ulteriormente caratterizzabile; nel continente invece si fa strada la scuola di Leibniz. Gli inglesi non faranno negli anni successivi sostanziali progressi in analisi, mentre nell’Europa continentale, come esamineremo nella prossima sezione, ci sarà una vera e propria esplosione dell’analisi a partire dai contributi della famiglia Bernoulli. Leibniz viene quindi vendicato e ricompensato: egli ci aveva visto più lontano, e il suo approccio, sebbene incompleto per certi versi rispetto a quello di Newton, dal momento che mancava della teoria delle serie infinite, si rivelerà l’approccio giusto per lo sviluppo dell’analisi matematica fino ai giorni nostri. 5. I fondamenti del calcolo infinitesimale 5.1. La diffusione del calcolo differenziale in Europa. Nell’immediato periodo post-Leibniz nell’Europa continentale si assiste ad una rapida diffusione dei metodi del calcolo differenziale e del calcolo integrale, anche se tra pochi esponenti della comunità matematica. In particolare, i primi matematici che danno un notevole contributo alla teoria sono i fratelli Bernoulli, Jacob (1654-1705) e Johann (1667-1748). In questi anni il calcolo differenziale viene applicato per la risoluzione di moltissimi problemi di origine fisica, problemi inattaccabili con gli strumenti della matematica classica. Nonostante questi matematici di grande valore cercano di diffondere il calcolo in Europa, le resistenze sono tante, e sono dovute soprattutto al fatto che i fondamenti del calcolo stesso sono poco affidabili e imprecisati, rispetto per esempio ai ben noti metodi classici, di solide fondamenta. Per cercare di vincere queste resistenze, i matematici sostenitori del nuovo calcolo si dilettavano a proporre spesso problemi inattaccabili classicamente, allo scopo di mostrare la superiorità del nuovo metodo di calcolo. Va in proposito ricordato il più celebre problema di questo tipo, proposto nel 1696 proprio da uno dei Bernoulli, e precisamente da Johann, sugli Acta Eruditorum. Si tratta del celebre problema della brachistocrona: dati due punti P e Q in un piano verticale, posti ad altezza diversa, si chiede di determinare la curva che connette P e Q e che minimizza il tempo di discesa di un grave che la percorre per il solo effetto della forza di gravità. Il problema della brachistocrona è il problema che ha segnato l’inizio di quel ramo dell’analisi matematica oggi noto come Calcolo delle Variazioni, ovvero dello studio dei problemi di minimo di funzionali di tipo integrale. Tra le soluzioni giunte per questo problema arrivano quelle 46 LUCA LUSSARDI di Leibniz e del fratello Jacob; inoltre arriva anche una soluzione non firmata dall’Inghilterra, ma notoriamente dovuta a Newton: si narra altresı̀ che Newton abbia risolto il problema della brachistocrona in una sola notte di lavoro. Curiosamente, la soluzione a questo problema è una curva già nota a quei tempi: si tratta infatti della cicloide, di cui abbiamo già parlato a proposito della determinazione delle tangenti con metodi riconducibili a considerazioni di tipo cinematico. Ma non è solo la Svizzera, patria dei Bernoulli, o la Germania ad accogliere le nuove idee della matematica. Il nuovo calcolo arriva anche in Francia nel 1691, anno in cui Johann Bernoulli, durante un soggiorno a Parigi, insegna il calcolo infinitesimale al marchese francese Guillame François de l’Hôpital (1661-1704) il quale nel 1696 pubblica, in anonimato, il trattato Analyse des infiniments petits, prima esposizione sistematica del calcolo differenziale. 5.2. Il concetto di funzione. Abbiamo più volte sottolineato il fatto che il moderno concetto di funzione non è presente negli studi di calcolo infinitesimale di Newton e Leibniz, ma ormai siamo arrivati al momento in cui i matematici capiscono che la nozione di funzione può essere risolutiva per approfondire il problema sui fondamenti dell’analisi matematica. Il termine funzione appare per la prima volta nel 1673 in un manoscritto di Leibniz intitolato Methodus tangentium inversa seu de functionibus. Il concetto di funzione tuttavia fa fatica a prendere piede: ricordiamo che fino a questo momento gli oggetti di interesse matematico erano le curve, espresse da relazioni del tipo P (x, y) = 0. Anche i Bernoulli trattano in modo secondario l’idea di funzione, ma sempre più si comprende in questi anni il fatto che la relazione P (x, y) = 0 sta in realtà dicendo, in molte situazioni, che l’ordinata y viene calcolata a partire dall’ascissa x applicando ripetutamente varie operazioni. Ecco che quindi uno dei Bernoulli dà la seguente definizione: Definizione 5.1. (Johann Bernoulli, 1718) Una funzione di una grandezza variabile è una quantità composta in una maniera qualunque da questa grandezza variabile e da costanti. Si fa quindi spazio una prima nozione di funzione completamente operativa: una funzione non è ancora una legge qualunque che associa ad ogni valore di x uno ed un solo valore di y, ma per adesso è solo un modo ben definito per trovare y ogni volta che x è noto. Questa analiticità del concetto di funzione si ritrova nell’Introductio in analysin infinitorum di Eulero (1707-1783), il quale dà la seguente definizione. Definizione 5.2. (Eulero, 1748) Una funzione è un’espressione analitica costruita a partire dalla variabile x mediante una serie di operazioni. APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 47 Si avverte, in particolare, il legame con il concetto di serie infinita di Newton: infatti, l’idea di Eulero è che ogni funzione sia espressa da una serie del tipo axα + bxβ + cxγ + · · · dove le potenze sono di qualunque tipo, anche non intere. La concezione euleriana delle funzioni è ancora lontana dalla definizione moderna, ma c’è anche di più: Eulero chiama infatti continue tutte quelle funzioni che siano descrivibili con un’unica espressione analitica, mentre invece chiama discontinue tutte le altre; per Eulero dunque la funzione f (x) = |x| è discontinua se considerata definita per ogni valore di x nel continuo geometrico dell’asse delle ascisse, in quanto risulta, per definizione, x se x ≥ 0 |x| = −x se x < 0 dalla quale si evince che |x| ha due espressioni analitiche diverse a seconda che x sia positivo o negativo. 5.3. La diffusione del calcolo infinitesimale in Italia. Nonostante l’Italia abbia dato i natali a Cavalieri, la geometria degli indivisibili non viene accettata dai matematici italiani, troppo ancorati alla geometria greca: va da sé dunque il fatto che anche la geometria di Cartesio e il calcolo infinitesimale non trovano nessuno spazio all’interno della matematica italiana del XVII secolo. Leibniz stesso fa alcuni tentativi di esportazione del calcolo differenziale anche nel nostro paese, grazie ad un soggiorno a Roma di sei mesi, ma con scarso successo. Bisogna quindi attendere la generazione successiva a quella dei matematici italiani già attivi al momento della comparsa del calcolo differenziale. Ed infatti, nel 1707 avviene il fatto che segna la comparsa del calcolo differenziale anche in Italia: Jacob Hermann (1678-1733), allievo dei fratelli Bernoulli, prende la cattedra di matematica all’Università di Padova. Da questo momento la città di Padova diviene il riferimento per tutti i matematici italiani che vogliono studiare i nuovi metodi del calcolo infinitesimale. Tuttavia le resistenze sono ancora abbastanza forti, e l’analisi italiana si limita, in questi anni, allo studio dell’integrazione di equazioni differenziali: ricordiamo Guido Grandi (1671-1742), Gabriele Manfredi (1681-1761) e Jacopo Riccati (1676-1754). Nonostante questi pregevoli tentativi, l’analisi italiana resta ad uso di pochi, soprattutto a causa dell’assenza di buoni testi di riferimento. Una prima svolta in questa direzione si ha nel 1748, anno in cui appaiono le Istituzioni analitiche di Maria Gaetana Agnesi (1718-1799), il primo matematico di sesso femminile dell’età moderna. Il punto di forza dell’opera della Agnesi consiste nel fatto che si tratta di un’opera volutamente elementare: essa mira alla preparazione di giovani menti e introduce ai metodi del calcolo 48 LUCA LUSSARDI infinitesimale. L’opera è composta da due volumi: nel primo volume, Dell’analisi delle quantità finite, la Agnesi tratta l’algebra elementare e la geometria cartesiana introducendo allo studio analitico delle curve; il secondo volume invece è diviso a sua volta in tre libri, Del calcolo differenziale, Del calcolo integrale, Del metodo inverso delle tangenti, e, come gli stessi titoli suggeriscono, si tratta di un’esposizione del calcolo infinitesimale. Purtroppo, la matematica italiana arresta il proprio sviluppo in questo periodo nel quale sembra rinascere; dovremo aspettare la metà del secolo successivo per assistere ad un rifiorire della matematica anche in Italia. 5.4. La critica di Berkeley. Come abbiamo già detto, si ha una rottura tra la matematica del continente e quella inglese, rottura dovuta alla disputa scoppiata tra Newton e Leibniz. Mentre in praticamente tutta l’Europa continentale il calcolo leibniziano si diffonde, in Inghilterra si crede ancora che il calcolo delle flussioni, accompagnato dal metodo delle serie infinite, sia in realtà più adatto ad essere sviluppato. Abbiamo avuto modo di osservare che è vero che l’uso combinato di flussioni e serie infinite permette di arrivare sempre ad una soluzione, ma solo, e questo accade in un grandissimo numero di casi significativi, ad una soluzione estremamente teorica: si arriva infatti ad avere sviluppi in serie, per altro locali, che non dicono assolutamente nulla sull’eventuale funzione generatrice. Tuttavia, i matematici inglesi perseverano con i metodi di Newton, e non stupisce che in questi anni ci siano alcune delle scoperte, che ricordiamo ancora oggi, a proposito degli sviluppi in serie di potenze di funzioni, da parte di analisti inglesi, come ad esempio Brook Taylor (1685-1731) e Colin Maclaurin (1698-1746), nomi che ricordiamo ancora oggi a proposito degli sviluppi in serie delle funzioni. I risultati sulle serie di potenze raggiunti dagli inglesi restano però privi di un vero significato, dal momento che non è ancora assolutamente presente la nozione di convergenza di una serie. A peggiorare lo stato dell’analisi matematica inglese si presenta sulla scena la più severa critica ai fondamenti del calcolo infinitesimale, ovvero quella del vescovo irlandese George Berkeley (1685-1753). Nell’anno 1734 infatti Berkeley pubblica un piccolo trattato intitolato The analist, scritto nella forma di dialogo rivolto ad un “matematico infedele”. Il vescovo critica molto duramente i fondamenti del calcolo, sia del calcolo delle flussioni newtoniano sia del calcolo differenziale leibniziano. Ad esempio, per quanto riguarda le flussioni, Berkeley osserva che il fatto di considerare il rapporto f (x + ẋo) − f (x) o quando o 6= 0, rimaneggiarlo in modo opportuno e alla fine porre o = 0, è un procedimento non valido. Berkeley, tuttavia, è conscio del fatto che il calcolo infinitesimale APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 49 risolve molti problemi in modo relativamente facile ma impossibili da trattare usando tecniche classiche, e quindi cerca di dare una spiegazione di questo. Secondo lui, infatti, si tratta di un processo di compensazione degli errori: le varie approssimazioni che si ripetono durante i ragionamenti del calcolo infinitesimale si compensano l’una con l’altra e il risultato finale è quindi corretto; citando lo stesso Berkeley, si arriva se non alla scienza, almeno alla verità. Di questo stesso parere è l’ingegnere francese Nicolas Léonard Sadi Carnot (1796-1832) che è uno dei primi scienziati che cerca di rispondere in modo altrettanto critico alle obiezioni di Berkeley. Le critiche mosse dal vescovo, per inciso perfettamente legittime, danno un’ulteriore scossa negativa alla matematica inglese, che quindi, risentendo di ciò, arresta il suo sviluppo; esiste qualche debole tentativo di porre dei fondamenti rigorosi al calcolo newtoniano, ad esempio Maclaurin nel 1742 pubblica il Treatise of fluxions nel quale riconduce l’intero calcolo delle flussioni a pura geometria, ma accettando come primitiva la nozione di velocità istantanea, per cui non compie alcun passo significativo nella direzione della sistemazione definitiva dei fondamenti del calcolo. 5.5. Lagrange e le derivate. Mentre in Inghilterra lo sviluppo del calcolo infinitesimale e delle applicazioni è sostanzialmente fermo a causa della limitata capacità dei metodi newtoniani da una parte e delle critiche di Berkeley dall’altra, nel restante continente europeo le applicazioni del calcolo differenziale e integrale di Leibniz diventano sempre più numerose e per certi versi spettacolari. Ma pian piano qualcosa comincia ad andare storto e si avverte più che mai la necessità di dare una teoria fondazionale rigorosa al calcolo infinitesimale. Siamo in pieno illuminismo, e quindi anche vari esponenti del mondo culturale, oltre agli addetti ai lavori, si preoccupano di dare una risposta a questi grandi interrogativi. In questi anni appare, per la prima volta, l’idea che la nozione, ancora imprecisata, di limite, possa essere la chiave: infatti, alla voce “limite” nell’Encyclopédie di d’Alambert si legge: La teoria dei limiti è la base della vera metafisica del calcolo differenziale. Nonostante questo fatto sia di per sé corretto, come sappiamo bene oggi, si tratta solo di un’indicazione, e bisogna aspettare Cauchy prima di registrare il passo decisivo. Prima dell’arrivo della definizione di limite però vi è un tentativo pregevole di fondazione del calcolo: il matematico italiano Giuseppe Luigi Lagrange (1736-1813) mangia la foglia ribaltando il punto di vista di Newton e considera come punto di partenza la teoria degli sviluppi in serie di Taylor, pubblicando, nel 1797, l’opera Théorie des fonctions analytiques, che raccoglie il più importante contributo pre-Cauchy. Lagrange, dopo aver mostrato che ogni funzione, localmente, è lo sviluppo della sue serie di Taylor, 50 LUCA LUSSARDI considera appunto lo sviluppo locale di f attorno a x0 , che scrive come f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · Chiama dunque derivata prima di f in x0 , e la denota con f 0 (x0 ), il coefficiente di (x − x0 ), ovvero a1 ; chiama poi derivata seconda di f in x0 , e la denota con f 00 (x0 ), il coefficiente di (x − x0 )2 , ovvero a2 , e cosı̀ via; infine, chiama f anche funzione primitiva, rispetto allo sviluppo in serie di potenze dato. Osserva quindi che se h è piccolo allora f (x0 + h) − f (x0 ) a0 + a1 h + a2 h2 + · · · − a0 = = a1 + a2 h + · · · h h da cui f 0 (x0 ) = a1 è proprio ciò che si attribuisce al rapporto f (x0 + h) − f (x0 ) h quando h = 0. Cosı̀ facendo, Lagrange recupera quindi il calcolo dei rapporti tra i differenziali di Leibniz, che appunto chiama calcolo delle derivate. Il problema dei fondamenti è però solo apparentemente risolto, dal momento che, seguendo l’approccio di Lagrange, tutto si sposta sulla dimostrazione del fatto che ogni funzione si sviluppa localmente in serie di potenze. 5.6. La definizione di limite. La definizione rigorosa di limite, nel caso delle successioni, appare per la prima volta nel 1659 nell’opera Geometria speciosa di Pietro Mengoli (1626-1686), quindi addirittura prima delle prime opere di Newton e Leibniz. Tuttavia, le idee di Mengoli non hanno avuto risonanza, poiché all’epoca il concetto di successione sembrava molto lontano da quello di funzione, molto più di quanto non sembri a noi, abituati al linguaggio unificante della teoria degli insiemi. Nel 1817 il matematico cecoslovacco Bernard Bolzano (1781-1848) pubblica la dimostrazione corretta del teorema degli zeri e per far questo si serve di varie nozioni che introduce in modo rigoroso, come la nozione di continuità delle funzioni e di convergenza di serie e successioni. Tuttavia, i suoi risultati per vari motivi restano per lo più sconosciuti, e negli stessi anni in Francia invece l’ingegnere civile Augustin Louis Cauchy (1789-1857) pubblica le note del suo Cours d’analyse tenuto all’École Polytechnique. In questo corso, Cauchy pone a fondamento del calcolo infinitesimale la nozione di limite e da questo concetto deduce la nozione di convergenza di successioni e di serie e di derivata come limite del rapporto incrementale. L’idea viene infatti dalla necessità di rendere rigoroso il concetto di derivata come limite del rapporto incrementale: dire quindi che la quantità f (x0 + h) − f (x0 ) −m h APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 51 deve essere infinitesima per ogni h infinitesimo e non nullo viene rimpiazzata con un gioco di quantificatori, ovvero f (x0 + h) − f (x0 ) ∀ε > 0 ∃δ > 0 tale che ogni volta che 0 < |h| < δ si ha − m < ε h Ecco quindi che da queste intuizioni si può estrarre la definizione di limite. Cauchy dice che: “Allorché i valori successivamente assunti da una stessa variabile si avvicinano indefinitamente a un valore fissato, in modo da finire per differirne di poco quanto si vorrà, quest’ultimo è chiamato limite di tutti gli altri.” Cauchy aggiunge dunque che per verificare che il limite di una funzione f per x che tende a x0 vale ` bisogna prendere un numero ε > 0 e da esso si deve sempre trovare un numero δ > 0 tale che per ogni x con 0 < |x − x0 | < δ risulti |f (x) − `| < ε. Si scrive, grazie all’unicità del limite, che vale sotto opportune ipotesi su x0 , ` = lim f (x). x→x0 La definizione di limite è vicina anche a quella di continuità data sempre dallo stesso Cauchy: per verificare che una funzione f è continua in x0 bisogna prendere un numero ε > 0 e da esso si deve sempre trovare un numero δ > 0 tale che per ogni x con |x − x0 | < δ risulti |f (x) − f (x0 )| < ε. Viene ripreso infine il problema della derivata di Lagrange ponendo, per una data funzione f , f (x0 + h) − f (x0 ) . h→0 h f 0 (x0 ) = lim Con l’approccio fondazionale di Cauchy le grandezze infinitesime fanno la loro definitiva scomparsa dal calcolo infinitesimale classico e la teoria dei limiti è ancora oggi alla base dell’insegnamento dell’analisi. 5.7. L’integrazione. Se il problema dei fondamenti del calcolo poteva dirsi risolto dalla teoria dei limiti di Cauchy, e con esso anche il calcolo differenziale, ovvero il calcolo delle derivate, per il calcolo integrale c’erano ancora parecchie considerazioni da fare. Sempre Cauchy infatti decide di definire l’integrale che noi oggi chiamiamo definito come l’area sottesa dal grafico della funzione, e quindi di dimostrare poi la relazione fondamentale tra integrazione e derivazione. L’idea di Cauchy, per integrare una funzione f continua nell’intervallo [a, b] è quella di suddividere l’intervallo dato in intervalli [a, x1 ], [x1 , x2 ], ... [xh , b]. Si calcola quindi la somma S = (x1 − a)f (x0 ) + (x2 − x1 )f (x1 ) + · · · + (b − xh )f (xh ) 52 LUCA LUSSARDI che rappresenta la somma delle aree dei rettangoli di basi xi+1 − xi e altezza rispettiva f (xi ). Cauchy dimostra dunque l’esistenza di una quantità limite che le somme S raggiungono quando la partizione dell’intervallo [a, b] si infittisce sempre di più, e inoltre dimostra che tale quantità dipende unicamente dalla forma della funzione f e non dalla scelta delle partizioni: è da sottolineare il fatto che Cauchy usa pesantemente la continuità di f . Diversamente rispetto alla teoria dei limiti e delle derivate, sull’integrazione delle funzioni la teoria Cauchy non appare del tutto soddisfacente. Infatti, ad esempio la mancanza di una teoria rigorosa dei numeri reali fa sı̀ che Cauchy non possa dimostrare in modo rigoroso l’esistenza dell’integrale come limite. Inoltre, la contuinuità della funzione integranda non sembrerebbe strettamente necessaria, soprattutto in vista di una delle applicazioni più concrete del calcolo integrale a quel tempo, ovvero la teoria delle serie trigonometriche, o serie di Fourier: la necessità di poter sviluppare in serie trigonometrica funzioni sempre più generali portava alla necessità di poter integrare funzioni sempre più generali e meno regolari. Nel 1829 il matematico tedesco Lejeune Dirichlet (1805-1859) studia l’integrabilità delle funzioni discontinue e arriva, tra le altre cose, a fornire un esempio di funzione discontinua in ogni punto che secondo lui non poteva in nessun modo essere integrata, funzione che ancora oggi porta il suo nome: la funzione di Dirichlet è data da f (x) := 1 se x è razionale 0 se x è irrazionale. Al di là delle questioni di integrabilità, il puro fatto di considerare una funzione come quella di Dirichlet dà prova dell’ormai piena maturazione del concetto di funzione: da questo momento in avanti una funzione viene concepita unicamente come una qualunque applicazione tra insiemi. La necessità di liberarsi dalle discontinuità nella teoria dell’integrazione è alla base degli studi del matematico tedesco Bernhard Riemann (1826-1866). Egli ribalta il punto di vista di Cauchy. Infatti, prima di tutto introduce una generalizzazione delle somme di Cauchy prendendo in ogni intervallo il valore della funzione in un punto qualunque dell’intervallo e non necessariamente negli estremi; successivamente, e qui sta la vera innovazione rispetto a Cauchy, usa l’esistenza di un limite delle somme cosı̀ ridefinite, come definizione di integrale, che è la nozione di integrabilità che usiamo ancora oggi, ed ecco perché lo chiamiamo integrale di Riemann. L’integrazione alla Riemann si adatta bene anche a molte funzioni discontinue, ad esempio se il numero di discontinuità è finito o al più numerabile. La funzione di Dirichlet resta non integrabile anche secondo Riemann: infatti l’estremo superiore delle somme per difetto vale 0, mentre l’estremo inferiore delle somme per eccesso vale 1; per aggiustare il tiro in APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 53 questa direzione sarà necessaria un’ulteriore generalizzazione del concetto di integrale, che avverrà solo ai primi del Novecento per opera di Henri Lebesgue (1875-1941). 5.8. I numeri reali: l’aritmetizzazione dell’analisi. La teoria dei limiti di Cauchy messa a fondamento dell’analisi per funzionare correttamente richiede una definizione precisa di numero reale: infatti, ad esempio, la nozione stessa di funzione continua fonda la sua essenza sulla continuità dei numeri reali, o ancora l’integrabilità alla Riemann richiede delicate proprietà dei numeri reali. Per completare il programma manca quindi una teoria rigorosa dei numeri reali. Osserviamo che il concetto di numero reale è presente praticamente da sempre, anche i greci sapevano che i numeri reali sono in corrispondenza al continuo geometrico della retta, e dunque le proprietà dei reali, compresa la completezza, vengono da sempre utilizzate anche se non vi è una teoria rigorosa sotto. Il matematico che più tra tutti sente l’esigenza di più rigore è il tedesco Karl Weierestrass (1815-1897), ma prima che possa rendere note le sue ricerche in questa direzione, altri matematici pubblicano valide teorie dei numeri reali; vediamo di analizzare i due più importanti tentativi, quello di Cantor e quello di Dedekind. Nel 1872 il tedesco Georg Cantor (1845-1918) espone, nel lavoro Über die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Reihen apparso su Mathematische Annalen, una teoria dei numeri reali che è fondata sull’uso delle cosiddette successioni di Cauchy, e che oggi costituisce una procedura che chiameremmo completamento dei razionali. L’idea di Cantor è un ribaltamento del punto di vista di Cauchy. Infatti, nella teoria delle successioni convergenti, Cauchy dice che se una successione di numeri xh è tale per cui per ogni scelta di ε > 0 esiste un indice ν tale che per ogni h, k > ν si ha |xh − xk | < ε allora la successione sta convergendo ad un limite, che è ancora un numero. Questo fatto, che è la completezza dei reali, non è dimostrato, e non può essere dimostrato se non si pone una definizione rigorosa di numero reale. Cantor decide di prendere questa proprietà di completezza come definizione di numero reale: i numeri reali sono dunque i limiti delle successioni di Cauchy. Formalmente quindi Cantor propone di chiamare numero reale una successione di Cauchy, ma c’è una piccola complicazione però, che non gli sfugge: infatti, diverse successioni di Cauchy possono dare origine allo stesso numero reale, basti pensare a tutte le successioni convergenti a 0, che identificano il solo reale 0. Per questo motivo, Cantor identifica tra loro due successioni di Cauchy se la loro differenza è una successione che converge a 0. Con questa operazione di quoziente si ha un buon modello per i numeri reali, e si possono dimostrare tutte le proprietà che oggi conosciamo per l’insieme R. La stessa costruzione basata sul completamento dei razionali viene proposta nello stesso anno dal francese Charles Meray (1835-1911) e anche dal tedesco 54 LUCA LUSSARDI Eduard Heine (1821-1881). Lo svantaggio principale di questo approccio è che prima di definire i numeri reali uno ha già bisogno della teoria dei limiti e delle successioni, oltre ovviamente all’insieme dei numeri razionali. Ben diverso è invece l’approccio del tedesco Richard Dedekind (1831-1916), il quale, sempre nel 1872, pubblica il lavoro Stetigkeit und irrationale Zahlen, sempre a proposito di una teoria dei reali. L’idea di Dedekind è quella di costruire i reali sfruttando alcune proprietà dei razionali. Ad esempio i razionali soddisfano alla proprietà di sezione: se a è razionale, tutti gli altri razionali si ripartiscono in due classi, l’una fatta da tutti i razionali minori di a e l’altra fatta dai razionali maggiori di a. Dedekind ha ovviamente in mente il modello del continuo geometrico, e osserva, a proposito della proprietà di sezione dei razionali, il seguente fatto vero per la retta: se uno considera due classi di punti sulla retta, A e B, tali che esse formano una partizione della retta e tali per cui ogni punto di A precede ogni punto di B (A e B sono dette in tal caso contigue), allora esiste uno ed un solo punto che sta tra le due classi A e B. Dedekind prende questa proprietà come definizione di numero reale: un numero reale diventerà l’elemento di separazione tra due classi contigue di razionali. Ad √ esempio, il numero irrazionale 2 può essere pensato come elemento di separazione tra le classi contigue A := {x razionale : x2 < 2}, B := {x razionale : x2 > 2}. Tecnicamente, quindi, un numero reale per Dedekind è una sezione dei razionali, ovvero è una coppia di classi contigue (A, B) di razionali. Questo approccio non necessita di nessuna nozione di analisi o di teoria dei limiti, ma necessita delle proprietà dell’insieme dei numeri razionali e di proprietà generali di teoria degli insiemi, ed è la costruzione dei reali che viene tutt’ora utilizzata più frequentemente nell’insegnamento dell’analisi. Per completare il quadro dunque basta essere in grado di proporre una costruzione dei razionali, ed è molto semplice costruire l’insieme dei numeri razionali all’interno della teoria degli insiemi a partire dai numeri naturali; l’ultimo scoglio è quindi la costruzione dei naturali. Ci sono vari tentativi di costruzione dei numeri naturali. Gottlob Frege (1848-1925), nel 1884, presenta una teoria insiemistica basata sul concetto di equipotenza: due insiemi sono equipotenti se possono essere messi in corrispondenza uno a uno tra di loro; il numero di un insieme è quindi l’insieme che ha come elementi tutti gli insiemi equipotenti ad esso. La definizione di Frege è più profonda di quanto sembri in quanto include, in un colpo solo, anche la nozione di numero cardinale transfinito, ovvero la nozione di numero associato ad un insieme infinito, ma non entriamo nel dettaglio di questo. Anche lo stesso Dedekind, nel 1888, presenta una teoria dei naturali, sempre APPUNTI DI STORIA DEL CALCOLO INFINITESIMALE 55 fondata, come quella di Frege, sulla teoria degli insiemi. Ricordiamo invece più nel dettaglio la definizione assiomatica di numero naturale proposta dal matematico italiano Giuseppe Peano (1858-1932), che appare la più semplice e che non necessita della teoria degli insiemi. Peano dice che: 1) 0 è un numero; 2) il successore di un numero è ancora un numero; 3) 0 non è successore di nessun numero; 4) se due numeri hanno lo stesso successore allora sono uguali; 5) se un insieme A di numeri contiene 0 e il successore di ogni suo elemento allora A è l’insieme di tutti i numeri. Le prime quattro proprietà sono molto intuitive. L’ultima proprietà è altrettanto intuitiva e formalizza, in un certo senso, la nozione primitiva del contare; inoltre, essa sta alla base del principio di induzione, tecnica dimostrativa di enorme utilità in matematica. Più in basso di cosı̀ non possiamo andare, abbiamo toccato le fondamenta della matematica; a questo punto possiamo solo chiederci: quanto queste fondamenta sono solide? Purtroppo dobbiamo rassegnarci al fatto che non possiamo garantire la solidità delle fondamenta della matematica: questo fatto può essere formalizzato e dimostrato, ed è stato fatto nel 1931 da un giovane matematico austriaco di nome Kurt Gödel (1906-1978), ma questa è un’altra storia. Riferimenti bibliografici [1] Carl B. Boyer, Storia della matematica, Mondadori, Milano, 1990. [2] H. J. M. Bos, Differentials, higher-order differentials and the derivative in the Leibnizian calculus, Archive for history of exact sciences 14 (1974) 1-90. [3] Elementi di Euclide, a cura di A. Frajese e L. Maccioni, UTET, Torino, 1970. [4] E. Giusti, Piccola storia del calcolo infinitesimale dall’antichità al novecento, Ist. Editoriali e Poligrafici Pisa-Roma, 2007. [5] M. Kline, Storia del pensiero matematico I e II, Einaudi Editore,Torino, 1999. [6] I. Newton, The method of fluxions and infinite series: with its application to the geometry of curvelines, printed by Henry Woodfall, London, 1736.