SVILUPPO STORICO DEL CALCOLO INFINITESIMALE. Gian Luigi Forti – Milano 2011 1 Introduzione. I primi risultati di quello che in termini moderni è l’integrazione, risalgono ad Archimede (287–212 a.C.). Vediamo con linguaggio moderno uno dei risultati che più hanno influenzato la matematica: la cubatura del segmento di paraboloide rotondo. √ √ Prendiamo la parabola z = x2 , x ∈ [− a, a]. Dividiamo AD = a in n parti uguali di lunghezza h = na . Calcoliamo i volumi dei cilindri ottenuti ruotando i rettangoli inscritti e circoscritti al paraboloide. Essi sono rispettivamente: 0, πh2 , 2πh2 , · · · , (n − 1)πh2 ; πh2 , 2πh2 , · · · , nπh2 ; e quindi le due somme sono sn = πh2 [1 + 2 + · · · + (n − 1)] = πh2 n−1 2 n(n − 1) =π a , 2 2n Sn = π n+1 2 a . 2n A questo punto Archimede afferma che il volume V cercato è π2 a2 e lo prova mediante il ”metodo di esaustione”, che potremmo brevemente definire la forma 1 greca del moderno calcolo dei limiti. Questo metodo si basa sul seguente principio enunciato negli Elementi, X.1, nella seguente forma: Date due differenti grandezze, se togliamo dalla maggiore una grandezza superiore alla sua metà, da ciò che rimane togliamo una grandezza superiore alla sua metà, e se ripetiamo continuamente questo processo, giungeremo ad una grandezza minore della più piccola delle due grandezze date. Questo non è altro che il ben noto Assioma di Archimede. Tale metodo è normalmente applicato in dimostrazioni per assurdo. Vediamo come nel caso che stiamo trattando. Sia, per esempio, V < π2 a2 , poiché Sn − s n = π 2 a , n scegliamo n in modo che sia Sn − s n < π 2 a −V 2 (qui viene usato l’Assioma di Archimede), cioè V − sn < π 2 a − Sn . 2 π 2 2 Ma ciò è assurdo in quanto V − sn > 0, mentre Sn = π n+1 2n a > 2 a . Con queste tecniche Archimede calcola il volume di vari solidi. Va notato che egli applica il metodo di esaustione caso per caso, senza darne una giustificazione una volta per tutte. Inoltre tale metodo non porta alla scoperta, ma permette di dimostrare un risultato già noto o comunque intuito. Infine il calcolo di somme del tipo a a 2a f +f + · · · + f (a) n n n poteva riuscire ad Archimede solo per funzioni elementari: egli lo usa per x, x2 , sin x. Uno dei piú interessanti lavori di Archimede è un breve trattato noto come Il Metodo. Questo venne scoperto da Heiberg nel 1906 a Costantinopoli: esaminando un palinsesto proveniente dal Monastero del S. Sepolcro di Gerusalemme, scoprı́ sotto una scrittura del XIII–XIV secolo, una scrittura piú antica, del X secolo, contenente scritti di Archimede. Uno di essi, il piú interessante, è Ad Eratostene: Metodo sui teoremi meccanici. Il suo metodo di carattere essenzialmente fisico fa uso dei teoremi sui centri di gravità da lui stesso dimostrati in altri lavori e spiega il suo intento nell’introduzione. Ma siccome ti riconosco, come già ho fatto, studioso e maestro eccellente di filosofia, e sai apprezzare, quando è il caso, le ricerche matematiche, ho creduto bene esporti e dichiararti in questo stesso libro le particolarità di un metodo, mediante il quale ti sarà possibile 2 acquistare una certa facilità di trattare cose matematiche per mezzo di considerazioni meccaniche. Sono persuaso, del resto, che questo metodo sarà non meno utile anche per la dimostrazione degli stessi teoremi. Infatti, anche a me alcune cose si manifestarono prima per via meccanica, e poi le dimostrai geometricamente; perché la ricerca fatta con questo metodo non fornisce una vera dimostrazione. Però è certamente piú facile, dopo avere con tal metodo acquistato una certa cognizione delle questioni, trovarne la dimostrazione, anziché cercarla senza averne alcuna cognizione preliminare...In questa occasione ho deciso di esporre per iscritto il metodo, sia perché l’avevo già preannunziato e non vorrei che si dicesse aver io fatto una promessa vana, sia perché sono persuaso che non poca utilità esso arrecherà alla matematica; penso infatti che alcuni dei contemporanei o dei futuri, mediante questo metodo, possano trovare anche altri teoremi, che a me non sono ancora venuti in mente ([R]). Il ”metodo meccanico” di Archimede si basa sulla legge della leva, secondo la quale un numero finito di masse m1 , m2 , · · · , mp a distanze rispettive d1 , d2 , . . . , dp dal fulcro, da uno stesso lato della leva, bilanciano un altro sistema di masse m′1 , m′2 , · · · , m′q dall’altro lato a distanze d′1 , d′2 , . . . , d′q se p X mi di = i=1 q X m′j d′j . j=1 Nella sua forma piú semplice, il metodo meccanico può essere cosı́ descritto. Siano R ed S due regioni giacenti lungo lo stesso intervallo di un asse orizzontale L. Data l’area a(S) e il centroide (o baricentro) cS di S, ricerchiamo l’area a(R) di R. Pensiamo le due regioni come lamine piane di densità unitaria, ciascuna consistente di un numero indefinitamente grande di elementi – segmenti di retta 3 o strisce di larghessa infinitesimale – perpendicolari ad L, e pensiamo ad L come una leva con fulcreo in O. Supponiamo che ci sia una costante k tale che, per ogni linea verticale a distanza x da O intersecante le regioni R ed S in segmenti di lunghezza ℓ e ℓ′ rispettivamente, si abbia k · ℓ = x · ℓ′ . Allora la legge della leva implica che il segmento ℓ posto nel punto P a distanza k da O, bilancia il segmento ℓ′ nella posizione ove si trova. Sembra allora potersi dedurre che se la regione R è posta col suo centroide in P , allora bilancerà la regione S dove essa si trova, cosı́ a(R) · k = a(S) · xS , dove xS è la distanza da O del centroide cS di S. Poiché k, a(S) e xS sono noti, ricaviamo a(R). Nel secolo XVI appaiono delle traduzioni in latino di Archimede, fra le quali quella di Niccolò Tartaglia, soprannome di Niccolò Fontana (Brescia, 1499 circa Venezia, 13 dicembre 1557), stampata a Venezia tar il 1542 e il 1565, una di Federico Commandino (Urbino, 1509–5 settembre 1575) del 1558 e una di Francesco Maurolico (16 settembre 1494-21 o 22 luglio 1575). Commandino non si limita ad una traduzione, ma prosegue le ricerche di Archimede trovando i baricentri di vari solidi. Luca Valerio (Napoli 1552–1618) con il suo De centro gravitatis solidorum pubblicato a Roma nel 1604, cerca di introdurre nella geometria le idee dell’algebra e, forse per la prima volta nella geometria, introduce il concetto di curva arbitraria, con la sola restrizione che sia ascendente o discendente, sia cioè, come diremmo oggi, immagine di una funzione y = f (x) crescente (O decrescente) in un intervallo; imitando Archimede, vuole misurare l’area della superficie compresa fra la curva, l’asse delle ascisse e due ordinate estreme. Con il metodo di esaustione arriva quindi a definire il nostro l’integrale delle funzioni monotone. Nel XVII secolo si iniziano a cercare dei metodi piú rapidi e facili, anche se meno solidamente fondati rispetto a quelli di Archimede, per risolvere i problemi posti dalla teoria e dalle applicazioni. 4 Il primo ad abbandonare i metodi archimedei per la determinazione di aree e volumi è Johannis Kepler (1571–1630). Nel suo Nova stereometria doliorum vinariorum (Linz, 1615) calcola il volume di 92 solidi di rotazione. Il procedimente è di tipo ”infinitesimale”: per esempio, divide il toro in fette sottilissime mediante piani per l’asse, ciascuna fetta è assimilabile ad un cilindro retto avente per base un cerchio meridiano e per altezza la distanza fra i centri dei cerchi limitanti la fetta. Quindi il toro è equivalente ad un cilindro avente per base il cerchio meridiano e altezza uguale alla circonferenza descritta dal centro di detto cerchio. Al termine del libro si trova una frase di grande interesse per lo sviluppo del calcolo differenziale: Ispirati dal buon genio, che certamente era geometra, i costruttori di botti han dato ad esse precisamente la forma che assicura la massima capacità in corrispondenza del diametro misurato. E poiché, nell’intorno di un massimo, le variazioni sono insensibili, i piccoli scarti accidentali non esercitano influenza apprezzabile sulla capacità, la cui misura sbrigativa è di conseguenza sufficientemente esatta. A Cavalieri spetta il merito di aver indicato un procedimento organico per determinare o paragonare aree e volumi. Bonaventura Cavalieri (Milano 1598– Bologna 1647) fece i primi studi a Milano, ed entrò nella congregazione religiosa dei Gesuati. Mandato dai superiori, alla fine del 1615 o nel 1616, a perfezionarsi a Pisa, ivi conobbe Benedetto Castelli, a quel tempo lettore di Matematica all’Università, che, avendo riconosciuto la grande abilità del Cavalieri, lo mise in relazione con Galileo Galilei. Dopo il soggiorno pisano, Cavalieri andò a Firenze, dove rimase piú di un anno. Tornato a Pisa, sostituı́ Castelli come lettore. Studiò Euclide, Archimede, Apollonio e Tolomeo. Dopo un infruttuoso tentativo di ottenere una cattedra a Bologna, Cavalieri, nel 1620, tornò a Milano e iniziò una fitta corrispondenza con Galileo. Dopo soggiorni a Roma e Parma, divenne infine il Matematico primario e Astronomo dell’ Università di Bologna, qui dimorò dal 1629 al 1647, anno della sua morte. La sua opera Geometria indivisibilibus continuorum del 1635 e la piú tarda Exercitationes geometricæsex (1647), trattano del metodo degli indivisibili. Tale metodo è molto simile a quello di Archimede descritto nel citato libro Il Metodo, che comunque non era conosciuto nel XVI secolo. L’idea è di pensare un’area come costituita dalle infinite corde intercettate entro di essa da un sistema di rette parallele: questi sono gli indivisibili. Egli stabilisce il seguente principio: Se due aree piane tagliate da un sistema di rette parallele, intercettano sopra ognuna di queste due corde uguali, le due aree sono uguali; se le corde corrispondenti hanno un rapporto costante, lo stesso rapporto passa fra le aree. In termini moderni, fissati a e b e quattro funzioni continue f1 , f2 , φ1 , φ2 : [a, b] → R, da f2 (x) − f1 (x) = φ2 (x) − φ1 (x) 5 segue Z a b [f2 (x) − f1 (x)] dx = Z a b [φ2 (x) − φ1 (x)] dx. Dopo le critiche di Guldino, Cavalieri tenta, senza successo, di dare una rigorosa giustificazione del suo metodo, che in realtà è già la definizione di integrale definito. Comunque, usando il metodo degli indivisibili, Cavalieri riesce a calcolare Z a xn dx. 0 Pascal, nelle Lettres de M. Dettonville à M. de Carcavi (1658–1659) si fa sostenitore del metodo degli indivisibili, senza mai nominare il Cavalieri. Questo scritto contiene la piú chiara esposizione di tale metodo e la sua difesa: Tutto ciò che si dimostra mediante gli indivisibili si può anche dimostrare col rigore e il metodo degli antichi: i due metodi non differiscone che per modo di parlare, ciò che non può ferire le persone ragionevoli una volta avvertite.... A coloro che pensano sia peccare contro la geometria pensare un’area piana come un numero infinito di linee dico che non s’intende altro che di un numero indefinito di rettangoli la cui somma è una superficie la cui area differisce da quella della superficie data per una qunatità piccola quanto si vuole. Anche Pierre de Fermat (Tolosa, 1601–1665) e Roberval (Giles Personnier, 1602–1675) avevano ottenuto la formula Z a an+1 xn dx = , n ∈ N. n+1 0 Pochi anni dopo (1644) Fermat determina il precedente integrale anche per n frazionario. Il procedimento, reso pubblico nel 1657, è il seguente. L’intervallo [0, a] viene diviso mediante punti in progressione geometrica: sia r < 1 e siano a, ar, ar2 , · · · i punti di suddivisione; gli intervalli hanno allora lunghezze a(1 − r), ar(1 − r), ar2 (1 − r), · · · e la funzione y = xn , n = pq , assume nei punti di suddivisione i valori an , an rn , an r2n , · · · . La somma delle aree dei rettangolini è (1 − r)an+1 [1 + rn+1 + r2(n+1) + · · · ] = 6 1 − r n+1 a . 1 − rn+1 Dobbiamo ora fare il limite per r → 1. Poniamo r = sq , allora 1 − r n+1 1 − sq n+1 (1 − s)(1 + s + · · · + sq−1 ) n+1 a = a = a 1 − rn+1 1 − sp+q (1 − s)(1 + s + · · · + sp+q−1 ) e quindi il limite è q n+1 , p+q a Z a cioè xp/q dx = 0 q a(p+q)/q . p+q Con lo stesso metodo prova la formula per n < 0. Ma questo risultato è già stato trovato da Evangelista Torricelli (Faenza, 1608–1647), discepolo di Galileo. Torricelli scopre che insiemi illimitati possono avere area finita, cioè che Z +∞ dx 1 = . x2 a a Questo risultato viene ottenuto usando il metodo degli indivisibili, mentre con metodi piú classici e archimedei calcola Z b dx , n > 1. n x a Ottiene quindi i primi risultati sugli integrali impropri. La cicloide ( x = r(ϕ − sin ϕ) y = r(1 − cos ϕ) aveva attirato l’attenzione di Galileo che propose al Torricelli il problema della sua quadratura, in realtà già risolto, fra il 1634 e il 1635, da Roberval, Descartes e Fermat. Anche Pascal si dedica alla cicloide e ad altre curve e dimostra dei teoremi che costituiscono i primi esempi di integrazione per parti e per sostituzione. Egli riesce a calcolare integrali del tipo Z Z Z p r r r sin x dx, x sin x dx, a2 − x2 dx, 7 ma coi procedimenti usati non avrebbe potuto andare molto lontano. Contemporaneo a Fermat e Pascal è l’inglese John Wallis (1616–1703) che, professore a Oxford, pubblica nel 1655 la Arithmetica infinitorum, dedicata al calcolo di integrali col metodo degli indivisibili. Il risultato piú notevole è la formula π 2 · 2 · 4 · 4 · · · (2n)(2n) · · · = 2 1 · 3 · 3 · 5 · 5 · · · (2n + 1)(2n + 1) · · · Vediamo come Wallis giunge a questo risultato mediante un metodo di interpolazione che ispirerà i futuri lavori di Newton. Lo scopo era di calcolare l’area di un quadrante del cerchio unitario, il cui reciproco viene indicato con il simbolo . Egli sapeva che Z 1 p , xq/p dx = p + q 0 se p e q sono interi positivi e grazie a questa formula può calcolare Z 1 0 (1 − x1/p )q dx, se p e q sono interi positivi. Lo scopo di Wallis era di scoprire una formula generale per il precedente integrale in termini di p e q e quindi sostituire p = q = 1/2 in questa formula per ottenere 1 = Z 0 1 (1 − x2 )1/q dx. Egli preferı́ lavorare col reciproco dell’integrale, cioè con f (p, q) = R 1 0 1 (1 − x1/p )q dx . Iniziò calcolando i valori di f (p, q) per p, q ≤ 10, ottenendo la seguente tabella: Una semplice osservazione alla tabella gli permise di concludere che per ogni p e q interi si trattasse di una tavola di coefficienti binomiali, cioè ogni elemento 8 della tabella è la somma di quello immediatamente sopra e di quello alla sua sinistra. Da una ispezione alle righe della tabella egli dedusse che f (2, q) = 1 (q + 1)(q + 2), 2 f (3, q) = 1 (q + 1)(q + 2)(q + 3), 6 e, in generale, f (p, q) = 1 p+q (q + 1)(q + 2) · · · (q + p) = f (p, q − 1). p! p Ora Wallis inizia il processo di interpolazione, inserendo righe e colonne corrispondenti a valori di p e q della forma ”un intero piú 1/2”. Prima di tutto inserisce tali valori per q nella formula precedente; cos’ı ottiene, per esempio, f (2, 1/2) = 1 15 1 1 +1 +2 = . 2 2 2 8 Per la simmetria diagonale della tabella, poú inserire anche i valori per i ”mezzo interi” di p e gli interi q. Il risultato è la tavola seguente, dove sono in grassetto i nuovi valori inseriti. È indicato anche il valore ignoto f (1/2, 1/2) = . Per semplificare le notazioni, scriveremo m = 2p, n = 2q, bm,n = f (m/2, n/2). Ora rimane il passo cruciale di ”riempimento dei vuoti” nell’ultima tabella. Se m e n sono interi pari, allora bm,n = f (m/2, n/2) = m/2 + n/2 m+n f (m/2, (n/2) − 1) = bm,n−2 . m/2 m Ma Wallis notò che la stessa proprietà valeva per i nuovi termini inseriti nella tabella, cioè quando uno fra m e n era dispari. Per esempio, da b4,1 = 15 8 , otteniamo 7 15 35 b4,3 = × = . 3 8 8 Allora egli usò questa proprietà per completare riga e colonna relative a m = 1 e n = 1 in termini di , ottenendo, per esempio, b1,3 = 4 4 b1,1 = . 3 3 9 Dopo di che completò la tavola usando il ”fatto” che questa per analogia doveva seguire la regola di formazione dei coefficienti binomiali (o del triangolo di Tartaglia–Pascal): bm,n = bm,n−2 + bm−2,n . La riga corrispondente a m = 1 della nuova tavola è allora Resta da calcolare b1,1 = . Dalla formula trovata in precedenza, ponendo m = 1 abbiamo b1,n = n+1 b1,n−2 , n da cui otteniamo facilmente per induzione che b1,n = 1 × 3 4 n+1 × × ··· × , 2 5 n per n pari, mentre per n dispari si ha b1,n = 2 4 n+1 × × × ···× . 2 1 3 n Essendo chiaro da b1,n = R 1 0 1 (1 − x2 )n/2 dx che la successione {b1,n } è crescente, inserendo quand=to calcolato nelle disuguaglianze b1,2n−1 < b1,2n < b1,2n+1 otteniamo n n n+1 Y Y 2k 2k + 1 Y 2k < < , 2 2k − 1 2k 2 2k − 1 k=1 k=1 k=1 o, equivalentemente, n Y k=1 Poiché 2 = n hY i 2n + 2 (2k)2 2 (2k)2 < < . (2k − 1)(2k + 1) (2k − 1)(2k + 1) 2n + 1 π 2 k=1 e (2n + 2)/(2n + 1) → 1 per n → +∞, ne segue n Y π (2k)2 2 2 4 4 = lim = · · · ··· n→+∞ 2 (2k − 1)(2k + 1) 1 3 3 5 k=1 10 Pagina della Arithmetica infinitorum Oggi possiamo ottenere facilmente la formula di Wallis per esempio mediante R1 il calcolo di 0 (x − x2 )n dx. Comunque ogni nuovo problema di quadratura esigeva la scoperta di un nuovo artificio per determinare il limite di una somma di infiniti termini. Questo scoglio sarebbe stato superato una volta provato che l’integrazione è l’inversa di una nuova operazione, la derivazione, di carattere piú elementare. Alle origini della derivata stanno i problemi delle tangenti, dei massimi e minimi e la velocità di un moto. Un metodo generale per condurre le tangenti richiede una definizione generale di curva ed una tale definizione proviene dalla geometria analitica che assume un aspetto organico solo nel 1637. Tale problema è particolarmente studiato da René Descartes (Cartesio) (1596– 11 1650) e da Fermat, i fondatori della geometria analitica. Nella Géométrie Cartesio si pone il problema di condurre la normale ad una curva ”geometrica”, cioè alegbrica. Il procedimento di Cartesio è algebrico piú che infinitesimale, e consiste nello intersecare la curva con una circonferenza per C e imporre che ci siano due radici coincidenti. È molto complicato e ovviamente non applicabile alle curve ”meccaniche” o ”trascendenti”. Egli comprese l’importanza del problema della costruzione delle tangenti ad una curva, affermando che questo è il problema piú utile e generale che io conosca ma anche quello che ho sempre desiderato conoscere nella geometria. Come si può facilmente immaginare l’applicazione diretta del metodo di Cartesio, intersezione di una curva algebrica con un cerchio, può portare a calcoli algebrici molto lunghi e noiosi, dovendosi imporre che una equazione della forma F (x) := [f (x)]2 + (v − x)2 − r2 = 0, abbia una radice doppia, dove f (x) è un polinomio, (v, 0) è il centro del cerchio (da determinare) ed r il suo raggio. Un algoritmo formale per la costruzione delle tangenti fu scoperto negli anni ’50 del XVII secolo da due matematici olandesi, Johann Hudde e René François de Sluse (Slusio). La regola di Hudde è una procedura per determinare le radici doppie richieste dal metodo del cerchio. Dato un polinomio F (x) = n X ai xi , i=0 si costruisce un secondo polinomio F ∗ (x) nel modo seguente. I termini di F (x) ordinati per potenze crescenti, sono moltiplicati ordinatamente per i termini di una progressione aritmetica arbitraria a, a + b, a + 2b, · · · , a + nb. Allora F ∗ (x) = n X ai (a + ib)xi . i=0 12 La regola di Huddle afferma che ogni radice doppia di F (x) deve essere una radice di F ∗ (x). Infatti, sia e una radice doppia di F (x), allora possiamo scrivere X X F (x) = (x − e)2 ci xi = ci (xi+2 − 2exi+1 + e2 xi ). Posto Ai = a + ib, abbiamo X F ∗ (x) = ci (Ai+2 xi+2 − 2eAi+1 xi+1 + e2 Ai xi ) = X X ci [(Ai + 2b)x2 − 2e(Ai + b)x + e2 Ai ]xi = ci [Ai (x − e)2 + 2bx(x − e)]xi , ed è quindi chiaro che e è radice di F ∗ (x). Il risultato precedente è immediato se osserviamo che F ∗ (x) = aF (x) + bxF ′ (x). È questo il primo caso ove appare l’importanza della derivata, ottenuta in modo puramente algebrico, di un polinomio. La regola di Hudde può essere utilizzata solamente se la curva algebrica è data in forma esplicita. Sluse inventò una regola che può applicarsi altrettanto bene al caso delle curve date nella forma implicita f (x, y) = 0, dove X f (x, y) = cij xi y j è un polinomio nelle due variabili x ed y. Data la precedente progressione aritmetica, definiamo X X f ∗x (x, y) = (a + bi)cij xi y j , f ∗y (x, y) = (a + bj)cij xi y j . Allora la regola di Slusio dice che la pendenza m della tangente in un punto (x, y) della curva f (x, y) = 0 è data da m=− y f ∗x · . x f ∗y Tale regola fu pubblicata nel 1673 nelle Philosophical Transactions senza spiegazioni. In ogni caso il principale significato delle regole di Hudde e Sluse consiste nel fatto che presentano un algoritmo per determinare le tangenti (o le normali) ad una curva algebrica., Quando Cartesio fece avere a Fermat la Géométrie, questi rispose inviando un suo opuscolo manoscritto De maximis et minimis, dove vengono gettate le basi del calcolo differenziale. L’osservazione, in linguaggio moderno, è che una funzione f è stazionaria dove c’è un massimo o un minimo, cioè dove f (x + h) − f (x) = 0. h→0 h lim 13 Un esempio che dà Fermat è il seguente. Dividere un segmento AC in E, in modo che AE · EC sia massimo. Poniamo AC0b e sia AE = a e quindi EC = b − a e il prodotto è ab − a2 . Sia ora a + e il primo segmento di b, il secondo sarà b − a − e e il prodotto ab − a2 + be − 2ae − e2 ; questo sarà ”uguagliato” a ab − a2 . Eliminando i termini comuni abbiamo be = 2ae + e2 . Sopprimendo e otteniamo b = 2a; quindi a = b/2. In linguaggio moderno, calcoliamo lim e→0 (ab − a2 + be − 2ae − e2 ) − (ab − a2 ) = b − 2a e e poniamo b − 2a = 0. Sfortunatamente Fermat non spiegò mai chiaramente e completamente quali fossero le basi logiche per un simile procedimento. Con il metodo precedente trova poi la tangente in un dato punto ad una curva, osservando che se P è un punto di y = f (x) e P T è la tangente, il Q1 P1 rapporto QP QT è massimo o minimo (è stazionario) fra i rapporti Q1 T con P1 prossimo a P . Fermat calcola la tangente per varie curve, ma non sempre è chiaro il procedimento seguito. La pubblicazione di questo metodo fu piú tarda, dopo la morte dell’autore, nel 1679. La versione dinamica della derivata nasce nella scuola di galileo, fondatore della dinamica. Torricelli nel suo De motu gravium del 1644 determina la velocità con la quale un proiettile cadente lungo la parabola continuerebbe il suo moto se cessasse la forza acceleratrice, nel qual caso il moto sarebbe uniforme lungo la tangente. Riprende poi il problema e osserva che se si rappresenta il diagramma della velocità v come funzione del tempo, allora lo spazio percorso fra due istanti t1 e t2 è dato dall’area fra la curva, l’asse t e le ordinate in t1 e t2 , cioè Z t2 s= v dt. t1 14 Se invece rappresentiamo s come funzione del tempo, osserva che in tal caso la determinazione della velocità è data dalla costruzione della retta tangente. Non pare, però, che si accorgesse della fondamentale reciprocità fra le due operazioni di ”integrazione” e ”derivazione”. Vent’anni dopo Torricelli, il Teorema fondamentale del Calcolo venne riscoperto da Isaac Barrow (Londra, 1630–1677). Egli studiò a Cambridge, dove nel 1663 ebbe la cattedra di matematica, che cedette nel 1669 al suo discepolo Newton. Nella sua opera Lectiones opticæ et geometricæ del 1670, opera che dal punto di vista espositivo è alquanto antiquata, si occupa di trasformazioni di curve e ottiene, ricorrendo a complessi procedimenti geometrici, risultati come l’additività della derivazione. Giunto alla decima lezione, Barrow descrive, su consiglio di un amico (Newton), un nuovo metodo per costruire le tangenti, metodo che in sostanza è quello di Fermat. Nella stessa lezione indica una trasformazione che si vedrà essere molto generale e non conviene omettere: data una curva y = f (x) crescente, se ne costruisce una seconda, Y = F (x) tale che Z x F (x) = f (t) dt, 0 cioè tale che Y sia uguale all’area compresa fra la prima curva, l’asse x e le ordinate f (0) = OL, f (x) = N M . Allora, per costruire la tangente in P (x, Y ) della seconda curva, partendo da N (x, 0) si porti sull’asse x il segmento NT = Y NP = y NM e si congiunga P con T ; la retta P T è la tangente richiesta. Ciò significa che il coefficiente angolare della tangente è NP = N M = y, NT cioè dY = y. dx In questo modo Barrow presenta il carattere inverso della derivazione – costruzione della tangente – rispetto all’integrazione – quadratura. Con Barrow termina la schiera dei precursori. Tutti i materiali per costruire il calcolo differenziale ed integrale erano pronti, ma era necessario metterli assieme in modo opportuno ed efficace. Questo è ciò che fecero indipendentemente Newton e Leibniz. Isaac Newton (1642–1727) fu chiamato nel 1669 a succedere al maestro Barrow sulla Cattedra Lucasiana di matematica di Cambridge. Le sue opere furono tutte pubblicate con notevole ritardo, sia per raggiungere un maggiore rigore ed evitare critiche sia per non fornire ad altri i procedimenti che gli servivano per risolvere nuovi problemi. Dei tre opuscoli riguardanti l’analisi infinitesimale, tutti compiuti, pare, prima del 1670, il Tractatus de quadratura curvarum fu pubblicato nel 1704, il De analysi per æquationes numero terminorum infinitas nel 1711, e il Methodus fluxionum et serierum infinitarum apparve postumo nel 1736. 15 Seguiamo l’evoluzione delle concezioni newtoniane riguardanti le serie ed il loro uso e il calcolo delle flussioni, cioè il calcolo differenziale. Nel 1614 viene pubblicato un piccolo volume intitolato Mirifici logarithmorum canonis descriptio da parte di John Napier (Nepero) (1550–1617); questo libretto contiene le prime tavole logaritmiche. Non ci soffermiamo sulle motivazioni e sulla definizione di logaritmo data da Napier, ma vediamone la connessione con il calcolo della aree. Il Gesuita Grégoire de Saint–Vincent (Bruges 1584, Gand 1667) nel 1647 scoprı́ un interessante proprietà delle aree sottese dall’iperbole equilatera xy = 1: se 0 < a < b e denotiamo con Aa,b l’area sottesa nell’intervallo [a, b], egli prova che se t > 0, allora Ata,tb = Aa,b . Il suo compagno Alphonse Antonio de Sarasa notò che la funzione L(x) = A1,x , x ≥ 1, soddisfa la ”legge dei logaritmi”, cioè L(xy) = L(x) + L(y). Quindi l’area iperbolica ”si comporta come un logaritmo” (la sua uguaglianza con il logaritmo naturale sarà provata solamente nel XVIII secolo). Ciò stimolò lo studio delle aree iperboliche e, apparentemente, i primi calcoli sistematici dei logaritmi come aree iperboliche furono condotti da Newton alla metà degli anni 1660. In un manoscritto, probabilmente del 1667, egli considera l’iperbole y= 1 , 1+x x > −1, e calcola l’area A(1 + x) sotto l’iperbole nell’intervallo [0, x]. Scrivendo 1 = 1 − x + x2 − x3 + · · · , 1+x (serie che ottiene semplicemente facendo l’usuale divisione), egli integra termine a termine per ottenere A(1 + x) = x − x2 x3 x4 + − + ··· . 2 3 4 16 Ovviamente noi sappiamo che A(1 + x) = ln(1 + x), ma Newton non parla di logaritmi, ma riconosce il carattere logaritmico di tale funzione. Usando tale serie calcola una breve tavola dei logaritmi di numeri interi. La stessa serie viene ottenuta da Nicolas Mercator (1620–1687), calcolando le aree sottese dall’iperbole per mezzo del metodo degli indivisibili di Cavalieri. Il De analysi per æquationes numero terminorum infinitas tratta della serie di potenze e di alcune operazioni su di esse. Le serie di potenze, riguardate come estensione dei polinomi, davano modo di rappresentare e calcolare nuove funzioni finora non accolte nell’analisi. Newton riesce ad estendere la formula che dà la potenza intera del binomio, (1 + x)n , al caso di esponente razionale r, ottenendo la cosiddetta serie binomiale. Vediamo il procedimento mediante il quale Newton giunge a tale serie. Innanzi tutto dobbiamo osservare che l’uso degli esponenti frazionari era allora sconosciuto. Solo Wallis, nella Arithmetica infinitorum del 1665, parla di ”indice (esponente) 3/2” e di ”indice −1/2”. Il primo vero uso sistematico degli esponenti frazionari e negativi appare nella serie binomiale di Newton. Egli si ispirò al libro di Wallis, non pubblicò tale serie ma la descrisse in due famose lettere del 1676 inviate a Henry Oldenburg, segretario della Royal Society di Londra, per essere trasmesse a Leibniz. Nella prima lettera del 13 giugno 1676 scrive: Le estrazioni di radice possono essere molto abbreviate mediante il seguente teorema: (P +P Q)m/n = P m/n + m m−n m − 2n m − 3n AQ+ BQ+ CQ+ DQ+· · · n 2n 3n 4n Dove P + P Q esprime la quantità di cui si deve ricercare la radice, o anche una qualsiasi potenza, o la radice di una potenza. P indica il primo termine di tale quantità; Q indica i rimanenti termini divisi per il primo, ed m n l’indice numerico della potenza di P + P Q; questo che sitratti di una potenza intera, frazionaria, positiva o negativa. Infatti come gli analisti sogliono scrivere a2 , a√3 ecc. di aa, aaa ecc, √ invece √ 3 cosı́ io scrivo a1/2 , a3/2 , a5/3 , invece di a, a3 , a5 ecc. Egualmente 1 1 scrivo a−1 , a−2 , a−3 , invece di a1 , aa , aaa . [...] E infine, invece dei termini ottenuti nel quoziente mediante le operazioni mi servo delle lettere A, B, C, D ecc.; e precisamente A al posto del primo termine P m/n , B al posto del secondo m n AQ; e cosı́ per tutti gli altri termini.([D]) La lettera poi continua con esempi di applicazioni della serie sopra citata, inoltre appaiono le serie di potenze dell’arcoseno e del seno. Nella seconda lettera del 24 ottobre 1676, Newton risponde aad alcune richieste di precisazioni e spiegazioni contenute nella risposta di Leibniz ad Oldenburg, da trasmettere a Newton, del 27 agosto 1676. Qui abbiamo la spiegazione di come quest’ultimo sia giunto alla serie binomiale. 17 Quando, all’inizio dei miei studi di matematica, esaminai l’opera del nostro celeberrimo Wallis, considerai le serie mediante la cui interpolazione egli ci dà l’area del cerchio e dell’iperbole, come per esempio la serie delle curve aventi per comune base, o asse, x e per ordinate (1−xx)0/2 ; (1−xx)1/2 ; (1−xx)2/2 ; (1−xx)3/2 ; (1−xx)4/2 ; (1−xx)5/2 ; ecc., dove se le aree dei termini alterni che sono: 1 2 1 3 3 1 x; x − x3 ; x − x3 + x5 ; x − x3 + x5 − x7 ; · · · , 3 3 5 3 5 7 potessero venire interpolate, otterremmo le aree dei termini intermedi, il primo dei quali (1 − xx)1/2 è il cerchio. Al fine di interpolarli notavo allora che in tutti i casi il primo termine era x e che i secondi termini 0 3 1 3 2 3 3 3 3 x ; 3 x ; 3 x ; 3 x ecc. erano in progressione aritmetica, e che quindi i primi due termini delle serie da interpolare dovevano essere: x− 1 3 2x 3 ;x − 3 3 2x 3 ;x − 5 3 2x 3 ;··· . Inoltre per interpolare le restanti consideravo che i denominatori 1; 3; 5; 7; ecc., erano in progressione aritmetica, e che quindi dovevavno ricercarsi solo i coefficienti dei numeratori; ma questi nelle aree date alternativamente erano le figure (cifre) delle potense del numero 11, cioè 110 , 111 , 112 , 113 , 114 ; ovvero 1; 1, 1; 1, 2, 1; 1, 3, 3, 1; 1, 4, 6, 4, 1; ecc. Mi domandavo inoltre in qual modo, in queste serie, date le prime due figure, fosse possibile ricavare le rimanenti; e trovai che, posta la seconda figura m, si ricavano tutte le altre, moltiplicando continuamente i termini della serie: m−0 m−1 m−2 m−3 m−4 × × × × ··· 1 2 3 4 5 Cosı́ per esempio, posto il secondo termine m = 4, il terzo termine sarà m−2 m−3 4 × m−1 2 , cioè 6; il quarto termine 6 × 3 , cioè 4; e 4 × 4 , cioè 1, m−4 il quinto; e 1 × 5 , cioè 0, il sesto; con il quale in questo caso la serie ha termine. Mi sono poi servito di questa regola per interpolare le serie. Cosı́ 1 3 x per il cerchio, essendo 2 3 il secondo termine, e ponendo m = 12 ho ottenuto i termini: 1 −1 1 × 2 , 2 2 ossia − 81 ; 1 − × 8 1 ossia + 16 ; + 1 × 16 1 2 1 2 18 −2 , 3 −3 , 4 5 ossia − 128 in infinitum. Cosı́ ho trovato che l’area del segmento circolare è 1 3 1 5 1 7 5 x x x x9 x − 2 − 8 − 16 − 128 ∗ · · · 3 5 7 9 E con lo stesso procedimento ottenni anche le aree da interpolare delle restanti curve, come l’area dell’iperbole e delle altre curve alterne nella serie (1 + xx)0/2 ; (1 + xx)1/2 ; (1 + xx)2/2 ; (1 + xx)3/2 , ecc. E lo stesso è il procedimento per interpolare le altre serie, e ciò attraverso intervalli di due o p iú termini mancanti. Questo fu il mio primo esordio in meditazioni di tal genere, che certamente avrei ben presto dimenticato se già da qualche settimana prima non avessi rivolto la mia attenzione a certi altri fatti. Infatti, proprio quando avevo appreso le cose di cui sopra, stavo considerando che anche i termini (1 − xx)0/2 ; (1 − xx)2/2 ; (1 − xx)4/2 ; (1 − xx)6/2 , ecc. cioè 1; 1 − xx; 1 − 2xx + x4; 1 − 3xx + 3x4 − x6 ecc. potevano venir interpolati alla stessa maniera, e cosı́ le aree da essi generate; e che a questo scopo niente altro si richiedeva se non l’eliminazione dei denominatori 1, 3, 5, 7 ecc. nei termini esprimenti le aree; che cioè i coefficienti dei termini della quantità da interpolare (1 − xx)1/2 , o (1 − xx)2/3 , o in generale (1 − xx)m , si ottenevano continuando la moltiplicazione dei termini delle serie m× m−1 m−2 × ··· 2 3 Cosı́ per esempio (1 − xx)1/2 sarà uguale a 1 1 1 1 − x2 − x4 − x6 + · · · ; 2 8 16 e (1 − xx)3/2 sarà uguale a 3 1 3 1 − x2 + x4 + x6 + · · · . 2 8 16 E (1 − xx)1/3 sarà uguale a 1 5 1 1 − x2 − x4 − x6 + · · · . 3 9 81 Egualmente la riduzione generale dei radicali in serie infinite, mediante la regola da me stabilita all’inizio della lettera precedente, mi era nota prima che trovassi il modo di farlo mediante estrazioni di radice. Tuttavia, una volta pervenuto alla conoscenza del primo procedimento, il secondo non poteva rimanermi a lungo nascosto. Infatti per 1 6 provare la validità di queste operazioni, moltiplicai 1− 12 x2 − 18 x4 − 16 x 19 per se stesso, ottenendo 1 − xx, dato che tutti gli altri termini, contin5 6 uando la serie, svanivano all’infinito. Anche 1 − 13 x2 − 19 x4 − 81 x +· · · moltiplicato due volte per se stesso, dette come risultato 1−xx. Questo mi indusse, non appena fu certa la dimostrazione di queste conclusioni, a tentare se, viceversa, queste serie, che risultavano essere radice della quantità 1 − xx, non potessero venire estratte aritmeticamente. Il tentativo riuscı́ perfettamente. Questo era il modo di lavorare con le radici quadrate ([D]) Partendo dalla serie (1 − x2 )1/2 = 1 − 1 x4 1 · 3 x6 x2 − · 2 − · + ··· 2 2! 2 3! 23 per integrazione termine a termine, ottiene l’area del segmento OP QR nella forma x3 x5 x7 x− − − + ··· 6 40 112 D’altra parte θ = arcsin x è dato dal doppio dell’area del settore circolare OQR, quindi p x3 x5 arcsin x = 2(x − − + · · · ) − x 1 − x2 6 40 20 e in conclusione arcsin x = x + 1 x3 1 · 3 x5 · + · + ···) 2 3 2·4 5 Ma Newton conosce il metodo per invertire una serie di potenze, metodo che descrive nel De analysi per æquationes numero terminorum infinitas. Ciò gli permette di ottenere la serie del seno e poi del coseno. Inoltre dalla serie logaritmica ottiene quella esponenziale. Nello stesso opuscolo è accennato il metodo diretto e inverso delle flussioni, trattato negli altri due lavori. Egli non dispone di criteri generali di convergenza, ma indaga caso per caso se il resto vada diminuendo abbastanza rapidamente al crescere dei termini. Nel 1666 Newton raccoglie ed organizza i risultati delle sue ricerche condotte nei due anni precedenti in un manoscritto al quale ci si riferisce col nome ”Il trattato sulle flussioni dell’Ottobre 1666”. Questo lavoro non venne pubblicato fino al 1967, ma sembra che copie del manoscritto circolassero fra i matematici inglesi del tempo. Newton studia il problema delle tangenti combinando le componenti della velocità di un punto mobile in un opportuno sistema di coordinate. Egli immagina la curva espressa dall’ equazione f (x, y) = 0 come il luogo delle intersezioni di due linee mobili, una verticale e l’altra orizzontale. Allora le coordinate x e y del punto mobile sono funzioni del tempo t, e danno le posizioni rispettive della linea verticale e di quella orizzontale. Il moto è allora la composizione di un moto orizzontale di velocità ẋ e di uno verticale di velocità ẏ. Per la legge del parallelogramma per la composizione delle velocit` (nota nel caso di velocità costati e qui applicata per le velocità istantanee), il vettore veloci‘tà tangente è la somma mediante il parallelogramma di ẋ e ẏ. Quindi la pendenza della tangente alla curva è data da ẏ/ẋ. Su questa base, Newton pensa due (o piú) punti A e B che percorrono distanze x e y su due differenti rette nello stesso periodo di tempo, tali che in ogni istante sia f (x, y) = 0, con velocità ẋ e ẏ. Egli chiama fluenti queste quantità variabili con lo scorrere del tempo (vari21 abile indipendente convenzionale) e ad ogni istante di tempo corrisponde una velocità di variazione di ciscuna fluente. Questa velocità viene chiamata flussione. Va notato che il concetto di velocità di un punto in moto lungo una retta viene considerato evidente a causa delle sue basi fisiche. Queste sono nel nostro linguaggio le derivate rispetto al tempo. Il primo problema di Newton è di trovare le relazioni che legano le flussioni ẋ e il legame f (x, y) = 0 fra le variabili x e y. Qualora f (x, y) = P ẏ, conoscendo aij xi y j sia un polinomio, egli dà la seguente soluzione: Si portino tutti itermini dell’equazione in un membro eguagliato a zero. Come prima cosa si moltiplichi ciascun termine per ẋ/x tante volte quanto è la dimensione [grado] di x in quel termine. Poi si moltiplichi ciascun termine per ẏ/y tante volte quanto è la dimensione di y in quel termine.[...] La somma di tutti questi prodotti deve essere eguagliata a zero. Questa equazione dà il legame fra le velocità. Per dimostrare questo, Newton inizialmente osserva che se due corpi si muovono con velocità costanti, allora le distanze percorse sono proporzionali alle velocità. Quindi continua, E anche se essi non si muovono uniformemente, le infinite piccole linee che descrivono in ogni momento sono descritte come se essi avessero la velocità del momento della loro generazione. In altri termini, la sua idea è che durante un intervallo di tempo ”infinitamente breve” o, la situazione è la stessa che si ha in un intervallo di tempo finito, nel caso di moto uniforme – un moto arbitrario è essentialmente uniforme durante un intervallo di tempo infinitamente breve. Quindi se le linee descritte sono x e y in un istante, esse diverranno x + ẋo e y + ẏo nell’istante successivo. Vediamo un esempio di calcolo delle flussioni, per una funzione di tre variabili, seguendo il metodo sopra descritto. Siano x, y, z fluenti legate da x3 − xy 2 + a2 z − b3 = 0, con a e b costanti. Sia o una quantità molto piccola e siano ẋ, ẏ, ż le flussioni incognite. Sostituiamo nell’equazione la quantità incrementate x + ẋo, y + ẏo, z + żo al posto di x, y, z ottenendo x3 +3x2 ẋo+3xẋ2 o2 +ẋ3 o3 −xy 2 −ẋy 2 o−2ẋẏyo−2ẋẏyo2 −xẏ 2 o2 −ẋẏ 2 o3 +a2 z+a2 żo−b3 = 0. 22 Sottraiamo membro a membro le due equazioni e dividiamo per o; otteniamo 3x2 ẋ + 3xẋ2 o + ẋ3 o2 − ẋy 2 − 2ẋẏy − 2ẋẏyo − xẏ 2 o − ẋẏ 2 o2 + a2 ż = 0. Ponendo o = 0, resterà 3x2 ẋ − ẋy 2 − 2ẋẏy + a2 ż = 0, relazione che dà il legame fra le flussioni. P Consideriamo ora un esempio in due variabili. Sia f (x, y) = aij xi y j = 0, sostituendo come sopra x + ẋo, y + ẏo al posto di x e y otteniamo X aij (x + ẋo)i (y + ẏo)j = 0. Sviluppando arriviamo a X X X aij xi y j + aij xi (jy j−1 ẏo + termini in o2 ) + aij y j (ixi−1 ẋo + termini in o2 ) X + aij (ixi−1 ẋo + · · · )(jy j−1 ẏo + · · · ) = 0. Tenendo conto della relazione fra x e y ed eliminando i termini contenenti o2 , il risultato è X aij (ixi−1 y j ẋo + jxi y j−1 ẏo) = 0. Dividendo per o abbiamo X iẋ x + X X j ẏ aij xi y j = ẋ iaij xi−1 y j + ẏ jaij xi y j−1 = 0, y da cui ricaviamo la pendenza ẏ/ẋ della tangente. Egli si riconduce al caso esaminato di legame algebrico anche in presenza di radicali. Per esempio, supponiamo di voler calcolare ẏ/ẋ se y = (1 + xn )3/2 . Newton introduce una nuova variabile z = 1 + xn avente flussione ż = nxn−1 ẋ. Allora y 2 = z 3 e quindi 2y ẏ = 3z 2 ż. Possiamo allora concludere che ẏ/ẋ = √ ẏ/ż 3z 2 /2y 3 = = nxn−1 1 + xn . ẋ/ż 1/nxn−1 2 In questo esempio vediamo, sia pure in forma implicita, l’uso della regola di derivazione delle funzioni composte. 23 Piú interessante è il metodo inverso della flussioni o problema della quadrature. Nel quinto e sesto dei problemi che illustrano il trattato dell’Ottobre 166, Newton discute la questione del calcolo delle aree mediante l’antidifferenziazione. Egli prova quanto già notato da Barrow: la flussione dell’area limitata da una curva e da due ordinate, di cui una variabile, è l’ordinata della variabile. Da ciò deduce che la ricerca dell’area equivale alla ricerca di di una funzione la cui flussione (derivata) è nota, cioè la ricerca di una primitiva. Quindi Newton stabilisce per la prima volta nettamente e chiaramente il carattere inverso della derivazione e dell’integrazione e il fatto che entrambi i problemi sono differenti asspetti di un unico oggetto matematico. Riportiamo qui le Proposizioni III e V del Tractatus de quadratura curvarum del 1704. Proposizione III. Teorema I.- Si indichi con z l’ascissa e si ponga: R = e + f z n + gz 2n + hz 3n + · · · ; sia poi z θ Rλ l’area di una curva. L’ordinata della curva sarà allora [θe + (θ + λn)f z n + (θ + 2λn)gz 2n + (θ + 3λn)hz 3n + · · · ]z θ−1 Rλ−1 . Dimostrazione.- Infatti se poniamo: z θ Rλ = u, sarà θżz θ−1 Rλ + λz θ ṘRλ−1 = u̇. nel primo termine dell’equazione invece di Rλ si scriva RRλ−1 e nel secondo zz θ−1 invece di z θ e si avrà (θżR + λz Ṙ)z θ−1 Rλ−1 = u̇. Ma avevamo posto R = e + f z n + gz 2n + hz 3n + · · · quindi sarà Ṙ = e + f żz n−1 + 2ng żz 2n−1 + 3nhżz 3n−1 + · · · Sostituiti questi valori di R e Ṙ nell’espressione di u̇, e scritto 1 al posto di ż si ottiene: [θe+(θ+λn)f z n +(θ+2λn)gz 2n +(θ+3λn)hz 3n +· · · ]z θ−1 Rλ−1 = u̇. 24 Teorema II.- Sia z l’ascissa e z θ−1 Rλ−1 (a + bz n + cz 2n + dz 3n + · · · ) (n intero) l’ordinata di una curva assegnata, ove R indica l’espressione R = e + f z n + gz 2n + hz 3n + · · · Allora, posto θ = r, n r + λ = s, s + λ = t, t + λ = u, · · · l’area della curva sarà data da h 1a 1 nb − sf A n z + re (r + 1)e 1 c − (s + 1)f B − tgA 2n z + + n (r + 2)e z θ Rλ n + 1 nd i − (s + 2)f C − (t + 1)gB − uhA 3n z + ··· . (r + 3)e Qui A, B, C, D, · · · denotano i successivi coefficienti della serie chiusa fra parentesi quadre, coi rispettivi segni, e precisamente: 1 na 1 nb − sf A , re (r + 1)e 1 c − (s + 1)f B − tgA C= n ,··· (r + 2)e A= , B= Dimostrazione.- Consideriamo le seguenti ordinate di curve: [θeA + (θ + λn)f Az n + (θ + 2λn)gAz 2n + (θ + 3λn)hAz 3n + · · · ]z θ−1 Rλ−1 , [(θ + n)eBz n + (θ + n + λn)f Bz 2n + (θ + n + 2λn)gBz 3n + · · · ]z θ−1 Rλ−1 , [(θ + 2n)eCz 2n + (θ + 2n + λn)f Cz 3n + · · · ]z θ−1 Rλ−1 , [(θ + 3n)eDz 3n + · · · ]z θ−1 Rλ−1 . Le aree delle curve di cui sopra, in base alla Proposizione III, saranno rispettivamente: Az θ Rλ , Bz θ+n Rλ , Cz θ+2n Rλ , Dz θ+3n Rλ . E se la somma delle ordinate si pone uguale all’ordinata di una nuova curva: (a + bz n + cz 2n + dz 3n + · · · )z θ−1 Rλ−1 , 25 la somma delle aree z θ Rλ (A + Bz n + Cz 2n + Dz 3n + · · · ) sarà uguale all’area di questa curva. Uguagliando i termini corrispondenti nelle due espressioni dell’ordinata della curva, si avrà: a = θeA, b = (θ + λn)f A + (θ + n)eB, c = (θ + 2λn)gA + (θ + n + λn)f B + (θ + 2n)eC e quindi a , θe b − (θ + λn)f A , B= (θ + n)e c − (θ + 2λn)gA − (θ + n + λn)f B C= , (θ + 2n)e A= e cosı́ via all’infinito. Ponendo ora: θ = r, n r + λ = s, s + λ = t, t + λ = u, · · · e sostituendo nell’espressione dell’area z θ Rλ (A + Bz n + Cz 2n + Dz 3n + · · · ) i valori trovati per A, B, C, · · · risulterà la serie dell’enunciato. Piú in generale avendo egli a disposizione i procedimenti di derivazione suppone di conoscere la primitiva F (x) che sta cercando e ammette che si possa scrivere nella forma F (x) = xα Rβ S γ · · · , dove α, β, γ, · · · sono numeri razionali e R, S, · · · sono polinomi o serie di potenze ordinati secondo le potenze crescenti di x. Con il metodo delle flussioni calcola la derivata F ′ (x) e la confronta con la funzione assegnata f (x) di cui è chiesta la primitiva; si suppone che f sia anch’essa scritta nella forma sopre indicata. Determinati i coefficienti incogniti in F ′ in modo da avere F ′ (x) = f (x), F sarà la (una) primitiva richiesta. In questo modo Newton costruisce una classe abbastanza ampia di funzioni f (x) algebriche aventi integrali algebrici. Ma egli non conduce a termine il problema dell’integrazione delle funzioni razionali. Una parte notevole del Methodus fluxionum è dedicata alle equazioni differenziali ed egli riesce a ridurre alle quadrature alcune delle piú semplici. Con Newton il calcolo infinitesimale è già costruito, ma va reso piú accessibile con una scelta adatta delle notazioni e con una esposizione ordinata dei principi su cui si fonda. 26 Sarà questo il compito di Leibniz che segnerà la via a tutte le trattazioni successive. Gottfried Wilhelm Leibniz nacque a Lipsia nel 1646 e entrò nella locale università all’età di quindici anni. Ivi studiò filosofia, logica, legge e matematica elementare. Ottenne il dottorato in legge nel 1667, dall’Università di Norimberga. Girò l’Europa come diplomatico al servizio dell’Elettore di Magonza e nel 1672 in missione a Parigi conobbe Huygens che lo mise al corrente dei progressi che andava compiendo la matematica. Fu allora che iniziò seriamente i suoi studi di matematica. I quattro anni seguenti furono per Leibniz in ”primo periodo di scoperte” (simile al periodo 1664–66 per Newton). Nel 1673 fu a Londra e strinse rapporti con vari soci della Royal Society, ma non conobbe Newton. Da appunti manoscritti del 1673–75 risulta che egli era in possesso fin d’allora della notazione differenziale. Nel 1676 tornò in Germania da Parigi e per i quarant’anni seguenti fu al servizio dell’Elettore di Hanover, come bibliotecario e consigliere. Durante il periodo parigino costruı́ una macchina calcolatrice e a questo riguardo osservò: Non è degno di uomini eccellenti perdere ore come schiavi nel lavoro di puro calcolo che potrebbe essere con sicurezza lasciato ad altri se venissero usate delle macchine Un progetto che perseguı́ per tutta la vita fu la ricerca di linguaggio universale o di una logica simbolica che potesse standardizzare tutti i processi razionali. Il suo scopo era la costruzione di un sistema di notazioni e di una terminologia che codificassero e semplificassero il ragionamento logico. In realtà fu precisamente (e solamente) nella matematica che Leibniz ottenne il suo scopo. Il suo calcolo infinitesimale costituisce un supremo esempio di notazioni e terminologia perfettamente adatto al soggetto trattato e che rispecchia fedelmente le operazioni logiche di base di quel soggetto. Non è esagerato dire che il calcolo di Leibniz rese accessibili ad un comune studente problemi che avevano in precedenza richiesto la genialità di un Archimede o di un Newton. Un esempio di quanto sopra detto può essere il seguente: nella notazione funzionale di Lagrange, la regola di derivazione della funzione composta h(x) = f (g(x)) è data da h′ (x) = f ′ (g(x))g ′ (x). Nulla nella formula precedente suggerisce che essa sia vera e nemmeno dà un’idea di come la si possa dimostrare. Nella notazione differenziale di Leibniz, posto z = f (y) e y = g(x), la relazione precedente diviene dz dz dy = · . dx dy dx Questa formula suggerisce con grande evidenza la sua validità e indica come la si possa dimostrare sostituendo i differenziali dx, dy, dz con gli incrementi finiti ∆x, ∆y, ∆z e procedendo con i passaggi al limite. 27 I primi passi cruciali nella scoperta ed elaborazione del calcolo, furono fatti da Leibniz durante il suo soggiorno parigino negli anni 1672–1676, otto o dieci anni dopo il cosiddetto periodo formativo di Newton. Ma il primo lavoro sull’argomento è pubblicato nel 1684 negli Acta eruditorum di Lipsia, vent’anni prima ella pubblicazione di De Quadratura di Newton. Nel 1714, due anni prima della sua morte, Leibniz compose il saggio Historia et origo calculi differentialis che si apre con le seguenti parole: È molto utile che le vere ragioni delle scoperte memorabili siano conosciute, specialmente quelle che furono concepite non per puro accidente ma mediante uno sforzo di meditazione. L’utilità di ciò non consiste solamente nel fatto che la storia può dare a ognuno quanto devuto e che altri siano spronati dall’attesa di un analogo elogio, ma anche che l’arte della scoperta possa essere presentata e i suoi metodi vengano resi noti mediante brillanti esempi. Una delle piú nobili invenzioni dei nostri tempi è stata una nuova specie di analisi matematica, conosciuta come calcolo differenziale; ma mentre la sua sostanza è stata adeguatamente spiegata, la sua sorgente e motivazione originale non è stata resa pubblica. Sono passati circa quarant’anni da quando il suo autore la inventò... Nell’Historia et origo Leibniz fa risalire l’ispirazione che lo portò al calcolo ai suoi primi interessi sulle somme e differenze di sequenze numeriche. Senza entrare nei dettagli, il problema di calcolare la somma della serie infinita 1+ 1 1 1 1 + + + ···+ + ··· 3 6 10 n(n + 1)/2 gli fu proposto da Christian Huygens ed egli mostrò che la somma era uguale a 2, estendendo poi il risultato a situazioni piú generali. In quello stesso periodo, il 1672, Leibniz ancora ignorava i lavori matematici dei suoi contemporanei. In una lettera del 1680 a Tschirhaus racconta di una memorabile conversazione con Huygens all’inizio del 1673 che lo convinse allo studio della matematica. Fu cosı́ che studiando i lavori di Pascal scoprı́ il suo famoso ”triangolo caratteristico”. Cosı́ descrive (in terza persona) tale scoperta nella lettura della Lettre de M. Dettonville (Pascal stesso): Grazie ad un esempio presentato da Dettonville, un luce lampeggiò sopra di lui che, strano a dirsi, Pascal stesso non aveva percepito. Quando egli dimostra i teoremi di Archimede relativi alla misura della superficie di una sfera o di parti di essa, usa un metodo nel quale l’intera superficie del solido generato dalla rotazione attorno ad un asse può essere ridotta ad una figura piana equivalente. Da ciò il nostro giovane amico trasse il seguente teorema generale. La parte di una retta normale ad una curva, compresa fra la curva stessa ed un asse, quando presa nello stesso ordine e applicata ad angolo retto all’asse dà luogo ad una figura equivalente al momento della curva rispetto all’asse. 28 Vediamo di chiarire cosa Pascal avesse provato. Data una circonferenza centrata nell’origine e avente raggio a ed un punto D su di essa, traccia la tangente in D e considera il triangolo rettangolo E1 E2 K con K sul raggio per D ed E1 E2 segmento della tangente. Osservato che i triangoli E1 E2 K e ADI sono simili, abbiamo DI AD = , E1 E2 E2 K quindi DI · E1 E2 = AD · E2 K = AD · R2 R2 . Ne segue che posto y = DI, a = AD, ∆s = E1 E2 , ∆x = R2 R2 , allora y∆s = a∆x. Pensando ∆s e ∆x come indivisibili e sommando, otteniamo che il risultato di Pascal è: Z Z yds = adx. Poiché 2πyds è l’area di una zona infinitesimale sull’emisfero di raggio a ottenuto facendo ruotare il quarto di cerchio attorno all’asse x, ne segue che l’area dell’emisfero è Z Z a A = 2πyds = 2πa dx = 2πa2 . 0 La luce che lampeggiò su Leibniz consistette nell’aver egli notato la possibilità della applicazione della costruzione del triangolo infinitesimale di Pascal ad una curva arbitraria, non solo alla circonferenza, con il ruolo del raggio del cerchio giocato dalla normale alla curva. 29 Cosı́ dalla similitudine dei triangoli nella precedente figura, segue che ds dx = , n y o yds = ndx. Sommando gli infinitesimi abbiamo Z Z yds = ndx. Poiché Leibniz non inventò la notazione differenziale–integrale fino a due anni dopo, nel 1675, egli dovette esprimere la formula precedente in modo verbale – il momento di una data curva rispetto all’asse x è uguale all’area sotto una seconda curva la cui ordinata è la normale n alla curva data. La moltiplicazione R per 2π dà l’area A = 2πyds della superficie di rivoluzione ottenuta ruotando la curva attorno all’asse x. ================= Lı́ Leibniz parte da una curva y = f (x) e suppone sia tracciata la tangente uscente da un punto (x, y) della curva stessa. Dato a x un incremento dx, dy sceglie il differenziale dy in modo che il rapporto dx dia il coefficiente angolare della tangente. Dopo di che vengono enunciate le regole di calcolo delle derivate senza parlare di derivate o limiti e senza alcuna giustificazione. Egli dice che da questo calcolo differenziale si possono ottenere massimi e minimi e tangenti. Dice poi ”La dimostrazione di tutte le regole esposte sarà facile per che è versato in questi studi”. Nello stesso lavoro è introdotto anche il differenziale secondo ddy e si afferma che il segno di esso permette di stabilire se una R curva è concava o convessa. In un lavoro del 1686 appare il simbolo y dx che ricorda come l’area sia costruita come somma di rettangolini ”infinitesimi”. Nel 1702 egli dà il procedimento per l’integrazione delle funzioni razionali mediante scomposizione in una somma di frazioni semplici e, per evitare numeri complessi, si chiede se ogni funzione razionale possa scomporsi in fattori di 1 e 2 grado reali. Egli non riesce a dare la risposta affermativa poiché fa un errore nella decomposizione di x4 + a4 . Anche nella formula di integrazione per sostituzione Z Z f g(x) g ′ (x) dx = f (u) du, la sostituzione simbolica u = g(x), du = g ′ (x)dx sembra rendere la relazione inevitabile. Il calcolo di Leibniz ha portato nelle possibilità di uno studente ordinario problemi che richiedevano la genialità di Archimede o di Newton. Ebbe al termine della sua vita una polemica con Newton e i suoi discepoli relativa alla priorità della scoperte. Morı́ nel 1716. In rapporti stretti con Leibniz sorge sul continente une stirpe di gendi matematici che illustrano, con le loro opere, il secolo XVIII. 30 Capostipite è Jakob Bernoulli (1654–1705), autore di fondamentali ricerche sulle applicazioni del calcolo differenziale alla meccanica; a lui è dovuta la denominazione di ”integrale”. Con questi matematici termina la prima fase del calcolo infinitesimale, che verrà sviluppato soprettutto sul continente da Johann Bernoulli (1667–1748) e dal suo discepolo Leonhard Euler (1707–1783). BIBLIOGRAFIA [R] E. Rufini: Il ”Metodo” di Archimede e le origini del calcolo infinitesimale nell’antichità, Biblioteca Scientifica Feltrinelli 4, 1961. [E] C.H. Edwards, Jr.: The Historical Development of the calculus, SpringerVerlag 1979. [D] La disputa Leibniz–Newton sull’analisi, Boringhieri 1958. 31