Capitolo 6
Equazioni di Lagrange
6.1
Motivazione
Un grave ostacolo nella applicazione diretta delle equazioni cardinali allo studio
della dinamica dei sistemi meccanici, siano essi o meno corpi rigidi, risiede nel
fatto che esse pongono l’accento sulle forze esterne al sistema meccanico. Ora,
se pensiamo ad un sistema meccanico M la cui libertà di moto sia in parte
limitata—pensiamo, ad esempio, ad un solido che trasla su un piano fisso—tra
le forze esterne vanno annoverate anche quelle che il sistema risente per effetto
della presenza del vincolo. L’esistenza di queste forze è evidente se si considera
che, per restare aderenti all’esempio appena proposto, se si sopprime il piano
di scorrimento, il solido cambierà radicalmente il suo tipo di moto, in generale.
Poiché le forze la cui esistenza non dipende dalla presenza del vincolo sono rimaste le stesse, è quantomeno plausibile che il vincolo eserciti un sistema di forze su
M. Ora, in generale, anche nei casi più favorevoli in cui le forze di natura dissipativa legate all’attrito sono assenti, le reazioni vincolari non sono note a priori,
a differenza delle forze attive che, come la gravità, sussistono indipendetemente
dal fatto che M sia vincolato o meno. I valori incogniti di queste forze, legate alla presenza dei vincoli obbligano, nel formalismo newtoniano basato sulle
equazioni cardinali, ad escogitare dei procedimenti di proiezione delle equazioni
in modo da eliminare le componenti delle reazioni vincolari e poter determinare
le equazioni di moto del sistema che siano prive delle reazioni e che, per questo
motivo, sono dette equazioni pure di moto. Le reazioni vincolari, una volta determinato il moto di M, possono essere dedotte dalle equazioni cardinali della
dinamica. Il punto cruciale è che questo processo di proiezione delle equazioni di
moto lungo direzioni ove i vincoli siano inefficaci e le reazioni vincolari assenti,
varia col problema considerato. L’uso del formalismo lagrangiano permette, al
contrario, l’eliminazione sistematica delle reazioni vincolari dalle equazioni di
moto in quanto si riduce, in buona sostanza, ad un processo di proiezione. Il
formalismo lagrangiano, nel caso in cui i vincoli siano ideali, cioè non dissipino
potenza, consente di ottenere equazioni pure di moto e dunque realizza in mo89
90
CAPITOLO 6. EQUAZIONI DI LAGRANGE
do sistematico la separazione del problema di risolvere il moto di M da quello
di determinare le reazioni vincolari in dinamica. Se questa motivazione non è
chiara si rischia di naufragare nel dettaglio dei calcoli e, in ultima analisi, di essere delusi dalla teoria in quanto, occorre dirlo subito, il formalismo lagrangiano
non fornisce un metodo di risoluzione delle equazioni differenziali che reggono il
moto di un sistema meccanico. Nelle sezioni che seguono renderemo più precise
le classi di vincoli cui il formalismo è direttamente applicabile.
6.2
Vincoli olonomi
Per poter studiare l’evoluzione di un sistema meccanico M composto da N punti
materiali o un corpo rigido o un altro sistema che sia formato da punti materiali
e corpi rigidi occorre assegnare ad ogni istante un insieme di coordinate i cui
valori permettano di individuare la configurazione di M in modo univoco. Noi
ci interesseremo del caso in cui il numero di queste coordinate è finito mentre
potremo considerare situazioni in cui M sia composto da infiniti punti materiali.
Partiamo dal sistema più semplice in cui M consiste di un punto materiale P
libero di muoversi nello spazio. Per individuare ad ogni istante in modo univoco
la configurazione di P occorre assegnare i valori delle sue tre coordinate cartesiane ortogonali (x(t), y(t), z(t)) rispetto ad un osservatore avente origine in
un punto O ed assi diretti come {ex , ey , ez }. Le tre coordinate possono essere
numeri reali qualsiasi, almeno in linea di principio. Viceversa, ad una terna ordinata di numeri reali qualsiasi si può far corrispondere un’unica configurazione
di P che può essere assunta ad un dato istante. Il vettore posizione r di P
rispetto ad O è una funzione delle coordinate scelte:
r = r(x(t), y(t), z(t)).
Quando M è formato da un numero N di punti materiali (Pi , mi ) liberi
nello spazio, occorre assegnare n = 3N coordinate indipendenti per individuare
univocamente una configurazione di M come, ad esempio, le coordinate cartesiane (xi (t), yi (t), zi (t)), con i = 1, ..., 3N dei singoli punti Pi . Ora, per i vettori
posizione ri dei punti Pi rispetto all’origine O, abbiamo
Pi − O = ri = ri (xi (t), yi (t), zi (t))
∀i = 1, ..., N.
Se ora i punti materiali di M sono vincolati a restare su un piano π, che possiamo
sempre assumere coincidente con il piano z = 0 di un osservatore di riferimento,
restando liberi per il resto, per ciascuno di essi occorre e basta conoscere ad
ogni istante di tempo due sole coordinate: xi (t) ed yi (t) e dunque il numero di
coordinate indipendenti che occorre assegnare ad ogni istante per individuare
la configurazione di M si riduce a 2N ed abbiamo
Pi − O = ri = ri (xi (t), yi (t))
∀i = 1, ..., N.
Come in precedenza, le coordinate (xi (t), yi (t)) sono numeri reali qualsiasi, almeno in linea di principio. Similmente se un punto materiale P è vincolato a
91
6.2. VINCOLI OLONOMI
muoversi su una superficie occorrono due coordinate indipendenti per individuarne la posizione. Pensiamo ad un punto mobile su una superficie sferica: in
questo caso le coordinate polari sferiche ϑ (colatitudine) e ϕ (longitudine) rappresentano un adeguato sistema di coordinate per individuare la posizione di P
sulla sfera. Osserviamo a questo proposito che, per mantenere la corrispondenza biunivoca tra i valori delle coppie (ϑ(t), ϕ(t)) e le configurazioni assunte da
P sulla superficie sferica, occorre porre delle limitazioni sui valori che possono
essere assunti da ϑ(t) e ϕ(t). Infatti occorre che ϑ ∈ [0, π] e ϕ ∈ [0, 2π), altrimenti la corrispondenza cesserebbe di essere biunivoca. Operata però questa
riduzione, permane un problema che non può essere eluso: cioè il fatto che ai
poli, dove ϑ = 0 o ϑ = π la variabile ϕ cessa di essere definita. Si tratta di
un problema inerente alla geometria sferica in quanto non è possibile utilizzare
un’unica carta coordinata per parametrizzarne l’intera superficie. Fatte salve
queste eccezioni in numero finito, possiamo dire di saper individuare una configurazione di un punto P mobile su una superficie sferica scrivendo il suo vettore
posizione, r := P − O, riferito al centro O della superficie sferica, nella forma
r := r(ϑ(t), ϕ(t)).
Anche se il significato delle coordinate cambia con la superficie S sulla quale
avviene il moto, occorrono sempre due coordinate indipendenti per individuare
la posizione di un punto P mobile su S in maniera univoca.
Possiamo ora considerare un punto materiale P mobile su una circonferenza
fissa di raggio R e centro O. Per individuare in modo univoco la posizione di
P sulla circonferenza è csufficiente assegnare un valore all’angolo ϑ che il raggio
vettore P − O forma con una direzione di riferimento, ad esempio la direzione
di ex . avremo in questo caso
P − O = r(ϑ(t)) = R[cos ϑ(t)ex + sin ϑ(t)ey ].
Più in generale, se P è mobile su una curva fissa C nello spazio euclideo tridimensionale, basta conoscere il valore dell’ascissa curvilinea s che individua la
lunghezza dell’arco di curva che porta da un punto O (origine) di C al punto P
per individuare la posizione di quest’ultimo in modo univoco, a patto di stabilire
un verso di percorrenza sulla curva C che permetta di distinguere i punti che
si ottengono muovendosi in un verso a partire da O da quelli che si ottengono
seguendo il verso opposto.
Consideriamo ora un corpo rigido B, libero di muoversi nello spazio. Per
individuarne la posizione in modo univoco ad ogni istante, occorre assegnare
la posizione di un punto solidale ad esso, ad esempio il suo centro di massa,
e l’orientazione di una terna ortonormale {e1 , e2 , e3 }, positivamente orientata
e solidale al corpo rigido. Per fissare la posizione del centro di massa G di B,
occorre e basta assegnare le sue coordinate {xG (t), yG (t), zG (t)} rispetto ad un
osservatore assoluto di origine O e base fissa, ortonormale {ex , ey , ez }. Vediamo ora quante coordinate occorre assegnare per determinare in modo univoco
l’orientazione della base mobile {e1 , e2 , e3 } rispetto alla base fissa {ex , ey , ez }.
Seguiamo di descrivere la rotazione necessaria ad effettuare il passaggio tra queste due basi servendoci degli angoli di Eulero. Osserviamo anzitutto che, se
92
CAPITOLO 6. EQUAZIONI DI LAGRANGE
ez
e3
e2
ϑ
ey
G
ex
ϕ
ψ
e1
n
Figura 6.1: Angoli di Eulero {ϕ, ϑ, ψ} per individuare la posizione della terna {e1 , e2 , e3 } solidale ad un corpo rigido rispetto ad una terna assoluta
{ex , ey , ez }. Il versore n è associato alla retta dei nodi, intersezione tra il
piano fisso {ex , ey } e quello mobile {e1 , e2 }.
immaginiamo di centrare in G una terna con assi paralleli ad {ex , ey , ez }, in
generale il piano mobile {e1 , e2 } e quello fisso {ex , ey } passanti entrambi per G,
si tagliano lungo una retta r, nota come linea dei nodi, individuata dal versore
n. La posizione di questa retta sul piano {ex , ey } passante per G è individuata dall’angolo ϕ ∈ [0, 2π) che il versore n forma, ad esempio, con la direzione
di ex . Supponiamo di fissare quest’angolo e studiamo quale sia la libertà residua di movimento per la terna {e1 , e2 , e3 }. Osserviamo che i due piani per
G {e1 , e2 } ed {ex , ey } formano tra loro un angolo ϑ ∈ [0, π] che coincide con
l’angolo compreso tra le rispettive normali e3 ed ez che, in particolare, sono
ortogonali entrtambe a n. Se supponiamo di fissare anche ϑ, la base mobile
{e1 , e2 } risulta individuata una volta che sia noto l’angolo ψ ∈ [0, 2π) che e1
forma con n. Fissato il valore di quest’angolo, la base mobile {e1 , e2 , e3 } è
completamente individuata. In definitiva, occorre assegnare sei coordinate indipendenti per individuare in modo univoco la posizione di un corpo rigido B
mobile: oltre alle coordinate {xG (t), yG (t), zG (t)} del centro di massa G, occorre
determinare i tre angoli di Eulero {ϕ(t), ϑ(t), ψ(t)}: in letteratura è diffuso il
nome di angolo di precessione, per indicare ϕ, di angolo di nutazione, per ϑ e
di angolo di rotazione propria per ψ.
Possiamo sviluppare i versori {e1 , e2 , e3 } sulla base fissa {ex , ey , ez } utilizzando
gli angoli di Eulero e seguendo le rotazioni parziali necessarie a passare dalla
base fissa a quella mobile. Anzitutto, per sovrapporre ex alla retta dei nodi,
dobbiamo effettuare una rotazione attorno all’asse ez di un angolo ϕ. Se Qϕ è
il tensore ortogonale corrispondente a questa rotazione abbiamo
Qϕ
{ex , ey , ez } → {n, n⊥ , ez } .
dove
n = cos ϕex + sin ϕey
and
n⊥ = −sinϕex + cos ϕey .
93
6.2. VINCOLI OLONOMI
Per sovrapporre ez ad e3 effettuiamo una rotazione intorno ad n di un angolo
ϑ: questa operazione è possibile perché sia ez che e3 sono ortogonali a n. Se
Qϑ è il tensore ortogonale corrispondente a questa rotazione otteniamo
Q
{n, n⊥ , ez } →ϑ {n, m, e3 } :
abbiamo ora
e3 = cos ϑn − sin ϑn⊥ ,
m = sin ϑn + cos ϑn⊥ .
Infine, effettuiamo una rotazione intorno ad e3 di un angolo ψ. Se Qψ è il
tensore ortogonale corrispondente a questa rotazione abbiamo
Qψ
{n, m, e3 } → {e1 , e2 , e2 }.
dove ora
e1 = cos ψn + sin ψm
e2 = − sin ψn + cos ψm.
Non è difficile a questo punto ottenere le espressioni di e1 , e2 , e3 in termini
dei versori della base fissa e mostrare come i coefficienti dello sviluppo siano
funzioni degli angoli di Eulero. Se consideriamo un punto P qualsiasi, solidale
al corpo rigido, il suo vettore posizione rispetto a G sarà del tipo P − G =
ℓ1 e1 + ℓ2 e2 + ℓ3 e3 , dove i coefficienti ℓi sono costanti rispetto all’osservatore
solidale, dal momento che tutti i punti del corpo rigido sono in quiete rispetto
a questo osservatore. Rispetto all’osservatore assoluto avremo
P −O = x(t)ex +y(t)ey +z(t)ez +
3
X
ℓi ei (ϕ(t), ϑ(t), ψ(t)) = r(x(t), y(t), z(t), ϕ(t), ϑ(t), ψ(t)).
i=1
Questo esempio, insieme a quelli trattati in precedenza, giustifica la definizione
della seguente classe di sistemi vincolati:
Definizione 6.1 Sia dato un sistema M := {(Pi , mi ), i = 1, · · · , N } di punti
materiali; diremo che M è soggetto a vincoli olonomi se, ∀i = 1, · · · , N è possibile scrivere i vettori posizione ri dei punti Pi come funzioni di un numero finito
di coordinate indipendenti q1 (t), q2 (t), ..., qn (t) ed eventualmente del tempo:
Pi − O = r i (q1 (t), q2 (t), ..., qn (t), t)
∀i = 1, ..., N.
(6.1)
Le coordinate q1 (t), q2 (t), ..., qn (t) sono dette coordinate generalizzate o lagrangiane di M ed il numero n di coordinate lagrangiane necessario ad individuare
univocamente la posizione di M ad un istante di tempo è detto numero di gradi
di libertà del sistema.
Se esiste almeno un punto per il quale non è possibile scrivere Pi − O nella forma
(6.1), allora il sistema M è soggetto a vincoli anolonomi.
94
CAPITOLO 6. EQUAZIONI DI LAGRANGE
La dipendenza esplicita dal tempo nelle funzioni ri merita di essere un po’
approfondita. Negli esempi illustrati finora, i vettori posizione dei punti componenti i vari sistemi di punti materiali dipendevano solo implicitamente dal
tempo, attraverso la dipendenza temporale delle coordinate lagrangiane. Vediamo un esempio in cui figura una dipendenza esplicita dal tempo. Consideriamo
nel piano un punto materiale libero di muoversi su una circonferenza di centro
O fisso, il cui raggio R(t) è variabile con legge assegnata a priori: ad esempio
R(t) = R0 (1 + 21 sin ωt). Ad ogni istante la posizione di P è espressa in uno dei
due modi equivalenti
P − O = R(t)[cos ϑ(t)ex + sin ϑ(t)ey ] =
= R0 (1 + 21 sin ωt)[cos ϑ(t)ex + sin ϑ(t)ey ] = R(t)er (t)
(6.2)
dove er è il versore radiale, diretto da O verso P . La differenza tra R(t) e ϑ(t)
sta nel fatto che, mentre la prima funzione è nota a priori, la seconda dipende
dalla soluzione del problema dinamico, da come il punto P viene sollecitato.
Un vincolo olonomo in cui non vi sia dipendenza esplicita dal tempo è detto
scleronomo mentre è detto reonomo se vi è dipendenza esplicita dal tempo.
Formalmente, diremo che i vincoli cui è soggetto M sono scleronomi se
∂ri
=0
∂t
∀i = 1, ..., N
(6.3)
mentre sono reonomi se esiste almeno un valore i0 dell’indice i per il quale si
abbia
∂ri0
6= 0.
(6.4)
∂t
La presenza di vincoli olonomi ha un riflesso sulla forma dei vettori posizione
dei punti di M che debbono obbedire (6.1). Se deriviamo v i rispetto al tempo
otteniamo
n
X
∂ri
∂ri
dri
vi =
=
q̇k (t) +
(6.5)
dt
∂qk
∂t
k=1
dove l’ultimo termine è diverso da 0 solo quando esiste almeno un vincolo reonomo. L’equazione (6.5) rappresenta l’espressione generale della velocità di un
punto materiale appartenente ad un sistema soggetto a vincoli olonomi.
Nel seguito, faremo uso del concetto di atto di moto, definito come segue
Definizione 6.2 Assegnato un sistema M di punti materiali, l’atto di moto
ad un certo istante t0 rappresenta la distribuzione delle velocità dei punti che
compongono M in quell’istante.
In particolare, la (6.5) rappresenta l’atto di moto per un sistema soggetto a
vincoli olonomi.
Definizione 6.3 Un atto di moto per un sistema M è detto atto di moto possibile ad un certo istante t0 se è una distribuzione di velocità compatibile con
i vincoli cui è soggetto M ma per il resto arbitraria. Un atto di moto virtuale è una distribuzione di velocità compatibile con i vincoli cui è soggetto M,
immaginati bloccati all’istante t = t0 , per il resto arbitraria.
95
6.2. VINCOLI OLONOMI
Ripartiamo dall’esempio semplice di un punto P mobile su una circonferenza
fissa di centro O e raggio R, cosı̀ da avere
P − O = r = R[cos ϑ(t)ex + sin ϑ(t)ey ].
L’atto di moto reale, cioè quello che si realizza nel corso del moto è
v=
dr
= Rϑ̇(t)[− sin ϑ(t)ex + cos ϑ(t)ey ] :
dt
osserviamo che il versore eϑ := [− sin ϑ(t)ex + cos ϑ(t)ey ] è tangente alla circonferenza. L’atto di moto possibile è una distribuzione di velocità compatibile con
il vincolo, ma per il resto arbitraria. Poiché il vincolo impone alla velocità di
essere tangente alla circonferenza, abbiamo
v = v[− sin ϑ(t)ex + cos ϑ(t)ey ]
dove v indica uno scalare arbitrario. In questo caso non c’è alcuna distinzione
tra atto di moto possibile ed atto di moto virtuale. Al contrario, consideriamo
il sistema soggetto a vincoli reonomi (6.2). L’atto di moto reale si ottiene
derivando (6.2) rispetto al tempo: ricordando le formule di Poisson, abbiamo
v=
dR(t)
˙ ϑ.
er + R(t)ϑ(t)e
dt
Questa velocità non è tangente alla circonferenza su cui si muove il punto ma
contiene una componente radiale che riflette il trascinamento subı̀to da P ad
opera del vincolo. Nell’atto di moto possibile, poiché R(t) è nota a priori, l’unico
parametro su cui possiamo giocare per ottenere una velocità compatibile con il
vincolo è la componente tangenziale della velocità: il vettore
v=
dR(t)
er + R(t)veϑ
dt
dove v è uno scalare arbitrario, è la più generale distribuzione di velocità compatibile con il vincolo, cioè l’atto di moto possibile per P . L’atto di moto virtuale
si ottiene congelando la dipendenza esplicita dal tempo, cioè immaginando che
il vincolo sia fisso, all’istante t = t0 . In questo modo, la velocità virtuale si
ottiene annullando la dipendenza esplicita dal tempo e dunque
b = R(t0 )b
v
v eϑ
dove lo scalare vb è arbitrario. Come si vede, l’atto di moto virtuale è tangente
alla posizione del vincolo all’istante t = t0 , avendo eliminato la dipendenza
esplicita del vincolo dal tempo. Dovrebbe esser chiaro da quanto precede che la
differenza tra atto di moto possibile ed atto di moto virtuale si evidenzia solo
nel caso in cui vi siano vincoli reonomi.
Osservazione Nelle definizioni precedenti l’arbitrarietà delle quantità scalari v
b non è assoluta. Occorre supporre che le velocità non facciano violare il
e v
96
CAPITOLO 6. EQUAZIONI DI LAGRANGE
vincolo; questa osservazione è importante dal momento che, quando il sistema
si trovasse in una configurazione di confine, l’arbitrarietà è limitata in modo
significativo. Chiariamo con un esempio, supponendo che M sia formato da un
solo punto materiale P mobile all’interno di un disco fisso di raggio R e centro
O. Come coordinate lagrangiane si possono assumere le coordinate polari (r, ϑ)
aventi O come polo e con l’anomalia ϑ contata a partire dall’asse delle ascisse:
P − O = r(t)er
dove er = er (t) è il versore radiale, diretto da O a P . Ora, l’atto di moto reale
è
v = ṙ(t)er (t) + r(t)ϑ̇(t)eϑ (t)
dove abbiamo utilizzato le formule di Poisson. L’atto di moto possibile che qui
si confonde con quello virtuale, dal momento che i vincoli sono scleronomi, è
v = v r er + v ϑ e ϑ
dove gli scalari v r e v ϑ sono arbitrari nel momento in cui r < R e dunque P
può esplorare tutte le direzioni senza uscire dalla regione ammissibile r ≤ R. Al
contrario, se r(t) = R, sono ammessi solo quelle velocità virtuali tali che v r ≤ 0,
ovvero tali che la componente radiale di v non sia positiva, in modo da impedire
a P di esplorare la regione r(t) > R che è irraggiungibile per il vincolo imposto.
Configurazioni nelle quali le velocità virtuali sono soggette a queste restrizioni
sono dette configurazioni di confine e gli atti di moto sono detti non reversibili.
Ha interesse per quel che segue procurarsi l’espressione dell’atto di moto
possibile e virtuale per un sistema a n gradi di libertà, soggetto a vincoli olonomi:
partendo dall’equazione (6.5) ed osservando che i vettori ∂∂qrji sono tangenti alla
posizione del vincolo, fissato all’istante t = t0 , abbiamo
vi =
n
X
∂ri
∂ri
vk +
∂qk
∂t
(6.6)
k=1
e
bi =
v
n
X
∂ri
vbk
∂qk
(6.7)
k=1
per l’atto di moto possibile e virtuale, rispettivamente: in queste espressioni le
n quantità scalari v k o vbk sono arbitrarie in ogni configurazione ordinaria, cioè
non di confine.
6.3
Vincoli di contatto e di rotolamento
Nella sezione precedente abbiamo considerato il caso in cui un sistema meccanico
M subisse restrizioni nelle configurazioni possibili; ora eseminiamo due casi in
cui le restrizioni vengono, almeno inizialmente, imposte sulle velocità dei punti
di M.
97
6.3. VINCOLI DI CONTATTO E DI ROTOLAMENTO
ν
B1
P1
P2
B2
Figura 6.2: Corpi rigidi B1 e B2 soggetti a vincolo di contatto in P1 ≡ P2 . Il
versore ν indica la normale al piano tangente comune alle superficie dei due
corpi nel punto di contatto.
Supponiamo (Fig. 6.2) che due corpi rigidi B1 e B2 siano vincolati ad avere
in ogni istante un punto P1 appartenente alla superficie di B1 ed un punto P2
della superficie di B2 a contatto. La condizione perché ciò succeda è che, detto
ν il versore normale al piano tangente comune a B1 e B2 nel punto di contatto
P1 ≡ P2 , si abbia
(v 1 − v 2 ) · ν = 0
(6.8)
dove v 1 è la velocità istantanea di P1 , pensato come punto di B1 e v 2 quella di
P2 , pensato come punto di B2 . L’equazione (6.8) afferma che, affinché B1 e B2
restino a contatto, occorre che il moto relativo tra i due corpi nel punto P1 ≡ P2
sia diretto lungo il piano tangente comune ai due corpi, ovvero possa esserci solo
strisciamento tra i due corpi. Quando si richiede che i due corpi ròtolino senza
strisciare l’uno sull’altro bisogna impedire l’instaurarsi di questo moto relativo
e dunque richiedere, fermo restando il significato dei simboli,
v1 − v2 = 0 :
(6.9)
in questo caso si parla anche di puro rotolamento di B1 su B2 .
Esempio In un piano {ex , ey } (Fig. 6.3), sia dato un disco di centro C e raggio R
libero di rotolare senza strisciare su una guida orizzontale fissa r. Determinare
il numero di gradi di libertà del sistema.
ϑ
b
O
C
P
ey
ex
H
Figura 6.3: Puro rotolamento di un disco di raggio R su una guida fissa e
rettilinea. Il moto avviene nel piano {ex , ey }.
Indichiamo con x l’ascissa del centro C del disco e con ϑ l’angolo di rotazione,
cioè l’angolo che una direzione fissa di riferimento (qui la verticale ascendente
passante per C) forma con un raggio vettore di un punto P solidale al disco. Se
98
CAPITOLO 6. EQUAZIONI DI LAGRANGE
prescindessimo dal vincolo di puro rotolamento, x e ϑ sarebbero indipendenti;
non è per‘ødifficile convincersi che, ad x fissato, un movimento indipendente di ϑ
comporterebbe lo strisciamento del disco sulla guida r e dunque è incompatibile
con il puro rotolamento. Da questa considerazione informale, nasce il sospetto
che il vincolo di puro rotolamento induca un legame tra le coordinate lagrangiane
scelte. Per dar sostanza a questa supposizione troviamo due espressioni differenti
per la velocità di C: la prima, derivando rispetto al tempo la relazione C − O =
x(t)ex , fornisce
v C = ẋ(t)ex .
La seconda espressione si ottiene imponendo la formula fondamentale della cinematica relativa. Detto H il punto della circonferenza del disco che si trova
ad un certo istante a contatto con r, il puro rotolamento (6.9) impone v H = 0
e, ricordando che il moto avviene nel piano e dunque la velocità angolare del
disco è ω = ωez = −ϑ̇(t)ez a causa del verso di rotazione assunto positivo per
il disco, abbiamo
v C = v H + ω ∧ (C − H) = −Rϑ̇(t)ez ∧ ey = Rϑ̇(t)ex :
confrontando le due espressioni ottenute per v C otteniamo
ẋ(t) = Rϑ̇(t).
(6.10)
Ora, questa relazione può essere integrata rispetto al tempo ottenendo
x(t) = Rϑ(t) + C
dove C è una costante di integrazione il cui valore dipende dalle condizioni
iniziali scelte. Se scegliamo il punto P in modo che P − C = Rey quando
C ≡ O ed indichiamo con t0 l’istante in cui C passa per O, allora x(0) = 0 e
ϑ(0) = 0 e dunque la condizione di puro rotolamento diventa
x(t) = Rϑ(t).
(6.11)
Occorre dunque una sola coordinata lagrangiana, x(t) o ϑ(t) indifferentemente,
per individuare la posizione del disco.
Esempio Supponiamo che nel piano {ex , ey } un disco di centro C e raggio R
rotoli senza strisciare sulla circonferenza di un altro disco fisso di centro O di
raggio R0 > R, disposto come in figura, con C interno al disco fisso (Fig. 6.4).
Studiare tale vincolo.
Sia H il punto di contatto istantaneo tra i due dischi e sia ϑ l’angolo che
H − O forma con la verticale discendente. La velocità angolare del disco mobile
sarà del tipo ω = ωez e cerchiamo di determinare ω in termini di ϑ̇ che non
è l’angolo di rotazione del disco quanto quello del raggio vettore C − O. La
strategia è la stessa di prima. Da una parte, osserviamo che C si muove su una
circonferenza di centro C e raggio R0 − R per cui
C − O = (R0 − R)er
99
6.4. VINCOLI PERFETTI
O
ey
ex
ϑ
C
eϑ
H
er
Figura 6.4: Puro rotolamento di un disco di raggio R all’interno di un disco
fisso di raggio R0 > R. Il moto avviene nel piano {ex , ey }.
dove er = er (t) è il versore radiale che punta da O a C. Siccome la velocità
angolare del segmento C − O è ϑ̇ez ed er è solidale a questo raggio vettore, dalle
formule di Poisson ricaviamo
v C = (R0 − R)ϑ̇ez ∧ er = (R0 − R)ϑ̇eϑ
dove eϑ := ez ∧ er è un versore tangente alla circonferenza descritta da C nel
suo moto e quindi al disco fisso su cui avviene il rotolamento. D’altra parte,
applicando al disco la formula fondamentale della cinematica rigida abbiamo
v C = v H + ωez ∧ (C − H) = −ωRez ∧ er = −ωReϑ
per cui
(R0 − R)
ϑ̇ :
(6.12)
R
qualora il disco si muovesse sulla guida circolare fissa con C esterno al supporto
si avrebbe
(R0 + R)
ω=−
ϑ̇.
(6.13)
R
ω=−
6.4
Vincoli perfetti
Una distinzione ulteriore dei vincoli si basa sulla potenza dissipata da questi in
un atto di moto virtuale, secondo questa definizione
c (v) delle
Definizione 6.4 Un vincolo è detto perfetto se la potenza virtuale W
reazioni vincolari, cioè la potenza in un atto di moto virtuale del sistema, è
nulla per tutti gli atti di moto virtuali
c (v) = 0 .
W
(6.14)
Spieghiamo perché si ponga l’accento sulla potenza virtuale in questa definizione.
L’obiettivo è quello di individuare una classe sufficientemente generale di vincoli
100
CAPITOLO 6. EQUAZIONI DI LAGRANGE
per i quali sia possibile eliminare ogni riferimento alle reazioni vincolari nelle
equazioni di moto. Il pensiero corre allora subito ai vincoli che non dissipano
potenza nel corso di ogni moto possibile che, con qualche notevole eccezione,
possono essere pensati, per fissare le idee, come vincoli in cui è assente ogni
forma di attrito.
x(t)
ey
ex
b
P
h(t)
O
Figura 6.5: Illustrazione del concetto di potenza virtuale. Il punto P è mobile,
in assenza di attrito, su una guida orizzontale che trasla nella direzione verticale
con legge oraria h = h(t) assegnata.
Consideriamo un punto materiale P mobile Fig. (6.5) su una guida orizzontale che non offra attrito alcuno e supponiamo che il moto avvenga nel piano
{ex , ey }. La reazione vincolare che P sperimenta per effetto della presenza della
guida in questo caso ideale è Φ = φey , se ex indica la direzione della guida.
È chiaro che, in questo caso, non solo la potenza effettiva, che si realizza nel
corso del moto, ma ogni potenza possibile cioè sviluppata in un atto di moto possibile qualsiasi è nulla in quanto v P = vex , con v arbitrario e quindi
(v)
W
= Φ · v = 0. In questo caso, in cui il vincolo è scleronomo, abbiamo ovvia(v)
c (v) = 0. Supponiamo ora che, ferme restando le proprietà del
mente W
=W
contatto tra P e la guida, quest’ultima venga fatta traslare lungo la direzione
ey con legge oraria assegnata: ad esempio, h(t) = h0 (1 + 12 sin ωt). La posizione
di P rispetto ad un’origine fissa è
P − O = x(t)ex + h(t)ey
dove, ancora una volta, x(t) è un’incognita che dipende dalle condizioni iniziali
e dalla sollecitazione cui è sottoposto il punto P , mentre h(t) è nota a priori.
Poiché v P = ẋ(t)ex + ḣ(t)ey , l’atto di moto possibile è
v P = vex + ḣ(t)ey
ed ora la potenza possibile delle reazioni vincolari è
W
(r)
= Φ · v P = ḣ(t)Φ 6= 0
bP = b
mentre la potenza virtuale, essendo v
v ex è nulla e quindi, richiedere perfezione del vincolo nel senso della definizione (6.4) permette di eliminare il riferimento alla reazione vincolare nel calcolo della potenza. Questo fatto sarà
sfruttato nella prossima sezione per dedurre delle equazioni pure di moto, in cui
cioè sono assenti le reazioni vincolari.
101
6.5. EQUAZIONI DI LAGRANGE
6.5
Equazioni di Lagrange
Seguiamo la via tradizionale che fa discendere le equazioni di Lagrange per un
sistema composto da N punti materiali (Pi , mi ) dotati di n ≤ 3N gradi di
libertà dall’ipotesi di vincoli olonomi e perfetti. La prima ipotesi permette di
scrivere i vettori posizione ri dei punti materiali rispetto ad un’origine fissata
O nella forma (6.1), dove la dipendenza esplicita dal tempo viene mantenuta,
volendo abbracciare sia i vincoli scleronomi che quelli reonomi. Come accennato
nell’introduzione al capitolo, l’ipotesi di vincoli perfetti consente di ottenere
equazioni pure di moto, in cui non figurano reazioni vincolari. Per determinare
le reazioni vincolari nel corso del moto si può far ricorso, una volta determinato
esplicitamente il moto del sistema, alle equazioni cardinali della dinamica.
Partiamo allora dalle equazioni di moto per i punti Pi
mi ai = F i + ϕi
i = 1, ..., N
dove F i indica la forza attiva risultante agente su Pi e ϕi la forza reattiva
risultante agente su Pi . Se moltiplichiamo scalarmente ogni equazione di moto
per la velocità virtuale (6.7) v̂ i del corrispondente punto materiale otterremo
mi ai · v̂ i = F i · v̂ i
(6.15)
dove non figurano contributi delle forze reattive, grazie all’ipotesi di perfezione
dei vincoli. Se sommiamo le N equazioni (6.15) e sostituiamo l’espressione (6.7)
delle velocità virtuali, arriviamo a
N X
n
X
N
mi a i ·
i=1 j=1
n
XX
∂ri
∂r i
v̂j =
Fi ·
v̂j .
∂qj
∂qj
i=1 j=1
(6.16)
Definiamo la j-esima componente generalizzata delle forze Qj come
Qj :=
N
X
i
Fi ·
∂r i
:
∂qj
(6.17)
con questa definizione possiamo riscrivere (6.16) nella forma
N X
n
X
i=1 j=1
n
mi ai ·
X
∂ri
v̂j =
Qj v̂j
∂qj
j=1
(6.18)
e procedere esaminando la struttura del membro di sinistra. Anzitutto osserviamo che, se j è un indice qualsiasi j = 1, ..., n,
∂ri
∂v i
=
:
∂qj
∂ q̇j
(6.19)
è sufficiente derivare (6.5) rispetto a q̇k , osservare che le funzioni r i non dipendono dalle q̇k e che ∂∂q̇q̇kj = δjk .
102
CAPITOLO 6. EQUAZIONI DI LAGRANGE
Notiamo ancora che
∂ri
∂ri
d
ai ·
= v̇ i ·
=
∂qj
∂qj
dt
∂r i
d ∂r i
vi ·
− vi ·
,
∂qj
dt ∂qj
dove nell’ultimo passaggio abbiamo usato la regola di derivazione del prodotto.
Se ora deriviamo (6.5) rispetto a qj otteniamo
n
X
∂v i
∂ 2ri
∂ 2 ri
d ∂r i
=
q̇k +
=
,
∂qj
∂qj ∂qk
∂t∂qj
dt ∂qj
k=1
come si può verificare ricordando la definizione di derivata totale di una funzione.
In definitiva, usando (6.19) possiamo scrivere
∂r i
d
∂vi
∂v i
ai ·
=
vi ·
− vi ·
∂qj
dt
∂ q̇j
∂qj
che, sostituita in (6.18), fornisce
n X
N X
j=1 i=1
mi
d
dt
X
n
∂vi
∂v i
Qj v̂j .
vi ·
− vi ·
v̂j =
∂ q̇j
∂qj
j=1
(6.20)
Per procedere, ricordiamo che l’energia cinetica di un sistema di N punti materiali ha l’espressione
N
1X
T =
mi v i · v i
2 i=1
per cui abbiamo
d
dt
e
∂T
∂ q̇j
N
X
d
=
mi
dt
i=1
∂v i
vi ·
∂ q̇j
N
X
∂T
∂v i
=
mi v i ·
.
∂qj
∂qj
i=1
Sostituendo queste espressioni in (6.20) otteniamo
n X
d ∂T
∂T
−
− Qj v̂j = 0 .
dt ∂ q̇j
∂qj
j=1
Poiché queste equazioni debbono valere per tutte le scelte delle quantità v̂j ,
mutuamente indipendenti, deve essere
d ∂T
∂T
−
− Qj = 0 ∀j = 1, ..., n.
(6.21)
dt ∂ q̇j
∂qj
È chiaro che in questo passaggio si sta supponendo di non trovarsi in una configurazione di confine, altrimenti l’arbitrarietà degli scalari v̂j non sarebbe completa.
103
6.5. EQUAZIONI DI LAGRANGE
Osservazioni. Supponiamo che le forze F i siano conservative, cioè esistano
funzioni Vi tali che
F i = −∇Vi ∀i = 1, ..., N .
In questo caso è possibile dare una forma compatta alle Qj e scrivere le equazioni di Lagrange in una forma più compatta. Se {xi , yi , zi } sono le coordinate
cartesiane dell’i-esimo punto materiale del sistema, possiamo scrivere
r i = xi (q1 , ..., qn )ex + yi (q1 , ..., qn )ey + zi (q1 , ..., qn )ez ;
Poiché
∇Vi =
∂Vi
∂Vi
∂Vi
ex +
ey +
ez
∂xi
∂yi
∂zi
abbiamo
P
PN
∂xi (q1 ,...,qn )
∂ ri
Qj = N
ex +
i=1 F i · ∂qj = −
i=1 ∇Vi · [
∂qj
=−
PN
∂Vi ∂xi (q1 ,...,qn )
i=1 ∂xi
∂qj
+
∂Vi ∂yi (q1 ,...,qn )
∂yi
∂qj
+
∂yi (q1 ,...,qn )
ey
∂qj
∂Vi ∂zi (q1 ,...,qn )
∂zi
∂qj
= − ∂q∂ j
+
∂zi (q1 ,...,qn )
ez ]
∂qj
PN
i=1
Vi ,
dove l’ultimo passaggio è conseguenza della regola di derivazione per funzioni
composte. Se definiamo l’energia potenziale totale V come
V (q1 , ..., qn ) :=
N
X
Vi
i=1
possiamo infine scrivere
Qj = −
∂V
∂qj
∀ j = 1, ..., n.
Poiché la funzione V non dipende dalle velocità generalizzate, deve essere anche
∂V
= 0 ∀j = 1, ..., n;
∂ q̇j
introdotta la funzione lagrangiana L := T − V , poiché
∂T
∂L
=
∂ q̇j
∂ q̇j
possiamo riscrivere le equazioni di Lagrange nella forma
d ∂L
∂L
=
∀j = 1, ..., n .
dt ∂ q̇j
∂qj
(6.22)
Supponiamo ora che una delle coordinate, ad esempio qj per un certo valore di j, non compaia esplicitamente nell’espressione di L. La corrispondente
equazione di Lagrange diventa
d ∂L
=0
dt ∂ q̇j
=
104
CAPITOLO 6. EQUAZIONI DI LAGRANGE
da cui segue che
pj :=
∂L
= costante :
∂ q̇j
l’analisi della funzione L è dunque un mezzo rapido per ottenere delle quantità
che si conservano nel corso del moto. Una coordinata qj che non compare
esplicitamente in L è detta coordinata ciclica od ignorabile e la corrispondente
quantità conservata pj è detta momento canonicamente coniugato a qj . È anche
possibile dimostrare che, se L non dipende esplicitamente dal tempo, cioè se
∂L
∂t = 0, allora la quantità
H :=
n X
∂L
j=1
∂ q̇j
q̇j − L
è costante nel corso del moto. La quantità H è detta hamiltoniana del sistema
ed in molti casi coincide con l’energia meccanica totale del sistema. Dunque
il formlismo lagrangiano è in grado di fornire immediatamente le espressioni
degli integrali primi del moto purché si sappia individuare una variabile ciclica.
Il significato fisico di questi integrali primi può essere desunto dalle leggi di
conservazione dedotte in precedenza.
Osservazione. Abbiamo scritto le equazioni (6.22) per una scelta particolare
di coordinate {q1 , ...qn }. Se avessimo deciso di descrivere il sistema attraverso
un’altra scelta di n coordinate lagrangiane {u1 , ..., un } legate alle {q1 , ...qn } da
una trasformazione invertibile, le equazioni di Lagrange avrebbero assunto la
forma
d ∂L
∂L
=
∀j = 1, ..., n
dt ∂ u̇j
∂uj
del tutto analoga a quella (6.22). Concludiamo cosı̀ che le equazioni di Lagrange
si scrivono allo stesso modo, qualunque sia la scelta di coordinate operata.
Osservazione. Il vincolo di puro rotolamento richiede la presenza di attrito tra i
corpi che rotolano senza strisciare uno sull’altro. Nonostante questo, il vincolo di
puro rotolamento è perfetto perché la velocità relativa tra i due corpi a contatto
è nulla e quindi la potenza virtuale risulta nulla.
Osservazione. Altre forze per le quali è possibile fornire un’espressione compatta
delle Qj sono le forze viscose, cioè forze del tipo
F i = −γi v i
che si oppongono al moto del punto materiale i-esimo. I coefficienti γi > 0 sono
dei coefficienti di viscosità. L’espressione delle Qj corrispondenti a forze viscose
è, ricordando che ∂∂qrji = ∂∂vq̇ji ,
N
X
N
N
X
∂ri
∂vi
1 ∂ X
Qj =
Fi ·
= Qj = −
γi v i ·
=−
γi vi2 ,
∂q
∂
q̇
2
∂
q̇
j
j
j i=1
i=1
i=1
105
6.5. EQUAZIONI DI LAGRANGE
dove vi2 = v i ·v i . Introducendo la funzione di dissipazione o funzione di Rayleigh
R definita come
N
X
γi 2
R :=
v
2 i
i=1
abbiamo
Qj = −
∂R
.
∂ q̇j
Come prima applicazione del formalismo lagrangiano, diamo una caratterizzazione delle configurazioni di equilibrio ordinarie per sistemi soggetti a vincoli
olonomi e perfetti, premettendo la seguente
Definizione 6.5 Una configurazione ordinaria di un sistema olonomo a vincoli
perfetti corrispondente ai valori q1 = q10 , q2 = q20 ,..., qn = qn0 delle coordinate
lagrangiane {q1 , ...qn } è detta di equilibrio se, posto il sistema inizialmente nella
configurazione {q10 , ...qn0 } in quiete, il sistema vi permarrà in quiete in tutti gli
istanti successivi.
Formalmente, se t = 0 è l’istante iniziale, una configurazione {q10 , ...qn0 } è di
equilibrio se, sapendo che
q1 (0) = q10 , ...., qn (0) = qn0
q̇1 (0) = 0, ...., q̇n (0) = 0
avremo
q1 (t) ≡ q10 , ..., qn (t) ≡ qn0 ∀t ≥ 0 .
Se un sistema è in quiete in una configurazione di equilibrio q1 = q10 , q2 = q20 ,...,
qn = qn0 allora la sua energia cinetica è nulla e dalle equazioni di Lagrange (6.21)
segue che
Qj (q10 , q20 , ..., qn0 ) = 0 ∀j = 1, ..., n;
Viceversa, se Qj = 0 in una configurazione q1 = q10 , q2 = q20 ,..., qn = qn0 e se le
equazioni di Lagrange ammettono un’unica soluzione quando sono specificati i
valori delle qi e delle q̇i all’istante iniziale, poiché
q1 (t) ≡ q10 , ..., qn (t) ≡ qn0
è soluzione delle equazioni di Lagrange, la configurazione q1 = q10 , q2 = q20 ,...,
qn = qn0 è di equilibrio. Pertanto abbiamo caratterizzato le configurazioni di
equilibrio per un sistema olonomo come i punti tali che
Qj (q10 , q20 , ..., qn0 ) = 0
∀j = 1, ..., n .
Se tutte le forze attive sono conservative i punti di equilibrio risolvono le equazioni
∂V
= 0 ∀j = 1, ..., n
∂qj
o, con espressione compatta,
∇V = 0 ,
dove si intende che il gradiente è ottenuto calcolando le derivate rispetto alle
coordinate generalizzate che descrivono il sistema.
Scarica

Equazioni di Lagrange