La teoria relativistica
dell’elettrone
Salice Terme
29.11.2004 – 4.12.2004
L’equazione di Schrödinger:
una strada per capirne la struttura
Pisa
1.12.2003 – 6.12.2003
La forma più generale dell’equazione è

i
 H
t
nella quale H è l’hamiltoniano, somma
degli operatori per l’energia cinetica, T,
e potenziale, V;
dove, mentre V è una funzione
delle coordinate spazio-temporali,
V  V ( x, y, z, t )
T è l’operatore differenziale
2 2
2  2
2
2 
 2  2  2 

 
2m
2m  x y
z 
Alla prima pagina di testo effettivo di un vecchio ma vigoroso
trattato di teoria quantistica dei campi (S.S. Schweber, H.A.
Bethe, F. de Hoffman, Mesons and Fields, Row, Peterson
& Co., Evanston/New York, 1956), si legge che l’equazione
per una particella libera,

2 2
i


t
2m
si può ottenere dalla
p2
E
2m
rimpiazzando

E  i
t

p  i
Osservato che la cosa è banalmente vera, ci si domanda che
cosa c’è sotto. La questione è opportunamente discussa per il
caso mono-dimensionale, cioè per l’equazione

 2  2
i

t
2m x 2
Si fa propria l’ipotesi di de Broglie che “alle particelle siano
associate delle onde”, e che le proprietà ondulatorie siano legate
a quelle corpuscolari dalle relazioni
T  E  h  
p
h

 k
L’equazione d’onda sarà un’equazione alle derivate parziali,
alla quale chiediamo di avere soluzioni monocromatiche, per
esempio della forma:
u ( x, t )  cos( kx  t )
Si mostra allora che
- deve figurarvi una derivazione del primo ordine rispetto al tempo
- e del secondo ordine rispetto alla coordinata spaziale
- che a coefficiente della prima deve figurare un fattore i
- che devono figurarvi m e h nella forma prevista
- In conclusione, che l’equazione deve proprio avere quella forma,
o, che è dire la stessa cosa, che essa si può proprio ottenere
rimpiazzando E e p con gli operatori differenziali di cui sopra.
L’equazione di Klein-Gordon
L’equazione di Schrödinger, in quanto basata sulla
p2
E
2m
non è relativistica. D’altra parte ora sappiamo che la ricetta
di Schweber, Bethe, de Hoffman,
T  E  h  
p
h

 k
è legittima. Utilizziamola partendo dalla relazione relativistica
2
E
2
2 2
  p m c
c
Otteniamo subito l’equazione, detta di Klein-Gordon,
2 2
 2 2 ( )   2 2 ( )  m 2c 2 ( )
c t
o, in notazione più compatta,
 2 1 2 
mc2
   2 2    2 
c t 


L’equazione presenta alcune difficoltà interpretative.
Nel caso dell’equazione di Schrödinger,
   ( x, y , z , t )
2
rappresenta la densità di probabilità di trovare la particella. La
probabilità di trovarla nel volume dV all’istante t è data dalla
 dV   x, y, z , t  dV
2
La probabilità deve conservarsi. Se definiamo la corrente di
probabilità come


   
j
2mi
segue dall’equazione di S. che vale l’equazione di continuità

 / t  div j  0
Nel caso dell’equazione di Klein-Gordon, se definiamo analogamente


  
j
2mi

segue dall’equazione stessa che vale l’equazione di continuità

 / t  div j  0
ma con una densità di probabilità data dalla
i    




2 
2mc  t
t 
Ma allora la ρ può assunmere anche valori negativi, poiché sia la
funzione d’onda sia la sua derivata prima possono essere prescritte
arbitrariamente a un dato istante t, essendo l’equazione del secondo
ordine.
Perché un’equazione del prim’ordine?
L’equazione di Dirac
Nel 1928 Dirac introdusse un’equazione d’onda relativisrtica
che evitava le probabilità negative che emergevano in
relazione all’equazione di Klein-Gordon.
Allo scopo, bisogna evitare che compaiano derivate prime
nell’espressione per ρ. Ma allora non devono comparire
derivate temporali di ordine superiore al primo nell’equazione
stessa.
Ora, secondo i dettami relativistici, ci deve essere perfetta
simmetria fra x,y,z, e ct. L’equazione deve quindi essere
del prim’ordine anche nelle derivate rispetto alle coordinate
spaziali.
Se non dovesse contenere altro che termini derivati, l’equazione
dovrebbe quindi avere la forma
1  3

  k k  0
c t k 1 x
dove le α sono coefficienti numerici e 1/c è introdotto per
ragioni dimensionali (che poi la velocità sia proprio c è dettato
dalla considerazione che la teoria che si vuol costruire è
relativistica).
Ma niente vieta che l’equazione possa contenere anche un termine
non derivato. Ora, i termini introdotti hanno coefficienti delle
dimensioni dell’inverso di una lunghezza. Tali dovranno essere
anche quelle del coefficiernte della ψ nel termine non derivato.
La costante con le dimensioni dell’inverso di una lunghezza si potrà
costruire, al più, con le costanti universali caratteristiche di una
teoria quanto-relativistica, e cioè c ed h; e con quello che appare
come un dato specifico ed ineliminabile del problema: la massa m
dell’elettrone. Si verifica che le dimensioni corrette sono date dal
rapporto mc/h.
Si approda dunque alla formula:
1  3
 imc
  k k 
  0
c t k 1 x

nella quale si è considerata la possibilità di un coefficiente
numerico β, sullo stesso piano dei coefficienti α, si è estratto per
convenienza un fattore i, e si è usata la costante di Planck
razionalizzata invece di quella ordinaria.
Il passo successivo è l’intuizione da parte di Dirac che la la
funzione d’onda possa (debba) avere più componenti.
Nella
1  3
 imc
  k k 
  0
c t k 1 x

La ψ deve allora essere pensata come una matrice colonna. Le α e
la ß saranno allora matrici quadrate. Se, per fare un esempio, la ψ
avesse due componenti, ß ψ si costruirebbe effettuando il prodotto
 11 12   1 

  
  21  22   2 
Interpretazione probabilistica
Vogliamo ora introdurre la densità di probabilità e la densità di
corrente associate al’equazione. Poiché vogliamo restare il più
vicino possibile alla forma consueta per la prima, poniamo
N
N
i 1
i 1
   i * i    1   
2

dove i distingue le componenti della funzione d’onda, N ne indica
il numero; l’asterisco indica la complessa coniugazione e la croce
la coniugazione hermitiana. Nell’ultima espressione ψ denota la
matrice colonna delle componenti; la sua coniugata hermitiana è la
matrice riga delle complesse coniugate delle componenti.
La densità di probabilità è così sempre definita positiva.
La forma generale di questa equazione si può ottenere moltiplicando
l’equazione a sinistra per la coniugata hermitiana della funzione
d’onda , la coniugata hermitiana dell’equazione a destra per la
funzione d’onda stessa e sommando membro a membro. Se si vuole
avere un’equazione della forma

1      


     j  0
c
t
t

si deve richiedere
  
Se d’altra parte si vuole ottenere un termine in forma di divergenza di
un vettore si deve anche avere
ossia tutte le matrici

k  k
devono essere
hermitiane
Con questa scelta la forma della densità di corrente è
univocamente individuata come:
j  c  
k

k
Sarà forse opportuno sottolineare che, per ogni valore di k, ciò
che figura a secondo membro è il prodotto fra la matrice riga
delle complesse coniugate delle componenti e la matrice
colonna che risulta dalla moltiplicazione della matrice α per quel
valore di k per la matrice colonna della funzione d’onda, dunque
un numero, il valore della componente k del vettore densità di
corrente.
Formulazione hamiltoniana
L’equazione
1  3
 imc
  k k 
  0
c t k 1 x

può essere posta in forma hamiltoniana. Moltiplicando membro
a membro per icħ, essa può essere infatti riscritta come
3

 
2
i
  c k


mc
 0
k
t k 1
i x
o ancora come

i
 H
t
con
 
H  c    mc 2
i
La necessità di rispettare la relazione
relativistica fra energia e impulso
Ci si domanderà a questo punto dove sia finito il requisito che
un’equazione d’onda relativistica deve rispecchiare la relazione
2
E
2
2 2
  p m c
c
La risposta è che deve ancora – e può – essere imposto: semplicemente
richiedendo che la funzione d’onda ψ soddisfi all’equazione di K.-G.
A questo scopo, si moltiplichi l’equazione
1
imc
1  3
 imc
k 
per
 


  k k 
  0
k
c t k
x

c t k 1 x

Si ottiene così un’equazione del secondo ordine che deve essere
soddisfatta dalla funzione d’onda. Si verifica che essa si riduce
a quella di Klein-Gordon se le matrici α e β soddisfano alle
condizioni:
1 k l
    l k    kl
2
k
k
     0
 
k 2
  1
2
dove a secondo membro si sottindente una matrice identità.
In conclusione, le matrici devono anticommutare fra loro ed avere
quadrato unità.
Aspetti formali
Sulla base delle proprietà stabilite per le matrici α e β si possono
raggiungere le seguenti conclusioni:
- le matrici hanno traccia nulla
-devono essere di dimensionalità pari
0  k 
Le matrici  k  
  0 
 k

dove
 0 1

 x  
1 0 
 I 0

  
0 I 
0  i

 y  
 i 0
soddisfano a tutte le condizioni.
1 0 

 z  
 0 1
Si può rendere più simmetrico il ruolo delle derivate temporale
e spaziali nella
1  3
 imc
  k k 
  0
c t k 1 x

moltiplicandola a sinistra membro a membro per β; si ottiene la
1  3
 imc

   k k 
 0
c t k 1
x

che assume una forma più simmetrica se si pone:
 
0
 k   k
( k  1,2,3)

Si noti che mentre la
0
resta hermitiana, le altre matrici γ
sono anti-hermitiane:
( k )    k
( k ) 2  1
Le γ soddisfano alle regole di commutazione:
      2 I





In termini delle matrici γ l’equazione si scrive ora:
 mc
  i

 0

 0
x

3

O ancora, moltiplicando membro a membro per ħ, sottintendendo
(convenzione di Einstein) la sommatoria sull’indice μ ripetuto)
e scrivendo

  

x
(i    mc )  0

o anche, ponendo
i    p 
( p  mc )  (  p  mc )  0


Ritorniamo alla
 
0
 k   k
( k  1,2,3)
Moltiplicando la seconda a sinistra per β, e ricordando che β
è a quadrato unità, otteniamo
  
k
k
La
j  c  

k
k
si riscrive
j  c    c  
k

k
k
avendo introdotto l’“aggiunta” della funzione d’onda, definita dalla
  

0
D’altra parte, ricordando che è a quadrato unità anche  0
possiamo scrivere
        


0
0
e quindi scrivere globalmente
j  


0
L’invarianza di Lorentz
L’equazione di Dirac è stata introdotta in conformità al dettame
relativistico per il quale ci deve essere perfetta simmetria fra
x,y,z, e ct. Da qui la scelta che l’equazione fosse del prim’ordine
nelle derivate rispetto a tutte le coordinate. Questa condizione è
necessaria ma non appare immediatamente sufficiente a
garantirne l’invarianza di Lorentz. Di più, si tratta di stabilire
quali siano le regole di trasformazione per quantità come la
quadri-corrente
j  


e per la stessa funzione d’onda e la sua aggiunta.
Ci limitiamo a menzionare le cose più importanti:
-le matrici dovranno restare inalterate
-la funzione d’onda trasformata, ψ’, dovrà ottenersi dalla ψ
in termini di una trasformazione lineare: ψ’=S ψ
-allora la matrice di trasformazione S deve soddisfare alla
condizione
S  S    
1




dove la Λ è la matrice della trasformazione di Lorentz
x      x 

Quanto all’aggiunta della funzione d’onda, sotto trasforrmazioni
ortocrone si trasforma secondo la
 'S
1
Si verifica allora che le componenti della quadri-corrente
j  


si trasformano come quelle di un quadri-vettore (uno pseudovettore sotto inversione del segno del tempo).
Soluzioni piane
Come l’equazione di Klein-Gordon, anche quella di Dirac
ammette soluzioni in termini di onde piane della forma:
 ( x )  u ( p )e
 ip x / 
o, nel linguaggio delle componenti
 j ( x )  u j ( p )e
 ip x / 
Esse sono autofunzioni degli operatori associati all’energia
e all’impulso.
Sostituendole, insieme con la forma esplicita delle matrici α e β,
nell’equazione di Dirac si ottiene un sistema lineare omogeneo
di quattro equazioni con incognite le componenti della funzione
d’onda u, che ha soluzione solo se il determinante è uguale a zero.
Ora, il determinante vale
E
2
 p c m c
2 2

2 4 2
e il suo annullamento esprime correttamente la relazione tra E e p.
Si ottengono soluzioni esplicite per ogni impulso p scegliendo
un segno per l’energia. Scegliamo il segno positivo:
E  ( p 2c 2  m 2c 4 )1/ 2

Sia u ( p) una tale soluzione . Ricordando l’hamiltoniana
 
H  c    mc 2
i
o
 
2
H  c  p  mc

u ( p )
ne sarà un’autosoluzione:
 



(c  p  mc )u ( p)  E ( p)u ( p)
u


Scriviamo u ( p )   1  dove le due componenti hanno a

 u  loro volta due componenti.
 2
Si verifica che u1 e u2 obbediscono alle equazioni seguenti:
 

2
c  pu2  mc u1  E ( p )u1
 

2
c  pu1  mc u2  E ( p )u2
Dalla seconda otteniamo
 
p
u2  c 
u
2 1
E ( p)  mc
Si verifica che la prima equazione è allora soddisfatta identicamente.
Ci sono dunque due soluzioni linearmente indipendenti per ogni
impulso p. Possiamo sceglierle ponendo altermativamente
1 
 0
u1    o u1   
 0
1 
Una forma esplicita per le due soluzioni è la




1


(1) 

u ( p)  
0


 
 c  p 1 
 E ( p )  mc 2  0 
 





0


( 2) 

u ( p )  
1


 
 c  p  0 
 E ( p )  mc 2 1 
 

(è omessa la normalizzazione, determinata dalla condizione u*u=1)
Nel limite non relativistico la seconda coppia di componenti è
piccola dell’ordine v/c rispetto alla prima.
Lo spin
Un operatore arbitrario F è una costante del moto se commuta
con l’hamiltoniana, cioè se:
[H , F ]  0
Il momento angolare orbitale
   
L  r  p  r 
i
non commuta con l’hamiltoniana
 
H  c    mc 2
i
Con l’hamiltoniana di Dirac commuta invece la somma
  1 
J  L  
2
il cui secondo termine è l’operatore di spin nel caso di uno
“spin ½”.
L’equazione di Dirac non è la più generale ’equazione d’onda
relativistica: essa descrive (relativisticamente) particelle di spin
spin ½.
Vogliamo vedere le cose più in dettaglio, soprattutto in relazione
al fatto che, per la descrizione di una particella di spin 1/2, sembra
bastare una funzione d’onda a due componenti.
Vediamo perché. La determinazione della componente dello spin
di una particella di spin ½ lungo una qualsiasi direzione dà come
risultato o +1/2 o –1/2. Denotati come
1 1
1 1
,
e ,
2 2
2 2
gli stati corrispondenti, lo stato generico di una particella di spin
½ è sempre espresso nella forma
1 1
1 1
  c1 ,  c1 ,
2 2
2 2
dove le c sono numeri complessi il cui modulo quadro esprime la
probabilità di trovare la particella con l’una o l’altra orierntazione
dello spin; essi saranno in generale funzioni delle coordinate, e si
identificheranno con le due componenti della funzione d’onda.
Interazioni con un campo
elettromagnetico
Il problema che ci siamo posti è meglio affrontato considerando
la particella in interazione con un campo elettromagnetico, cosa
che, evidentemente, è di per sé interessante.
Come introdurre una tale interazione? La prescrizione è di
sostituire nell’hamiltoniana della particella libera
 
2
H  c  p  mc
e 
l’impulso secondo la p  p  A
c


dove le A sono le componenti del quadri-potenziale e si è attribuita
la carica e alla particella.
La sostituzione è quanto si deve fare per introdurre l’interazione
elettromagnetica nelle equazioni classiche del moto di una
particella carica. Il principio di Hamilton porta infatti allora
a equazioni di Eulero-Lagrange che descrivono una particella
di carica e soggetta a una forza di Lorentz (K. Moriyasu, An
Elementary Primer for Gauge Theory, World Scientific, 1983,
p. 15 segg.).
Quantisticamente, all’hamiltoniana libera si aggiunge ora un
termine d’interazione
 
H '  e  A  e
Le matrici cα appaiono qui il corrispettivo delle componenti della
velocità nell’espressione classica del termine d’interazione
e 
H '   v  A  e
c
La corrispondenza

c  v
è d’altra parte conforme alla scrittura della probabilità di corrente
come
j  c  
k
Con
 
H  c  p  mc 2

k
che diventa ora
   e 
2
H  c   p  A    mc  e
c 

... l’equazione di Dirac informa hamiltoniana diventa ora:
  e 

i
 [c  ( p  A)  mc 2  e ]
t
c
Utilizzando la forma esplicita introdotta per le matrici α e β, e
ponendo

~ 
 
   ~
  p  (e / c) A

 
si ottiene
~

~ 

   ~ 
 ~ 
ì  ~   c    ~   e  ~   mc 2  ~ 
t   
 
 
  
L’evoluzione temporale delle soluzioni piane è retta dal fattore
e
 ( iE /  ) t
e
[ i ( mc2 T ) /  ]t
Nel limite non relativistico domina il termine di massa; si potrà
scrivere allora
~


 
 ( imc /  ) t  
 ~   e
 
 
 
2
dove ora φ e χ sono funzioni del tempo lentamente variabili.
Effettuando la derivazione nel termine
~




i  ~ 
t   
si approda all’equazione:
0
 
   
  
2 
i    c      e    2mc  
t   
 
 
 
in effetti un sistema di due equazioni differenziali accoppiate.
Se nella seconda
 

i
 c    e  2mc 2 
t
trascuriamo la debole dipendenza temporale e consideriamo
una debole energia d’interazione eΦφ, otteniamo
 
 


2mc
Sostituendo nella prima equazione otteniamo la
   
       

i

 e 
t 
2m

Sfruttando l’identità
        
  a   b  a  b  i  (a  b )
 
ricordando che p   , che il prodotto π x π non si
i


annulla perché va considerata l’azione di   A e di A  
su φ e che

 
  A  rot A  B
l’equazione prende la forma:
 2


( p  (e / c) A)
e  
i
[

  B  e ]
t
2m
2mc
nella quale si riconosce l’equazione di Pauli per l’elettrone.
L’equazione di Dirac costituisce dunque un’estensione relativistica
della trattazione standard delle particelle di spin ½. In quest’ultima
gli stati sono descritti in termini di “spinori” - funzioni d’onda a due
componenti - che bastano a render conto dei due gradi di libertà di
spin di tali particelle. La trattazione relativistica deve invece far uso
di spinori a quattro componenti.
Per il caso di un debole campo magnetico uniforme l’equazione può
essere posta nella forma
 

p2
e 
i
[

( L  2S )  B]
t
2m 2mc
 1 
dove L è il momento orbitale e S  
2
lo spin.
A un momento angolare L=ħ corrisponde in generale un valore
del momento magnetico di
e
2mc
(si dice allora che il rapporto giromagnetico g vale 1). Il valore
di g per il momento magnetico intrinseco – quello legato allo spin –
per l’elettrone deve valere 2 per rendere conto dell’effetto Zeeman.
Il risultato è correttamente ottenuto dalla teoria di Dirac, come si
controlla sull’ultima formula, nella quale a L è sommato 2S.
Il problema delle energie negative
Ritorniamo alle soluzioni piane dell’equazione di Dirac. Sostituendo
una tale soluzione della forma
 ( x )  u ( p )e
 ip x / 
nell’equazione di Dirac si ottiene, come si ricordava, un sistema
lineare omogeneo di quattro equazioni con incognite le componenti
della funzione d’onda u. Come pure si ricordava, si ottengono
soluzioni esplicite per ogni impulso p scegliendo un segno per
l’energia nella
E  ( p c  m c )
2 2
2 4 1/ 2
Abbiamo discusso le due soluzioni linearmente indipendenti che
si ottengono scegliendo il segno +. Ma accanto a queste ci sono
due analoghe soluzioni scegliendo il segno – .
Soluzioni ad energia negativa presentano ovvie difficoltà interpretative. Potremmo non dar loro troppo peso se non ci fosse una
probabilità di transizione finita a stati di energia negativa; in tal
caso, una particella ad energia positiva rimarrebbe sempre in
un tale stato. Ma la teoria quantistica prevede la possibilià di una
tale transizione in presenza di un campo esterno.
Nel 1930 Dirac propose una soluzione in termini della sua “hole
theory”, secondo la quale gli stati ad energia negativa sarebbero
di norma tutti occupati, con uno ed un solo elettrone in ogni stato
secondo il principio d’esclusione di Pauli. Lo stesso principio rende
impossibile la transizione a stati di energia negativa, a meno che ...
A meno che uno di essi non sia stato in qualche modo vuotato.
Un tale stato ad energia negativa “apparirebbe come qualcosa
avente energia positiva, poiché, per farlo scomparire, vale a dire
per riempirlo, dovremmo aggiungere ad esso un elettrone ad
energia negativa”. Per ragione analoga, la “hole” dovrebbe avere
carica opposta a quella dell’elettrone.
Va allora sottolineato che per interpretare la teoria in presenza di
interazioni si è forzati a una formulazione a molte particelle nella
quale il numero delle particelle non è conservato, cioè a una
teoria quantistica di campo.
Quando Dirac formulò la sua teoria le particelle cariche per così
dire a disposizione erano l’elettrone e il protone, e venne naturale
(anche allo stesso Dirac) pensare che la particella di carica più
che la teoria associava all’elettrone non fosse altro che il protone.
Oppenheimer (1930) e Weyl (1931) dimostrarono però che la
particella doveva avere la stessa massa dell’elettrone. Poiché
nulla di simile esisteva, nel 1931 Pauli considerò la cosa come
una manchevolezza della teoria di Dirac.
Ma già nel 1932 Anderson scoprì il posit(r)one.
Acquisivano allora piena legittimità i processi di creazione di
coppie eletrone-positrone e di annichilazione di una coppia:
Scarica

La teoria relativistica dell`elettrone