Approccio Computazionale alla Nanomineralogia Mauro Prencipe Note per la Scuola GNM: Proprietà ed applicazioni dei Minerali alla Nanoscala Otranto (Lecce) 14-18 Giugno 2004 Indice 1 Premesse fisico-matematiche 1.1 Stati di un sistema . . . . . . . . . . . . . . . 1.2 Variabili dinamiche . . . . . . . . . . . . . . . 1.3 Misure . . . . . . . . . . . . . . . . . . . . . . 1.4 Rappresentazioni . . . . . . . . . . . . . . . . 1.5 Relazioni di commutazione . . . . . . . . . . . 1.6 Principio di Corrispondenza . . . . . . . . . . 1.6.1 Un esempio semplice: la particella nella 1.7 Momento Angolare . . . . . . . . . . . . . . . 1.7.1 Un esempio: Lo spin dell’elettrone . . . 1.8 Autovettori del momento angolare . . . . . . . 1.9 Equazioni del moto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . scatola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Applicazioni a sistemi atomici e molecolari 2.1 L’atomo di idrogeno . . . . . . . . . . . . . . . . . . . . . . . 2.2 Il Principio di Antisimmetria . . . . . . . . . . . . . . . . . . . 2.3 Sistemi multielettronici . . . . . . . . . . . . . . . . . . . . . . 2.4 Sistemi multinucleari . . . . . . . . . . . . . . . . . . . . . . . 2.5 L’energia elettronica nell’approssimazione monodeterminantale 2.6 Energia di correlazione . . . . . . . . . . . . . . . . . . . . . . 2.7 Metodo Variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 5 6 9 10 12 13 15 17 17 . . . . . . . 19 19 20 21 24 26 29 30 3 Spazio di Fock e seconda quantizzazione 3.1 Rappresentazione dello stato di un sistema nello spazio di 3.2 Operatori nello spazio di Fock . . . . . . . . . . . . . . . 3.3 Equazioni di Hartree-Fock . . . . . . . . . . . . . . . . . 3.4 Funzioni base . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Un esempio: la molecola H2 . . . . . . . . . . . . Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 32 34 37 40 42 4 Applicazione alle strutture cristalline 4.1 Simmetria . . . . . . . . . . . . . . . 4.1.1 Un esempio: il gruppo 4 . . . 4.2 Simmetria traslazionale . . . . . . . . 4.3 Hartree-Fock periodico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 43 46 48 50 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Capitolo 1 Premesse fisico-matematiche 1.1 Stati di un sistema In meccanica quantistica, lo stato di un sistema è specificato da un vettore di stato che contiene in sé tutte le informazioni sul sistema stesso, in linea di principio misurabili. Il generico stato del sistema viene identificato dal simbolo | i e denominato vettore ket (notazione e nomenclatura dovuta a Dirac). Quando si faccia riferimento a un qualche stato particolare, è d’uso etichettarlo con una lettera posta entro il simbolo ket; per esempio |Ai è il vettore ket che descrive un dato sistema nello stato A. Ai vettori ket possono farsi corrispondere dei vettori bra, di simbolo generico h |; i bra sono definiti implicitamente da equazioni del tipo hA|Bi = c (1.1) dove, con la notazione hA|Bi si intende il prodotto scalare tra i vettori |Bi e hA|, essendo quest’ultimo il bra corrispondente (immaginario coniugato) al ket |Ai e c un numero in generale complesso. Un’espressione h | i (o, più in generale, h· · · i) viene chiamata braket ed è quindi un numero (infatti è il prodotto scalare tra due vettori). I vettori ket possono essere moltiplicati per dei numeri (in generale complessi); si assume che gli stati corrispondenti ai vettori |Ai e c|Ai siano coincidenti. Lo stesso dicasi per i vettori bra. Il bra corrispondente al ket c|Ai è hA|c, dove c indica il complesso coniugato di c. I vettori ket possono essere sommati per ottenere altri vettori ket, es.: |Ci = c1 |Ai + c2 |Bi (1.2) dove c1 , c2 sono due numeri complessi. In tal caso si dice che lo stato corrispondente al ket |Ci è una sovrapposizione degli stati corrispondenti ai ket |Ai e |Bi. Similmente: hC| = hA|c1 + hB|c2 (1.3) Due stati A e B si dicono ortogonali se hA|Bi = hB|Ai = 0. Ancora, uno stato A si dice normalizzato se il ket corrispondente soddisfa all’equazione hA|Ai = 1. 2 CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 3 Se nella (1.2) i ket |Ai e |Bi sono ortogonali (e normalizzati), i coefficienti c1 e c2 si ottengono moltiplicando l’equazione, a sinistra, rispettivamente per gli immaginari coniugati hA| e hB|: hA|Ci = c1 hA|Ai + c2 hA|Bi = c1 · 1 + c2 · 0 = c1 (1.4) hB|Ci = c1 hB|Ai + c2 hB|Bi = c1 · 0 + c2 · 1 = c2 D’altra parte, usando la (1.3), abbiamo: c1 = hC|Ai → c1 = hC|Ai (1.5) c2 = hC|Bi → c2 = hC|Bi Dal confronto delle (1.4) e (1.5) risulta allora che hA|Ci = hC|Ai e hB|Ci = hC|Bi. In definitiva, affinchè un dato stato possa essere espresso in termini di sovrapposizione di altri stati, con coefficienti indipendenti dalla scelta della particolare rappresentazione (in ket o bra) conviene far valere la relazione generale hA|Bi = hB|Ai 1.2 (1.6) Variabili dinamiche L’effetto della misura di un’osservabile viene specificato tramite l’azione di un operatore sul ket che descrive il sistema. A ogni osservabile (o variabile dinamica) nota in meccanica classica corrisponde un operatore quantistico construito a partire da certe regole che, nell’insieme, prendono il nome di principio di corrispondenza. Se F̂ è l’operatore corrispondente alla variabile dinamica F , l’effetto della misura di F su un sistema nello stato rappresentato dal ket |Ai è indicato dall’espressione F̂ |Ai. In generale, F̂ |Ai = |Bi, dove |Bi rappresenta un (diverso) stato del sistema; in altre parole, la misura di F comporta la transizione del sistema da uno stato A a uno stato (diverso) B. Vale pure un’equazione corrispondente per i bra: hA|F̂ † = hB|, dove l’operatore F̂ † viene detto coniugato Hermitiano (o aggiunto) di F̂ . Un operatore si dice Hermitiano (autoaggiunto) se F̂ = F̂ † . Gli operatori che rappresentano osservabili sono Hermitiani. Ricordando la (1.6), ponendo |Bi = F̂ |Ci, abbiamo hB| = hC|F̂ † e: hC|F̂ † |Ai = hA|F̂ |Ci (1.7) Gli operatori F̂ sono lineari nel senso che soddisfano equazioni del tipo F̂ (c1 |Ai + c2 |Bi) = c1 F̂ |Ai + c2 F̂ |Bi (1.8) ed analoghe sui bra. Non sempre l’effetto della misura dell’osservabile F su un sistema in uno stato A porta alla transizione a uno stato diverso. In tali casi valgono equazioni del tipo F̂ |Ai = a|Ai (1.9) CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 4 dove a è un numero e si è sfruttato il fatto che sia |Ai, sia a|Ai descrivono lo stesso stato A. Equazioni simili sono molto importanti nella teoria generale e prendono il nome di equazioni agli autovalori. Con riferimento all’equazione (1.9), |Ai si dice autovettore dell’operatore F̂ (lo stato A dicasi autostato) corrispondente all’autovalore a. Gli autovalori di un dato operatore Hermitiano corrispondente a una variabile dinamica F sono numeri reali. Infatti, stante la (1.9), vale la corrispondente hA|F̂ = ahA| (1.10) Moltiplicando la (1.9) a sinistra per hA| e la (1.10) a destra per |Ai otteniamo: hA|F̂ |Ai = ahA|Ai hA|F̂ |Ai = ahA|Ai (1.11) da cui a = a (cioé, a è un numero reale). Gli autovettori di un operatore Hermitiano corrispondenti ad autovalori diversi sono ortogonali: siano infatti F̂ |Ai = a|Ai (1.12) F̂ |Bi = b|Bi con a diverso da b; moltiplicando per |Ai, da destra, l’immaginaria coniugata della seconda delle (1.12) e tenuto conto che b = b, si ha: hB|F̂ |Ai = bhB|Ai (1.13) D’altra parte, moltiplicando per hB|, da sinistra, la prima delle (1.12), abbiamo hB|F̂ |Ai = ahB|Ai (1.14) Sottraendo la (1.13) dalla (1.14) si ottiene (a − b)hB|Ai = 0 ed essendo per ipotesi a − b 6= 0, segue hB|Ai = 0. Si noti che se vale F̂ |Ai = a|Ai allora cF̂ |Ai = F̂ c|Ai = a c|Ai; in altre parole, se |Ai è autovettore di F̂ associato all’autovalore a, anche c|Ai è un autovettore associato allo stesso autovalore (si ricordi pure che |Ai e c|Ai descrivono lo stesso stato A). Un autovalore associato ad autovettori diversi (non proporzionali) si dice degenere. Una qualunque combinazione lineare di autovettori associati a un autovalore degenere è ancora un autovettore associato al medesimo autovalore: se F̂ |Ai i = a|Ai i allora (i = 1, n) (1.15) ! F̂ X i ci |Ai i ! = X i ci F̂ |Ai i = a X i ci |Ai i (1.16) CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 5 Vediamo ancora una proprietà riguardante il coniugato Hermitiano del prodotto di due operatori F̂ e Ĝ; posti F̂ |Ai = |Bi e Ĝ† |Ci = |Di, si ha: hB|Di = hA|F̂ † Ĝ† |Ci = hD|Bi = hC|ĜF̂ |Ai = hA|(ĜF̂ )† |Ci (1.17) (ĜF̂ )† = F̂ † Ĝ† (1.18) Allora, dove si è sfruttato il fatto che, per un qualunque operatore Ĝ, (Ĝ† )† = Ĝ. In una sezione successiva si vedrà che il prodotto di operatori non è in generale commutativo (F̂ Ĝ 6= ĜF̂ ) e conta quindi l’ordine con cui i prodotti sono effettuati. La (1.18) dice che il coniugato Hermitiano del prodotto di due operatori è uguale al prodotto in ordine inverso dei coniugati Hermitiani degli stessi. 1.3 Misure Si assume che il risultato della misura dell’osservabile F su un sistema che si trovi in un autostato di F̂ sia l’autovalore corrispondente a quell’autostato (o meglio, corrispondente all’autovettore associato a quell’autostato). Dunque, se vale F̂ |Ai = a|Ai, a è il risultato della misura di F quando il sistema si trovi nello stato A descritto da |Ai. Se A è normalizzato, a = hA|F̂ |Ai. Se il sistema si trova in uno stato B che non è autostato di F , si assume comunque che il risultato della misura di F sia uno dei possibili autovalori di F̂ . Non è dato tuttavia conoscere con certezza quale tra gli autovalori di F̂ sia il risultato di una singola misura: è noto che la misura non potrà fornire che uno degli autovalori di F̂ , ma non si sa quale di questi. Si assume pure che il valore hB|F̂ |Bi sia il valor medio di un gran numero di misure della stessa osservabile su sistemi identici (e non più misure ripetute della stessa osservabile sullo stesso sistema). Inoltre, per continuità fisica, la misura di un’osservabile F compiuta una seconda volta sullo stesso sistema deve dare lo stesso valore ottenuto con la prima misura. Sia a il risultato della prima misura di F su un sistema che si trova in uno stato B che non è autostato di F : sappiamo che a deve essere un autovalore di F ; ora, se ripetiamo la misura una seconda volta, per la continuità fisica di cui sopra, sappiamo che il risultato deve essere certamente a: questo vuol dire che, per la seconda misura, il sistema dove trovarsi in quell’autostato (A) di F associato all’autovalore a. Ma allora la prima misura ha causato la transizione del sistema dallo stato B allo stato A (collasso della funzione d’onda). Poiché la misura di un’osservabile F su un qualunque stato B causa la transizione da B a un autostato A di F , si ammette che B (qualunque esso sia) sia sempre esprimibile come sovrapposizione di un certo numero di autostati di F ; la misura avrebbe l’effetto di proiettare lo stato B su uno degli stati base da cui è composto. In formule: X |Bi = c1 |A1 i + · · · + cn |An i ≡ ci |Ai i (1.19) i=1,n hB|F̂ |Bi = X i,j ci cj hAi |F̂ |Aj i = X i,j ci cj aj hAi |Aj i = X i,j ci cj aj δij = X j |cj |2 aj (1.20) CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 6 dove δij (delta di Krönecker) vale 1 se i = j, 0 altrimenti e si è tenuto conto dell’ortonormalità degli autostati di F . Il valor medio di F nello stato B è dunque una media pesata degli autovalori di F ; i quadrati dei moduli dei numeri (complessi) ci , coefficienti della combinazione lineare che esprime B in funzione degli Ai , rappresentano i pesi nella media degli autovalori. In altri termini, ciascun |ci |2 è la probabilità che la misura di F dia come risultato l’autovalore ai , nello stato rappresentato da |Bi; i ci sono allora le corrispondenti ampiezze di probabilità. Poiché B è uno stato generico (qualunque) di un sistema, perchè una misura di una data osservabile F sia sempre possibile, deve esistere un numero sufficiente di autostati di F con i quali esprimere qualunque stato B; in altre parole, gli autostati di F costitiscono un insieme completo. Data l’ortonormalità degli Ai vale: X X hAj |Bi = ci hAj |Ai i = ci δij = cj (1.21) i i dunque i ci sono i prodotti scalari hAi |Bi. Allora, X X X |Bi = ci |Ai i = hAi |Bi|Ai i = |Ai ihAi |Bi i i (1.22) i Data la genericità di B vale allora la condizione di completezza: X |Ai ihAi | = 1 (1.23) i Una variabile dinamica è un’osservabile solo se dispone di un insieme completo di autostati. 1.4 Rappresentazioni Per i risultati visti alla sezione precedente, un insieme completo di autostati Ai di una qualunque variabile dinamica F può essere usato per esprimere un qualunque stato B di un dato sistema. I coefficienti ci della combinazione lineare che esprime B in funzione degli Ai definiscono univocamente B, cioè, fissata una base di autovettori, B viene univocamente rappresentato dai coefficienti della combinazione lineare: |Ai i |Bi −→ (c1 , . . . , cn ) ≡ {ci }i=1,n (1.24) Si dice che l’insieme dei ci costituisce una rappresentazione di B nello spazio degli autostati di F . La rappresentazione dipende comunque dalla scelta di F , cosı̀ come la rappresentazione di un vettore della geometria ordinaria, in termini delle sue componenti lungo tre direzioni, dipende dallo specifico sistema di riferimento prescelto. Nella generalità dei casi il numero di autostati di una data osservabile non è finito e neppure è discreto il che vuol dire che possono esistere infiniti autostati variabili con continuità in un dato intervallo (che non è detto sia finito). Un esempio classico è quello delle coordinate di un oggetto: esistono infinite posizioni (coordinate espresse da tre numeri reali in un dato riferimento cartesiano) in cui un oggetto può trovarsi e, supposto non vi siano vincoli particolari, CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 7 tali posizioni possono variare con continuità in un dato intervallo. Essendo la posizione di un oggetto un’osservabile, detto |ri il generico autostato dell’operatore posizione r̂ [r è l’insieme delle tre coordinate spaziali (x, y, z)], per cui r̂|ri = r|ri, un qualunque stato B potrà essere rappresentato dai coefficienti c(r) = hr|Bi i quali, essendo le coordinate r variabili con continuità, sono in realtà delle funzioni delle stesse. Al variare di r, il ket |ri (o il bra hr|) descrive tutti i possibili autovettori di r̂ e c(r) rappresenta l’intero insieme dei coefficienti che esprimono |Bi in funzione di |ri. La funzione c(r) dunque è la rappresentazione di |Bi nello spazio delle coordinate (rappresentazione di Schrödinger) ed è normalmente indicata con il simbolo ψ(r) (funzione d’onda). Quanto detto a proposito dei ci , in merito alla loro interpretazione in termini di ampiezze di probabilità, si traspone facilmente al caso degli autovalori continui: la funzione ψ(r) è l’ampiezza di probabilità che la misura della posizione di un oggetto dia come risultato r. La corrispondente densità di probabilità nel punto r è |ψ(r)|2 , mentre la probabilità che la misura posizionale dia un valore compreso nell’intervallo infinitesimo dr è |ψ(r)|2 dr. Nel caso di autovettori continui, la condizione di completezza (1.23) viene conveniente espressa da Z |ridrhr| = 1 (1.25) dove la sommatoria (discreta) sugli autostati è stata sostituita da un integrale (sommatoria continua) sugli stessi. Risulta: Z Z |Bi = 1 |Bi = |ridrhr|Bi = |ridr ψB (r) (1.26) La rappresentazione di B in un altro sistema di riferimento r0 sarà allora facilmente ottenibile dalla (1.26): Z 0 ψB (r ) = hr0 |ridr ψB (r) (1.27) ammesso di conoscere la funzione di trasformazione hr0 |ri. Se |Ai è un ket normalizzato che descrive lo stato di una particella, hA|Ai = 1. Nella rappresentazione di Schrödinger, per la condizione di completezza, si ha allora: Z Z Z (1.28) hA|Ai = 1 = hA|1|Ai = hA|ridrhr|Ai = dr ψ(r)ψ(r) = dr |ψ(r)|2 Vale a dire: l’integrale su tutto lo spazio della probabilità di trovare la particella in una qualche posizione r vale 1. Diviene cosı̀ evidente la necessità di usare funzioni d’onda normalizzate: poiché deve essere certa la probabilità di trovare la particella in qualche punto dello spazio, la somma (integrale) delle probabilità su tutte le possibili posizioni deve essere 1 (1 è, per definizione, la probabilità dell’evento certo). Anche gli operatori possono essere rappresentati nello spazio base degli autovettori di una qualche variabile dinamica. Con riferimento al caso discreto e finito, sia F̂ un operatore e sia {|Ai i}i=1,n un insieme completo (e finito) di vettori; l’insieme dei numeri fij = hAi |F̂ |Aj i costituisce la corrispondente rappresentazione di F̂ . Gli fij possono essere organizzati nella CAPITOLO 1. PREMESSE FISICO-MATEMATICHE forma di una matrice quadrata di n righe ed n colonne: f11 · · · f1n . |Ai i .. . F̂ −→ {fij }i,j=1,n → . . fn1 · · · fnn 8 (1.29) Consideriamo ora l’espressione F̂ |Bi = |Ci; introducendo la condizione di completezza (1.23) e moltiplicando a destra per hAj |, si ottiene: X hAj |F̂ |Ai ihAi |Bi = hAj |Ci (1.30) i Indicati rispettivamente con bi e cj gli scalari hAi |Bi e hAj |Ci, l’equazione (1.30) può allora scriversi come X (1.31) cj = fji bi i La sommatoria implicata nella (1.31) altro non è che l’ordinario prodotto riga per colonna della matrice rappresentativa di F̂ per il vettore colonna (n righe e una colonna) rappresentativo di |Bi. L’insieme dei cj [uno per ogni hAj | nella (1.30)] costituisce il vettore colonna rappresentativo di |Ci. In sintesi: b1 c1 f11 · · · f1n . . |Ai i . . . .. .. = .. (1.32) F̂ |Bi = |Ci −→ . bn cn fn1 · · · fnn Si noti che la rappresentazione di un operatore F̂ nello spazio base dei suoi stessi autovettori |Ai i è una matrice diagonale: gli elementi sulla diagonale principale sono gli autovalori di F̂ , e tutti gli altri sono nulli: a1 |Ai i ... (1.33) hAj |F̂ |Ai i = ai hAj |Ai i = ai δij → F̂ −→ an La ricerca degli autovalori di una data osservabile F viene perciò anche detta diagonalizzazione (della matrice rappresentativa, in un qualche spazio) di F̂ . Sappiamo che un operatore F̂ è Hermitiano se coincide con il suo coniugato Hermitiano: F̂ = F̂ † . In tal caso, ricordando la (1.7): hAj |F̂ |Ai i = hAi |F̂ † |Aj i = hAi |F̂ |Aj i → fji = f ij (1.34) Una matrice F i cui elementi coincidono con i complessi coniugati della matrice trasposta (fji = f ij ) viene detta Hermitiana; la (1.34) dice allora che la matrice rappresentativa di un CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 9 operatore Hermitiano è Hermitiana. La matrice rappresentativa dell’operatore Ĥ, prodotto di due operatori F̂ e Ĝ, in una base {|Ai i}i=1,n , ha elementi hij = hAi |F̂ Ĝ|Aj i. Per la condizione di completezza: X hij = hAi |F̂ |Ak ihAk |Ĝ|Aj i (1.35) k La (1.35) è l’elemento (i, j) della matrice prodotto riga per colonna delle due matrici rappresentative di F̂ e Ĝ, rispettivamente: X hij = fik gkj (1.36) k da cui: h11 · · · h1n f11 · · · f1n g11 · · · g1n |Ai i . .. .. .. = ... ... .. Ĥ = F̂ Ĝ −→ . . . hn1 · · · hnn fn1 · · · fnn gn1 · · · gnn (1.37) Vale a dire: la matrice rappresentativa dell’operatore prodotto di due operatori è il prodotto riga per colonna delle matrici rappresentative dei due operatori. 1.5 Relazioni di commutazione Siano A e B due variabili dinamiche, associate agli operatori  e B̂, e sia |Ai un autovettore di  associato all’autovalore a; supponiamo di compiere una misura dell’osservabile A e successivamente una misura dell’osservabile B, su un sistema che (all’inizio) sia nello stato rappresentato da |Ai. Il risultato della prima misura è a, e il sistema rimane ancora nello stato A (infatti |Ai è autovettore di Â). La seconda misura fornirà un certo autovalore di B (secondo una data distribuzione di probabilità che dipende dai coefficienti della combinazione lineare di |Ai in funzione degli autovettori |Bi i di B̂ ) e porterà il sistema nel corrispondente autostato di B. Supponiamo ora di invertire le due misure: la prima misura (B) fornirà ancora uno tra gli autovalori di B̂ (secondo la stessa distribuzione di probabilità di cui sopra); la seconda misura (A) non darà più con certezza il valore a perchè, a seguito della prima misura, il sistema si è spostato da un autostato di A a un autostato di B che, in generale, non è pure autostato di A. Le due misurazioni non sono dunque scambiabili: ai fini del risultato conta l’ordine con cui vengono effettuate. In formule B̂ Â|Ai = 6 ÂB̂|Ai → B̂  6= ÂB̂ → B̂  − ÂB̂ 6= 0 (1.38) Dunque, a differenza del prodotto ordinario, il prodotto tra operatori non è commutativo. Una notazione compatta per indicare la differenza B̂  − ÂB̂ è [B̂, Â]. Tale espressione viene detta commutatore (di  e di B̂). Si noti che [B̂, Â] = −[Â, B̂]. CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 10 Supponiamo ora che i due operatori commutino: questo vuol dire che [B̂, Â] = 0. In tal caso: ÂB̂|Ai = B̂ Â|Ai = aB̂|Ai (1.39) La (1.39), letta nel modo Â(B̂|Ai) = a(B̂|Ai), insieme con la Â|Ai = a|Ai, dice che sia |Ai sia B̂|Ai sono autovettori dell’operatore Â, associati allo stesso autovalore a; allora, per quanto detto in precedenza (a meno di degenerazioni dell’autovalore che qui non consideriamo) B̂|Ai e |Ai descrivono lo stesso autostato e devono quindi differire al più per una certa costante (sia b). Dunque B̂|Ai = b|Ai (1.40) vale a dire: |Ai è autovettore di B̂ con autovalore associato b. In sintesi, due operatori che commutano hanno uno stesso insieme di autovettori; in tal caso sono possibili misure simultanee delle osservabili corrispondenti che forniscono risultati certi e indipendenti dall’ordine con cui vengono effettuate. In generale, dato un insieme I = {Ai }i=1,n di osservabili che commutano, cioè tali per cui per ciascuna coppia (i, j) vale [Âi , Âj ] = 0, ciascun autovettore potrà essere etichettato dall’insieme (a1 , . . . , an ) degli autovalori associati (uno per ogni operatore dell’insieme) |Ai → |a1 , . . . , an i ≡ |ai (1.41) dove si è indicato con a l’insieme {ai }i=1,n . Nella teoria generale è importante saper trattare con espressioni del tipo [AB, C] dove con A,B e C si intendono tre operatori (si è omesso il simbolo ˆ su ciascun operatore): [AB, C] = ABC − CAB = ABC − CAB + ACB − ACB = A(BC − CB) + (AC − CA)B = A[B, C] + [A, C]B (1.42) Analogamente [A, BC] = B[A, C] + [A, B]C. 1.6 Principio di Corrispondenza Il principio di corrispondenza stabilisce regole precise per tradurre qualunque osservabile classica nel corrispondente operatore quantistico. Trattandosi per l’appunto di un principio, una sua dimostrazione non è formalmente richiesta e la sua veridicità, assunta a priori, si giustifica in base all’accordo tra i risultati sperimentali e quelli predetti con calcoli quantistici che ne facciano uso. Tuttavia è possibile ottenere dimostrazioni di tale principio assumendo a priori la veridicità di altri principi da cui viene poi ottenuto per derivazione logica. Una via (quella seguita da Dirac) consiste nello stabilire una corrispondenza tra il commutatore di due operatori quantistici  e B̂ e la parentesi di Poisson delle due variabili dinamiche classiche corrispondenti. L’altra via (quella seguita da Schwinger) consiste nell’assumere come principio base quello di minima azione: classicamente, data la Lagrangiana L di un sistema, la corretta traiettoria spazio-temporale percorsa dal sistema, nella propria evoluzione da un tempo t1 a un tempo t2 , è quella che rende minimo l’integrale di azione: Z t2 L dq (1.43) I= t1 CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 11 dove q è un insieme di variabili canoniche atte a descrivere la traiettoria. Il principio di minima azione assume la forma δI = 0, ove con δI si intenda la variazione dell’integrale di azione a seguito di una variazione arbitraria della traiettoria tra gli estremi temporali t1 e t2 . È possibile formulare l’evoluzione di un sistema quantistico in modo analogo, costruendo opportunamente una Lagrangiana quantistica che, assunta la validità del principio di minima azione anche per un sistema quantistico, consenta di ottenere le corrette traiettorie spazio-temporali. Dalla corrispondenza tra le Lagrangiane classica e quantistica discendono poi le regole di traduzione delle osservabili classiche negli operatori quantistici. La trattazione dettagliata del principio di corrispondenza è molto complessa e va al di là degli scopi di queste note; seguiamo perciò una trattazione molto semplificata e parziale del principio, a partire dalla relazione di de Broglie, che supporremo nota e assunta a priori, tra impulso (p) di una particella e lunghezza d’onda (λ) dell’onda associata: λ = h/p (1.44) dove h è la costante di Planck. ~ L’espressione generale di un’onda piana di vettore d’onda ~k è ψ = eık·~r . Riferendoci al caso semplice monodimensionale di un’onda che si propaga lungo x: ψ = eıkx . Ricordando la relazione di Eulero eıa = cos a + ı sin b, ψ = cos(kx) + ı sin(kx). A partire da una delle due componenti (reale o immaginaria) dell’onda ψ si evince facilmente che la lunghezza d’onda è data dalla relazione kλ = 2π, da cui: k = 2π/λ. Introducendo la (1.44), otteniamo: k = 2πp/h = p/h̄, dove h̄ = h/2π. In definitiva: ψ = eıpx/h̄ . Consideriamo ora la derivata rispetto a x dell’onda ψ: dψ d ıpx/h̄ ıp ıpx/h̄ = e = e dx dx h̄ (1.45) Possiamo allora definire l’operatore −ıh̄ d/dx che, agendo su ψ, fornisce −ıh̄ d ψ = pψ dx (1.46) L’equazione (1.46) è un’equazione agli autovalori in cui un dato operatore (−ıh̄ d/dx) agisce su una funzione (ψ) per dare la stessa funzione moltiplicata per una costante (p). Possiamo allora assumere che l’espressione quantistica dell’operatore impulso p̂, nella rappresentazione di Schrödinger, sia proprio −ıh̄ d/dx e ψ = eıpx/h̄ sia l’autovettore dell’operatore corrispondente all’autovalore p. In tre dimensioni l’operatore p̂ diviene un operatore vettoriale con tre componenti (p̂x , p̂y , p̂z ), per cui ~ ~ ~ p̂ = −ıh̄ ∂/∂x i + ∂/∂y j + ∂/∂z k ≡ −ıh̄∇ (1.47) dove (~i, ~j, ~k) sono tre vettori ortonormali e ∇ è l’operatore vettoriale gradiente. Si noti che p̂2 = p̂· p̂ = −h̄2 (∂ 2 /∂ 2 x+∂ 2 /∂ 2 y+∂ 2 /∂ 2 z) ≡ −h̄2 ∇2 (dove ∇2 è l’operatore Laplaciano); l’operatore corrispondente all’energia cinetica (T̂ ) di una particella di massa m, che classicamente è definita come p2 /2m, è dunque −h̄2 /2m∇2 . CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 12 Data la commutabilità degli operatori di derivazione risulta che [T̂ , p̂ ] = 0, per cui gli autostati dell’impulso sono anche autostati dell’energia cinetica; del resto, è immediato verificare che vale T̂ ψ = p2 /2m ψ, essendo ψ l’autovettore dell’impulso, di cui all’equazione (1.46). Considerazioni che qui non sviluppiamo mostrano che, nella rappresentazione di Schrödinger, gli operatori posizione (x̂, ŷ e ẑ), corrispondenti alle osservabili posizionali x, y e z, consistono nella semplice moltiplicazione per x, y e z. Si noti che [p̂x , x̂] 6= 0 (ed analoghe relative alle altre due componenti, y e z); infatti, utilizzando una qualunque funzione di prova f (x), si ha: [d/dx, x]f (x) = (d/dx x − x d/dx)f (x) = d df (x) [xf (x)] − x = f (x) dx dx (1.48) da cui, dovendo la (1.48) valere per qualunque f : [p̂x , x̂] = −ıh̄ (1.49) Questo significa che gli autovettori dell’operatore p̂ non sono gli stessi dell’operatore r̂: non è possibile conoscere con certezza e nello stesso tempo sia la posizione, sia l’impulso di una data particella (Principio di Indeterminazione di Heisenberg). Sono invece nulli tutti i commutatori del tipo [p̂x , ŷ] tra componenti di p̂ e di r̂ riferite a direzioni diverse. 1.6.1 Un esempio semplice: la particella nella scatola Immaginiamo una particella di massa m costretta a muoversi in una regione monodimensionale di lunghezza L nell’intervallo tra i punti x = 0 e x = L (scatola; l’esempio è facilmente estensibile alle 3 dimensioni) e cerchiamo gli autovalori e gli autovettori dell’operatore energia cinetica T̂ = p̂2 /2m. Sappiamo già che la funzione ψ = eıpx/h̄ è autofunzione di T̂ , ma non è l’unica. In realtà, come è facile verificare, anche funzioni del tipo cos(kx) e sin(kx) sono autofunzioni di T̂ , cosı̀ come lo è una loro qualunque combinazione lineare [per la (1.16)]: ψ(x) = A cos(kx) + B sin(kx) (1.50) Se vogliamo, la soluzione ψ = eıpx/h̄ è una soluzione particolare con A = 1 e B = ı. Essendo la particella confinata entro l’intervallo (x ≥ 0, x ≤ L) la sua funzione d’onda deve annullarsi all’esterno della scatola (perchè la probabilità di trovare la particella fuori dalla scatola è nulla). La continuità della funzione ψ nel passaggio dall’esterno all’interno della scatola impone allora le due condizioni al contorno ψ(0) = 0, ψ(L) = 0. Dalla prima condizione risulta: ψ(0) = 0 = A cos 0 + B sin 0 = A → A = 0 (1.51) da cui ψ = B sin(kx). Con la seconda condizione si ottiene: ψ(L) = 0 = B sin(kL) → sin(kL) = 0 → kL = nπ → k = nπ/L (1.52) CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 13 dove n è un numero intero non nullo (se fosse k = 0 la funzione d’onda sarebbe nulla ovunque: non esistenza della particella; per lo stesso motivo non può essere B = 0). Nota la relazione tra k e p (di cui al paragrafo precedente: k = p/h̄), l’energia cinetica della particella sarà: T = p2 /2m = h̄2 k 2 /2m = n2 h̄2 π 2 /2mL2 = n2 h2 /8mL2 (1.53) Il risultato notevole è che il valore di T non può essere qualunque ma è ristretto ai multipli interi di h2 /8mL2 : la particella non può avere un qualsivoglia valore dell’energia cinetica, cosı̀ come non può avere un momento p (e velocità) qualunque. Ancora, poiché n deve essere non nullo, l’energia cinetica della particella non può in alcun caso essere nulla: la particella non può stare ferma. L’energia cinetica più bassa consentita è h2 /8mL2 ed è chiamata energia di punto zero. La quantizzazione dell’energia cinetica (cioè la sua non continuità), ovvero l’esistenza di livelli energetici discreti, è una diretta conseguenza dell’imposizione delle condizioni al contorno. 1.7 Momento Angolare Una osservabile classica particolarmente importante che, nei campi di forza centrali, è una costante del moto, è il momento angolare ~` = ~r × p~, dove il prodotto implicato è vettoriale. In componenti: `x = ypz − zpy `y = zpx − xpz ` = xp − yp z y x (1.54) Il modulo quadro di ~` è la somma dei quadrati delle tre componenti: `2 ≡ |~`|2 = `2x + `2y + `2z . È interessante calcolare le relazioni di commutazione tra le diverse componenti del momento angolare, ad esempio: [`ˆx , `ˆy ] = [ŷ p̂z − ẑ p̂y , ẑ p̂x − x̂p̂z ] = [ŷ p̂z , ẑ p̂x ] − [ŷ p̂z , x̂p̂z ] − [ẑ p̂y , ẑ p̂x ] + [ẑ p̂y , x̂p̂z ] (1.55) Il primo commutatore a destra dell’ultima uguaglianza vale [ŷ p̂z , ẑ p̂x ] = ŷ[p̂z , ẑ p̂x ] + [ŷ, ẑ p̂x ]p̂z = ŷẑ[p̂z , p̂x ] + ŷ[p̂z , ẑ]p̂x + ẑ[ŷ, p̂x ]p̂z + [ŷ, ẑ]p̂x p̂z = −ıh̄ŷ p̂x (1.56) Il secondo ed il terzo commutatore della (1.55) sono nulli, mentre il quarto vale: [ẑ p̂y , x̂p̂z ] = ẑ[p̂y , x̂p̂z ] + [ẑ, x̂p̂z ]p̂y = ẑ x̂[p̂y , p̂z ] + ẑ[p̂y , x̂]p̂z + x̂[ẑ, p̂z ]p̂y + [ẑ, x̂]p̂z p̂y = ıh̄x̂p̂y (1.57) [`ˆx , `ˆy ] = ıh̄(x̂p̂y − ŷ p̂x ) = ıh̄`ˆz (1.58) In definitiva: In modo del tutto analogo si dimostra che [`ˆy , `ˆz ] = ıh̄`ˆx e [`ˆx , `ˆz ] = −ıh̄`ˆy . La non commutabilità delle diverse componenti del momento angolare implica la non misurabilità CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 14 simultanea delle stesse: per un dato sistema è possibile specificare solo una delle tre componenti del momento angolare. Si noti che: [`ˆ2 , `ˆz ] = [`ˆ2x , `ˆz ] + [`ˆ2y , `ˆz ] + [`ˆ2z , `ˆz ] = `ˆx [`ˆx , `ˆz ] + [`ˆx , `ˆz ]`ˆx + `ˆy [`ˆy , `ˆz ] + [`ˆy , `ˆz ]`ˆy + `ˆz [`ˆz , `ˆz ] + [`ˆz , `ˆz ]`ˆz = −ıh̄`ˆx `ˆy − ıh̄`ˆy `ˆx + ıh̄`ˆy `ˆx + ıh̄`ˆx `ˆy = 0 (1.59) Analogamente: [`ˆ2 , `ˆx ] = [`ˆ2 , `ˆy ] = 0. Il modulo quadro del momento angolare totale (o la sua radice e quindi il modulo del momento angolare totale) è quindi misurabile simultaneamente a una delle sue tre componenti. In sintesi, per un dato autostato B del momento angolare è possibile specificare contemporanemente sia il modulo del momento totale, sia una delle sue componenti (convenzionalmente `ˆz ) e l’autovettore rappresentativo potrà essere etichettato con i rispetti autovalori: |Bi → |`, `z i. Consideriamo ora la componente `ˆz e vediamone la relazione di commutazione con l’operatore p̂2 (omettendo il simboloˆ): [p2 , `z ] = [p2x , `z ] + [p2y , `z ] + [p2z , `z ] (1.60) con [p2x , `z ] = px [px , `z ] + [px , `z ]px e analoghe per le componenti py e pz . D’altra parte, [px , `z ] = [px , xpy − ypx ] = x[px , py ] + [px , x]py − y[px , px ], −[px , y]px = ıh̄py (1.61) e quindi, data la commutabilità tra px e py : [p2x , `z ] = ıh̄px py + ıh̄py px = 2ıh̄px py Procedendo in modo analogo con gli altri due commutatori della (1.60), si ottiene: [p2 , `z ] = −2ıh̄px py y [p2 , ` ] = 0 z z (1.62) (1.63) In totale: [p2 , `z ] = 0. La componente `ˆz del momento angolare commuta con p̂2 e quindi con l’energia cinetica T̂ = p̂2 /2m. In un campo di forze centrali il potenziale ad esse associato dipende unicamente dalla distanza dall’origine delle forze: V = V (r), dove r = (x2 + y 2 + z 2 )1/2 . In particolare, un potenziale Coulombiano è della forma 1/r. Calcoliamo il commutatore [1/r, `z ]: [1/r, `z ] = x[1/r, py ] + [1/r, x]py − y[1/r, px ] − [1/r, y]px (1.64) Ricordando che py = −ıh̄d/dy, [1/r, py ] = −ıh̄[1/r, d/dy] = ıh̄d(1/r)/dy = −ıh̄2y/r (1.65) e quindi x[1/r, py ] = −ıh̄2xy/r. In modo analogo si dimostra che il terzo commutatore nella (1.64) vale ıh̄2xy/r, mentre sono nulli i rimanenti due commutatori. In definitiva [1/r, `z ] = 0. CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 15 Per quanto visto, la componente `ˆz del momento angolare orbitale commuta sia con l’operatore T̂ che rappresenta l’energia cinetica, sia con un operatore V̂ che rappresenta il potenziale dovuto ˆ Definendo l’operatore a forze centrali, eventualmente agenti sul sistema. Lo stesso dicasi per `. ˆ Ĥ] = 0. L’Hamiltoniano Hamiltoniano (Ĥ) come la somma di T̂ e V̂ , abbiamo: [`ˆz , Ĥ] = [`, rappresenta l’energia totale del sistema e la sua commutabilità con il momento angolare totale e con una delle sue componenti implica l’esistenza di stati che abbiano, nello stesso tempo, valori definiti dell’energia e del momento angolare. Se E è l’autovalore associato ad un dato autovettore |Ai di Ĥ (cioè E è l’energia di un sistema che si trova in un certo autostato dell’Hamiltoniano), allora: |Ai → |E, `, `z i. Questo risultato è alla base della teoria atomica. 1.7.1 Un esempio: Lo spin dell’elettrone Misurazioni sperimentali indicano che all’elettrone è invariabilmente associato un momento magnetico. Fissato un sistema di riferimento, di tale momento magnetico è possibile ottenere una sola componente lungo un dato asse (sia z) la quale può avere solo i due possibili valori h̄e/2mc e −h̄e/2mc (e, m e c sono rispettivamente la carica, la massa elettronica e la velocità della luce). Questi risultati suggeriscono la possibilità di assegnare all’elettrone un momento angolare detto di spin (ŝ) la cui componente lungo z (ŝz ) abbia gli autovalori h̄/2 e −h̄/2. Indichiamo con |αi e con |βi gli autovettori di ŝz associati rispettivamente agli autovalori h̄/2 e −h̄/2: ( ŝz |αi = 1/2 h̄|αi (1.66) ŝz |βi = −1/2 h̄|βi La matrice Sz , rappresentativa di ŝz nello spazio degli autovettori (|αi, |βi), è allora: ! 1 0 Sz = 1/2 h̄ 0 −1 (1.67) Trattandosi di un momento angolare, per ŝ e le sue componenti devono valere le stesse relazioni di commutazione viste per `ˆ e sue componenti; in particolare, in termini matriciali (cioè rappresentando tutti gli operatori di spin nello spazio degli autovettori di ŝz ): Sx Sy − Sy Sx ≡ [Sx , Sy ] = ıh̄Sz Sy Sz − Sz Sy ≡ [Sy , Sz ] = ıh̄Sx S S − S S ≡ [S , S ] = ıh̄S z x x z z x y (1.68) CAPITOLO 1. PREMESSE FISICO-MATEMATICHE Siano a b ! c d e e f g h 16 ! le matrici Sx e Sy , rispettivamente. Dalla terza delle (1.68) abbiamo: Sz Sx − S x Sz ! ! ! ! a b 1 0 1 0 a b 1 1 h̄ − h̄ = 2 2 0 −1 c d c d 0 −1 " ! !# ! a b a −b 0 b 1 = h̄ − = h̄ 2 −c −d c −d −c 0 ! e f = ıh̄ g h (1.69) vale a dire: e = h = 0; f = −ıb; g = ıc. Da questo risultato e dalla seconda delle (1.68) si ottengono pure a = d = 0. Infine, sfruttando la prima delle (1.68), si ottiene la relazione bc = 1/4 h̄2 il che suggerisce di porre (per simmetria) b = c = 1/2 h̄. Le tre matrici rappresentative delle componenti dello spin nelle tre direzioni (matrici di Pauli) sono allora: ! 0 1 Sx = 21 h̄ 1 0 ! 0 −ı Sy = 12 h̄ (1.70) ı 0 ! 1 0 1 Sz = 2 h̄ 0 −1 Si noti che solo la matrice Sz è diagonale, il che vuol dire che gli autovettori (di Sz ) |αi e |βi non sono anche autovettori di Sx e Sy (cosı̀ come deve essere). La matrice rappresentativa di ŝ2 (S 2 = Sx2 + Sy2 + Sz2 ) è: " ! ! !# ! 1 0 1 0 1 0 1 0 1 3 S 2 = h̄2 + + = h̄2 (1.71) 4 4 0 1 0 1 0 1 0 1 2 I vettori |αi e |βi sono autovettori di S 2 associati entrambi all’autovalore ! ! 3/4 h̄ ; infatti, essendo 1 0 |αi e |βi rappresentati rispettivamente dai vettori colonna e (poiché |αi = 1|αi+0|βi 0 1 e |βi = 0|αi + 1|βi) valgono le equazioni: ! ! ! ! 1 0 1 1 1 3 2 = 34 h̄2 = 12 ( 12 + 1)h̄2 4 h̄ 0 1 0 0 0 ! ! ! ! (1.72) 1 0 0 0 0 3 2 = 34 h̄2 = 12 ( 12 + 1)h̄2 4 h̄ 0 1 1 1 1 q L’autovalore del momento di spin dell’elettrone è quindi 12 ( 12 + 1) h̄. CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 1.8 17 Autovettori del momento angolare ˆ per un sistema soggetto a forze centrali, una tratTornando al momento angolare orbitale (`) p tazione completa mostra che questo è quantizzato e può assumere soltanto i valori `(` + 1) h̄, dove ` è un numero intero, zero compreso. La componente del momento angolare lungo una data direzione (`ˆz ) è essa stessa quantizzata e può assumere soltanto i valori interi m, compresi nell’intervallo [−`, `] (tradizionalmente il numero quantico `z viene indicato con la lettera m). Si noti che nel caso dello spin i corrispondenti numeri quantici (s e sz ) valgono: s = 1/2 e sz = −1/2, 1/2. Gli autovettori del momento angolare, nella rappresentazione di Schrödinger, sono le funzioni armoniche sferiche che, in coordinate sferiche (r, θ, φ) sono indicate con la notazione Ym` (θ, φ) (le armoniche sferiche non hanno una dipendenza da r, radiale). Valgono allora le due equazioni: `ˆ2 Ym` (θ, φ) = `(` + 1) h̄2 Ym` (θ, φ) (1.73) `ˆ Y ` (θ, φ) = m h̄ Y ` (θ, φ) z m m Fissato ` esistono allora 2` + 1 autofunzioni di `ˆ2 associate allo stesso autovalore `(` + 1)h̄2 : precisamente tutte quelle ottenute al variare di m tra −` ed `. Per esempio, se ` = 1 si hanno 1 le tre armoniche Y−1 (θ, φ), Y01 (θ, φ) e Y11 (θ, φ). Combinazioni lineari di armoniche avento lo ˆ associate al medesimo autovalore, stesso ` (e diverso m) sono ancora autofunzioni di `ˆ2 (e di `) ma non sono ovviamente più autofunzioni di `z . 1.9 Equazioni del moto Come già accennato, all’energia totale di un sistema corrisponde un operatore Hamiltoniano (Ĥ, Hermitiano) ottenuto, secondo il principio di corrispondenza, dalla funzione Hamiltoniana classica, essendo quest’ultima esprimibile (nei casi di nostro interesse) come somma dei contributi cinetico (T ) e potenziale (V ) all’energia totale: H = T + V . Si assume che la funzione d’onda Ψ(r, t) di un sistema soddisfi all’equazione del moto (equazione di Schrödinger dipendente dal tempo): ĤΨ(r, t) = ıh̄ ∂Ψ(r, t) ∂t (1.74) dove t è il tempo. Se Ĥ non dipende dal tempo (sistema conservativo), considerazioni che qui tralasciamo mostrano che è possibile fattorizzare Ψ(r, t) nel prodotto e−iEt/h̄ ψ(r), e all’equazione (1.74) corrisponde quella indipendente dal tempo: Ĥψ(r) = Eψ(r) (1.75) dove E è l’energia totale del sistema. Consideriamo un operatore F̂ e il suo valor medio in uno stato rappresentato dal vettore |ψi [ψ(r, t) = hr|ψi]: F = hψ|F̂ |ψi e valutiamone la derivata rispetto al tempo; per la regola di derivazione di un prodotto: dF ˙ F̂ |ψi + hψ| ∂ F̂ |ψi + hψ|F̂ |ψi ˙ = hψ| dt ∂t (1.76) CAPITOLO 1. PREMESSE FISICO-MATEMATICHE 18 ˙ (e hψ|) ˙ indica la derivazione rispetto a t. Per la (1.74), |ψi ˙ = −ı/h̄Ĥ|ψi dove la notazione |ψi ˙ e hψ| = ı/h̄hψ|Ĥ (si ricordi che H è Hermitiano) che, introdotte nella (1.76), portano a: dF ∂ F̂ ∂ F̂ = ı/h̄hψ|Ĥ F̂ − F̂ Ĥ|ψi + ≡ −ı/h̄hψ|[F̂ , Ĥ]|ψi + dt ∂t ∂t (1.77) Dalla (1.77) vediamo che se F̂ non dipende esplicitamente dal tempo (vale a dire: ∂ F̂ /∂t = 0) e se è nullo il commutatore [F̂ , Ĥ], allora è nulla la derivata di F rispetto a t: F è una costante del moto. Si noti che questo è proprio il caso del momento angolare nel caso di un sistema soggetto a forze centrali. Capitolo 2 Applicazioni a sistemi atomici e molecolari 2.1 L’atomo di idrogeno Il sistema conservativo più semplice dotato di un potenziale centrale V = −e2 /r (dove e è la carica elettronica) è l’atomo di idrogeno. Nella rappresentazione di Schrödinger, a nucleo fermo, l’operatore Hamiltoniano assume la forma: −h̄2 /2m∇2 − e2 /r, dove il primo termine rappresenta il contributo cinetico all’energia. L’equazione del moto indipendente dal tempo è allora l’equazione differenziale del secondo ordine: 2 ∂ ∂2 ∂2 e2 h̄2 + + − ψ(r) = Eψ(r) (2.1) − 2m ∂x2 ∂y 2 ∂z 2 r Poiché `ˆ e `ˆz commutano con Ĥ, l’autofunzione ψ di Ĥ che soddisfa all’equazione (2.1) deve pure essere autofunzione del momento angolare. Passando a un sistema di coordinate sferiche, questo vuol dire che, fissati ` ed m, sia ψ(r, θ, φ), sia l’armonica sferica Ym` (θ, φ) devono descrivere lo stesso autostato del momento angolare; ma allora ψ(r, θ, φ) e Ym` (θ, φ) devono differire al più per una costante (sia R): ψ(r, θ, φ) = R Ym` (θ, φ). Si noti che, non dipendendo gli autovettori del momento angolare da r, ma soltanto dalle coordinate θ e φ, si richiede che la costante R sia tale (cioè costante) solo rispetto alle ultime due coordinate, mentre nessun vincolo si pone relativamente ad una sua dipendenza da r. In ultima analisi, la trattazione dettagliata del problema e la soluzione esplicita dell’equazione (2.1) portano a: ψ(r, θ, φ) = Rn` (r)Ym` (θ, φ) Ĥψ(r, θ, φ) = En ψ(r, θ, φ) (2.2) 2 2 ˆ ` ψ(r, θ, φ) = `(` + 1)h̄ ψ(r, θ, φ) `ˆ ψ(r, θ, φ) = mh̄ψ(r, θ, φ) z dove n è un numero intero positivo (zero escluso, come avviene nel caso della particella nella scatola) da cui dipende l’energia dell’elettrone nel campo creato dal nucleo [la seconda equazione delle (2.2) mostra appunto che E dipende solo da n]; ` può assumere solo i valori interi 19 CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 20 nell’intervallo [0, n − 1] ed m quelli interi nell’intervallo [−`, `]. Le funzioni d’onda ψn`m (r, θ, φ) prendono il nome di orbitali atomici. Per gli orbitali atomici è d’uso una notazione specifica: gli orbitali con ` = 0, 1, 2, 3 vengono rispettivamente indicati con le lettere s, p, d e f e il numero quantico n si antepone al simbolo dell’orbitale; ad esempio ψ200 ≡ 2s. Si noti che combinazioni lineari di orbitali atomici aventi lo stesso numero quantico ` sono ancora autofunzioni di Ĥ e di `ˆ2 associate agli stessi autovalori (stessa energia e momento angolare totale). Ad esempio, gli orbitali ψn11 e ψn11 si possono combinare nelle somme: √1 (ψn11 + ψn11 ) 2 (2.3) √ı (ψn11 − ψ ) n11 2 I due nuovi orbitali vengono solitamente indicati con i simboli npx e npy e non sono autofunzioni di `ˆz ; ad esempio: 1 h̄ `ˆz (npx ) = √ [`ˆz ψn11 + `ˆz ψn11 ] = √ [1ψn11 − 1ψn11 ] = −ıh̄(npy ) 2 2 (2.4) A differenza di ψn11 e ψn11 le due combinazioni lineari (2.3) sono funzioni reali, il che ne giustifica l’utilizzo. Gli orbitali ψn10 hanno simbolo npz . In casi particolari (a simmetria non sferica) è d’uso considerare combinazioni lineari di orbitali aventi lo stesso n ma diverso `; si parla in tal caso di orbitali ibridi. Tali orbitali sono ancora autofunzioni di Ĥ associate alla stessa energia En ma, in generale, non sono né autofunzioni di `ˆ2 , né di `ˆz . La descrizione del comportamento degli elettroni nel campo elettrico creato dal nucleo si completa con la considerazione dello spin: trascurando gli effetti di accoppiamento spin-orbita tra i momenti angolari orbitale e di spin, la funzione d’onda complessiva [spin-orbitale, ψ(x)] si fattorizza nel prodotto tra la componente orbitale φ(r) e la componente di spin χ(s), ove si intenda che la variabile s possa assumere solo i due valori ±1/2, in corrispondenza dei quali la funzione χ(s) rappresenti gli stati |αi e |βi. La notazione x si riferisce all’insieme delle coordinate spaziali (r) e di spin (s). In sintesi: ψn`ms (x) = φn`m (r)χ(s) 2.2 (2.5) Il Principio di Antisimmetria Consideriamo un sistema composto da due particelle identiche descritto, nella rappresentazione di Schrödinger, dalla funzione d’onda ψ(x1 , x2 ). Precisamente, secondo l’interpretazione probabilistica, la quantità |ψ(x1 , x2 )|2 dx1 dx2 è la probabilità di trovare la particella 1 nell’elemento di volume dx1 e la particella 2 nell’elemento di volume dx2 (stiamo considerando volumi dello spazio 4-D delle 3 coordinate spaziali, più la coordinata di spin). Scambiamo ora le due particelle, ponendo la prima nella posizione x2 e la seconda nella posizione x1 : la funzione d’onda relativa alla nuova situazione sarà allora ψ(x2 , x1 ) e |ψ(x2 , x1 )|2 dx1 dx2 sarà CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 21 la probabilità di trovare la particella 1 nell’elemento di volume dx2 e la particella 2 nell’elemento di volume dx1 . Poiché le due particelle sono identiche, il loro scambio non deve avere effetti misurabili (di fatto, lo scambio non altera nulla del sistema) il che significa che le due probabilià su scritte devono essere uguali: |ψ(x1 , x2 )|2 dx1 dx2 = |ψ(x2 , x1 )|2 dx1 dx2 La (2.6) è compatibile con le due possibili equazioni: ( ψ(x2 , x1 ) = ψ(x1 , x2 ) ψ(x2 , x1 ) = −ψ(x1 , x2 ) (2.6) (2.7) Entrambe le possibilià sono in effetti osservate in Natura: le particelle che soddisfano alla prima delle (2.7) sono dette bosoni e sono tutte le particelle a spin intero, zero compreso; le particelle che soddisfano alla seconda delle (2.7) sono dette fermioni e sono tutte le particelle a spin semi-intero. L’elettrone (spin 1/2) è un fermione. I sistemi multielettronici soddisfano cosı̀ al principio di antisimmetria, per cui la loro funzione d’onda cambia di segno a seguito dello scambio di due elettroni. Nel caso generale, possiamo definire un operatore di permutazione1 P̂ che scambia la posizione di due elettroni; se P̂ij scambia l’elettrone i-esimo con l’elettrone j-esimo, allora: P̂ij ψ(x1 , . . . xi , . . . xj , . . . xn ) = −ψ(x1 , . . . xj , . . . xi , . . . xn ). Se P̂ è una permutazione qualunque, che scambia un dato numero di elettroni, vale: P̂ ψ = P ψ, dove P è la parità della permutazione, positiva se pari è il numero di scambi (p) operati da P̂ , negativa se p è dispari: P = (−1)p . Rimanendo al caso di due soli elettroni, se x1 = x2 , dalla seconda delle (2.7) si ha ψ(x1 , x1 ) = −ψ(x1 , x1 ) il che è possibile solo se ψ(x1 , x1 ) = 0: due elettroni aventi lo stesso spin (identico numero quantico s) non possono occupare la stessa posizione dello spazio, essendo nulla la corrispondente ampiezza di probabilità. Poiché la funzione d’onda è continua nelle coordinate (non presenta cioè salti bruschi al variare di queste), la circostanza per cui ψ(x1 , x1 ) = 0 implica che, fissata una delle due posizioni x (sia x1 ), la stessa funzione abbia valori molto bassi per x2 variabile nell’intorno di x1 : è bassa la probabilità che i due elettroni (a spin identico) vengano a trovarsi in posizioni vicine. Questa è l’origine del principio di esclusione di Pauli sul quale torneremo in seguito. Due elettroni a spin opposto differiscono almeno per una coordinata (s), dunque per questi la circostanza x1 = x2 non può mai verificarsi anche nel caso r1 = r2 ; nessun vincolo è quindi imposto dal principio di antisimmetria alle loro rispettive posizioni. 2.3 Sistemi multielettronici Consideriamo ancora un sistema a due elettroni descritto dalla funzione d’onda ψ(x1 , x2 ). Fissiamo x2 e consideriamo ψ(x1 , x2 ) come funzione di x1 ; dato un insieme completo di au1 Gli operatori di permutazione P sono Hermitiani e, nel loro insieme, costituiscono un gruppo: dato un insieme di N elettroni, esistono N ! permutazioni {Pi }i=1,N ! , per cui Pr Ps = Pq (cioè, il prodotto di due permutazioni, inteso come applicazione successiva delle stesse, è ancora una permutazione); Pr2 = I, dove I è l’operatore identità, per cui Pr−1 = Pr , avendo definito con Pr−1 la permutazione inversa di Pr . CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 22 tofunzioni (sia {φi (x)}i=1,n ) (dove n può essere infinito) di un qualunque operatore monoelettronico (cioè che agisce su un solo elettrone), sappiamo che ψ(x1 , x2 ) può essere espressa come combinazione lineare delle funzioni φ: X ci φi (x1 ) (2.8) ψ(x1 , x2 ) = i=1,n dove la dipendenza parametrica dalle coordinate x2 si è trasferita nei coefficienti ci . Gli stessi coefficienti sono in realtà delle funzioni di x2 , a loro volta esprimibili come combinazione lineare delle stesse funzioni dell’insieme completo {φi (x)}i=1,n : X ci (x2 ) = cij φj (x2 ) (2.9) j=1,n dove i cij sono degli scalari. Introducendo la (2.9) nella (2.8) si ha: X ψ(x1 , x2 ) = cij φi (x1 )φj (x2 ) (2.10) i,j La permutazione dei due elettroni produce: P̂12 ψ(x1 , x2 ) = ψ(x2 , x1 ) = X cij φi (x2 )φj (x1 ) (2.11) i,j da cui, scambiando tra loro gli indici i e j (i ↔ j) e tenuto conto del principio di antisimmetria e della commutabilità del prodotto di due funzioni φ, si ottiene: X X ψ(x2 , x1 ) = cji φi (x1 )φj (x2 ) = −ψ(x1 , x2 ) = − cij φi (x1 )φj (x2 ) (2.12) i,j i,j Ciò significa che cij = −cji e che cii = 0: nella sommatoria non compaiono mai prodotti del tipo φi φi . L’equazione (2.10) si generalizza facilmente al caso di N elettroni, per cui la funzione d’onda complessiva risulta esprimibile come: X ψ(x1 , · · · , xN ) = ci1 ,...,iN φi1 (x1 )φi2 (x2 ) · · · φiN (xN ) (2.13) i1 ,...,iN La (2.13) prende il nome di espansione di Boys di una funzione d’onda multielettronica nella somma (eventualmente infinita) di prodotti di funzioni d’onda monoelettroniche. Come nel caso bielettronico, per effetto del principio di antisimmetria, sono nulli tutti i coefficienti dei prodotti aventi almeno due fattori uguali; ogni prodotto della somma è allora costituito da funzioni monoelettroniche diverse tra loro (prodotto di Hartree). Fissato un dato insieme k di N indici {k1 , . . . , kN }, indichiamo con Φk (x1 , . . . , xN ) il corrispondente prodotto di Hartree [φk1 (x1 ) · · · φkN (xN )] e con ck il relativo coefficiente nella (2.13); data l’ortonormalità dell’insieme {φk (x)}, ogni ck è ottenibile dall’espressione: Z ck = hΦk (x1 , . . . , xN )|ψ(x1 , . . . xN )i ≡ dx1 · · · dxN φk1 (x1 ) · · · φkN (xN )ψ(x1 , . . . xN ) (2.14) CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 23 Il coefficiente ckP corrispondente ad un prodotto di Hartree ΦPk (x1 , . . . , xN ) che differisca da Φk (x1 , . . . , xN ) soltanto per una permutazione P̂ degli indici in k [che differisca cioè da Φk (x1 , . . . , xN ) soltanto per l’ordine con cui compaiono la varie funzioni φ che lo compongono] è dato da: ckP = hΦPk |ψi = hΦk |P̂ ψi = P hΦk |ψi = P ck (2.15) Diviene allora possibile raggruppare nella (2.13) tutti i termini che differiscono al più per una permutazione degli indici e, tenuto conto della (2.15), abbiamo: ψ(x1 , . . . , xN ) = N! XX k ck p Φpk (x1 , . . . , xN ) (2.16) p=1 P ! p Riconosciamo in ciascun termine N p=1 p Φk della sommatoria su k l’espressione di un determinante [determinante di Slater, Ψk (x1 , . . . xN )], e precisamente: φ (x ) · · · φ (x ) k1 1 kN 1 1 .. .. Ψk (x1 , . . . xN ) = √ (2.17) . . N! φk1 (xN ) · · · φkN (xN ) dove si è introdotto il coefficiente di normalizzazione (1/N !)1/2 . È conviente definire un operatore di antisimmetrizzazione  che, agendo su un prodotto di Hartree produca il corrispondente determinante di Slater: N! 1 X p P̂  = (2.18) N ! p=1 da cui: ÂΦk = 1 X 1 X 1 p P̂ Φk = p Φpk = √ Ψk N! p N! p N! (2.19) Si verifica facilmente la normalizzazione di ciascun determinante di Slater: N! N! 1 X 1 X hΨk |Ψk i = p p hP̂r Φk |P̂s Φk i = p p hΦk |P̂r P̂s Φk i N ! r,s=1 r s N ! r,s=1 r s (2.20) dove ciascun integrale hΦk |P̂r P̂s Φk i vale 1 se e solo se r = s, zero altrimenti; infatti, nel caso in cui le due permutazioni P̂r e P̂s non siano identiche Pr Ps = Pq 6= I (dove I è la permutazione identica: applicare due volte la stessa permutazione ha l’effetto di non permutare alcunché); allora se P̂q è la permutazione che scambia gli elettroni, poniamo r e s, fattorizzando l’integrale secondo l’espressione p hΦk |Φkq i = hφk1 (x1 )|φk1 (x1 )i · · · hφkr (xr )|φks (xr )i · · · hφks (xs )|φkr (xs )i · · · (2.21) compaiono degli integrali del tipo hφkr |φks i che sono nulli data l’ortonormalità dell’insieme delle φ. Da ciò deriva: N! N! 1 X 1 X 2 hΨk |Ψk i = p p δrs = =1 N ! r,s=1 r s N ! r=1 pr (2.22) CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 24 dove si è tenuto conto del fatto che 2pr vale evidentemente sempre 1 essendo, per qualunque permutazione, il quadrato di 1 o -1. In definitiva, la funzione d’onda di un sistema multielettronico è esprimibile in modo esatto come combinazione lineare (in linea di principio infinita) di determinanti di Slater (chiamati anche detor), costruiti su un insieme completo di funzioni φ, autofunzioni di un qualunque operatore monoelettronico Hermitiano: P ψ(x , . . . , x ) = 1 N k ck Ψk (x1 , . . . , xN ) √ Ψk (x1 , . . . , xN ) = N ! ÂΦk (x1 , . . . , xN ) (2.23) P  = 1/N ! P̂ p p Φ (x , . . . , x ) = φ (x ) · · · φ (x ) k 1 N ki 1 kN N Si sottolinea il fatto che ciascun prodotto di Hartree Φk è costruito a partire da N spin-orbitali φ monoelettronici diversi tra loro (in effetti, è nullo ogni detor ottenuto antisimmetrizzando un prodotto di Hartree contenente almeno due spin-orbitali). Questa è la base del Principio di Esclusione di Pauli secondo il quale, entro un atomo, a ogni elettrone compete un insieme di numeri quantici diversi da quelli di ogni altro elettrone (in pratica, uno dato spin-orbitale può essere occupato al più da un elettrone). Nei calcoli pratici su sistemi multielettronici è, per ovvie ragioni, impossibile trattare con serie infinite di detor, per cui la funzione d’onda multielettronica viene solitamente espressa da una serie finita di detor o, al limite, da un detor solamente (metodo Hartree-Fock). Si noti che, ai fini della corretta rappresentazione della funzione d’onda multielettronica ψ, nel caso della serie infinita di detor è del tutto ininfluente la scelta dell’insieme di funzioni monoelettroniche φ: qualunque insieme completo di funzioni fornisce l’esatta rappresentazione di ψ. Nel caso di una serie finita di detor è invece necessario scegliere e ottimizzare adeguatamente l’insieme di funzioni φ, al fine di ridurre il più possibile l’errore di troncamento. 2.4 Sistemi multinucleari Nel caso di un sistema multielettronico con più nuclei (molecola o cristallo), l’operatore Hamiltoniano H contiene i contributi cinetici dei nuclei e degli elettroni, e i contributi di potenziale dovuti alle interazioni elettrostatiche internucleari, interelettroniche e nucleo-elettrone: n N h̄2 X 1 2 h̄2 X 2 1 X Zk Zh e2 1 X e2 X Zk e2 H=− ∇ − ∇ + + − 2 k=1 Mk k 2m i=1 i 2 k,h6=k rkh 2 i,j6=j rij rki k,i (2.24) dove le sommatorie su k e h sono riferite agli n nuclei; le sommatorie su i e j sono riferite agli N elettroni; Mk e Zk sono rispettivamente la massa e il numero atomico del nucleo k; ∇2k e ∇2i sono i Laplaciani riferiti rispettivamente alle coordinate nucleari e a quelle elettroniche; m è la massa elettronica; e è il valore assoluto della carica elettronica; rkh , rij e rki sono, rispettivamente, le distanze tra i nuclei h e k, tra gli elettroni i e j e tra il nucleo k e l’elettrone i. CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 25 Data la grande differenza di massa tra i nuclei e gli elettroni, le velocità dei primi devono necessariamente essere molto più basse di quelle dei secondi: gli elettroni seguono il moto dei nuclei e modificano istantaneamente la loro configurazione per ogni dato insieme di posizioni nucleari. In termini formali, ciò vuol dire che è possibile fattorizzare la funzione d’onda complessiva (nuclei+elettroni) nel prodotto di due funzioni d’onda delle quali, una descrive lo stato dei nuclei nel campo medio creato dagli elettroni, e l’altra descrive lo stato multielettronico nel campo creato da una specifica configurazione nucleare. Questa separazione tra il moto elettronico e quello nucleare costituisce l’approssimazione di Born-Oppenheimer. In formule: Ψ(x, R) = ψ(x, R)φ(R) (2.25) dove x e R descrivono rispettivamente gli insiemi delle coordinate elettroniche (comprensive dello spin) e nucleari. Nella (2.25) la ψ(x, R) dipende parametricamente dalla configurazione nucleare R ed è autofunzione dell’Hamiltoniano elettronico N h̄2 X 2 X Zk e2 1 X e2 Hel = − ∇ − + 2m i=1 i rki 2 i,j6=j rij k,i (2.26) (dove la dipendenza parametrica dalle coordinate nucleari entra attraverso i termini di interazione nucleo-elettrone) con: Hel ψ(x, R) = Eel (R)ψ(x, R) (2.27) L’energia totale del sistema (a nuclei fissi), E(R), è la somma del contributo elettronico Eel e del potenziale internucleare: 1 X Zk Zh e2 E(R) = Eel (R) + (2.28) 2 k,h6=k rkh Per inciso, la configurazione nucleare di equilibrio (R◦ ) è quella corrispondente al minimo dell’energia E(R) rispetto alle coordinate nucleari: i h ∂E(R) =0 ∂R R◦ (2.29) h i ∂ 2 E(R) >0 ∂R2 R◦ Nel seguito faremo riferimento unicamente alla funzione multielettronica ψ(r, R) omettendo però di indicare la dipendenza dalla configurazione nucleare R; l’Hamiltoniana Hel e l’energia Eel (R) verranno per brevità indicate con i soli simboli H ed E. L’equazione del moto da studiare sarà la (2.27). Notiamo esplicitamente che l’operatore Hamiltoniano può essere scomposto nella somma di contributi monoelettronici h(i) e bielettronici g(i, j): Pn Zk e2 h̄2 2 ∇ − h(i) = − i k=1 rik 2m 2 (2.30) g(i, j) = reij H = P h(i) + 1 P i i,j6=i g(i, j) 2 CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 26 dove ciascun h(i) agisce sul solo elettrone i e ciascun g(i, j) agisce solo sulla coppia di elettroni (i, j). 2.5 L’energia elettronica nell’approssimazione monodeterminantale Si pone qui il problema di valutare l’energia elettronica E nell’ambito delle approssimazioni monoderminantale (Hartree-Fock, in cui la serie infinita di determinanti di Slater viene troncata al primo termine) e di Born-Oppenheimer: E = hΨ|H|Ψi √ (2.31) Ψ = N ! ÂΦ Q Φ= N i=1 φi (xi ) dove, Q ricordiamo, Φ è un prodotto (di Hartree) di N spin-orbitali monoelettronici φ (il simbolo indica appunto la produttoria degli N φi ),  è l’antisimmetrizzatore, Ψ è il detor corrispondente all’applicazione dell’antisimmetrizzatore sul prodotto di Hartree. L’antisimmetrizzatore è un operatore Hermitano (perchè somma di operatori Hermitiani) per il quale: A2 = A (qui e nel seguito omettiamo il simbolo ˆ di operatore); infatti, tenuto conto delle proprietà gruppuali degli operatori di permutazione, per cui Pp Pq = Pr , e che p q ≡ (−1)νp +νq = (−1)νr ≡ r , dove gli esponenti ν sono il numero di scambi effettuati dalle corrispondenti permutazioni, si ha: A2 = 1 X 1 XX 1 X P P = P = A=A p q p q r r N !2 p,q N !2 p r N! p (2.32) Inoltre, data l’indistinguibilità degli elettroni, l’antisimmetrizzatore commuta con l’Hamiltoniano (l’operatore Hamiltoniano resta invariato se scambiamo tra loro due elettroni qualunque): [A, H] = 0, da cui: E = hΨ|H|Ψi = N !hAΦ|H|AΦi = N !hΦ|AHA|Φi = N !hΦ|HA2 |Φi = N !hΦ|H|AΦi = = N! X N N Y Y p h φi (xi )|H|Pp φj (xj )i = p = i N! X N X p k=1 j N N Y Y p h φi (xi )|h(k)|Pp φj (xj )i + i j N! N N N Y Y 1X X + p h φi (xi )|g(k, `)|Pp φj (xj )i 2 p k,`6=k i j (2.33) CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 27 Consideriamo dapprima i contributi monoelettronici nella (2.33); poiché il singolo operatore monoelettronico h(k) agisce solo sull’elettrone k, per tutte le permutazioni Pp che scambiano due qualunque elettroni r ed s, e che non interessano l’elettrone k si ha: Q QN h N i φi (xi )|h(k)|Pp j φj (xj )i = (2.34) hφr (xr )|φs (xr )ihφs (xs )|φr (xs )ihφk (xk )|h(k)|φk (xk )i Q i6=k,r,s hφi (xi )|φi (xi )i Data l’ortormalità dell’insieme delle φ, gli integrali del tipo hφr (xr )|φs (xr )i sono nulli, quindi il relativo contributo al termine monoettronico si annulla. Se Pp scambia l’elettrone k con qualche altro elettrone r si ha, similmente: Q QN h N φ (x )|h(k)|P i i p i j φj (xj )i = (2.35) hφr (xr )|φk (xr )ihφk (xk )|h(k)|φr (xk )i Q i6=k,r hφi (xi )|φi (xi )i Anche qui, l’integrale hφr (xr )|φk (xr )i annulla il relativo contributo. L’unico termine non nullo nella sommatoria su tutte le possibili permutazioni è quello relativo alla permutazione identica I: N N Y Y Y (2.36) h φi (xi )|h(k)|I φj (xj )i = hφk (xk )|h(k)|φk (xk )i hφi (xi )|φi (xi )i ≡ hk i j i6=k Valendo 1 la parità della permutazione identica, il contributo monoelettronico complessivo all’equazione (2.33) vale: X X hk (2.37) hφk |h(k)|φk i = k k Vediamo ora i contributi bielettronici; come accade per i termini monoelettronici, poiché l’operatore g(k, `) agisce solo sugli elettroni k ed `, tutte le permutazioni che coinvolgono scambi di elettroni diversi da k e da ` portano a un contributo nullo. Gli unici due contributi non nulli si hanno nel caso della permutazione identica (parità 1) e della permutazione Pk` che scambia i corrispondenti due elettroni (parità -1), da cui: PN ! p Q QN p h N i φi (xi )|g(k, `)|Pp j φj (xj )i = (2.38) hφk (xk )φ` (x` )|g(k`)|φk (xk )φ` (x` )i − hφk (xk )φ` (x` )|g(k`)|φ` (xk )φk (x` )i Fattorizzando gli spin-orbitali φ(x) nel prodotto di una funzione orbitale η(r) e di una funzione di spin χ(s) e tenuto conto che l’operatore g non agisce sulle componenti di spin (siamo appunto nell’ambito dell’approssimazione spin-orbitale che esclude nell’Hamiltoniano termini di accoppiamento spin-orbita), vediamo per il primo termine a destra dell’uguaglianza, nella (2.38): hφk (xk )φ` (x` )|g(k`)|φk (xk )φ` (x` )i = hηk (rk )η` (r` )|g(k`)|ηk (rk )η` (r` )ihχk (s)|χk (s)ihχ` (s)|χ` (s)i = hηk (rk )η` (r` )|g(k`)|ηk (rk )η` (r` )i ≡ gk`,k` (2.39) CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 28 Per il secondo termine della (2.38) vale invece: hφk (xk )φ` (x` )|g(k`)|φ` (xk )φk (x` )i = hηk (rk )η` (r` )|g(k`)|η` (rk )ηk (r` )ihχk (s)|χ` (s)ihχ` (s)|χk (s)i = (2.40) hηk (rk )η` (r` )|g(k`)|η` (rk )ηk (r` )iδχk χ` ≡ gk`,`k δχk χ` Si noti che i contributi (2.40) sono nulli se la coppia di spin-orbitali k ed ` è riferita a elettroni con spin opposti (χk 6= χ` → δχk χ` = 0). In definitiva, l’energia EHF nell’approssimazione monodeterminantale (Hartree-Fock, HF) è: EHF = N X k N N 1 X 1 X hk + gk`,k` − gk`,`k δχk χ` 2 k,`6=k 2 k,`6=k (2.41) χk =χ` I termini hk contengono il contributo cinetico e quello potenziale dovuto all’interazione dell’elettrone k con gli n nuclei del sistema. I termini gk`,k` descrivono l’interazione Coulombiana tra gli elettroni k ed `; per tale motivo vengono chiamati integrali Coulombiani: Z e2 |ηk (rk )|2 |η` (r` )|2 gk`,k` ≡ drk dr` (2.42) |rk − r` | A livello Hartree-Fock, il contributo Coulombiano bielettronico viene quindi valutato come l’interazione tra le due distribuzioni di carica e|ηk (rk )|2 ed e|η` (r` )|2 . I termini gk`,`k vengono detti integrali di scambio: Z e2 η k (rk )η` (rk )η ` (r` )ηk (r` ) gk`,`k = drk dr` (2.43) |rk − r` | Tali termini (presenti solo per coppie di elettroni aventi lo stesso spin) sono l’espressione del principio di antisimmetria all’interno dell’approssimazione di Hartree-Fock: poiché due elettroni con spin identico tendono a evitarsi, la loro interazione Coulombiana repulsiva sarà più bassa rispetto a quella che si ha tra due elettroni a spin opposto; in tal caso il termine Coulombiano (2.42) viene diminuito del termine di scambio (2.43). Si noti che l’energia di scambio non ha uno specifico significato fisico: si tratta di un termine correttivo al modo con cui, in ambito Hartree-Fock, si calcola l’energia di interazione Coulombiana interelettronica. Introduciamo i simboli Jk e Kk e i due nuovi operatori monoelettronici Coulombiani e di scambio J e K, tali che: X0 X0 X0 Jk = gk`,k` = hφk φ` |g(k, `)|φk φ` i = hφk | hφ` |g(k, `)|φ` i|φk i ≡ hφk |J|φk i (2.44) Kk = ` ` ` X0 X0 X0 ` gk`,`k = ` hφk φ` |g(k, `)|φ` φk i = hφk | ` hφ` |g(k, `)|φk i|φ` i ≡ hφk |K|φk i (2.45) CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 29 X0 dove la notazione indica una sommatoria su tutti gli indici ` 6= k, e dove si sono reintro` dotti gli spin-orbitali [nella (2.45) tutti i termini con χ` 6= χk sono nulli; formalmente, si può quindi sommare su tutti gli ` omettendo di indicare la restrizione χ` = χk ]. Possiamo allora scrivere: N X 1 1X 1 EHF = hk + (hk + Jk − Kk ) = hφk |(h + F )|φk i (2.46) 2 2 2 k k dove F =h+J −K (2.47) è l’operatore monoelettronico di Fock. Il valor medio di F nello stato φk è: εk = hφk |F |φk i (2.48) e rappresenta l’energia (cinetica+potenziale) dell’elettrone k nel campo medio creato da tutti gli altri n − P1 elettroni e dai nuclei (energia associata all’orbitale φk ); l’energia EHF è dunque pari a 1/2 k (hk + εk ). La funzione d’onda monodeterminantale ΨHF non è che un’approssimazione della vera funzione multielettronica ψ e, in quanto tale, non è autofunzione dell’Hamiltoniano esatto del sistema (esatto, ferme restando le approssimazioni spin-orbitale, non relativistica e di BornOppenheimer). Con il procedimento di Hartree-Fock (HF), il carattere approssimato del problema multielettronico viene trasferito dalla funzione d’onda all’Hamiltoniano; ΨHF risulta essere autofunzione dell’Hamiltoniano efficace di Hartree-Fock: HHF = 1/2(h + F ) 2.6 (2.49) Energia di correlazione Poiché, in ambito HF, le interazioni Coulombiana e di scambio tra due elettroni vengono calcolate attraverso la distribuzione media dei singoli elettroni [si rivedano le (2.42) e (2.43)] e, quindi, senza tener conto della correlazione tra le posizioni istantanee degli stessi, si parla di errore di correlazione. La vera funzione d’onda ψ potrà essere formalmente scritta come la somma di ΨHF e di una funzione di correlazione ψcorr , per cui: E = hψ|H|ψi = hΨHF + ψcorr |H|ΨHF + ψcorr i = = hΨHF |H|ΨHF i + hψcorr |H|ΨHF i + hΨHF |H|ψcorr i + hψcorr |H|ψcorr i = = EHF + Ecorr (2.50) L’energia di correlazione Ecorr è dunque, per definizione, la differenza tra l’energia vera del sistema multielettronico e l’energia calcolata nell’ambito dell’approssimazione monodeterminantale. Cosı̀ come per l’energia di scambio, anche all’energia di correlazione non può essere attribuito un preciso significato fisico, essendo niente più che un termine correttivo all’energia di Hartree-Fock. CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI 2.7 30 Metodo Variazionale Come detto, l’espansione della funzione d’onda multielettronica ψ in una serie infinita di determinanti di Slater (espansione di Boys) è esatta per qualunque insieme completo di funzioni monoelettroniche φ, con le quali si costruiscono i prodotti di Hartree. Tuttavia, troncando la serie a un solo termine, si pone il problema di determinare il miglior insieme di funzioni φ attraverso le quali esprimere ψ con il minimo errore. In campo molecolare tali funzioni vengono chiamate orbitali molecolari. Dato l’operatore Hamiltoniano del sistema, l’insieme delle sue autofunzioni {ψi }i=0,∞ è ortonormale completo, il che vuol dire che qualunque funzione φ può essere espressa come combinazione lineare delle ψ. Consideriamo una di tali combinazioni lineari, normalizzata, troncata a n termini, che rappresenta una possibile approssimazione dell’autofunzione ψ0 di H associata al più basso autovalore E0 (stato fondamentale): φ= n X ci ψi (2.51) i=0 P Dalla condizione hφ|φi = 1 (φ è normalizzata) risulta i |ci |2 = 1. Ordiniamo le funzioni ψi secondo il valore dell’autovalore (energia Ei ) a esse associato; l’energia E calcolata usando la funzione φ sarà: X X X ci cj hψi |H|ψj i = ci cj Ej hψi |ψj i = |ci |2 Ei (2.52) E = hφ|H|φi = i,j i,j i dove si è tenuto conto del fatto che hψi |ψj i = δij . Poiché ciascun Ei ≥ E0 , sostituendo ogni Ei con E0 , abbiamo : X X |ci |2 Ei ≥ E0 |ci |2 = E0 → E ≥ E0 (2.53) i i La disuguaglianza (2.53) ci dice che l’energia calcolata con una funzione d’onda approssimata φ non è mai inferiore all’energia esatta dello stato fondamentale ψ0 del sistema. Evidentemente, E = E0 nel caso in cui φ = ψ0 (cioè, nel caso in cui la φ sia la funzione d’onda esatta per lo stato fondamentale). Questo importante risultato prende il nome di teorema variazionale. Tale teorema è alla base del metodo variazionale: dato un qualunque insieme ortonormale completo di funzioni ψi , la miglior approssimazione possibile dello stato fondamentale del sistema, espressa come combinazione lineare φ di un sottoinsieme delle ψi , si ottiene minimizzando l’energia in funzione dei coefficienti ci della combinazione lineare. In effetti, tanto più bassa è E, tanto più si avvicina a E0 , tanto più φ si approssima a ψ0 . In formule: φ[c] = Pn i=1 ci ψi → E[c] = hφ|H|φi hφ|φi (2.54) ∂E[c] =0 ∂c dove si è indicata esplicitamente la dipendenza funzionale di φ e di E dall’insieme c dei coefficienti ci e si è rimosso il vincolo sulla normalizzazione di φ (per cui è comparso il denominatore hφ|φi). CAPITOLO 2. APPLICAZIONI A SISTEMI ATOMICI E MOLECOLARI Lavorando con combinazioni lineari reali di funzioni ψi reali e notando che hφ|φi = abbiamo: X X X hφ|φiE = hφ|H|φi → E |ci |2 = ci cj hψi |H|ψj i = ci cj hij i i,j 31 P i |ci |2 , (2.55) i,j da cui, derivando rispetto a ck , tenuto conto che hki = hik (la matrice Hamiltoniana è Hermitiana e reale, se costruita con funzioni ψ reali): X ∂E X 2 |ci | + 2Eck = 2 hki ci ∂ck i i Per la (2.54) le derivate ∂E/∂ck sono nulle e, quindi: X hki ci = Eck (2.56) (2.57) i Esiste una di tali equazioni per ogni coefficiente ck ; nell’insieme vale l’equazione matriciale: hc = Ec (2.58) la cui soluzione fornisce gli autovalori e le autofunzioni dell’energia. Si tratta allora di risolvere l’equazione secolare |h − EI| = 0 (dove I è la matrice identità): perchè si abbiano soluzioni non banali si deve annullare il determinante associato al sistema omogeneo (h − EI) c = 0. La soluzione del problema variazionale coincide dunque con la diagonalizzazione della matrice h rappresentativa dell’operatore Hamiltoniano nello spazio delle funzioni ψ. Capitolo 3 Spazio di Fock e seconda quantizzazione Tornando al problema di Hartree-Fock, nello spirito del metodo variazionale, è possibile ottenere il miglior insieme di orbitali molecolari per l’approssimazione monodeterminantale della funzione d’onda multielettronica, minimizzando l’energia EHF di cui alla (2.46) rispetto a variazioni delle φk . Per esprimere tali variazioni e la conseguente derivata dell’energia lavoreremo nello spazio di Fock, con i cosiddetti metodi di seconda quantizzazione, la cui definizione è l’oggetto della presente sezione. 3.1 Rappresentazione dello stato di un sistema nello spazio di Fock Sia {ψi (x)}i=1.∞ un insieme di funzioni d’onda monoelettroniche, autofunzioni di un operatore Hamiltoniano monoelettronico h(i). Un sistema multielettronico descritto entro un modello P a particelle indipendenti (IPM: independent particle model) prevede un Hamiltoniano di N funzioni ψi sono autoH = N i h(i); è facile verificare che prodotti antisimmetrizzati √ QN funzioni di H. Una funzione Ψk (x1 , . . . , xN ) = N ! i=1 ψki (xi ) può essere vista come la rappresentazione di Schrödinger di un vettore |k1 , . . . , kN i dello spazio di Fock: ψ (x ) · · · ψ (x ) k1 1 kN 1 1 .. .. hx|k1 , . . . , kN i = √ (3.1) . . N! ψk1 (xN ) · · · ψkN (xN ) Tale vettore indica l’occupazione degli N spin-orbitali {ψk1 , . . . , ψkN }, da parte degli N elettroni. Si noti che, a causa dell’antisimmetria, valgono relazioni del tipo |iji = −|jii (scambio di due colonne nel determinante associato). Indicando con |∅i lo stato vuoto che non contiene elettroni, definiamo gli operatori creazione di elettroni a+ j che, applicati allo stato vuoto creano un elettrone nello spin-orbitale ψj : a+ j |∅i = |ji 32 (3.2) CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 33 L’effetto dell’applicazione di a+ j su un qualunque vettore |k` · · · pi che non contiene j è quello di porre un nuovo elettrone nello spin-orbitale ψj : νr a+ j |k` · · · pi = |k` · · · pji = (−1) |k`j · · · pi (3.3) dove νr è il numero di permutazioni necessarie per riordinare la lista degli spin-orbitali come indicato nella (3.3). Viceversa, poiché non è possibile porre più di un elettrone in un dato + + spin-orbitale, a+ j |k`j · · · pi = 0. Dati due operatori creazione ai e aj e un vettore che non contenga né i né j, abbiamo: + + a+ i aj |k · · · pi = ai |k · · · pji = |k · · · pjii (3.4) + a+ j ai |k · · · pi = |k · · · piji = −|k · · · pjii + + + Ciò significa che a+ i aj + aj ai = 0 (la stessa relazione è verificata se i o j o entrambi sono contenuti nel vettore su cui gli operatori sono applicati). In tal caso si dice che i due operatori + anticommutano e si usa la notazione [a+ i , aj ]+ = 0. Parimenti è possibile definire degli operatori distruzione a− j che distruggono un elettrone nello spin-orbitale ψj . L’applicazione di un qualunque operatore distruzione allo stato vuoto produce 0; lo stesso si verifica applicando a− j a un vettore che non contiene j. Negli altri casi: a− j |k · · · pji = |k · · · pi νr a− j |k · · · j · · · pi = (−1) |k · · · 6 j · · · pi (3.5) dove νr è il numero di scambi necessari per portare j in fondo alla lista. È facile verificare che − anche per gli operatori distruzione vale la relazione di anticommutazione [a− i , aj ]+ = 0. + + − Vediamo ora l’effetto dell’applicazione dei prodotti a− i aj e aj ai , con i 6= j, sul vettore |k · · · i · · · pi che non contiene j: + − νr a− i aj |k · · · i · · · pi = ai |k · · · i · · · pji = (−1) |k · · · 6 i · · · pji − νr −1 + a+ aj |k · · · 6 i · · · pi = (−1)νr −1 |k · · · 6 i · · · pji j ai |k · · · i · · · pi = (−1) (3.6) Se |k · · · i · · · pi contenesse j (o se considerassimo un vettore |k · · · pi che non contiene i) entrambi i prodotti di operatori darebbero risultato nullo. Dalle due equazioni (3.6) si desume + quindi che [a− i , aj ]+ = 0. D’altra parte, se i = j e il vettore |k · · · pi non contiene j: + − a− j aj |k · · · pi = aj |k · · · pji = |k · · · pi − a+ j aj |k · · · pi = 0 (3.7) Viceversa, se |k · · · pi contiene j, + a− j aj |k · · · j · · · pi = 0 − a+ j aj |k · · · j · · · pi = (−1)νr a+ j |k (3.8) νr · · · 6 j · · · pi = (−1) |k · · · 6 j · · · pji = |k · · · j · · · pi CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 34 + + − Complessivamente la (3.7) e (3.8) indicano che a− j aj + aj aj = 1 da cui, considerando la (3.6), − si ottiene [a+ i , aj ]+ = δij . La condizione di normalizzazione di uno spin-orbitale, per cui hψk |ψk i = 1, implica nello spazio di Fock: + † + + † + −1 † + (3.9) hk|ki = 1 = h∅|(a+ k ) ak |∅i → (ak ) ak = 1 → (ak ) = (ak ) vale a dire: gli operatori creazione sono unitari (il coniugato Hermitiano coincide con l’operatore inverso). D’altra parte, come è facile verificare, l’inverso di un operatore creazione a+ j è − l’operatore distruzione aj e, dunque, il coniugato Hermitano di un operatore creazione è un operatore distruzione. Possiamo allora semplificare leggermente la notazione e indicare con aj un operatore distruzione e con a†j l’operatore creazione. Riassumendo, le relazioni anticommutazione per gli operatori creazione/distruzione sono: [ai , aj ]+ = 0 (3.10) [a†i , a†j ]+ = 0 † [ai , aj ]+ = δij Si noti che, se a†j |∅i = |ji, vale hj| = h∅|(a†j )† = h∅|aj : un operatore aj crea dunque un elettrone nello spin-orbitale j se, anzichè vettori ket nello spazio di Fock, si usano vettori bra. Similmente, un operatore creazione sul ket è un operatore distruzione sul bra. 3.2 Operatori nello spazio di Fock Consideriamo ora la rappresentazione di un operatore F̂ nello spazio di Fock, soffermandoci in primo luogo sugli operatori monoelettronici. Sia F S la rappresentazione dell’operatore monoelettronico F̂ nello spazio di Schrödinger. Sappiamo che l’applicazione di F S a uno spin-orbitale ψk (x) (appartenente a un insieme ortonormale completo {ψi }) produce un nuovo stato che, rappresentato nello spazio di Schrödinger, è esprimibile come combinazione lineare di spin-orbitali appartenenti allo stesso insieme {ψi }: X F S ψk (x) = Fk0 k ψk0 (x) (3.11) k0 Ricordato che ψk (x) ≡ hx|ψk i ≡ hx|ki (dove, per brevità, si è indicato con |ki il vettore |ψk i), moltiplicando a destra per hx|qi = hq|xi e integrando su tutte le coordinate (spaziali e di spin) si ottiene: Z Z X X X S hq|xiF hx|ki dx = Fk0 k hq|xidxhx|k 0 i = Fk0 k hq|k 0 i = Fk0 k δqk0 = Fqk (3.12) k0 k0 k0 dove si è sfruttata la condizione di completezza (1.25) e l’ortonormalità dell’insieme {ψi }. In sostanza, i coefficienti Fk0 k che compaiono nella (3.11) sono dati da: Fk0 k = hk 0 |F S |ki (3.13) CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 35 P Gli operatori monoelettronici di nostro interesse sono sempre della forma F̂ = i F̂ (i), vale a dire: sono sempre somme di operatori monoelettronici, ognuno dei quali agisce su S un elettrone √ specifico. Nella rappresentazione di Schrödinger, l’azione di F su un detor Ψ1···N = N !ÂΦ1···N , essendo Φ1···N il prodotto di Hartree ψ1 (x1 ) · · · ψN (xN ), è data da √ S S N !F  F Ψ1···N = N Y √ ψj (xj ) = N! j=1 √ = N! XX i N X i=1 Fki Âψk (xi ) k N Y  N Y ψj (xj )F S (i)ψi (xi ) = j6=i ψj (xj ) = XX j6=i i Fki Ψ1···k···N (3.14) k dove si è sfruttata la commutabilità dell’antisimmetrizzatore  con gli operatori monoelettronici F S (i) e il fatto che, in generale, il risultato dell’applicazione di F su uno stato rappresentato da ψi è un nuovo stato rappresentabile come combinazione lineare delle stesse funzioni ψk . Si noti che nella (3.14) la sommatoria su i è sugli N elettroni, mentre quella su k non è limitata superiormente (almeno, se l’insieme {ψi } non è finito). Si verifica facilmente che i coefficienti Fki sono gli elementi di matrice: Fki = h1 · · · k · · · N |F S (i)|1 · · · i · · · N i (3.15) dove la scrittura |1 · · · N i indica il detor costruito con gli spin-orbitali (1, . . . , N ). Nello spazio di Fock, il vettore |1 · · · k · · · N i, corrispondente al detor Ψ1···k···N , si può ottenere dal vettore |1 · · · i · · · N i attraverso l’applicazione dell’operatore a†k ai che distrugge un elettrone nello spin-orbitale ψi e crea un elettrone nello spin-orbitale ψk : |1 · · · k · · · N i = a†k ai |1 · · · i · · · N i (3.16) quindi, indicando con F F la rappresentazione di F̂ nello spazio di Fock, in corrispondenza della (3.14) troviamo un’equazione: XX F F |1 · · · N i = Fki a†k ai |1 · · · N i (3.17) i k La sommatoria su i nella (3.17) può formalmente essere estesa all’infinito (l’indice i può quindi variare su tutti i valori assunti dall’indice k) perchè per ogni valore di i > N l’operatore distruzione ai applicato al vettore |1 · · · N i produce un risultato nullo (infatti, se i > N , lo spin-orbitale ψi non è occupato in |1 · · · N i). In definitiva, dovendo la (3.17) valere per un detor qualunque, rinominando gli indici, si ha: X FF = Fij a†i aj (3.18) i,j Veniamo ora al caso degli operatori bielettronici del tipo B = P i,j6=i B(i, j). L’effetto CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 36 dell’applicazione di B S sul detor Ψ1···N è: S B Ψ1···N √ = S N !B  N Y √ ψk (xk ) = N! k=1 √ N! N X i,j6=i √ N! N X  N Y ψk (xk ) X N Y ψk (xk )B S (i, j)ψi (xi )ψj (xj ) = k6=i,j Bmn,ij ψm (xi )ψn (xj ) = m,n N Y Bmn,ij Âψm (xi )ψn (xj ) i,j6=i m,n N X X  i,j6=i k6=i,j X N X ψk (xk ) = k6=i,j Bmn,ij Ψ1···m···n···N (3.19) i,j6=i m,n dove Bmn,ij = hmn|B S (i, j)|iji. Nello spazio di Fock, al detor Ψ1···m···n···N corrisponde il vettore |1 · · · m · · · n · · · N i, ottenuto dal vettore |1 · · · i · · · j · · · N i nel modo: |1 · · · m · · · n · · · N i = a†n aj |1 · · · m · · · j · · · N i = a†n aj a†m ai |1 · · · i · · · j · · · N i (3.20) Ricordate le (3.10), conviene distingure i due casi j 6= m e j = m. Nel primo caso: a†n aj a†m ai = −a†n a†m aj ai = a†m a†n aj ai (3.21) Nel secondo caso (j = m) abbiamo: a†n aj a†j ai = a†n (1 − a†j aj )ai = a†n ai − a†n a†j aj ai (3.22) Ora, a†n ai |1 · · · i · · · j · · · N i = |1 · · · n · · · j · · · N i e, d’altra parte, a†n a†j aj ai |1 · · · i · · · j · · · N i = (−1)νi a†n a†j aj |1 · · · 6 i · · · j · · · N i = (−1)νi a†n |1 · · · (3.23) 6 i · · · j · · · N i = |1 · · · n · · · j · · · N i quindi nel caso j = m, l’applicazione dell’operatore a†n ai −a†n a†j aj ai al vettore |1 · · · i · · · j · · · N i produce un risultato nullo. In considerazione di questo fatto e della possibilità di estendere le sommatorie sugli indici i e j a tutto il campo di variabilità degli indici m e n (per lo stesso motivo visto nel caso degli operatori monoelettronici), abbiamo: X B F |1 · · · i · · · j · · · N i = Bmn,ij a†m a†n aj ai |1 · · · i · · · j · · · N i (3.24) i,j,m,n dove anche il vincolo i 6= j è rimosso (aj aj |1 · · · i · · · j · · · N i = 0, quindi la rimozione del vincolo è ininfluente sul risultato). In definitiva, X BF = Bmn,ij a†m a†n aj ai (3.25) i,j,m,n CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE Nello spazio di Fock, l’Hamiltoniano H = HF = X i,j P i hij a†i aj + h(i) + 1/2 P0 i,j 37 g(i, j) è espresso da: 1 X gmn,ij a†m a†n aj ai 2 i,j,m,n (3.26) con hij = hi|h|ji; gmn,ij = hmn|g|iji. Il valor medio dell’energia in un dato stato | i sarà dato dall’equazione X 1 X hij ha†i aj i + E = hHi = gmn,ij ha†m a†n aj ai i (3.27) 2 i,j i,j,m,n 3.3 Equazioni di Hartree-Fock Siamo ora pronti per affrontare il problema variazionale connesso alla ricerca del miglior insieme di funzioni monoelettroniche (orbitali molecolari) per la rappresentazione dello stato fondamentale multielettronico, nell’ambito dell’approssimazione monodeterminantale. Si tratta di cercare il minimo dell’energia E = hΨ|H|Ψi rispetto a variazioni arbitrarie di Ψ, essendo H l’Hamiltoniano (3.26) e Ψ un determinante di Slater. Formalmente, una variazione di Ψ può essere espressa come l’applicazione di un operatore U alla Ψ, per produrre una nuova funzione Ψ0 : |Ψ0 i = U |Ψi. Unico vincolo richiesto per la trasformazione è la conservazione della norma, per cui: hΨ0 |Ψ0 i = 1 = hU Ψ|U Ψi = hΨ|U † U |Ψi → U † U = I (3.28) dove I è l’operatore identità. In sostanza, si richiede che U sia unitario (il coniugato Hermitiano di U coincide con l’operatore inverso U −1 ). Conviene definire U attraverso un operatore R tale che: U = eR (3.29) † dove R è un operatore antihermitiano: R† = −R; in tal modo U † U = eR eR = eR−R = I. Si noti che per R tendente a 0, la trasformazione U è infinitesima (in tal caso U tende a I). La variazione infinitesima di E (δE) a seguito di una trasformazione infinitesima U sarà data da: E + δE = hΨ0 |H|Ψ0 i = hΨ|U † HU |Ψi = hΨ|e−R HeR |Ψi (3.30) Sviluppando in serie gli esponenziali, abbiamo: 1 1 e−R HeR = (I − R + R2 − · · · )H(I + R + R2 + · · · ) = 2 2 1 1 = H + HR − RH − RHR + HR2 + R2 H + · · · = 2 2 1 = H + [H, R] + [[H, R], R] + · · · 2 (3.31) Trascurando i termini di ordine superiore al primo (si tratta di una trasformazione infinitesima) e imponendo la stazionarietà dell’energia a seguito di tale trasformazione (δE = 0) otteniamo: δE = hΨ|[H, R]|Ψi = 0 (3.32) CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 38 La (3.32) prende il nome di condizione di Brillouin. Nello spazio di Fock, diamo ad R la forma di operatore monoelettronico: X R= (3.33) ∆sr a†r as r,s e l’antihermiticità di R si traduce nella relazione ∆†ij = −∆ji dove, per definizione di matrice aggiunta (∆† ), ∆†ij = ∆ji . Nello spazio di Fock, al detor Ψ corrisponde il vettore |1 · · · N i in cui solo gli spin-orbitali con indici compresi tra 1 e N sono occupati, mentre tutti gli altri sono vuoti. Nel seguito, gli indici i, j, . . . si riferiranno a spin-orbitali occupati, mentre gli indici m, n, . . . indicheranno quelli vuoti. Usando la condizione di Brillouin e separando le sommatorie sui sottoinsiemi di indici (i, j 6= i), (i, m), (m, i), (m, n 6= m), (i, i) e (m, m) che, nell’insieme, costituiscono tutte le possibili combinazioni, abbiamo: X X δE = ∆ij hΨ|Ha†j ai |Ψi − ∆ij hΨ|a†j ai H|Ψi + i,j6=i X i,j6=i ∆im hΨ|Ha†m ai |Ψi − X − X i,m X i,m ∆mi hΨ|Ha†i am |Ψi m,i X ∆mn hΨ|Ha†n am |Ψi − m,n6=m ∆ii hΨ|Ha†i ai |Ψi ∆mn hΨ|a†n am H|Ψi + m,n6=m − X i X ∆mi hΨ|a†i am H|Ψi + m,i X X ∆im hΨ|a†m ai H|Ψi + ∆ii hΨ|a†i ai H|Ψi + i ∆mm hΨ|Ha†m am |Ψi m − X ∆mm hΨ|a†m am H|Ψi = 0 (3.34) m La maggior parte dei termini nella (3.34) è nulla: i termini hΨ|Ha†j ai |Ψi (prima sommatoria) sono nulli perchè prevedono la creazione di un elettrone in uno spin-orbitale già occupato (ψj ); i termini hΨ|a†j ai H|Ψi (seconda sommatoria) sono nulli perchè prevedono l’azione da destra dell’operatore a†j ai sul bra hΨ| (creazione di un elettrone nello spin-orbitale già occupato ψi si ricordi che un operatore distruzione su un ket è di creazione sul corrispondente bra); per motivi analoghi si annullano le sommatorie 4, 5, 7, 11, 12 (tutte per distruzione di elettroni in m) e la 8 (distruzione di un elettrone in n). I termini hΨ|Ha†i ai |Ψi e hΨ|a†i ai H|Ψi sono entrambi uguali a hΨ|H|Ψi, quindi la coppia di sommatorie 9 e 10 si annulla identicamente. Le uniche due sommatorie non nulle sono la 3 e la 6, da cui: X X δE = ∆im hΨ|Ha†m ai |Ψi − ∆mi hΨ|a†i am H|Ψi = 0 (3.35) i,m m,i D’altra parte, il complesso coniugato dei termini hΨ|a†i am H|Ψi nella seconda sommatoria della (3.35) è hΨ|a†i am H|Ψi = hΨ|(a†i am H)† |Ψi = hΨ|Ha†m ai |Ψi (3.36) e, poiché ∆ è antihermitiana, ∆†mi = −∆im ; perciò −∆mi = ∆im (si ricordi che, per definizione di matrice aggiunta, ∆†mi = ∆im ). In definitiva, le due sommatorie nella (3.35) sono l’una la CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 39 complessa coniugata dell’altra, per cui è sufficiente considerarne una soltano nella ricerca del punto di stazionarietà di E: X δE = ∆im hΨ|Ha†m ai |Ψi = 0 (3.37) i,m dove, ricordiamo, l’indice i varia su tutti gli spin-orbitali occupati, mentre l’indice m su quelli vuoti (detti anche virtuali). Essendo i coefficienti ∆im nella (3.35) degli scalari assolutamente arbitrari, la condizione δE = 0 si traduce nell’annullamento di ogni termine hΨ|Ha†m ai |Ψi e la condizione di Brillouin prende la forma hΨ|H|Ψ(i → m)i = 0 (3.38) dove con |Ψ(i → m)i si è indicato il rappresentativo (nello spazio di Fock) del detor ottenuto promuovendo un elettrone dallo spin-orbitale ψi allo spin-orbitale ψm . Vediamo ora in dettaglio la forma assunta dell’operatore Ha†m ai , essendo H l’Hamiltoniano (3.26), per cui: X 1 X Ha†m ai = grs,tu a†r a†s au at a†m ai (3.39) hrs a†r as a†m ai + 2 r,s,t,u r,s dove, ricordiamo, i coefficienti hrs e grs,tu altro non sono che degli scalari. Consideriamo dapprima i termini monoelettronici: a†r as a†m ai = a†r (δsm − a†m as )ai = δsm a†r ai − a†r a†m as ai (3.40) hrs ha†r as a†m ai i = hrs hδsm a†r ai i − hrs ha†r a†m as ai i (3.41) da cui: Il secondo termine a destra dell’uguaglianza nella (3.41) è nullo (infatti, considerata l’azione a destra sul bra hΨ|, tale termine prevede la distruzione di un elettrone nello spin-orbitale m che è vuoto) e quindi: X X X δsm hrs ha†r ai i = δri hrm = him ≡ hi|h|mi (3.42) hrs a†r as a†m ai = r,s r,s r Nei termini bielettronici compare il prodotto a†r a†s au at a†m ai che si trasforma in: a†r a†s au at a†m ai = a†r a†s au (δmt − a†m at )ai = δmt a†r a†s au ai − a†r a†s au a†m at ai = δmt a†r a†s au ai − a†r a†s (δum − a†m au )at ai = δmt a†r a†s au ai − δum a†r a†s at ai + a†r a†s a†m au at ai (3.43) Il valor medio h i dell’ultimo termine della (3.43) è nullo (distruzione di un elettrone nello spin-orbitale vuoto m, nel bra h |), da cui: X X X grs,tu δum ha†r a†s at ai i = grs,tu a†r a†s au at a†m ai = grs,tu δmt ha†r a†s au ai i − r,s,t,u r,s,t,u r,s,t,u X r,s,u X s grs,mu ha†r a†s au ai i − | {z } δri δsu gis,ms − X s gis,sm X r,s,t grs,tm ha†r a†s at ai i = | {z } δri δst (3.44) CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE In sintesi, ricombinando le (3.37), (3.42) e (3.44), otteniamo: X X δE = 0 → him + gij,mj − gij,jm = 0 j 40 (3.45) j Richiamando gli operatori h (2.37), J (2.44) e K (2.45), riconosciamo nella (3.45) l’elemento di matrice hi|F |mi dell’operatore monoelettronico di Fock (2.47), per cui la condizione di stazionarietà dell’energia E, a seguito di variazioni arbitrarie (ma che conservano la norma) della funzione d’onda monodeterminantale, si traduce nella: hψi |F |ψm i = 0 (3.46) per ogni coppia di spin-orbitali di cui uno occupato (i) e uno vuoto (m). L’equazione di HartreeFock (3.46) è certamente soddisfatta dalle autofunzioni di F ; in tal caso, infatti, stante le equazioni ( F |ψm i = εm |ψm i F |ψi i = εi |ψi i e tenuto conto che autostati associati ad autovalori diversi sono ortogonali, si ha: hψi |F |ψm i = εm hψi |ψm i = 0 (3.47) La ricerca del miglior insieme di funzioni monoelettroniche (orbitali molecolari) per l’approssimazione monodeterminantale della funzione d’onda multielettronica coincide, quindi, nella ricerca delle autofunzioni dell’operatore di Fock. È da notare che, nelle loro definizioni, gli operatori J e K già contengono gli orbitali molecolari e, cioè, le stesse funzioni che dovrebbero risultare dalla soluzione delle equazioni di HartreeFock. In pratica si segue una procedura iterativa per cui, (1) a partire da un adeguato insieme di funzioni di partenza (orbitali atomici) si ottengono gli operatori J e K; (2) si rappresenta l’operatore di Fock nello stesso insieme di orbitali atomici e si diagonalizza la matrice risultante; (3) le autofunzioni di F cosı̀ ottenute si utilizzano per ricalcolare J e K e si torna al punto (2). Il procedimento si arresta allorché la soluzione ottenuta a un certo passo non differisca per più di una certa soglia dalla soluzione ottenuta al passo precedente. Si parla di metodo a campo autoconsistente, da cui la sigla HF-SCF (Hartree-Fock, Self Consistent Field). 3.4 Funzioni base Come detto nella sezione precedente, la soluzione del problema multielettronico in ambito monodeterminantale passa attraverso la diagonalizzazione della matrice di Fock F , rappresentativa del corrispondente operatore F̂ in qualche spazio funzionale. In pratica, gli orbitali molecolari ψk vengono rappresentati da combinazioni lineari di funzioni ϕj : ψk (x) = M X j=1 akj ϕj (x) (3.48) CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 41 dove, seguendo il metodo variazionale, i coefficienti akj vengono ottenuti diagonalizzando la matrice F di elementi Fij = hϕi |F̂ |ϕj i. A prescindere dallo spin (e quindi, ponendo l’attenzione soltanto sulla parte orbitale di ciascun spin-orbitale), in linea di principio qualunque insieme completo di funzioni ϕj può essere usato per rappresentare gli orbitali molecolari. Tuttavia, per problemi di convergenza e di costo del calcolo, è conveniente limitare la scelta a poche famiglie di funzioni e usare quelle in grado di fornire buone approssimazioni degli orbitali molecolari con relativamente pochi termini (M ) nella combinazione lineare. In pratica, seguendo l’idea intuitiva per cui gli orbitali molecolari possono essere visti come sovrapposizione di orbitali atomici (AO), si scelgono funzioni centrate sui singoli nuclei che riproducono più o meno fedelmente gli AO degli atomi presenti nella molecola o cristallo; il metodo si identifica perciò con la sigla MO-LCAO: Molecular Orbitals as Linear Combination of Atomic Orbitals. Un problema computazionale legato all’uso di funzioni localizzate sui nuclei è la perdita di ortogonalità dell’insieme delle ϕj (funzioni centrate su nuclei diversi non sono ortogonali); dal punto di vista formale questo comporta una modifica dell’equazione matriciale da risolvere per la diagonalizzazione di F , con la comparsa di una matrice di overlap S i cui elementi Sij sono gli integrali hϕi |ϕj i: F A = SAE (3.49) dove A è la matrice degli autovettori {akj }k,j=1,M . Funzioni molto usate sia in campo molecolare sia in campo cristallino sono quelle di tipo gaussiano (GT F , Gaussian type functions) che, in coordinate sferiche (r, θ, φ), hanno la forma: gα`m (r, θ, φ) = r` Y`m (θ, φ)e−αr 2 (3.50) Oltre che dai numeri quantici ` ed m che descrivono la dipendenza angolare della funzione e, quindi, il tipo di orbitale, le GT F dipendono da un esponente α che deve essere ottimizzato variazionalmente, determinandone il valore a cui corrisponde il minimo dell’energia. Poiché una singola GT F non è solitamente in grado di riprodurre accuratamente l’andamento di un orbitale nelle vicinanze del nucleo, si usano spesso combinazioni lineari di GT F dette funzioni contratte, per cui il singolo orbitale ϕj della (3.48) diventa: ϕj = pj X i=1 di gαi `m (r, θ, φ) = pj X di r` Y`m (θ, φ)e−αi r 2 (3.51) i=1 dove pj è il numero di primitive nella contratta ϕj e dove i coefficienti di ed esponenti αi vanno determinati variazionalmente. È d’uso indicare le basi contratte con notazioni che mostrano il numero di primitive per ogni orbitale (o per ogni insieme di orbitali con energia simile, come gli orbitali ns e np); per esempio, il simbolo 8-31G indica una base formata da una contrazione di 8 primitive per descrivere lo shell più interno dell’atomo (1s) e una split valence, per lo shell di valenza (2s + 2p), composta da una contrazione di 3 primitive più una gaussiana esterna libera (in questo caso la valenza è descritta da due insiemi di funzioni: la contrazione e la gaussiana libera, da cui il nome split valence). Normalmente gli esponenti e i coefficienti delle gaussiane nelle contrazioni vengono ottimizzati variazionalmente sull’atomo isolato, mentre gli esponenti delle gaussiane libere più esterne si ottimizzano direttamente per la molecola o cristallo. CAPITOLO 3. SPAZIO DI FOCK E SECONDA QUANTIZZAZIONE 42 Basi via via più ricche (aumento del numero di shell e aumento del numero di gaussiane per ogni contrazione) conducono a un abbassamento dell’energia totale e a una migliore descrizione degli orbitali molecolari, a causa dell’aumento della libertà variazionale (aumento del numero dei parametri ottimizzabili). Tuttavia, oltre un certo limite, un ulteriore aumento del numero di funzioni base non produce più miglioramenti apprezzabili; tale limite viene detto limite Hartree-Fock. 3.4.1 Un esempio: la molecola H2 Riportiamo di seguito i risultati Hartree-Fock per la molecola di idrogeno. L’influenza della base viene valutata calcolando l’energia della molecola, a geometria fissa (0.7122 Å), aumentando via via il numero di shell e il numero di primitive. I risultati sono riportati nella seguente tabella (distanze in Å, energie in Hartree: 1 Hartree = 4.3597482 · 10−18 J): Base 3G 6G 21G 31G 311G -1.12621 -1.12256 -1.12658 -1.12776 0.71220 0.71049 0.73483 0.72996 0.73159 -1.11751 -1.12622 -1.12296 -1.12683 -1.12804 1.92477 1.92538 2.00185 1.99252 2.00025 E (d = 0.7122 Å) -1.11751 dequilibrio E (dequilibrio ) viriale In tabella è pure riportato il coefficiente del viriale che è pari al rapporto −V /T tra il potenziale totale (V , inclusivo del termine internucleare) e l’energia cinetica degli elettroni (T ); alla distanza di equilibrio, una funzione d’onda al limite Hartree-Fock deve avere un viriale pari a 2. Le basi 3G e 6G sono piuttosto distanti dal limite HF (come appare dal viriale) e la diminuzione di energia passando dalla 3G alla 6G è dovuta al miglioramento della descrizione della funzione d’onda nelle vicinanze dei nuclei. Le basi split valence hanno coefficienti del viriale decisamente migliori anche se le energie non sono molto più basse di quella calcolata con la 6G (la 21G presenta un’energia più alta a d = 0.71220 Å); la base 311G ha un viriale molto vicino a 2 e l’energia più bassa. Si pure noti l’effetto della base sulla distanza di equilibrio [la distanza a cui, a base fissa, si ha il minimo della curva E(d)]. La base 311G prevede un totale di M = 6 shell (3 su ogni atomo) con le quali si costruisce una matrice di Fock F di dimensione 6, dalla cui diagonalizzazione si ottengono 6 orbitali molecolari con le rispettive energie. Dei 6 orbitali, solo uno (quello a energia più bassa) è occupato dai due elettroni a spin opposto; l’energia ε0 = hψ0 |F |ψ0 i di tale orbitale vale -0.5985 Hartree. Capitolo 4 Applicazione alle strutture cristalline In questo capitolo si assumono note la definizione e le principali proprietà dei gruppi, peraltro discusse in numerosi testi. Qualche dettaglio è fornito relativamente al concetto di rappresentazione di un gruppo e sue proprietà. 4.1 Simmetria Un sistema invariante a seguito di una data trasformazione si dice simmetrico rispetto a quella trasformazione. Per un sistema simmetrico, sono formalmente definibili degli operatori Ŝ che esprimono l’effetto della trasformazione attraverso equazioni del tipo: Ŝ|ψi = s|ψi (4.1) dove la simmetria del sistema rispetto a Ŝ viene formalmente tradotta in un’equazione agli autovalori: se il sistema è invariante rispetto alla trasformazione S, allora l’applicazione della stessa non deve avere effetti osservabili e quindi non mutare lo stato del sistema. In altre parole, gli stati possibili del sistema sono autostati degli operatori di simmetria. Non alterando nulla di un sistema, una simmetria Ŝ conserva evidentemente pure la normalizzazione; ricordando che al ket Ŝ|ψi corrisponde il bra hψ|Ŝ † , ciò implica: hψ|ψi = 1 = hψ|Ŝ † Ŝ|ψi → S † Ŝ = Iˆ (4.2) (dove Iˆ è la trasformazione identica) per cui gli operatori di simmetria sono unitari (Ŝ † = Ŝ −1 ). Se un sistema è simmetrico rispetto a una trasformazione S, tutte le sue proprietà (che, ricordiamo, sono estraibili unicamente dal vettore di stato |ψi) sono necessariamente invarianti rispetto alla stessa. In particolare, l’energia del sistema non varia a seguito dell’azione di Ŝ, da cui: E = hψ|Ĥ|ψi = hψ|Ŝ † Ĥ Ŝ|ψi → S † Ĥ Ŝ = H (4.3) Data l’unitarietà di Ŝ, la (4.3) implica Ĥ Ŝ − Ŝ Ĥ ≡ [Ĥ, Ŝ] = 0: gli operatori di simmetria di un sistema commutano con l’Hamiltoniano. In generale, l’insieme {Ŝj } degli operatori che commutano con l’Hamiltoniano, dotato dell’operazione prodotto (inteso come applicazione 43 CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 44 successiva di operatori) è un gruppo. Infatti, siano Ŝi e Ŝj due operatori per cui [Ĥ, Ŝi ] = [Ĥ, Ŝj ] = 0, si ha: [Ĥ, Ŝi Ŝj ] = Ŝi [Ĥ, Ŝj ] + [Ĥ, Ŝi ]Ŝj = 0 (4.4) cioè il prodotto Ŝi Ŝj commuta con Ĥ e dunque appartiene a {Ŝj }; l’operatore identità Iˆ commuta evidentemente con Ĥ e quindi si trova in {Ŝj } con funzione di elemento neutro; ˆ abbiamo infine, definito con Ŝi−1 l’operatore inverso di Ŝi , per cui Ŝi−1 Ŝi = Ŝi Ŝi−1 = I, [Ĥ, Ŝi ] = 0 = Ŝi−1 [Ĥ, Ŝi ]Ŝi−1 = Ŝi−1 Ĥ − Ĥ Ŝi−1 = −[Ĥ, Ŝi−1 ] (4.5) perciò anche l’inverso di ogni operatore di {Ŝj } commuta con Ĥ e si trova quindi nello stesso insieme {Ŝj } . Dunque, tutte le proprietà richieste per la definizione di gruppo sono rispettate. Il gruppo degli operatori che commutano con l’Hamiltoniano viene detto gruppo dell’equazione di Schrödinger. Da questo risultato discende che l’insieme degli operatori di simmetria di un sistema forma un gruppo (rispetto al prodotto di operatori). Gli autostati dell’Hamiltoniano di un sistema sono contemporaneamente autostati degli operatori Ŝ che appartengono al gruppo dell’equazione di Schrödinger (in forza della commutabilità tra Ĥ e Ŝ) e, in particolare, degli operatori che appartengono al gruppo di simmetria S del sistema. Divengono allora immediatamente applicabili agli autostati dell’energia le proprietà valide per le funzioni base delle rappresentazioni irriducibili di S (che sono appunto autofunzioni degli operatori di simmetria). Dato un gruppo S = {Ŝj }j=1,p di p operatori di simmetria Ŝj (p è l’ordine del gruppo), indicando con ξrk la r-esima funzione base della rappresentazione irriducible k del gruppo S, abbiamo: h X Ŝj ξrk = χkrs (Ŝj )ξsk (4.6) s=1 dove h è la dimensione della rappresentazione k e i χkrs (Ŝj ) sono degli scalari in generale complessi. Riferendoci per semplicità al caso dei gruppi abeliani (cioè ai gruppi commutativi, per cui ∀i, j ∈ {1, . . . , p}, [Ŝi , Ŝj ] = 0, le dimensioni h di tutte le rappresentazioni irriducibili sono unitarie (h = 1) e il numero di tali rappresentazioni è pari all’ordine p del gruppo. In tali casi, la (4.6) si semplifica nella Ŝj ξrk = χk (Ŝj )ξrk (4.7) e lo scalare χk (Ŝj ) ≡ χkj viene detto carattere dell’operatore (Ŝj ) nella rappresentazione irriducibile k. L’insieme {χkj }j=1,p dei caratteri di tutti gli operatori di S viene detto carattere della rappresentazione. Formalmente: Sξrk ≡ {Ŝ1 , . . . , Ŝp }ξrk = {χk1 , . . . , χkp }ξrk (4.8) Indicato con |χk i il vettore ket dei caratteri χkj , vale l’importante teorema (di ortogonalità tra caratteri): p X hχ` |χk i = χ`j χkj = pδk` (4.9) j=1 CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 45 L’ordine di un elemento Ŝj in un gruppo è quel numero intero n ≤ p (che si può dimostrare ˆ allora, per un gruppo abeliano essere sempre esistente) tale che Ŝjn = I; ˆ rk = 1 · ξrk = (χkj )n ξrk Ŝjn ξrk = Iξ (4.10) ciò implica che i caratteri χkj siano tra le radici n-esime dell’unità (che sono in numero di n). Rappresentando il numero 1 in campo complesso, per cui 1 = e2πmı , dove m è un intero, le radici n-esime dell’unità sono e2πmı/n con m = 1, . . . , n (per esempio, per n = 4 si hanno le quattro radici 1, −1, ı, −ı). Le funzioni base per rappresentazioni irriducibili diverse sono ortogonali: hξrk |ξs` i = 0; ˆ e della (4.9): infatti, tenuto conto dell’unitarietà degli Ŝj (per cui Ŝj† Ŝj = I) p 1 1X ` k ` k 1X ` † hξ |Ŝj Ŝj |ξ k i = χi χi hξ |ξ i = hχ` |χk ihξ ` |ξ k i = δk` hξ ` |ξ k i hξ |ξ i = p i=1 p i p ` k (4.11) Nel caso k 6= `, la (4.11) ammette come unica soluzione hξrk |ξs` i = 0. Si può dimostrare che l’insieme delle funzioni base delle diverse rappresentazioni irriducibili di un gruppo di simmetria è completo; qualunque funzione può quindi essere espressa come combinazione lineare delle stesse. In termini di vettori ket: p X |ψi = ck |ξ k i (4.12) k dove, sfruttando l’ortogonalità tra funzioni base di diverse rappresentazioni irriducibili, si ha c` = hξ ` |ψi. Nello spazio delle funzioni ξ k , la matrice rappresentativa dell’operatore Hamiltoniano assume una forma diagonale a blocchi; infatti, essendo le ξ k anche autostati di H, si ha: H|ξ k i = Ek |ξ k i, da cui: H`k = hξ ` |H|ξ k i = Ek hξ ` |ξ k i = Ek δ`k (4.13) Si noti che, in generale, ciascuna ξ k è a propria volta una combinazione lineare di funzioni ζjk appartenenti alla stessa rappresentazione irriducibile k; la dimensione del k-esimo blocco della matrice Hamiltoniana corrisponde allora al numero (q) di funzioni ζjk usate per esprimere ξ k . In sintesi: H|ψi = E|ψi P |ψi = pk=1 ck |ξ k i (4.14) Pq k k k i |ζ |ξ i = a j=1 j j H k = hζ k |H|ζ k i ij i j dove con Hijk si è indicato l’elemento (i, j) del blocco k (di dimensione q × q) della matrice H; la diagonalizzazione di H k fornisce gli autovalori E k e gli autovettori di simmetria k (cioè i coefficienti akj ). CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 46 È conveniente definire degli operatori proiezione (di Wigner) che, agendo su una funzione ψ, ne proiettino la componente appartenente ad una data rappresentazione irriducibile: p 1X k χ Ŝj P̂ = p j j k (4.15) e, ricordando la (4.9), p p p p 1X X ` 1X X k ` ` P̂ |ψi = c` χj Ŝj |ξ ` i = c` χj χj |ξ i = ck |ξ k i p ` p ` j j k (4.16) Sfruttando gli operatori di Wigner è possibile costruire opportune funzioni di simmetria specificata per la rappresentazione dell’operatore Hamiltoniano. 4.1.1 Un esempio: il gruppo 4 Consideriamo il gruppo 4 avente gli elementi {1, 2, 4, 4−1 } dove 1 rappresenta l’identità, 2 la rotazione di ordine 2, 4 e 4−1 la rotazione di ordine 4 e sua inversa. Come è facile verificare, l’ordine n di ciascun elemento coincide con l’ordine della rotazione (per esempio, l’ordine della rotazione 4 è 4, infatti 4 rotazioni successive di ordine 4 corrispondono alla rotazione identica 1: 44 = 1). Si ha allora che il carattere della rotazione 1 può essere solo 1; i caratteri della rotazione 2 possono essere 1 e -1; i caratteri di 4 e 4−1 possono essere 1, -1 ı e −ı. Il numero di rappresentazioni irriducibili è 4 (il gruppo è abeliano e il suo ordine è 4) e i caratteri delle rappresentazioni devono essere ortogonali; questo implica la scelta obbligata: 1 2 4 4−1 A 1 1 1 1 B 1 1 -1 -1 E 1 -1 ı -ı E 1 -1 -ı ı dove le quattro diverse rappresentazioni (una per riga) sono state etichettate con delle lettere (A, B ed E) seguendo delle regole che qui tralasciamo; le ultime due rappresentazioni nella tabella su scritta hanno la stessa etichetta E, essendo l’una la complessa coniugata dell’altra. Una rappresentazione tipo la A in tabella, che ha i caratteri pari a 1 per ogni elemento del gruppo, esiste per ogni gruppo e si chiama rappresentazione totalsimmetrica. Un esempio classico di applicazione è la classificazione degli orbitali π nel ciclobutadiene (C4 H4 ) costruiti come combinazione lineare di orbitali pz centrati sui nuclei degli atomi di carbonio. Si noti che la distinzione stessa tra orbitali π e orbitali σ, nelle molecole planari, ha origine dalla diversa simmetria degli orbitali rispetto al piano su cui giace la molecola: per definizione, gli orbitali π sono antisimmetrici rispetto a tale piano, (se m̂ è l’operatore CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 47 di riflessione rispetto al piano, si ha m̂|πi = −1|πi) mentre gli orbitali σ sono simmetrici (m̂|σi = 1|σi). Orientiamo la molecola in modo tale che la direzione z sia parallela all’asse di rotazione 4, poniamo l’origine O nel baricentro e numeriamo gli atomi di carbonio come indicato nella figura seguente (asse z normale al piano molecolare): q @s 4 q s `O s q 3 1 s Carbonio q Idrogeno s2 @q L’orbitale π di simmetria A si può ottenere applicando l’operatore di Wigner P̂ A sull’orbitale (pz )1 centrato sull’atomo di carbonio 1: π A = P̂ A (pz )1 = i 1h ˆ 1 · I(pz )1 + 1 · 2̂(pz )1 + 1 · 4̂(pz )1 + 1 · 4̂−1 (pz )1 = 4 1 [(pz )1 + (pz )3 + (pz )2 + (pz )4 ] 4 (4.17) (si noti che la funzione cosı̀ ottenuta non è normalizzata). Similmente, l’orbitale π di simmetria B si ottiene applicando P̂ B su (pz )1 : π B = P̂ B (pz )1 = i 1h ˆ 1 · I(pz )1 + 1 · 2̂(pz )1 − 1 · 4̂(pz )1 − 1 · 4̂−1 (pz )1 = 4 1 [(pz )1 + (pz )3 − (pz )2 − (pz )4 ] 4 (4.18) I due orbitali di simmetria E sono degeneri (hanno la stessa energia); corrispondono alle combinazioni lineari: i 1h ˆ E E −1 π1 = P̂1 (pz )1 = 1 · I(pz )1 − 1 · 2̂(pz )1 + ı · 4̂(pz )1 − ı · 4̂ (pz )1 = 4 1 [(pz )1 − (pz )3 + ı(pz )2 − ı(pz )4 ] (4.19) 4 i 1h ˆ π2E = P̂2E (pz )1 = 1 · I(pz )1 − 1 · 2̂(pz )1 − ı · 4̂(pz )1 + ı · 4̂−1 (pz )1 = 4 1 [(pz )1 − (pz )3 − ı(pz )2 + ı(pz )4 ] (4.20) 4 In luogo dei due orbitali π1E e π2E si possono usare le loro combinazioni lineari reali ( πaE = π1E + π2E = 21 [(pz )1 − (pz )3 ] πbE = ı π2E − π1E = 12 [(pz )2 − (pz )4 ] (4.21) CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 48 In ambito Hartree-Fock, le energie degli orbitali π sono gli elementi di matrice hπ|F |πi; ad esempio, normalizzando π A , si ha: εA = 1 h(pz )1 + (pz )3 + (pz )2 + (pz )4 |F |(pz )1 + (pz )3 + (pz )2 + (pz )4 i = 4 h(pz )1 |F |(pz )1 i + 2h(pz )1 |F |(pz )2 i + h(pz )1 |F |(pz )3 i (4.22) dove si sono sfruttate evidenti relazioni del tipo h(pz )1 |F |(pz )2 i = h(pz )1 |F |(pz )4 i. Calcolando le energie anche per gli altri orbitali, otteniamo in definitiva: A ε = h(pz )1 |F |(pz )1 i + 2h(pz )1 |F |(pz )2 i + h(pz )1 |F |(pz )3 i εB = h(pz )1 |F |(pz )1 i − 2h(pz )1 |F |(pz )2 i + h(pz )1 |F |(pz )3 i εE = εE = h(p ) |F |(p ) i − h(p ) |F |(p ) i z 1 z 1 z 1 z 3 a b (4.23) Nel caso specifico, essendosi usata una sola funzione base per ogni rappresentazione irriducibile, le dimensioni dei singoli blocchi della matrice di Fock sono unitarie. 4.2 Simmetria traslazionale L’invarianza traslazionale tipica delle strutture periodiche rende possibile l’applicazione dei metodi quantistici anche ai cristalli, ovvero a strutture periodiche, virtualmente infinite, in una o più direzioni. Il gruppo T delle traslazioni di un reticolo è abeliano ed è costituito da infiniti elementi del tipo R̂j che traslano un dato nodo di un vettore reticolare Rj . Trattandosi di un gruppo infinito e abeliano, T ha infinite rappresentazioni irriducibili monodimensionali. Per definizione, l’azione di un operatore R̂j su una funzione f (r) è: R̂j f (r) = f (r + Rj ) (4.24) e, nel caso in cui f (r) sia Ĥ(r)ψ(r), data l’invarianza traslazionale dell’operatore Hamiltoniano del cristallo [per cui Ĥ(r + Rj ) = Ĥ(r)] , si ha: R̂j Ĥ(r)ψ(r) = Ĥ(r + Rj )ψ(r + Rj ) = Ĥ(r)ψ(r + Rj ) = Ĥ(r)R̂j ψ(r) (4.25) che, data la genericità di ψ, implica [Ĥ, R̂j ] = 0. In definitiva, tutti gli elementi di T commutano con Ĥ e quindi T appartiene al gruppo dell’equazione di Schrödinger. Le autofunzioni di Ĥ sono allora contemporaneamente anche autofunzioni di R̂j (∀R̂j ∈ T ): ( Ĥψ = Eψ (4.26) R̂j ψ = χ(Rj )ψ Essendo T un gruppo, il prodotto di due traslazioni è ancora una traslazione: R̂i R̂j = R̂` , da cui: R̂i R̂j ψ(r) = R̂i ψ(r + Rj ) = ψ(r + Rj + Ri ) = R̂` ψ(r) (4.27) CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 49 e, perciò, l’operatore R̂` trasla di Rj + Ri . Combinando la (4.27) con la seconda delle (4.26), si ottiene: R̂i R̂j ψ(r) = R̂i χ(Rj )ψ(r) = χ(Rj )χ(Ri )ψ(r) = R̂` ψ(r) = χ(Ri + Rj )ψ(r) (4.28) da cui si ottiene l’importante relazione tra i caratteri degli operatori traslazione: χ(Rj )χ(Ri ) = χ(Ri + Rj ) (4.29) Data una base reticolare B = {ai }i=1,3 , ciascuna traslazione reticolare Rj sarà esprimibile come combinazione lineare (a coefficienti interi, ni ) dei vettori di B: X Rj = ni ai (4.30) i da cui, dalla (4.29), segue che: χ(Rj ) = χ(a1 )n1 χ(a2 )n2 χ(a3 )n3 (4.31) Scrivendo in notazione esponenziale ciascun χ(ai ), per cui χ(ai ) = e2πıki , abbiamo: χ(Rj ) = e2πı(n1 k1 +n2 k2 +n3 k3 ) = e2πık·Rj (4.32) P dove k = ` k` a∗` , con i nuovi vettori a∗ definiti dalle relazioni a∗` · ai = δ`i . Riconosciuti nei k i vettori appartenenti allo spazio reciproco, possiamo dire che esiste una rappresentazione irriducibile del gruppo di simmetria delle traslazioni per ogni vettore k dello spazio reciproco. Si noti che due vettori k e k0 che differiscano per P identificano P un vettore K del reticolo reciproco la stessa rappresentazione; si ha infatti: K = i mi a∗i (con mi interi), K·Rj = mi ni (quindi il prodotto K · Rj è un numero intero) e 0 0 χk (Rj ) = e2πık ·Rj = e2πık·Rj e2πıK·Rj = χk (Rj ) (4.33) per cui, per ogni R̂j ∈ T , i caratteri delle due rappresentazioni k e k0 sono uguali e identificano la stessa rappresentazione. Ci si può allora limitare a considerare le sole rappresentazioni (non equivalenti) etichettate da vettori k appartenenti alla prima zona di Brillouin. Le autofunzioni degli operatori di traslazione (che, ricordiamo, sono anche autofunzioni dell’Hamiltoniano) saranno esse stesse etichettabili con i vettori k dello spazio reciproco; richiamando la seconda delle (4.26), abbiamo R̂j ψ k (r) = e2πık·Rj ψ k (r) (4.34) L’equazione (4.34) è il teorema di Bloch e la funzione ψ k viene detta funzione di Bloch. È d’uso introdurre le condizioni cicliche al contorno di Born-Von Karman che conferiscono al cristallo infinito la topologia di un 3-toro. In pratica, scelti tre interi Nj (j = 1, 2, 3), si pone ψ k (r + Nj aj ) = ψ k (r) (4.35) CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 50 ma, d’altra parte: ψ k (r + Nj aj ) = e2πıNj k·aj ψ k (r) (4.36) da cui deriva che e2πıNj k·aj = e2πıNj kj = 1; ciò comporta che per ciascun j si abbia kj = mj /Nj con mj intero. Il numero di punti k nella prima zona di Brillouin diviene allora finito e pari a generica rapN = N1 N2 N3 (infatti, entro tale zona, ciascun mj è compreso tra 0 e Nj − 1); la P presentazione irriducibile k sarà identificata da una terna di interi mj per cui k = j mj /Nj a∗j . 4.3 Hartree-Fock periodico Come già fatto per i gruppi puntuali, di cui alla sezione (4.1), è possibile definire degli operatori proiezione di Wigner che proiettino da una qualunque funzione φ la componente relativa a una specifica rappresentazione irriducibile k; a parte un non essenziale fattore di normalizzazione: P P k = j e−2πık·Rj R̂j (4.37) P k φ(r) = P e−2πık·Rj R̂ φ(r) = P e−2πık·Rj φ(r + R ) ≡ P e2πık·Rj φ(r − R ) j j j j j j dove nell’ultima sommatoria si è scambiato Rj con −Rj . Più in particolare, indicando con φµ (r − Aµ ) la µ-esima funzione monoelettronica (AO) centrata sul nucleo µ di coordinate Aµ , nella cella 0 del cristallo, abbiamo (per ogni k) la funzione di Bloch: X ξµk (r) = P k φµ (r − Aµ ) = e−2πık·Rj φµ (r − Aµ − Rj ) (4.38) j Nello spazio delle funzioni di Bloch, la matrice rappresentativa dell’operatore di Fock F̂ assume una forma diagonale a blocchi; ciascun blocco corrisponde a un punto k e ha una dimensione (n ) che dipende dal numero di atomi (nuclei) della cella elementare e dal numero di orbitali atomici (AO) usati per descrivere ogni atomo. Le autofunzioni di F (orbitali cristallini; CO), ottenute dalla diagonalizzazione di ciascun blocco F k , saranno allora esprimibili come combinazione lineare delle funzioni di Bloch: X ψik (r) = aµi (k)ξµk (r) (4.39) µ dove l’indice i varia tra 1 e n. Le energie degli orbitali cristallini (autovalori di F ) sono: εi (k) = hψik |F k |ψik i (4.40) Fissato l’indice i dell’autovalore εi , l’energia del corrispondente orbitale cristallino varia con continuità al variare di k tra tutti i punti della prima zona di Brillouin e definisce quella che viene indicata col termine di banda. In ambito Hartree-Fock, possiamo dire che la struttura a bande di un solido cristallino, altro non è che l’insieme degli autovalori dell’operatore di Fock (funzioni di k) rappresentato nello spazio delle funzioni base delle rappresentazioni irriducibili del gruppo di simmetria delle traslazioni. CAPITOLO 4. APPLICAZIONE ALLE STRUTTURE CRISTALLINE 51 Dettagli tecnici sul metodo Hartree-Fock periodico e sulla implementazione nel programma CRYSTAL si possono trovare in Roetti C. (1996): The CRYSTAL code. In: QuantumMechanical Ab-Initio Calculation of the Properties of Crystalline Materials. Lecture Notes in Chemistry, 67, 125-137. Pisani (eds.) Springer, Berlin. Minimizzando l’energia EHF in funzione dei parametri geometrici (parametri di cella e coordinate frazionarie), nell’ambito dell’approssimazione di Born-Oppenheimer, si possono ottenere la struttura di equilibrio di una data fase cristallina e le sue proprietà estraibili dalla funzione d’onda multielettronica.