Laurea Specialistica
“Metodologie Chimiche Avanzate”
A.A. 2003-2004
Banche dati strutturali in chimica
(un modulo del corso “Informatica per la Chimica”)
Gabriele Ricchiardi
Ricercatore/Chimica Fisica
Tel.:011 6707845
[email protected]
Contenuti
Il modulo didattico presenta un’introduzione alla
conoscenza ed all’uso delle principali banche dati
contenenti le strutture delle molecole e dei solidi.
• Fonti di informazione strutturale
• come si descrive una struttura
tridimensionale
• Banche dati elettroniche
• come e dove trovare le
strutture
• Inorganic Crystal Structure
Database
• rappresentazione di molecole e
solidi
• Cambridge Structural Database
• analisi delle strutture
• Protein Data Bank
• statistica sui database
• Informazione chimica dai
database strutturali
Struttura tridimensionale
In queste lezioni ci occuperemo della struttura tridimensionale a livello
atomico di molecole e solidi. Essa è nota, in modo più o meno
dettagliato, per la maggior parte degli elementi e dei composti noti.
O
H
N
N
H
O
Fonti di informazione strutturale
1) Esperimenti di diffrazione da cristalli: Raggi X, neutroni, elettroni
con lunghezze d’onda dell’ordine di 10-10m sono diffratti dai
cristalli. Il diffrattogramma permette di risalire alle posizioni
atomiche (Vedi corso “Strutturistica”)
2) Spettroscopie: le spettroscopie vibrazionali danno informazioni
strutturali su piccole molecole; L’NMR fornisce informazioni sulle
distanze interatomiche anche per molecole complesse. (Vedi
corsi di Chimica Fisica)
3) Chimica computazionale:permette di calcolare, con accuratezza
variabile, la struttura di qualsiasi modello (Vedi corso “Chimica
Computazionale”)
Diffrazione e dati strutturali
RX
Risoluzione di strutture
(complessa e non
deterministica)
MISURA:
Direzione e intensità
dei raggi diffratti
Buon senso…
Distribuzione spaziale
della densità
elettronica
Simulazione della
diffrazione (semplice
e deterministica)
Posizioni dei nuclei
Chimica
computazionale
Trasmettere e catalogare i dati strutturali
Posizioni dei nuclei
nel cristallo
• Molti atomi
• Simmetria traslazionale
• Simmetria nella cella
• Incertezze
• Altre informazioni…
Come si trasmette questa
informazione in modo:
1) Univoco
2) Sintetico
3) Standardizzato
?
DB
Una scheda tipica
1)Dati per l’identificazione
2)Dati bibliografici
3)Dati strutturali
• Parametri di cella (a,b,c,,,)
• Coordinate degli atomi non legati da
relazioni di simmetria (“unità
asimmetrica”)
• Simmetria (simbolo o numero del
gruppo spaziale)
4) Altri dati non indispensabili…
a

b
dati aggiuntivi: fattori di occupazione
“fattori di occupazione”: esprimono
quanto i siti atomici sono occupati.
Tutti i siti occupati: Occ=1
Occ= 9/12
Occ=11/12
Forniscono informazione sul
DISORDINE STRUTTURALE
dati aggiuntivi: fattori termici
esprimono la mobilità termica degli atomi, rispetto alla posizione
media misurata
r
atomo “fermo”
r
atomo “mobile”
Osservabile:
densità el.
localizzata
Fattore termico
(B o U) piccolo
densità (media)
osservata allargata
Forniscono informazione sulla FORZA
DEI LEGAMI E SULLA “MECCANICA”
DELLE MOLECOLE
Fattore termico
(B o U) grande
Fonti cartacee
I cristallografi pubblicano da sempre i loro risultati su riviste
specializzate. Inoltre, alcuni testi raccolgono collezioni di dati
strutturali.
fonte
contenuto
disponibilità
Structure Reports
(1939-)A,B
A:strutture inorganiche e
metalli, B: strutture
organiche
Biblioteca
Mineralogia
R.W.G. Wyckoff,
“Crystal
Structures”
Composti inorganici
Biblioteca Chimica
Acta
Crystallographica
A,B,C
La principale e più
autorevole rivista di
cristallografia generale
Biblioteca
Mineralogia
Sempre più frequentemente, strutture vengono pubblicate anche su
riviste non specializzate. Inoltre, il numero di strutture risolte
annualmente aumenta esponenzialmente a causa di progressi tecnici
e scientifici. Le fonti cartacee cadranno in disuso (ai fini di archivio).
Database elettronici
Fin dagli anni sessanta, alcuni gruppi hanno iniziato a catalogare dati
strutturali in formato elettronico, attingendo dalle pubblicazioni cartacee o
dirattamente ai dati sperimentali.
Inizialmente si trattava di databases raccolti in ambito accademico e distribuiti
gratuitamente ai fini di ricerca.
La raccolta e l’immissione dei dati nei databases sono diventate nel tempo
attività molto onerose. Ciò, unito al valore strategico dei databases in molti
campi della ricerca industriale (ad es. nel settore farmaceutico) ha contribuito a
trasformare la produzione di databases su basi commerciali.
Negli anni, si è attuata una concertazione degli sforzi dei vari produttori,
specializzatisi nella raccolta di classi di composti. Oggi esistono tre principali
database strutturali:
• ICSD (Inorganic Crystal Structure Database)
• CSD (Cambridge Structural Database – composti organici)
• PDB (protein Data Bank – molecole biologiche)
Database elettronici -2
Inorgnic Crystal
Structure
Database (ICSD)
Cambridge
Structural
Database
(CSD)
Protein Data
Bank
(PDB)
Produttore
FIZ-Karlsruhe, D
Cambridge
Crystallographic Data
Centre, UK
Brookhaven National
Laboratory, USA
Contenuto
Elementi e strutture
inorganiche
Strutture organiche
Proteine, acidi
nucleici, virus, ed
altre macromolecole
di interesse biologico
N° strutture
(2003)
Distribuzione
Sito web
Oltre 70000
272000
22900
On-line o su (1) CDrom
On-line o su
(parecchi) CD-rom
On-line, con parecchi
“mirror sites”.
http://www.stninternational.de/stnda
tabases/databases/ics
d.html
www.ccdc.cam.ac.uk
www.pdb.org
ICSD
Criterio di selezione delle strutture
Programma di ricerca
Esempio
Come esportare i risultati in moldraw
Files .CRY e .CIF in moldraw
tutorial
Scarica

file