Laurea Specialistica “Metodologie Chimiche Avanzate” A.A. 2003-2004 Banche dati strutturali in chimica (un modulo del corso “Informatica per la Chimica”) Gabriele Ricchiardi Ricercatore/Chimica Fisica Tel.:011 6707845 [email protected] Contenuti Il modulo didattico presenta un’introduzione alla conoscenza ed all’uso delle principali banche dati contenenti le strutture delle molecole e dei solidi. • Fonti di informazione strutturale • come si descrive una struttura tridimensionale • Banche dati elettroniche • come e dove trovare le strutture • Inorganic Crystal Structure Database • rappresentazione di molecole e solidi • Cambridge Structural Database • analisi delle strutture • Protein Data Bank • statistica sui database • Informazione chimica dai database strutturali Struttura tridimensionale In queste lezioni ci occuperemo della struttura tridimensionale a livello atomico di molecole e solidi. Essa è nota, in modo più o meno dettagliato, per la maggior parte degli elementi e dei composti noti. O H N N H O Fonti di informazione strutturale 1) Esperimenti di diffrazione da cristalli: Raggi X, neutroni, elettroni con lunghezze d’onda dell’ordine di 10-10m sono diffratti dai cristalli. Il diffrattogramma permette di risalire alle posizioni atomiche (Vedi corso “Strutturistica”) 2) Spettroscopie: le spettroscopie vibrazionali danno informazioni strutturali su piccole molecole; L’NMR fornisce informazioni sulle distanze interatomiche anche per molecole complesse. (Vedi corsi di Chimica Fisica) 3) Chimica computazionale:permette di calcolare, con accuratezza variabile, la struttura di qualsiasi modello (Vedi corso “Chimica Computazionale”) Diffrazione e dati strutturali RX Risoluzione di strutture (complessa e non deterministica) MISURA: Direzione e intensità dei raggi diffratti Buon senso… Distribuzione spaziale della densità elettronica Simulazione della diffrazione (semplice e deterministica) Posizioni dei nuclei Chimica computazionale Trasmettere e catalogare i dati strutturali Posizioni dei nuclei nel cristallo • Molti atomi • Simmetria traslazionale • Simmetria nella cella • Incertezze • Altre informazioni… Come si trasmette questa informazione in modo: 1) Univoco 2) Sintetico 3) Standardizzato ? DB Una scheda tipica 1)Dati per l’identificazione 2)Dati bibliografici 3)Dati strutturali • Parametri di cella (a,b,c,,,) • Coordinate degli atomi non legati da relazioni di simmetria (“unità asimmetrica”) • Simmetria (simbolo o numero del gruppo spaziale) 4) Altri dati non indispensabili… a b dati aggiuntivi: fattori di occupazione “fattori di occupazione”: esprimono quanto i siti atomici sono occupati. Tutti i siti occupati: Occ=1 Occ= 9/12 Occ=11/12 Forniscono informazione sul DISORDINE STRUTTURALE dati aggiuntivi: fattori termici esprimono la mobilità termica degli atomi, rispetto alla posizione media misurata r atomo “fermo” r atomo “mobile” Osservabile: densità el. localizzata Fattore termico (B o U) piccolo densità (media) osservata allargata Forniscono informazione sulla FORZA DEI LEGAMI E SULLA “MECCANICA” DELLE MOLECOLE Fattore termico (B o U) grande Fonti cartacee I cristallografi pubblicano da sempre i loro risultati su riviste specializzate. Inoltre, alcuni testi raccolgono collezioni di dati strutturali. fonte contenuto disponibilità Structure Reports (1939-)A,B A:strutture inorganiche e metalli, B: strutture organiche Biblioteca Mineralogia R.W.G. Wyckoff, “Crystal Structures” Composti inorganici Biblioteca Chimica Acta Crystallographica A,B,C La principale e più autorevole rivista di cristallografia generale Biblioteca Mineralogia Sempre più frequentemente, strutture vengono pubblicate anche su riviste non specializzate. Inoltre, il numero di strutture risolte annualmente aumenta esponenzialmente a causa di progressi tecnici e scientifici. Le fonti cartacee cadranno in disuso (ai fini di archivio). Database elettronici Fin dagli anni sessanta, alcuni gruppi hanno iniziato a catalogare dati strutturali in formato elettronico, attingendo dalle pubblicazioni cartacee o dirattamente ai dati sperimentali. Inizialmente si trattava di databases raccolti in ambito accademico e distribuiti gratuitamente ai fini di ricerca. La raccolta e l’immissione dei dati nei databases sono diventate nel tempo attività molto onerose. Ciò, unito al valore strategico dei databases in molti campi della ricerca industriale (ad es. nel settore farmaceutico) ha contribuito a trasformare la produzione di databases su basi commerciali. Negli anni, si è attuata una concertazione degli sforzi dei vari produttori, specializzatisi nella raccolta di classi di composti. Oggi esistono tre principali database strutturali: • ICSD (Inorganic Crystal Structure Database) • CSD (Cambridge Structural Database – composti organici) • PDB (protein Data Bank – molecole biologiche) Database elettronici -2 Inorgnic Crystal Structure Database (ICSD) Cambridge Structural Database (CSD) Protein Data Bank (PDB) Produttore FIZ-Karlsruhe, D Cambridge Crystallographic Data Centre, UK Brookhaven National Laboratory, USA Contenuto Elementi e strutture inorganiche Strutture organiche Proteine, acidi nucleici, virus, ed altre macromolecole di interesse biologico N° strutture (2003) Distribuzione Sito web Oltre 70000 272000 22900 On-line o su (1) CDrom On-line o su (parecchi) CD-rom On-line, con parecchi “mirror sites”. http://www.stninternational.de/stnda tabases/databases/ics d.html www.ccdc.cam.ac.uk www.pdb.org ICSD Criterio di selezione delle strutture Programma di ricerca Esempio Come esportare i risultati in moldraw Files .CRY e .CIF in moldraw tutorial