Dalla sequenza alla struttura Dalla sequenza alla struttura V L S E G E W Q L V L V . . . Sequenza O2 Struttura Funzione Che informazioni offre la struttura? • • • • • • Conformazione dei siti attivi e di legame Orientazione dei residui conservati Interpretazione di meccanismi Visualizzazione di cavità Calcolo di potenziale elettrostatico … Esempio • FtsZ – divisione cellulare in procarioti, mitocondri e cloroplasti. • Tubulina – componente strutturale dei microtubuli – comunicazione intracellulare e divisione cellulare. • FtsZ e Tubulina hanno bassa similarità di sequenza e non sembrerebbero omologhe. FtsZ e tubulina sono omologhe? • Proteine che hanno conservato la struttura tridimensionale possono derivare da un progenitore comune anche se la divergenza della sequenza non permette più di riconoscere l’omologia. Burns, R., Nature 391:121-123 Picture from E. Nogales Un altro esempio • α-lattalbumina e lisozima possiedono: – Stesso fold – Moderata similarità – Diversa funzione ALA TRP PRO Esempi di folding: up-and-down barrel greek key jelly-roll Domìni Struttura quaternaria Cristallografia a raggi X • Ottenere cristalli della proteina – 0.3-1.0 mm – Le singole molecole sono ordinate in modo periodico, ripetitivo. • La struttura è determinata dai dati di diffrazione. Diffrazione a raggi X Image from http://www-structure.llnl.gov/Xray/101index.html Schmid, M. Trends in Microbiology, 10:s27-s31. Cristallografia a raggi X • Le proteine devono cristallizzare – Grande quantità – Solubili • Accesso a radiazione adatta • Tempo di calcolo per risolvere la struttura Instrumentation or synchrotron X-rays Instrumentation ESRF - Grenoble Instrumentation Elettra - Trieste Dalla densità elettronica al modello strutturale + Densità iniziale = Interpretazione Struttura 3D • La qualitá delle MAPPE dipende dalla risoluzione. • La risoluzione dipende dalla qualitá dei cristalli. Risoluzione Campo magnetico NMR NOE (Nuclear Overhauser Effect) Il campo magnetico Magnete a 900 MHz Magnete a 400 MHz Costo commerciale di uno spettrometro a 900 MHz: ca. 5 M € n. di spettrometri 900 MHz operativi al mondo < 10 Risonanza Magnetica Nucleare (NMR) • • • • • • Proteine in soluzione Limite di dimensione ~ 40 kDa Proteine stabili a lungo Marcatura con 15N, 13C, 2H. Strumentazione molto costosa Tempo per assegnare le risonanze Regions of the 1H NMR Spectrum are Further Dispersed by the 3D Fold What would the unfolded protein look like? Resolve Peaks By Multi-D NMR A BONUSregions in 2D spectra provide protein fingerprints If 2D cross peaks overlap go to 3D or 4D ….. Conformational Ensemble Representing an NMR Structure C N Pro e contro X-ray NMR • Richiede cristalli, problematico • • Non ha limiti (teorici) di grandezza Possibile in soluzione, più semplice • Limitato a proteine fino a circa 300 residui • Piú preciso • Meno preciso • Risoluzione • Numero di vincoli • Struttura può essere deformata dai cristalli, rigida • Struttura nativa in soluzione, flessibile • Una “soluzione“ • Molti modelli X-ray NMR Protein Data Bank (PDB) • URL: http://www.rcsb.org/pdb/ • Coordinate 3-D di strutture proteiche • Formato unico • Tutte le strutture risolte con i raggi X e NMR • Più vecchia della maggior parte degli altri database • Strutturata male a causa dello sviluppo storico Il Protein Data Bank Crescita del PDB Motivi strutturali depositati ogni anno Superfamiglie depositate ogni anno Formato PDB I HEADER COMPND COMPND SOURCE SOURCE AUTHOR AUTHOR ... REMARK REMARK REMARK REMARK REMARK REMARK REMARK REMARK REMARK ... SEQRES SEQRES SEQRES ... ONCOGENE PROTEIN 06-JUN-91 121P H-RAS P21 PROTEIN COMPLEX WITH GUANOSINE-5'-[B,G-METHYLENE] 2 TRIPHOSPHATE HUMAN (HOMO SAPIENS) CELLULAR HARVEY-RAS GENE TRUNCATED AND 2 EXPRESSED IN (ESCHERICHIA COLI) U.KRENGEL,K.SCHEFFZEK,A.SCHERER,W.KABSCH,A.WITTINGHOFER, 2 E.F.PAI 121P 121P 121P 121P 121P 121P 121P 2 3 4 5 6 7 8 1 1 REFERENCE 1 1 AUTH U.KRENGEL,I.SCHLICHTING,A.SCHEIDIG,M.FRECH,J.JOHN, 1 AUTH 2 A.LAUTWEIN,F.WITTINGHOFER,W.KABSCH,E.F.PAI 1 TITL THE THREE-DIMENSIONAL STRUCTURE OF P21 IN THE 1 TITL 2 CATALYTICALLY ACTIVE CONFORMATION AND ANALYSIS OF 1 TITL 3 ONCOGENIC MUTANTS 1 REF NATO ASI SER.,SER.A V. 220 183 1991 1 REFN ASTM NALSDJ US ISSN 0161-0449 2002 121P 121P 121P 121P 121P 121P 121P 121P 121P 17 18 19 20 21 22 23 24 25 1 2 3 121P 121P 121P 56 57 58 166 166 166 MET THR GLU TYR LYS LEU VAL VAL VAL GLY ALA GLY GLY VAL GLY LYS SER ALA LEU THR ILE GLN LEU ILE GLN ASN HIS PHE VAL ASP GLU TYR ASP PRO THR ILE GLU ASP SER Formato PDB II HELIX HELIX ... SHEET SHEET SHEET ... TURN TURN TURN ... ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ... HETATM HETATM HETATM HETATM ... 1 A1 2 A2 LYS SER 1 S 2 S 3 S 6 GLU 6 GLU 6 THR 1 T1 2 T2 3 T3 ALA ILE ALA 1 2 3 4 5 6 7 8 9 10 11 1324 1325 1326 1327 16 65 GLN THR 37 49 2 11 46 83 25 74 ILE THR VAL VAL GLU ASN 1 1 46 0 58 -1 9 1 O N LEU LEU 53 6 N O LYS ASP 42 54 14 49 86 121P 121P 80 81 121P 121P 121P 85 86 87 121P 121P 121P 91 92 93 104 105 106 107 108 109 110 111 112 113 114 N CA C O CB CG SD CE N CA C MET MET MET MET MET MET MET MET THR THR THR 1 1 1 1 1 1 1 1 2 2 2 -7.176 -5.913 -5.903 -6.703 -4.712 -4.594 -3.193 -4.325 -4.966 -4.759 -4.312 32.630 31.928 30.860 30.881 32.869 33.420 34.558 35.886 29.934 28.930 29.597 -6.655 -6.676 -5.600 -4.654 -6.415 -4.990 -4.899 -4.618 -5.760 -4.751 -3.441 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 14.06 17.27 16.41 16.12 17.94 19.41 21.82 23.68 15.08 16.71 16.63 121P 121P 121P 121P 121P 121P 121P 121P 121P 121P 121P PG O1G O2G O3G GTO GTO GTO GTO 167 167 167 167 5.150 4.768 4.164 4.834 32.173 32.597 32.683 30.641 22.030 23.390 21.069 22.025 1.00 1.00 1.00 1.00 11.69 13.29 12.61 13.18 121P1427 121P1428 121P1429 121P1430 X Y Z B-factor ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 CA C O N CA C O CB OG N CA C O CB OG1 CG2 GLU GLU GLU SER SER SER SER SER SER THR THR THR THR THR THR THR 225 225 225 226 226 226 226 226 226 227 227 227 227 227 227 227 -0.900 -0.185 -0.514 0.788 1.534 2.231 1.883 2.572 3.237 3.242 3.989 4.274 4.179 5.354 5.114 6.256 -1.002 0.146 1.329 -0.203 0.805 1.806 1.952 0.130 -0.941 2.478 3.417 2.705 3.296 3.797 4.682 4.492 39.233 39.970 39.758 40.823 41.594 40.681 39.514 42.515 41.848 41.223 40.410 39.080 38.022 41.074 42.172 40.065 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 70.00 70.00 70.00 70.00 70.00 68.89 70.00 70.00 70.00 65.51 70.00 56.25 44.63 70.00 70.00 70.00 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 1HXN 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185