Complexity in Biology and Medicine Physics and the City Bologna 15-17 dicembre 2005 Claudio Franceschi CIG, Centro Interdipartimentale “L. Galvani” University of Bologna ITALY 1° punto il corpo come entità “storica” risultato dell’evoluzione ed il nuovo paradigma della medicina evolutiva Il corpo come entità storico/evolutiva nel DNA c’è scritta non solo l’informazione genetica ma anche tutta la storia evolutiva della nostra specie solo una piccola percentuale del DNA codifica per proteine (“coding regions”) il resto è costituito da geni troncati, pseudogeni, introni, sequenze ripetute, trasposoni, microsatelliti, sequenze che codificano per piccoli RNA… Il corpo come entità storico/evolutiva nel DNA c’è scritta non solo l’informazione genetica ma anche tutta la storia evolutiva della nostra specie solo una piccola percentuale del DNA codifica per proteine (“coding regions”) il resto è costituito da geni troncati, pseudogeni, introni, sequenze ripetute, trasposoni, microsatelliti, sequenze che codificano per piccoli RNA… La storia evolutiva della vita sulla terra è una storia di contaminazioni genetiche “orizzontali” meglio rappresentata da un albero reticolato o da una rete La medicina evolutiva il nostro corpo è il risultato di un processo di adattamento, durato molti milioni di anni, ad un ambiente che è stato drasticamente modificato negli ultimi, pochi, millenni e soprattutto negli ultimi secoli. Il risultato è che siamo dei “disadattati evolutivi” In alcune parti del mondo (paesi ricchi, sviluppati) abbiamo “ottimizzato” l’ambiente (nutrizione, igiene, medicina, condizioni di lavoro) The highest national life expectancy observed for female, 1580 - present L’aspettativa di vita si è più che raddoppiata negli ultimi due secoli Max Plank Institute for Demography, Rostock, Germany, Annual Report 2001 il nuovo paradigma della medicina evolutiva Le più importanti patologie sono in larga misura la conseguenza del fatto che il nostro corpo è governato da geni e varianti genetiche (polimorfismi) in larga misura “ancestrali” che si sono selezionate per adattarsi ad un ambiente caratterizzato da: - Carestie (oggi opulenza e facile accesso al cibo) - Infezioni (oggi ambiente “igienizzato”) - Grande dispendio di energie fisiche (oggi sedentarietà) 2° punto il corpo come sistema complesso ed i nuovi paradigmi della Biologia Sistemica (Systems Biology) e della Biologia delle Reti (Network Biology) THE PHYSIOME PROJECT Multiscale integration Hunter & Borg, Integration from proteins to organs: the Physiome Project, Nat. Rev. Mol. Cell. Biol. 2003 L’organizzazione a livelli multipli di scale spaziali (da 1 nm per le proteine a 1 m per l’intero corpo) e temporali (da 10-6 a livello molecolare a 109 s per l’intero corpo) richiede una gerarchia di modelli Oltvai & Barabasi, Life’s complexity pyramid, Science 2002 SYSTEM BIOLOGY • Per capire la Biologia a livello sistemico dobbiamo esaminare la struttura e la dinamica delle funzioni cellulari e dell’intero organismo, piuttosto che le caratteristiche delle parti isolate di una cellula o di un organismo • Proprietà dei sistemi quali la robustezza emergono come argomento centrale, ed il capire queste proprietà può avere un forte impatto sulla medicina Kitano H, Systems Biology, a brief overview, Science 2002 SYSTEM BIOLOGY Sebbene la Biologia Sistemica sia ancora agli inizi, i suoi benefici potenziali sono immensi, sia in termini scientifici che pratici… La Biologia si sta muovendo dal livello molecolare al livello sistemico, e questa transizione sta rivoluzionando la nostra comprensione dei complessi sistemi regolatori biologici e sta fornendo eccezionali opportunità per l’applicazione pratica di queste conoscenze….. Kitano H, Systems Biology, a brief overview, Science 2002 SYSTEM BIOLOGY • Forse la conseguenza più importante dello HUMAN GENOME PROJECT è stata quella di spingere gli scienziati verso una nuova concezione della Biologia, ovvero verso l’approccio sistemico • La Biologia Sistemica non studia i geni e le proteine individualmente ed un alla volta, come è stato fatto, del resto con straordinario successo, negli ultimi 30 anni. Piuttosto si interessa di come si comportano e di quali relazioni hanno tra loro gli elementi che costituiscono un sistema biologico, mentre stanno funzionando Ideker T, Galitdki T, Hood L, A new approach to decoding life: Systems Biology, Annu. Rev. Genomics Hum. Genet. 2001 Sistema endocrino CORPO/MENTE Sistema nervoso Sistema immunitario Comunicazioni tra sistema nervoso e sistema immunitario nello stress Webster JI et al, Ann. Rev. Immun., 2002 Uno degli obiettivi fondamentali della ricerca biomedica nell’era post-genomica è quello di fare un catalogo sistematico delle molecole e delle loro interazioniper capire come esse determinino quelle “macchine” enormemente complesse che sono le cellule. La Biologia delle reti suggerisce la presenza di leggi universali ed offre una nuova impalcatura concettuale che sta rivoluzionando la biologia e la medicina Nature Rev Genet, 5, 101-113, 2004 Barabasi and Oltvai, Nat Rev Genet, 2004 Mappa delle interazioni proteina-proteina nel lievito (S. cerevisiae) Network di interazione proteica nel verme C. elegans Corteccia visiva di macaco (rappresentata come un circuito elettronico) Un sistema di elementi interagenti può essere rappresentato da un oggetto matematico chiamato “grafo” con nodi o vertici, e con connessioni (edges) così da costituire una rete (network) - un nodo è caratterizzato dalla sua connettività o “grado” K che indica quante connessioni (links) esso ha con altri nodi - La distribuzione della connettività P(k) indica la probabilità che un determinato nodo abbia esattamente K connessioni (si ottiene contando il numero di nodi N(k) con K= 1,2… e dividendo per il numero totale dei nodi) Le reti biologiche sono scale-free Network topology: different system structure, different behaviour Barabasi & Oltvai, Nat. Rev. Genet. 2004 Le complesse reti biologiche (metaboliche, di interazione tra geni e tra proteine) sono scale-free (invarianza di scala) caratterizzate da: - Grande Eterogeneità (seguono una legge di potenza) - Robustezza e Ridondanza (tolleranti ad errori e a inattivazioni di nodi) - Rarità degli hubs (nodi altamente connessi) Le reti scale-free sono - gerarchiche - modulari (combinazione iterativa di clusters) • Le reti scale-free sono caratterizzate da una distribuzione della connettività P(K) ~ K-g che segue (approssima) una legge di potenza (power law) Confronto tra la distribuzione della connettività in reti scale-free (O) e in grafi random ( □) aventi lo stesso numero di nodi e di connessioni Le reti “scale-free” tendono all’accrescimento ed al rinforzo della connettività nel corso dell’evoluzione secondo la regola che “i ricchi diventano più ricchi” i nuovi nodi preferiscono attaccarsi a nodi che sono già altamente connessi complessizzazione evolutiva ORIGINE DEGLI HUBS NELLE RETI BIOLOGICHE Attaccamento preferenziale Duplicazione genica i geni e le relative proteine non funzionano da soli ma sono inseriti in netwoks dal punto di vista della funzione i geni possono essere assegnati a categorie multiple e tale assegnazione può essere “pesata” i geni e le relative proteine non funzionano da soli ma sono inseriti in netwoks le mappe rappresentano network di interazioni possibili ed in vivo non tutte le connessioni sono presenti ed attive allo stesso tempo o in ogni tipo cellulare i geni e le relative proteine non funzionano da soli ma sono inseriti in netwoks i geni hanno patterns di espressione dinamici nel tempo e nello spazio i geni e le relative proteine non funzionano da soli ma sono inseriti in netwoks Visione probabilistica della funzione del gene (Fraser and Marcotte, Nature Genetics, 36, 559-564, 2004) integrated approach subjective manual curation probabilistic description of gene function the data directly reveal the hierarchy Reti di interazioni fisiche tra geni del lievito (S. cerevisiae) 10.435 interazioni (4 dataset combinati) 7.238 interazioni (3 dataset combinati) 3.344 interazioni (2 dataset combinati) Biologia Sistemica e Matematica La complessità dei sistemi biologici e la enorme quantità di informazioni oggi disponibili a livello di geni, proteine, cellule e organi richiede lo sviluppo di modelli matematici che possano definire le relazioni tra struttura e funzione a tutti i livelli di organizzazione dei sistemi biologici modello troppo semplice modello troppo complesso Rapporto tra efficacia/complessità nei modelli bottom-up Topo Topo mutante Porcospino Roditori Mammiferi Uomo Balena Lunghezza massima di vita (anni) How to study human longevity ? 1. Centenarians vs young/old subjects 2. Very old sibpairs 3. Twins 4. Families enriched in very old components 5. Longitudinal studies on cohorts of different age the model of centenarians selection + remodelling Centenarians represent an extreme phenotype: 1:8-10,000 centenarians are likely not simply the more robust but those people who adapted and remodelled better and quicker (more hormetic ?) GEHA GEnetics of Healthy Aging Integrated Project of EU 6thFP 7.2 M €, 25 Units (coordinator C. Franceschi) Recruitment and Genome Scanning (nuclear and mitochondrial genomes) of 2800 90+ sibpairs collected in 12 countries Starting date: May 1st 2004 Longevity genes in humans (association studies) INFLAMMATION-Immune response STRESS RESPONSE In red and bold genepositive associations with longevity IL-1b CD95 IL-1a IL-1RA Defensins IL10 TGFb1 HFE TH IFNg IGF1-R HRAS1 SIRT3 SOD1 TNFa IL6 SOD2 TLR4 FAS HSP70 REN PON1 APOE Fibrinogen INS TPO Factor VII Factor V APOB PAI-1 APOA1 PPARg APOC3 APOA4 RISK FACTORS FOR CARDIOVASCULAR DISEASES, DEMENTIA AND DIABETES p53 PARP WAF-1 Y CHROM CANCER, DNA REPAIR, CELLULAR PROLIFERATION, APOPTOSIS Polymorphisms of genes involved in stress response and inflammation have a genderspecific association with longevity IFN-g HSP70 IL-6 PPRAgamma IL-10 Tyrosine Hydroxylase mtDNA SIRT3 APOA1 le reti (vie metaboliche, vie di segnalazione intracellulari) più antiche sono le più altamente connesse From a In una prospettiva da Systems Biology I geni positivamente associati con la longevità potrebbero essere geni - functionalmente importanti - gerarchicamente elevati altamente connessi (“hubs”) Le malattie comuni sono dovute a varianti geniche comuni (evolutivamente ancestrali) La longevità potrebbe essere associata a varianti geniche comuni più recenti (adattative per nuove situazioni ambientali) From a In una prospettiva da Systems Biology Si può anche ipotizzare che l’invecchiamento sia dovuto a marcati rimodellamenti delle reti e/o a inattivazione di geni/proteine altamenti connessi/e Studi che utilizzano le nanotecnologie dei microarrays o microchips che consentono di misurare l’espressione (RNA) di decine di migliaia di geni alla volta da cellule o tessuti La seconda parte del disegno sperimentale... Reclutamento 25 soggetti appartenenti a 5 classi d’età: n. 5 soggetti per gruppo 25-35 anni 40-50 anni 55-65 anni 70-80 anni >90 anni …viene valutato l’effetto dell’età sull’espressione genica analizzando l’RNA totale estratto da linfociti T di soggetti di differenti classi di età su una piattaforma 19K (circa 19.000 geni) in collaborazione con Unilever, UK Un disegno sperimentale con una “time series” ci permette di formulare un maggiore numero di ipotesi e l’utilizzo di un maggior numero di metodi di analisi Prima analisi: individuare i geni che cambiano espressione durante il corso della vita (della serie) ma con poca variabilità all'interno dello stesso gruppo di età Analisi: 2-way ANOVA significativa nel tempo (P<0.05) e non significativa per ogni age group (P>0.95) Risultati: 61 geni su circa 15.000 risultano significativi a questa analisi PROFILI DI ESPRESSIONE GENICA (19.000 geni) 200 150 IN LINFOCITI T 100 DA DONATORI DI DIFFERENTE ETA’ 50 (20-93 anni) -0.5 0 0.5 1 che nell’insieme costituiscono 400 una sorta di 300 serie temporale 200 Istogrammi dei 100 coefficienti di correlazione -0.5 0 0.5 1 le persone che invecchiano sono esposte ad un carico immunologico (infezioni croniche batteriche, virali) per un periodo di diverse decadi non previsto dall’evoluzione ripetuti episodi di stress acuto o cronico fisico e psicologico Citochine Ormoni Inflammazione cronica (Inflamm-ageing) ripetuti episodi di stress acuto o cronico antigenico Franceschi et al., Inflamm-aging: an evolutionary perspective on Immunosenescence Ann. N. Y. Acad. Sci. 908, 879-96, 2000 Condizioni patologiche che hanno una patogenesi (o una forte componente) Infiammatoria • • • • • 1. aterosclerosi e m. cardio- e cerebro-vascolari 2. sindr. metabolica, obesità, diabete di tipo 2 3. osteoporosi ed osteoartrite 4. neurodegenerazione (demenza di Alzheimer) 5. tumori The immune system as a complex system A network of cells communicating through chemical signaling (cytokines, chemokines, among others) Immune system integrated intercellular signalling network TGF-b, RANK Ligand, MF derived Chemokine Other 7 mediators eB,D=10 eB,B=17 ACTH CXCR3 Endorphins Other 14 mediators Dendritic cell B lymphocyte eD,B=17 eB,M=3 eB,G=3 IL-10 MIP-1a, b TNF-a IL-6 IL-10 TNF-a TGF-b IL-8/CXCL-8 CD30L eG,B=3 TNF-a, TGF-b, Substance P Other 14 mediators IL-7 IL-10 TNF-a eD,D=11 CD100/Sema4D CD-27 Ligand IL-11 Other 8 mediators eD,M=5 IL-10 IL-15 IL-16 MIP-1a, b TNF-a eD,G=3 GM-CSF MIP-1a, b TGF -b IL-12 IL-16 TGF-b eG,D=1 IL-12 IL-13 IL-15 Other 6 mediators eM,D=5 eM,B=9 Granulocyte eM,M=6 Mast cell eM,G=1 Eotaxin/CCL11 IL-15 MIP-1a, b Other 3 mediators TNF-a Tieri, Valensin, Latora, Castellani, Marchiori, Remondini, Franceschi, Quantifying the relevance of different mediators in the human immune cell network, submitted to Bioinformatics, 2004 Network relevance r of the mediators of the immune cell network Tieri, Valensin, Latora, Castellani, Marchiori, Remondini, Franceschi, Quantifying the relevance of different mediators in the human immune cell network, submitted to Bioinformatics, 2004 Mathematical modeling of the Immune System Results indicate that mediators involved in the inflammatory process and innate immunity have the most central role in the immune network, mirroring the fact that many of the major age-related diseases have an inflammatory pathogenesis they also suggest that it should be possible to identify candidate longevity genes with an in silico systems biology approach Rappresentazione schematica dell’architettura genetica del comportamento La figura illustra la complessa architettura genetica di insiemi modulari, parzialmente sovrapposti, di geni che danno origine a fenotipi comportamentali sotto l’influenza di fattori di sviluppo, ambientali e del sesso fornendo una piattaforma comportamentale sulla quale si esercita la forza della selezione per far emergere cambiamenti evolutivi Anholt RRH, BioEssays 26, 1299-1306, 2004 Rappresentazione schematica di moduli genetici che possono dare origine a fenotipi comportamentali I punti verdi e rossi rappresentano trascritti che formano parte di moduli sovrapposti che danno origine a fenotipi compositi. Le frecce indicano effetti epistatici esercitati da questi geni attraverso le reti alle quali appartengono. Anholt RRH, BioEssays 26, 1299-1306, 2004 Kitano H, Systems Biology, a brief overview, Science 2002 i geni e le relative proteine non funzionano da soli ma sono inseriti in netwoks - Qual è allora il bersaglio dell’evoluzione? - Su che cosa si esercita a selezione naturale? i geni e le relative proteine non funzionano da soli ma sono inseriti in netwoks in che misura la selezione naturale modella la topologia delle reti a livello cellulare ? i geni e le relative proteine non funzionano da soli ma sono inseriti in netwoks quali sono i processi dinamici che modellano la topologia delle reti su una scala temporale evolutiva ? Kell DB, Metabolomics and System Biology: making sense of the soup Curr. Opin. Microbiol. 2004, 7, 296-307 La modalità ipotetico-deduttiva usa le conoscenze per costruire un’ipotesi che a sua volta è messa alla prova sperimentalmente così da generare nuove osservazioni. Queste modalità di ragionamento induttive e abduttive usate entrambe nell’avanzamento della conoscenza scientifica si basano fondamentalmente sulla generalizzazione delle regole (o idee o ipotesi) a partire da alcuni esempi e l’ipotesi è la fine e non l’inizio del ragionamento. Poiché la dimensionalità dei dati è oggi così elevata, si rendono necessari metodi computazionali altrettanto “intensi” per estrarre dai dati sperimentali una (o più !!!) ipotesi o idee the Red Queen hypothesis …”Here, you see, it takes all the running you can do, to keep in the same place”… …”come vedi, bisogna correre il più forte possibile per rimanere nello stesso posto” L. Carroll Alice Through the Looking Glass grazie per l’attenzione