Bioinformatica Corso di Laurea Specialistica in Informatica RNA non codificanti ed RNA regolatori 29/04/2011 RNA non codificanti ed RNA regolatori • • • • Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA Piccoli RNA non codificanti • Gli RNA non codificanti (ncRNA) giocano un ruolo fondamentale nei sistemi biologici complessi, pur non codificando alcuna proteina. • Tra i ncRNA maggiormente caratterizzati troviamo i tRNA (RNA transfer) e gli rRNA (RNA ribosomiali). • Recenti studi hanno però rivelato diverse altre classi di ncRNA, aventi funzioni catalitiche e strutturali. • Questi RNA sono componenti essenziali di complessi riboproteici (RNP), all’interno dei quali svolgono il ruolo di guida e riconoscimento di sequenze nucleotidiche target attraverso il meccanismo di complementarità delle basi. Alcuni tipi di ncRNA • tRNA (RNA transfer): adattatori per la conversione del codice genetico a triplette nel codice amminoacidico delle proteine. • rRNA (RNA ribosomiali): il cuore dell’apparato traduzionale all’interno del quale svolgono sia funzione strutturale che catalitica (formazione del legame peptidico). • snRNA (Piccoli RNA nucleari): sono componenti critici dello spliceosoma e svolgono un ruolo importantissimo nella maturazione degli mRNA. Alcuni tipi di ncRNA • snoRNA (Piccoli RNA nucleolari): sono implicati nel processamento e nella maturazione degli RNA ribosomali e di altri tipi di RNA, aumentandone l’attività. • miRNA e siRNA: sono piccoli RNA in grado di regolare l’espressione genica a livello posttrascrizionale, silenziando specifiche molecole di mRNA. • piRNA: sono coinvolti nel silenziamento trascrizionale dei retrotrasposoni nelle cellule germinali. RNA non codificanti ed RNA regolatori • • • • Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA Regolazione genica post-trascrizionale • L’espressione genica può essere regolata a livello posttrascrizionale. • Non è detto che tutto l’mRNA che viene trascritto a partire da un certo gene venga utilizzato per sintetizzare la relativa proteina. Trascrizione Traduzione RNA regolatore • La regolazione post-trascrizionale dell’espressione avviene per mezzo di molecole di RNA regolatore. genica • L’RNA regolatore è una molecola di RNA in grado di legarsi ad una molecola di mRNA impedendone la traduzione. • L’RNA regolatore riconosce il suo bersaglio in base al principio di appaiamento complementare delle basi. • Gli RNA regolatori sono solitamente piccole molecole di RNA con una certa struttura secondaria, ma con una regione a singolo filamento complementare ad una regione a singolo filamento dell’mRNA bersaglio. • Nella regolazione basata su small RNA è importante anche la struttura secondaria della molecola di RNA target. RNA regolatore e inibizione della traduzione • L’appaiamento di una molecola di RNA regolatore ad una regione a singolo filamento di mRNA può provocare: – L’inibizione della traduzione senza distruzione della molecola di mRNA – La degradazione della molecola di mRNA • In entrambi i casi si ha il “silenziamento” del gene, il cui effetto è la mancata produzione della proteina corrispondente. • Perché un RNA regolatore possa legarsi ad una molecola di mRNA bersaglio: – La regione di legame sul bersaglio deve essere accessibile, ovvero meno stabile (deve contenere una regione, anche piccola, a singolo filamento). – Il legame con l’RNA regolatore deve essere energeticamente favorevole. Accessibile Non accessibile RNA antisenso • Un gene antisenso codifica per un RNA la cui sequenza è complementare a quella di un RNA bersaglio: Target RNA 5’-AGGACTACCGACTAGCATA-3’ 3’-TCCTGATGGCTGATCGTAT-5’ Antisense RNA • A volte il gene antisenso si trova sul filamento opposto a quello del gene bersaglio, pertanto i due RNA saranno perfettamente complementari. • Altre volte gli RNA antisenso vengono trascritti da altre regioni del genoma, per cui si potrebbe avere una parziale complementarità delle loro basi. RNA non codificanti ed RNA regolatori • • • • Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA I microRNA • I microRNA (miRNA) sono piccole molecole di RNA in grado di regolare negativamente l’espressione di geni target a livello post-trascrizionale. • Sono dei piccoli RNA antisenso che mostrano complementarità parziale (quasi sempre) o totale (più raramente) delle loro basi rispetto a quelle dei loro mRNA bersaglio. • I miRNA sono in grado di impedire la traduzione dei loro target preservandone la stabilità o provocandone la distruzione. • Un miRNA può avere più target ed uno stesso mRNA può essere target di diversi miRNA. I microRNA (2) • I miRNA sono trascritti da particolari sequenze genomiche (geni miRNA) situate di solito in regioni intergeniche o negli introni di altri geni. • Molti miRNA sono altamente conservati, in specie anche molto lontane tra loro (Es. Caenorhabditis elegans e Homo sapiens). • Sono presenti anche nei virus, probabilmente come meccanismo di autoregolazione e di interferenza con le cellule ospiti, ma non nei batteri. I geni miRNA • I geni miRNA hanno sequenze tali da generare trascritti di RNA con struttura a forcina (hairpin): loop GGCCUGUUCCCCGAGACUAUUGAUCUCGGGGAACAGGCC CUA GGCCUGUUCCCCGAGA A CCGGACAAGGGGCUCU A UGA • Si parla di strutture di tipo STEM-LOOP. I due bracci dello STEM possono non essere totalmente complementari: Biogenesi dei miRNA • I trascritti primari dei geni miRNA sono chiamati primiRNA. • I pri-miRNA vengono tagliati da un enzima chiamato Drosha in molecole più piccole, a doppio filamento, chiamate pre-miRNA. • I pre-miRNA vengono esportati nel citoplasma e tagliati in RNA doppio filamento più piccoli da un altro enzima chiamato Dicer. • Uno dei due filamenti contiene il miRNA maturo, lungo solitamente tra i 19 e i 25 nucleotidi, che viene incorporato in un complesso proteico chiamato RISC. miRNA • I miRNA nei RISC sono in grado di legarsi a siti specifici di mRNA provocandone il silenziamento: • L’appaiamento della sequenza del miRNA con il suo sito bersaglio non è perfetto, ma può contenere bulge e loop. • Dalle coppie miRNA/target individuate sperimentalmente emergono alcune regolarità nelle modalità di appaiamento. Osservazioni sulle modalità di appaiamento • La regione iniziale (5’) del miRNA è chiamata seed e sembra essere la regione più importante nel silenziamento. • E’ lunga solitamente tra i 7 e i 10 nucleotidi, ma esistono casi di seed più corti o più lunghi. • Tale regione è solitamente appaiata in modo perfettamente complementare al suo target: • Il primo nucleotide del miRNA non è determinante e può non essere appaiato. Osservazioni sulle modalità di appaiamento • La regione a valle del seed contiene solitamente un bulge o un loop: • La regione 3’ del miRNA mostra solitamente una complementarità imperfetta al suo target. • Le coppie G:U nella regione del seed sembrano essere sfavorevoli al silenziamento, sebbene siano ammesse, mentre sono abbastanza comuni nella regione 3’. • Infine, le regioni di legame dei miRNA si trovano nella regione 3’ UTR degli mRNA bersaglio. Funzioni dei miRNA • I miRNA svolgono un ruolo centrale nel controllo di numerosi processi fisiologici: – Sviluppo – Differenziamento cellulare – Apoptosi • Aberrazioni nella loro espressione (mancanza, sotto o sovra espressione) sono correlate a diversi tipi di patologie: – Cancro – Malattie neurodegenerative – Malattie cardiache • Si tratta dunque di molecole molto importanti, il cui studio è fondamentale nella comprensione dei processi biologici, dei fenotipi patologici e, di conseguenza, nel design di terapie innovative. Un problema bionformatico: la ricerca dei geni miRNA • Ad oggi, nell’uomo, sono stati individuati più di 1400 miRNA. • Sono noti miRNA in molti altri eucarioti e nei virus. • La ricerca di nuovi geni miRNA è uno dei compiti principali della bioinformatica nello studio della regolazione genica post-trascrizionale. • Data una sequenza genomica ci si chiede se essa contiene uno o più geni miRNA. • Come nella gene prediction, è importante individuare regolarità nelle sequenze dei geni miRNA e nei dintorni, al fine di stabilire regole per la predizione. • Ad oggi la regola principale è la forma di stem-loop assunta dal trascritto primario (pri-miRNA). Ricerca di geni miRNA • I tool per la predizione di geni miRNA si basano dunque sulla ricerca di sequenze in grado di assumere la forma di stem loop qualora venissero trascritte in RNA. • Ogni sequenza di questo tipo contiene quindi due sottosequenze (quasi) complementari, l’una in senso opposto all’altra (stem) separate da una regione “loop”: loop GGCCUGUUCCCCGAGACUAUUGAUCUCGGGGAACAGGCC CUA GGCCUGUUCCCCGAGA A CCGGACAAGGGGCUCU A UGA Ricerca di geni miRNA (2) • Uno dei problemi principali nella ricerca di geni miRNA è la presenza di un numero elevato di potenziali hairpins nei genomi eucariotici. • Il problema quindi è l’identificazione degli hairpin corretti. • Occorre quindi trovare dei buoni filtri per la riduzione dello spazio di ricerca. Ricerca di geni miRNA: Approcci basati sulla riduzione dello spazio di ricerca • Conservazione – miRScan Trova potenziali hairpin in un genoma ed utilizza BLAST per trovare omologhi in un’altra specie. – miRFinder Confronta sequenze intergeniche di due diversi genomi (es. Arabidopsis e Riso) e utilizza una serie di regole empiriche per selezionare gli hairpin più probabili. La conservazione tra le specie può ridurre significativamente il numero di hairpin, ma taglia fuori tutti i geni miRNA specie-specifici. Ricerca di geni miRNA: Approcci basati sulla riduzione dello spazio di ricerca (2) • Match intragenomici – miMatcher Questo tool si basa sul fatto che un miRNA possiede almeno un target nel genoma. Dato un possibile target, vengono ricercati match perfetti con i possibili hairpin individuati nel genoma. Questo approccio è però praticabile solamente nelle piante, nelle quali la complementarità tra miRNA e target è totale, a differenza degli animali nei quali la complementarità è parziale. Ricerca di geni miRNA: Approcci dedicati Classificazione degli hairpin • Molti metodi per la ricerca di geni miRNA si basano su caratteristiche termodinamiche e osservazioni empiriche. • Gli hairpin vengono individuati attraverso tool per la predizione della struttura secondaria dell’RNA (Es. Mfold) e classificati in base all’energia libera. • Una volta individuati gli hairpin termodinamicamente più favorevoli, vi sono due possibili approcci per la classificazione: – Metodi basati su regole empiriche – Metodi di machine learning Ricerca di geni miRNA: Approcci dedicati Metodi basati su regole empiriche • Questi metodi si basano su tutte le caratteristiche osservate nei pre-miRNA noti. • Esempi di regole: – Non più di un nucleotide ogni 20 può essere spaiato. – Almeno 16 delle basi nel miRNA maturo devono essere appaiate. – Il contenuto di nucleotidi G e C (indice di maggiore stabilità) deve essere tra il 30% e il 70%. Ricerca di geni miRNA: Approcci dedicati Metodi di Machine Learning • Nei metodi di machine learning, le regole vengono estratte e verificate automaticamente a partire da esempi (pre-miRNA validati sperimentalmente). • Approcci tipici: – HMM (Hidden Markov Models) – SVM (Support Vector Machines) • Questi metodi ricevono in input un hairpin, lo analizzano e restituiscono in output un valore 1 o 0, a seconda che l’hairpin abbia le caratteristiche di un miRNA o meno. • I modelli vengono addestrati utilizzando set di hairpin già classificati. miRBase • miRBase è la banca dati ufficiale dei miRNA: http://microrna.sanger.ac.uk/sequences/ • Contiene le sequenze dei miRNA maturi e degli stem-loop precursori, oltre a riferimenti bibliografici ed informazione sui target. miRBase • Cliccando su Browse si può database organizzato per specie: sfogliare l’intero miRBase • Per ogni miRNA sono riportati: Lo stem-loop… …ed il miRNA maturo Un problema bioinformatico: la ricerca di target per i miRNA • Sebbene si conoscano più di 1400 miRNA nell’uomo (e molti altri in altre specie), solo per il 10% di essi è stato individuato almeno un target. • Problema: – Dato un miRNA, determinare i suoi possibili mRNA target • Esistono numerosi tool su web che offrono servizi di predizione di target per miRNA: – – – – TargetScan PicTar miRanda … • Molti di essi offrono dei database di predizioni già effettuate da consultare. Un tool di predizione di target: miRanda • miRanda è il tool per la predizione di target per miRNA sviluppato al Memorial Sloan-Kettering Cancer Center (New York). • La prima versione (1993) è stata utilizzata per determinare target per miRNA in Drosophila melanogaster. • I concetti base dell’algoritmo di miRanda sono: - Appaiamento delle sequenze miRNA/Target - Valutazione termodinamica dei duplex predetti - Analisi della conservazione dei siti di legame • Così come le sequenze dei miRNA, anche i loro siti di legame sui target sono spesso conservati: questo tipo di informazione è alla base del filtro di miRanda. L’algoritmo di miRanda (a) (b) Si considerano le sequenze dei miRNA e dei 3’ UTR dei trascritti di Drosophila. (c1) miRNA e UTR vengono allineati per complementarità. Appaiamenti ammessi: - A:U - G:C - G:U Requisito fondamentale di un buon appaiamento: - Alta complementarità nella regione del seed. (c2) Viene valutata la struttura secondaria (predetta) dei duplex ottenuti: minore è l’energia libera, più stabile è il legame. (d) Viene effettuata l’analisi di conservazione, confrontando i siti di legame dei trascritti con gli UTR degli ortologhi in Drosophila pseudoobscura e Anopheles Gambiae (mediante allineamento). I target con siti conservati vengono ordinati per energia e memorizzati nel database. MicroRNA.org • Il web-server di miRanda si trova all’indirizzo: http://www.microrna.org • Qui è possibile accedere alle predizioni effettuate per uomo, topo e ratto. miRanda • E’ possibile effettuare la ricerca per miRNA (Es. miR15a): • E’ possibile effettuare la ricerca per target (Es. Bcl2): miRanda – Ricerca per miRNA • Cerchiamo i target predetti per il miRNA miR-15a in Homo sapiens: • Cliccando su “view targets” si ottiene l’elenco dei target, con i dettagli degli appaiamenti: miRanda – Ricerca per target • Cerchiamo i miRNA per i quali il gene Bcl-2 è un target predetto: RNA non codificanti ed RNA regolatori • • • • Piccoli RNA non codificanti RNA regolatore microRNA RNAi e siRNA I siRNA • I siRNA sono piccole molecole di RNA simili ai miRNA. • Non sono codificati da sequenze genomiche ma derivano da altre molecole di RNA più grandi, spesso di origine esogena (es. virus). • Come i miRNA vengono tagliati dal Dicer ed incorporati nel RISC. • Si appaiano con complementarità totale a siti specifici sui loro target (in CDS o UTR) provocandone la degradazione. siRNA ed RNA Interference • I siRNA sono le principali molecole utilizzate nell’RNA Interference (RNAi) artificiale. • I siRNA vengono disegnati ad hoc sulla base del sito di legame scelto sul trascritto da silenziare ed hanno generalmente complementarità totale al loro target. • Le molecole di siRNA vengono solitamente introdotte nelle cellule mediante vettori virali, virus ingegnerizzati che trasportano l’informazione per la codifica dei siRNA nel loro genoma. • Un uso tipico dell’RNAi è il knock-out artificiale dei geni, ovvero il silenziamento dell’espressione di uno più geni per studiarne gli effetti e le conseguenze e di conseguenza le funzioni svolte. RNA interference • Premio Nobel 2006 per la Medicina Craig Mello ed Andrew Fire