Predizione di struttura secondaria di molecole di RNA Motivi strutturali elementari delle strutture secondarie. I nucleotidi sono indicati da cerchietti grigi e i legami a idrogeno tra le basi complementari da brevi tratti. Le regioni a doppio filamento sono dette stem (s1-s5). Le regioni a singolo filamento sono classificate come: Hairpin loop (L),Internal loop (I) e Multibranched loop (M) Le basi non appaiate presenti solo su uno dei due lati di uno stem creano delle protusioni o bulge (B) Le regioni non appaiate a singolo filamento sono dette junctions (D) Ciascuno dei motivi elementari di struttura secondaria descritti prima contribuisce alla stabilità della struttura secondaria e quindi alla determinazione della sua energia libera. Gli stem sono elementi stabilizzanti (contributo negativo all’energia libera) mentre tutte le regioni a singolo filamento sono destabilizzanti. Ricordate che gli appaiamenti canonici secondo le regole di WatsonCrick sono AU e GC ma comunque l’appaiamento GU è molto frequente ed è abbastanza stabile. 5’- GU AU UA CG GC -3’ GU AU UA CG GC -0,3 -0,3 -0,3 -1,3 -1,3 -1,2 -1,8 -2,1 -2,1 -1,2 -2,1 -2,1 -4,8 -4,3 Energia libera (Kcal/mol) -4,8 from Salser (1977). Algoritmi dinamico-ricorsivi • Il processo di ricerca comincia a partire dai pentanucleotidi e procede in modo ricorsivo considerando oligonucletidi di dimensioni sempre maggiori. • La scelta dei pentanucleotidi è dovuta al fatto che la più piccola struttura composta da un loop formato da tre nucleotidi e chiuso da due basi appaiate. • Traceback : determinate le strutture di energia minima per tutte le possibili subsequenze di una molecola di RNA, viene determinata la struttura globale caratterizzata dal minimo di energia libera. Predizione della struttura secondaria dell’RNA FOLDRNA utilizza il metodo dinamico-ricorsivo e predice la SS che minimizza l’energia libera. Un limite di questo tipo di programmi è dato dal fatto che la struttura che viene predetta è solo una delle possibili strutture caratterizzate da valori di energia libera molto vicina tra loro. Quindi è consigliabile determinare oltre alla struttura ottimale tutte le strutture subottimali la cui energia libera sia prossima (entro una percentuale) al valore minimo calcolato per la struttura ottimale. MFOLD (http://www.bioinfo.rpi.edu/applications/mfold/cgi-bin/rnaform1.cgi) è il programma più affidabile per predire le strutture secondarie ottimali e sub-ottimali. PFOLD (www.daimi.au.dk/~compbio/rnafold/) predice la struttura comune ad un allineamento di sequenze di RNA fornito come input. (I risultati li ricevEte via e-mail) RISULTATO PFOLD La struttura comune è visualizzata attraverso parentesi annidate che indicano i residui coinvolti negli appaiamenti TREE Se ad esempio si considera la sequenza: 5’- AAGAUGCUACGGUGAAGCAUCA -3’ Quale struttura secondaria viene predetta da MFOLD? RISULTATO MFOLD