Predizione di struttura secondaria di molecole di RNA
Motivi strutturali elementari delle strutture secondarie. I nucleotidi
sono indicati da cerchietti grigi e i legami a idrogeno tra le basi
complementari da brevi tratti.
Le regioni a doppio filamento sono dette stem (s1-s5).
Le regioni a singolo filamento sono classificate come:
Hairpin loop (L),Internal loop (I) e Multibranched loop (M)
Le basi non appaiate presenti solo su uno dei due lati di uno
stem creano delle protusioni o bulge (B)
Le regioni non appaiate a singolo filamento sono dette junctions
(D)
Ciascuno dei motivi elementari di struttura secondaria descritti prima
contribuisce alla stabilità della struttura secondaria e quindi alla
determinazione della sua energia libera.
Gli stem sono elementi stabilizzanti (contributo negativo all’energia
libera) mentre tutte le regioni a singolo filamento sono destabilizzanti.
Ricordate che gli appaiamenti canonici secondo le regole di WatsonCrick sono AU e GC ma comunque l’appaiamento GU è molto frequente
ed è abbastanza stabile.
5’-
GU
AU
UA
CG
GC
-3’
GU
AU
UA
CG
GC
-0,3
-0,3
-0,3
-1,3
-1,3
-1,2
-1,8
-2,1
-2,1
-1,2
-2,1
-2,1
-4,8
-4,3
Energia libera (Kcal/mol)
-4,8 from Salser (1977).
Algoritmi dinamico-ricorsivi
• Il processo di ricerca comincia a partire dai
pentanucleotidi
e
procede
in
modo
ricorsivo
considerando oligonucletidi di dimensioni sempre
maggiori.
• La scelta dei pentanucleotidi è dovuta al fatto che la più
piccola struttura composta da un loop formato da tre
nucleotidi e chiuso da due basi appaiate.
• Traceback : determinate le strutture di energia minima
per tutte le possibili subsequenze di una molecola di RNA,
viene determinata la struttura globale caratterizzata dal
minimo di energia libera.
Predizione della struttura secondaria dell’RNA
FOLDRNA utilizza il metodo dinamico-ricorsivo e predice la SS che
minimizza l’energia libera.
Un limite di questo tipo di programmi è dato dal fatto che la struttura
che viene predetta è solo una delle possibili strutture caratterizzate da
valori di energia libera molto vicina tra loro.
Quindi è consigliabile determinare oltre alla struttura ottimale tutte le
strutture subottimali la cui energia libera sia prossima (entro una
percentuale) al valore minimo calcolato per la struttura ottimale.
MFOLD
(http://www.bioinfo.rpi.edu/applications/mfold/cgi-bin/rnaform1.cgi) è il programma più affidabile per predire le strutture
secondarie ottimali e sub-ottimali.
PFOLD (www.daimi.au.dk/~compbio/rnafold/) predice la struttura
comune ad un allineamento di sequenze di RNA fornito come input. (I
risultati li ricevEte via e-mail)
RISULTATO PFOLD
La struttura comune è visualizzata attraverso parentesi annidate che
indicano i residui coinvolti negli appaiamenti
TREE
Se ad esempio si considera la sequenza:
5’- AAGAUGCUACGGUGAAGCAUCA -3’
Quale struttura secondaria viene predetta da MFOLD?
RISULTATO MFOLD
Scarica

Lezione Analisi Struttura secondaria RNA