CLONAGGIO DEL DNA E SUE PRINCIPALI APPLICAZIONI IN AMBITO BIOMEDICO Montemurro Luca Clonare il materiale genetico Il materiale genetico (sia esso DNA genomico o cDNA) è composto da molte parti (sequenze) che prendono parte al funzionamento della cellula sia coinvolte nell’espressione di geni in proteine sia sconosciute. Per studiare al meglio queste sequenze è necessario isolarle ed aumentarne selettivamente la quantità. Ciò può essere fatto tramite il clonaggio del materiale genetico. Per clonaggio (non clonazione) si intende la generazione di costrutti tramite il legame di sequenze di interesse con altre in grado di replicarsi in modo indipendente. Il processo del clonaggio è composto da 4 fasi: 1. 2. 3. 4. Costruzione di molecole ricombinanti Trasformazione Propagazione selettiva dei cloni Isolamento dei cloni contenenti il DNA ricombinante voluto Enzimi di restrizione Le biotecnologie ricombinanti sono in grado di analizzare e manipolare il materiale genetico essenzialmente utilizzando una serie di specifiche attività enzimatiche con le quali si possono “tagliare” e “cucire” il DNA Tra gli strumenti più utili a nostra disposizione si annoverano gli enzimi di restrizione, enzimi capaci di riconoscere sul DNA brevi sequenze bersaglio, di solito palindromiche tagliandole in posizioni specifiche. Una palindrome è una parola che si legge allo stesso modo sia da destra che da sinistra, per es. la parola radar oppure ala. Un sito di riconoscimento palindromico è una sequenza in cui il filamento superiore e inferiore, letti in direzione 5'-3', sono uguali. Per es. la sequenza: 5'-GAATTC3‘ 3'-CTTAAGEsistono tre classi di enzimi di restrizione: Gli enzimi di tipo I e III portano le attività di restrizione e di metilazione nella5' stessa molecola e non sono utilizzati in biologia molecolare a causa della loro aspecificità di taglio. Gli enzimi di classe II, invece, portano le due attività su molecole distinte e sono caratterizzati da una elevata specificità di taglio. Centinaia di endonucleasi di tipo II sono correntemente utilizzate e commercializzate o mordo tua nuora o aro un autodromo Gli enzimi di restrizione furono scoperti intorno agli anni ‘50 e devono il loro nome al fenomeno della restrizione-modificazione controllata dalla cellula ospite. Si notò che talvolta l’introduzione in E.coli di DNA esogeno, proveniente da un diverso ceppo di E.coli, risultava nella sua rapida frammentazione in piccoli frammenti (restrizione). L’analisi di un DNA virale rivelatosi capace di resistere alla degradazione, rivelò, una decina di anni più tardi, la presenza di alcune basi metilate. Si scoprì, quindi, l’esistenza in E.coli di sistemi di restrizione/modificazione capaci di metilare specifiche basi e, contemporaneamente, di tagliare le stesse basi quando non metilate (Fig.1 e 2). Con questo sistema E.coli è capace di degradare DNA esogeno tagliandolo in specifici siti di riconoscimento. Gli stessi siti presenti sul DNA endogeno, tuttavia, non sono tagliati perché preventivamente metilati dal sistema di restrizione-metilazione 1 2 Nomenclatura La nomenclatura degli enzimi di restrizione si basa sul genere e sulla specie del batterio dal quale è stato isolato l’enzima di restrizione: per es. BamHI deriva da Bacillus amylofaciens, EcoRI da Escherichia coli, HindIII da Haemophilus influentiae etc. Specificità sito-specifica e frequenza di taglio La straordinaria importanza degli enzimi restrizione risiede nella loro specificità. Ogni particolare enzima di restrizione, infatti, riconosce una sequenza specifica di basi all’interno di una catena polinucleotidica. La maggior parte degli enzimi più comuni riconoscono da 4 a 6 basi. Il numero di basi riconosciute è di importanza pratica perché determina la frequenza media di taglio e la dimensione media dei frammenti generati. E’ ovvio che un enzima che riconosce una sequenza di 4 basi taglierà più frequentemente di uno che ne riconosce 6. Più in dettaglio, consideriamo, per esempio, l’enzima AluI che riconosce la sequenza di 4 basi AGCT. Assumendo che la distribuzione delle 4 basi che compongono il DNA sia casuale, avremo che in ogni posizione del DNA ci sarà 1 probabilità su 4 di trovare una A. Analogamente nella posizione seguente avremo 1 probabilità su 4 (0.25) di trovare una G, mentre la probabilità di trovare in sequenza A e G sarà uguale al prodotto delle probabilità 1/4 x 1/4, ovvero 1/42= 1/16. Nel caso di un enzima che riconosca 4 basi, quindi, la frequenza uguale sarà a 1/44 = 1/256 basi, mentre nel caso di un enzima che riconosca 6 basi sarà 1/4 6 = 1/4096. In altre parole un enzima con una sequenza di riconoscimento di 4 basi, come ad es. AluI taglierà, in media una volta ogni 256 bp , mentre un’enzima come EcoRI una volta ogni 4096 bp. In generale la frequenza di taglio è sempre uguale a 1/4 n , dove n = al numero di nucleotidi del sito di riconoscimento. L‘utilizzo degli enzimi di restrizione é molto semplice. La maggior parte di essi funziona in semplici tamponi tra pH 7 e 8, generalmenta a 37°C. Le condizioni di utilizzo sono comunque sempre specificate dai fornitori. Per definizione una unità di un enzima di restrizione è la quantità di enzima richiesta per digerire completatamente 1 µg di DNA substrato in un’ora. Tutti gli enzimi, in condizioni non ottimali, danno il cosiddetto "effetto star", che consiste nella capacità dell'enzima di "confondersi" riconoscendo e tagliando sequenze simili, ma non identiche a quella target. Per evitare l'effetto star è opportuno attenersi alle condizioni specificate dai fornitori, con particolare riferimento al glicerolo e alla quantità di enzima, che non devono essere mai in eccesso. Sebbene esistano enzimi di restrizione con siti di riconoscimento degenerati (per es. BsiEI riconosce la sequenza 5'-CGPuPyCG-3' dove Pu e Py rappresentano "qualunque purina" e "qualunque pirimidina“), la maggior parte degli enzimi di restrizione utilizzati nell'ingegneria genetica riconoscono sequenze specifiche che tagliano in tre modi diversi: •Generando estremità piatte (blunt) Es. SmaI 5'-CCCGGG-3' 3'-GGGCCC-5' 5'-CCC-3' 3'-GGG-5' 5'-GGG-3' 3'-CCC-5' •Generando estremità coesive (sticky) sporgenti al 5' (5' protuding) Es. EcoRI 5'-G-3' 5'-GAATTC-3' 3'-CTTAA-5' 3'-CTTAAG-5' •Generando estremità coesive (sticky) sporgenti al 3' (3' protuding) Es. PstI 5'-CTGCAG-3' 3'-GACGTC-5' 5'-CTGCA-3' 3'-G-5' 5'-AATTC-3' 3'-G-5' 5'-G-3' 3'-ACGTC-5' Estrazione di frammenti di DNA da gel Dopo aver digerito un DNA con enzimi di restrizione ed averne separato i frammenti risultanti su gel di agarosio, il passo seguente di solito consiste nell’excidere dal gel, con un bisturi, specifiche bande corrispondenti a geni o porzioni di DNA di nostro interesse e purificarle da gel. Esistono molti sistemi per purificare bande da gel, tra cui: • • • • • • elettroeluizione colonne a scambio ionico gel-filtration ultrafiltrazioni agarosio a basso punto di fusione ecc. ecc. Ligazione Dopo aver tagliato (e isolato) specifici frammenti di DNA, il passo successivo di un clonaggio consiste nel “cucirli” tra loro in modo covalente. Nella maggior parte dei casi questo compito è affidato alle ligasi, enzimi che catalizzano la formazione di legami fosfodiesterici tra estremità 3'-OH e 5'-P di molecole di DNA adiacenti, uguali (ligazione intra-molecolare) o diverse (ligazione inter-molecolare). Catalizzano, inoltre la chiusura di interruzioni a singolo filamento (nicks) in molecole di DNA a doppio filamento. Il ruolo naturale della ligasi consiste nella riparazione dei nicks a singolo filamento di DNA danneggiati o nella giunzione dei frammenti di Okazaki durante la duplicazione del DNA. L’appaiamento labile di due frammenti di restrizione con estremità coesive, dunque, è simile alla giunzione di due nicks, molto vicini, situati su filamenti opposti. La DNA ligasi più utilizzata è quella codificata dal batteriofago T4, un enzima, ATPdipendente, ottenuto da cellule di E. coli infettate dal fago T4. Seppur a minor efficienza la T4 DNA ligasi è capace di ligare tra loro anche estremità piatte. Questo enzima richiede ATP come substrato. Nel primo passaggio della reazione la ligasi reagisce con l’ATP per formare un complesso covalente ligasi-AMP, il quale, a sua volta, reagisce con il fosfato al 5' su un lato del nick, trasferendo l’AMP al gruppo fosfato. Il passaggio finale è l’attacco ad opera del gruppo 3'-OH che ripristina l’integrità dello scheletro zucchero-fosfato Le estremità “coesive”, che contengono cioè corti filamenti a singolo filamento complementari tra loro, che vengono generate da molti enzimi di restrizione, facilitano il compito della ligasi, perché le estremità tendono ad appaiarsi tra loro. In queste condizioni le ligazioni si effettuano generalmente tra 4 e 37°C, per un tempo variabile tra 1 e 24 ore. Se, invece, bisogna ligare estremità “blunt”, la ligazione è più difficile e si effettua a bassa temperatura e a più elevata concentrazione di enzima e di frammenti da ligare per favorire l’incontro delle molecole da ligare. Ottimizzazione della ligazione Per ottenere buoni risultati la ligazione deve essere accuratamente ottimizzata rispetto alla: • temperatura e al tempo di reazione • alla concentrazione totale del DNA • alla concentrazione dell’inserto e del vettore. Riguardo alla temperatura bisogna considerare che si contrappongono due aspetti opposti: la stabilizzazione dell’appaiamento tra estremità coesive, ottimale a basse temperature, e l’attività enzimatica della ligasi, massima a 37°C. Come compromesso si utilizza spesso una temp. di 16°C per 12 ore. Per quanto riguarda la concentrazione è importante sia quella del DNA totale T, che quella dell’inserto I e del vettore V. In linea di massima, basse concentrazioni di DNA favoriscono le reazioni di primo ordine come la ricircolarizzazione del vettore, la cui velocità è linearmente proporzionale alla sua concentrazione. D’altra parte aumentare la concentrazione totale incrementando la concentrazione di vettore, peggiora la situazione, ma aumentare la concentrazione dell’inserto aumenta la probabilità di avere di avere inserti circolarizzati o vettori con inserti multipli In pratica il problema si supera utilizzando T 10-20 ng/µl e rapporti molari I/V da 3:1 a 1:3 in reazioni di 10-20 µl. E’ importante ricordare si devono utilizzare i rapporti molari. E’ pratica comune considerare uguale il PM di molecole di DNA diverse, deducendo il numero di moli dal rapporto: peso in g (o sottomultipli) del DNA Kb del DNA Esempio di calcolo: Vogliamo ligare 50 ng di un vettore di 10 Kb con un inserto di 1 Kb, in due separate reazioni, utilizzando rapporti molari I/V 1:1 e 3:1, rispettivamente. 1^ ligazione: 2^ ligazione 1I : 1V = x/1: 50/10; 1:1 = x: 5; x= 5 ng 3I : 1V = x/1: 50/10; 3:1 = x: 5; x= 15 ng Più semplicemente si calcola il rapporto tra i PM di inserto e vettore, eventualmente moltiplicato per il numero di moli, e lo si moltiplica per i ng di vettore. Per la 2^ ligazione: I/V = 1/10 = 0,1; 50 0,1 = 5 ; 5 3 = 15 Fosfatasi alcalina In molti casi, pur ottimizzando la reazione di ligazione, non si riesce ad evitare una elevata frequenza di ricircolarizzazione del vettore, come, ad esempio, quando il vettore e l’inserto sono tagliati con lo stesso enzima di restrizione. P-5'AATTC HO-3' vettore inserto P-5'AATTC HO-3' 3'OH TTAAG -5'P vettore 3'OH TTAAG -5'P Una strategia per superare questo problema consiste nell’utilizzo di una fosfatasi, come ad esempio la fosfatasi alcalina (CIP), un enzima che rimuove il gruppo fosfato al 5' impedendo così l’azione della ligasi. La defosforilazione del vettore con una fosfatasi impedisce la ricircolarizzazione del vettore, abbassando sensibilmente il background. Poiché il vettore defosforilato non può essere ligato, inoltre, è possibile utilizzare un eccesso molare di vettore, minimizzando la possibilità di avere inserzioni multiple. In alcuni casi, per esempio nella costruzione di una libreria genomica in lambda, è più conveniente defosforilare l’inserto (in questo caso una popolazione di inserti) P-5'AATTC HO-3' vettore 3'OH fosfatasi HO- AATTC HO-3' TTAAG -5'P vettore 3'OH TTAAG -OH Sebbene un vettore defosforilato non possa essere circolarizzato dalla ligasi, può essere ligato ad un inserto sfruttandone il suo fosfato al 5'. L’assenza di fosfati al 5' del vettore produrrà due nicks, uno per filamento. Queste interruzioni a singolo filamento, tuttavia non influenzeranno negativamente la stabilità del costrutto (vettore + inserto) e saranno riparate dai sistemi di riparo di E.coli subito dopo la trasformazione. P-5'AATTC HO-3' vettore HO- AATTC HO-3' 3'OH TTAAG -5'P inserto vettore 3'OH TTAAG -OH -OH -OH + ligasi vettore inserto vettore -OH -OH Filling in Nel corso dei clonaggi può capitare di dover trasformare estremità coesive sporgenti al 5' o al 3‘ in estremità piatte, sintetizzando le basi mancanti nel filamento incompleto al 5' (filling in), oppure eliminando quelle sporgenti al 3' (trimming) Esempio 1: estremità “sticky” 5' protuding (es.EcoRI) In questo caso la tecnica d’elezione consiste nel cosiddetto “ filling in” che consiste nel “riempire” una estremità sporgente al 5' con la Klenow 5'P 3'OH G 3'OH C AATTC dTTP dATP dGTP 5'P 5'P 3'OH G TTAAG C AATTC 3'OH 5'P Linker e adapter Sebbene sia sempre possibile trasformare estremità coesive in estremità piatte per sfruttarne la versatilità che ne permette la ligazione con estremità piatte generate con molte enzimi diversi, va considerato che le ligazioni “blunt” sono comunque più difficili da ottenere. Un alternativa consiste nell’utilizzo di linkers o adapters. I linkers sono corti oligonucleotidi sintetici autocomplementari che contengono, al loro interno, un sito di restrizione. Per esempio la sequenza: 5'-CCGGATCCGG-3' Che contiene al suo interno il sito di riconoscimento per BamHI. In presenza di un frammento “blunt” e di ligasi avremo: Frammento SmaI + 5'-CCGGATCCGG-3' CCGGATCCGG-3' Frammento SmaI GGCCTAGGCC-5' Trattando, quindi, con BamHI avremo trasformato un’estremità blunt (SmaI) in una sticky (BamHI). CCGGATCCGG-3' Frammento SmaI GGCCTAGGCC-5' + BamHI CCG-3' Frammento SmaI GGCCTAG-5' Nonostante l’aggiunta di un linker implichi una ligazione blunt end, utilizzando elevate concentrazioni molari di linker, si migliora notevolmente l’efficienza di ligazione. Gli eventuali multimeri di linker che si potrebbero così creare, saranno facilmente rimossi con la successiva digestione con l’enzima di restrizione. Gli adapters sono coppie di brevi oligonucleotidi sintetici parzialmente complementari progettati per appaiarsi tra loro creando un frammento a doppia elica con estremità coesive differenti. Per esempio la coppia: 5'-GATCCCCGGG-3' Estremita coesive BamHI Frammento SmaI CCG-3' GGCCTAG-5' 5'-AATTCCCGGG-3' annealing Estremita coesive EcoRI 5'-GATCCCCGGG-3' 3'GGGCCCTTAA-5' ligazione Estremita coesive EcoRI Frammento SmaI CCGGATCCCCGGG-3' GGCCTAGGGGCCCTTAA-5' Omopolimeric tailing Un ulteriore strategia per aggiungere estremità coesive a molecole di DNA consiste nell’utilizzare la terminal deossinucleotide transferasi, più comunemente noto come terminal transferasi. Questo enzima catalizza l’aggiunta, stampo indipendente, di nucleotidi trifosfati all’OH in posizione 3'. Quando incubato in presenza di un singolo deossiribonucleotide trifosfato, per es: il dCTP, questo enzima catalizza l’aggiunta di una coda omopolimerica di questo deossiribonucleotide alla estremità 3' terminale. 5'-P HO-3' 5'-P 3'OH 5'-P HO-3'CCCCCCCC Terminal transferasi + dCTP CCCCCC3'OH 5'-P Sottoponendo il vettore e l’inserto a trattamento con terminal transferasi con due deossiribonucleotidi diversi le due molecole diventano complementari tra loro e possono essere ligate. vettore inserto Terminal transferasi + dGTP 5'-P HO-3'GGGGGG vettore Terminal transferasi + dCTP GGGGGG3'OH 5'-P 5'-P HO-3'CCCCCCCC inserto CCCCCC3'OH 5'-P T/A cloning di prodotti di PCR La maggior parte delle polimerasi termostabili utilizzate nella PCR, possiedono una debole attività di tipo terminal trasferasico e aggiungono un residuo di adenosina alla estremità 3' dei propri prodotti di amplificazione 5'-P HO-3 A Sebbene questa caratteristica ostacoli il clonaggio dei prodotti di amplificazione, è stata vantaggiosamente sfruttata in una serie di vettori commerciali, i cosiddetti vettori T/A, che vengono forniti già linearizzati e che possiedono un residuo di timidina alle loro estremità 3'. I residui 3' terminali di T del vettore si appaiano con le A dei prodotti di amplificazione rendendo così possibile il clonaggio dei prodotti di PCR. A-3'OH 5'-P Per clonare un gene dobbiamo inserirlo in un vettore di clonaggio ed introdurre il costrutto risultante in un ospite capace di replicarlo Isolamento di un gene Trasformazione di cellule procariotiche ed eucariotiche Un aspetto importante di tutte le tecniche di ingegneria genetica è rappresentato dalla introduzione del DNA ricombinante in una cellula ospite capace di replicarlo. La capacità di trasferire geni da un organismo ad un altro è alla base di tutte le tecniche di ingegneria genetica. L’efficienza di questo passaggio è cruciale per garantire il successo di qualunque clonaggio Svariate strategie di trasferimento genico sono state evolute in diversi organismi e sono rimaste le tracce di antichi trasferimenti genici. I batteri, per esempio, sono in grado di trasferire materiale genetico da batterio a batterio, mediante coniugazione; i virus infettando cellule suscettibili di vari organismi; i batteri del suolo del genere Agrobacterium riescono a trasferire e integrare stabilmente in cellule vegetali porzioni del loro genoma. Recenti progressi nelle tecniche di trasferimento genico permettono oggi di trasferire ad alta efficenza, e in modo controllato materiale genico in altri organismi. L’introduzione di materiale genetico eterologo, cioè proveniente da un altro organismo, in una cellula viene generalmente definita trasformazione. Bisogna tener conto, tuttavia, che il termine “trasformazione” è piuttosto generico, indicando, per esempio anche la trasformazione di cellule normali in cellule tumorali. Generalmente per “trasformazione” s’intende il trasferimento di DNA in cellule batteriche, mentre per “trasfezione” il trasferimento genico mediato da batteriofagi o virus. Per le cellule animali il termine “trasformazione” indica il passaggio da cellula normale a cellula tumorale, mentre l’introduzione di DNA eterologo nella cellula si definisce “trasformazione mediata da DNA” o, più frequentemente “trasfezione”. Tipi di trasferimento genico DNA DNA plasmidico Elettroporazione CaCl2 Coniugazione Trasformazione virus Trasfezione PEG Elettroporazione DEAE-destrano Cellula animale Ca3(PO4)2 Cellula batterica Elettroporazione cannoncino balistico Agrobacterium protoplasto Elettroporazione Cellula vegetale fusione di protoplasti Protocollo di trasformazione con cellule calcio-competenti A. CaCl2 method (fresh cells) 1. Dil ute overnight LB culture 1:1000 into 100 ml of fr esh LB broth a t 37° C 2.Coll ect cells at O.D. A600 =0.4-0.5 (It may vary d epend ing on the strains) and sedim ent at 4.000 x g (=5000 rpm with A4 rotor * ) for 5’ at 4°C 3. Wash cells in about ha lf the volume ( 50 ml ) of cold 0.1 M CaCl2 4. . Sediment cells at 3.0000 xg for 5’ and resuspend very g ently in about 1/4 the volume ( 25 ml ) of cold 0.1 M CaCl2 5. Sedim ent cell s at 3.0000 xg for 5’ and resuspend very g ently in 4 ml ) of cold 0.1 M CaCl2. Stand on ice for at least 30’. 6. Add DNA in a volume as little as possible (up to 0.1 ml ) to a 200 µl aliquot of competent cells and incub ate on ice fr om 1 hour to all day 7. Heat sho ck for 90’’ at 42°C. (impo rtant!) 8. Add 0,8 ml of LB without drug s and incuba te wit hout shak ing for 1 hour 9. Plate on selective media by spreading. Tavola riassuntiva dei principali metodi di trasferimento genico Batteri • Elettroporazione • trasformazione chimica con CaCl2 • coniugazione batterica Protoplasti • Elettroporazione • fusione di protoplasti Piante • elettroporazione • trasferimento mediato da Agrobacterium • cannoncino balistico • fusione di protoplasti Lieviti • PEG • Elettroporazione • DEAE-destrano Cellule animali • PEG • Elettroporazione • DEAE-destrano • Ca3(PO4)2 Vettori di clonaggio (1) Gran parte degli straordinari progressi ottenuti dalla biotecnologia e dalla biologia molecolare, dipendono dall'acquisizione della capacità di amplificare e propagare indefinitivamente i geni. Clonare un gene significa isolarlo da un genoma ed inserirlo in un vettore capace di replicarsi in un certo ospite (di solito E.coli o lievito). Esistono diversi tipi di vettori di clonaggio, ciascuno con vantaggi e svantaggi. La principale considerazione da fare é relativa alle dimensioni dell'inserto di DNA che ogni vettore può accettare. PLASMIDI da 0,1 a 10 Kb FAGI da 8 a 22 kb COSMIDI da 32 a 45 kb BAC da 75 a 300 kb YAC da 100 a 2000 kb Vettori di clonaggio (2) Dai plasmidi batterici naturali sono derivati i vettori di clonaggio, le cui caratteristiche essenziali sono • Origine di replicazione • Marcatore selezionabile • Siti di restrizione unici PLASMIDI I plasmidi sono degli elementi genetici extracromosomali che si replicano autonomamente. Variano da 1 a 200 kb e sono molto diffusi tra i procarioti. Esempi di plasmidi batterici naturali sono i plasmidi ColE1 di E.coli, i plasmidi Sym di rhizobium, I plasmidi Ti o Ri di Agrobacterium. I plasmidi possono essere lineari o integrati nel cromosoma batterico ma, nella maggior parte dei casi, sono molecole di DNA circolari (episomi) Nell'ospite batterico i plasmidi si presentano come molecole circolari superavvolte, che, durante le manipolazioni sperimentali, possono rilassarsi o linearizzarsi in seguito a rotture a singolo o a doppio filamento. In un gel di agarosio e bromuro di etidio le tre forme migrano a velocità diverse e possono essere distinte. nick Plasmide superavvolto (supercoiled) Plasmide circolare rilassato Plasmide linearizzato Plasmide: forma rilassata forma lineare forma superavvolata forma linerizzata (tagliata con un enzima di restrizione in un sito unico) Replicazione plasmidica La caratteristica più importante dei plasmidi, quella di essere dei “repliconi”, cioè molecole capaci di replicazione autonoma, è conferita loro dalla presenza di una origine di replicazione, chiamata ori (nel caso dei plasmidi oriV, per “ori vector”) I plasmidi si replicano per replicazione (uni o bi-direzionale) o per circolo rotante Richiedono proteine plasmidiche e/o dell’ospite batterico Funzioni dell’origine di replicazione Oltre ad essere essenziale per la replicazione, l’origine di replicazione controlla: • Il numero di copie • La specificità d’ospite • I gruppi di incompatibilità Numero di copie e modalità di replicazione I plasmidi si replicano con due modalità diverse. Alcuni, generalmente quelli di grandi dimensioni, si replicano in maniera coordinata con la replicazione del cromosoma batterico e si di dicono sottoposti a controllo stringente. In genere sono presenti in una o poche copie per batterio. Altri, in genere di piccole dimensioni, si replicano in maniera indipendente dalla replicazione batterica e si dicono sottoposti a controllo rilassato. Sono presenti in molte copie - fino a 1000 - per batterio. Plasmidi ori numero di copie pBR322 e derivati PMB1 15-20 pUC e derivati ColE1 500-700 pACYC e derivati p15A 10-12 pSC101 e derivati pSC10 1 -5 Controllo del numero di copie I plasmidi possono controllare il numero di copie regolando l’inizio della replicazione plasmidica L’inizio della replicazione può essere controllata regolando: • La disponibilità del primer necessario a innescare la replicazione del DNA plasmidico • La disponibilità di proteine essenziali alla replicazione • La funzionalità di proteine essenziali alla replicazione Rnasi H RNA II ori rop RNA I La replicazione plasmidica inizia dalla ori ed è innescata da un primer a RNA (RNA II), trascritto da un promotore situato 550 bp a monte della ori. Gli ibridi DNA:RNA formati dal filamento di DNA e dall’RNA II nascente, costituiscono un substrato per la Rnasi H che taglia l’ibrido e fornisce l’OH al 3' per la replicazione del DNA. La maturazione dell’RNA II è controllata dall’RNA I, trascritto sul filamento opposto della stessa regione di DNA e, quindi, complementare all’RNA II. L’appaiamente tra l’RNA II e l’RNA I compete con l’appaiamento tra l’RNA II e il filamento stampo, riducendo la frequenza di inizio della replicazione. Il prodotto d’espressione del gene rop, inoltre, stabilizza il complesso RNA I:RNA II, riducendo ulteriormente la frequenza di inizio. Rnasi H RNA II ori rop RNA I Il numero di copie dei plasmidi, quindi, è diminuito da mutazioni che destabilizzano il legame tra il filamento stampo e l’RNA II o da mutazioni che stabilizzano il complesso RNA I : RNA II e, all’inverso è diminuito da mutazioni che stabilizzano il legame RNA I:RNA II e aumentato da mutazioni che destabilizzano il legame tta il filamento stampo e l’RNA II. Analogamente mutazioni che aumentano la disponibilità della proteina Rop o dell’RNA I o che diminuiscono l’abbondanza di RNA II diminuiscono il numero di copie, mentre mutazioni che aumentano l’abbondanza di RNA II e diminuiscono quella di RNA I e/o Rop, aumentano il numero di copie. Marcatori selezionabili I plasmidi naturali a volte codificano per uno o pochi geni non essenziali capaci di conferire loro un vantaggio selettivo in alcune situazioni. Per esempio possono codificare per la tossine batteriche o per geni di resistenza agli antibiotici. In alcuni casi, tuttavia, nessun vantaggio competitivo sembra essere associato alla presenza di geni di resistenza. Tutti i vettori di clonaggio includono almeno un marcatore selezionabile. Hanno lo scopo essenziale di distinguere e selezionare le molecole ricombinanti. Inoltre, sotto un'appropriata pressione selettiva, stabilizzano il plasmide I marcatori selezionabili più utilizzati nei batteri sono i geni di resistenza agli antibiotici. Per esempio il gene per la beta-lattamasi codifica per un enzima capace di idrolizzare l'anello lattamico degli antibiotici di tipo penicillinico (es. l'ampicillina). I batteri che contengono un plasmide con questo gene quindi (simboleggiato con Amp o Ap) possono crescere in terreni di coltura che contengono l'ampicillina. Siti di restrizione unici Per effettuare un clonaggio molecolare è necessario avere sempre almeno un sito di riconoscimento per una endonucleasi di restrizione. Il sito di riconoscimento per una endonucleasi di restrizione deve essere presente nel vettore una volta sola per non distruggere l'integrità fisica del plasmide e non deve essere presente in regioni cis essenziali (es. ori o promotori) o in geni che codificano per funzioni essenziali (es. geni di resistenza). La tendenza è stata quella di raggruppare (anche sovrapponendole) sequenze uniche riconosciute da enzimi di restrizione in una zona particolare del plasmide chiamata appunto Multiple Cloning Site (MCS) o anche polylinker. Questa regione è di solita ingegnerizzata in modo tale da essere compresa, ad esempio tra un promotore e un sito terminatore Evoluzione dei vettori di clonaggio (1) Da questi vettori di clonaggio sono derivati decine di nuovi altri vettori. La tendenza é quella di creare vettori più piccoli e funzionali. Ci sono numerosi vantaggi, infatti, a ridurre la dimensione di un plasmide 1) E' più maneggevole: per esempio é più difficile danneggiarlo o introdurvi interruzioni a singola elica durante le manipolazioni sperimentali. 2) E' più facile estrarlo: i principali metodi di separazione dei plasmidi dal cromosoma batterico si basano sulla denaturazione degli acidi nucleici (per es. mediante calore o basi diluite) e sulla loro successiva rinaturazione. Mentre i plasmidi, di piccole dimensioni, rinaturano rapidamente il grosso cromosoma batterico non riesce a rinaturare velocemente e viene selettivamente eliminato. La velocità di rinaturazione plasmidica é inversamente proporzionale alla dimensione. Quanto più piccoli sono, quindi, tanto più facile é il loro isolamento. 3) E' più facile introdurlo dentro un batterio: i metodi di "trasformazione" sono essenziali nella tecnologia del DNA ricombinante: esistono varie tecniche, come la trasformazione con CaCl2 o l'elettroporazione, ma in tutti i casi l'efficienza di trasformazione é inversamente proporzonale alla dimensione plasmidica. Evoluzione dei vettori di clonaggio (2) Un'ulteriore tendenza è quella di sostituire i siti di restrizione unici con Multi cloning sites sempre più completi. Questa caratteristica (in genere) facilita il lavoro di clonaggio permettendo di utilizzare l'enzima di restrizione più conveniente. Questo problema è particolarmente sentito quando si devono clonare inserti di grosse dimensioni in cui possono essere presenti numerosi siti di restrizione. Numerosi altri vettori più o meno "specializzati" sono reperibili per gli utilizzi più disparati: "trascrizione in vitro, inserzioni di trasposoni, selezione di mutazioni, clonaggio di frammenti amplificati con PCR, vettori "shuttle" che contengono più origini di replicazione ecc. Il problema della selezione vettori plasmidici Qualunque tipo di clonaggio molecolare implica la ligazione di un inserto con un vettore e l'introduzione di questo costrutto in un ospite, generalmente, batterico. Questa trasformazione produce tre tipi di batteri, che bisogna riuscire a discriminare, nel modo più rapido e semplice possibile. • batteri vuoti • batteri contenenti il solo vettore • batteri contenenti il vettore ligato all'inserto L'uso di marcatori selezionabili, per esempio resistenze ad antibiotici, permette facilmente di distinguere batteri vuoti - sensibili all'antibiotico - da batteri contenti il vettore, con o senza l'inserto, - resistenti all'antibiotico. Ma non é ovvio come selezionare i cloni positivi per l'inserto e il vettore da quelli contenenti solo il vettore. Per farlo si può ricorrere a metodi generali e laboriosi come l'ibridazione su colonia (colony hybridisation) o un'analisi per digestione con enzimi di restrizione (se i cloni trasformanti sono pochi). Molti vettori di clonaggio moderni sono costruiti per facilitare lo screening dei cloni ricombinanti. Selezione per inattivazione inserzionale pBR322 é un esempio tipico di vettore di clonaggio. Costruito nel 1977 da Bolivar e Rodriguez é stato per molti anni uno dei vettori più utilizzati nei laboratori di ricerca. E' un vettore di piccole dimensioni, presente in circa 20 copie per cellula batterica, con un certo numero di siti unici per enzimi di restrizione. La sua caratteristica più saliente consiste nell'avere due geni di resistenza, uno all'ampicillina e uno alla tetraciclina. Sfruttando i siti di restrizione all'interno di uno dei geni resistenza é possibile clonare un inserto al suo interno e identificare i cloni positivi selezionandoli per la perdita della resistenza corrispondente. BamHI (4363 bp) Immaginiamo, per esempio di voler clonare un inserto in pBR322 all'interno del gene tetr (resistenza alla tetraciclina) utilizzando il sito BamHI. Per prima cosa si digerisce il vettore e l'inserto con l'enzima di restrizione BamHI. Trasformiamo, quindi, la mix di ligazione (per esempio con cloruro di calcio) in un batterio senza plasmidi sensibile sia alla tetraciclina che all' ampicillina (per esempio HB101) e facciamo crescere i batteri in un terreno di crescita solido in presenza dell'antibiotico ampicillina. In queste condizioni si selezioneranno soltanto i batteri contenenti il vettore di clonaggio ma non distinguiamo i batteri che contengono il vettore vuoto da quelli che contengono il vettore con l'inserto La presenza di due geni di resistenza, però ci permette di replicare tutti i batteri trasformanti su una seconda piastra contenente tetraciclina e distinguere i cloni positivi da quelli contenenti il solo vettore. I cloni positivi, infatti, presentano un inserto di DNA inserito nel sito BamHI di pBR322. Questa inserzione interrompe l'integrità strutturale e funzionale del gene di resistenza permettendo cosi' di identificare i cloni positivi come Ap+ Tc- pUC18 Un ulteriore evoluzione dei vettori di clonaggio é rappresentata dalla serie pUC, costruita nel 1982 da J.Messing e collaboratori. E' un plasmide più piccolo, presente nell'ospite batterico in un alto numero di copie. Rispetto a pBR322 contiene più siti di restrizione utilizzabili (in gran parte presenti in un unica regione chiamata polylinker o multi cloning site) e specialmente un’altra forma di selezione per inattivazione inserzionale nota come -complementazione o selezione bianco-blu. Selezione Bianco-Blu (-complementazione) I vettori della serie pUC possono esprimere, sotto il controllo del promotore del lattosio, un piccolo peptide, corrispondente alla parte N-terminale della beta-galattosidasi (il prodotto genico di lacZ). Questo peptide é in grado di complementare la funzionalità enzimatica di beta-galattosidasi mutanti prive della corrispondente parte N-terminale ( lacZ∆M15) Utilizzando, in terreno solido, un substrato cromogenico come l' X-Gal (5-bromo-4-cloro-3indolil-betagalattoside) l'attività enzimatica viene recuperata e le colonie appaiono colorate di BLU. Poiché il polylinker di pUC é situato nel gene che codifica l'alfa peptide, l'inserzione di un frammento di DNA, ne interrompe l'integrità funzionale e la capacità di dare alfacomplementazione. I cloni corrispondenti appaiono BIANCHI e segnalano la presenza di un clone positivo. Un vettore plasmidico evoluto Limiti della selezione per -complementazione Bisogna considerare, tuttavia, che la selezione bianco-blu può talvolta essere ingannevole: qualche volta cloni bianchi risultano essere negativi, e qualche volta cloni blu possono essere positivi. Se l’inserto è relativamente piccolo, infatti, e risulta inserito in registro con lo schema di lettura della ß-galattosidasi o dell’ -peptide, si può formare una proteina di fusione parzialmente o totalmente attiva. In questo caso, dunque, un clone ricombinante con un inserto correttamente inserito, manterrà comunque attività ß-galattosidasica e produrrà colonie blu. D’altro canto può accadere che colonie bianche risultino in realtà contenere solo vettori vuoti. E’ sufficiente, infatti, la delezione di anche una sola base per modificare lo schema di lettura della proteina, facendo perdere completamente l’attività enzimatica. E’ sempre opportuno, quindi, selezionare un piccolo numero di colonie bianche, putativamente positive, e sottoporle ad ulteriore analisi con altri metodi, per esempio con enzimi di restrizione e successiva analisi su gel Colony hybridization Nonostante l’esistenza di sistemi di selezione facilitata, come la selezione inserzionale o l’-complementazione ci sono casi in cui questi ausilii non sono disponibili; per es. in molti vettori d’espressione, in molti vettori di clonaggio di uso generale, nei rari casi in cui l’inserto si inserisce in frame e recupera comunque attività -galattosidasica, oppure quando l’efficenza del clonaggio è molto bassa e ci aspettiamo un clone positivo tra centinaia di negativi. La colony hybridization o ibridazione su colonia è un potente metodo di screening basato sulla ibridazione di una sonda, di solito marcata radiattivamente, complementare all’inserto e in grado quindi di discriminare, in situ, i cloni ricombinanti da quelli contenenti il solo vettore. 1) ligazione e trasformazione 3) trattamento della membrana: denaturazione in situ 2) replica della piastra su filtro di nitrocellulosa 4) Preparazione della sonda generalmente si purifica l’inserto clonato e si marca per Nick translation 5) Ibridazione della sonda 6) Autoradiografia Colony PCR 2.Si avvia una reazione di PCR per ogni clone che si vuole analizzare, risospendendo nella mix di PCR una parte della colonia. Si utilizza una coppia di primers specifica per l’inserto clonato 1.Si piastra, come al solito, una trasformazione. I cloni trasformanti possono contenere il solo vettore o il vettore più l’inserto M 1 2 3 4 5 - + I cloni 1, 2, 3 e 4 contengono l’inserto. Il clone 5 contiene solo il vettore. “-” e “+” sono controlli negativo e positivo Strategie di clonaggio Clonare un gene è un processo complesso che può essere schematizzato in 3 tappe: • La prima tappa consiste nella scelta del materiale genetico da usarsi per il clonaggio: bisogna scegliere l’organismo da usare, le condizioni di partenza, per esempio quale fase di sviluppo, e bisogna decidere se utilizzare il cDNA o DNA genomico • La seconda tappa consiste nella costruzione di una genoteca o library. Anche questo aspetto deve essere ben valutato. Una buona library deve essere rappresentativa, deve poter essere analizzata con un numero relativamente basso di cloni indipendenti, deve essere stabile e deve contenere cloni parzialmente sovrapposti in modo da permettere un eventuale chromosome walking. • La terza tappa, probabilmente la più difficile, consiste nello screening dei cloni ricombinanti cioè nella ricerca della sequenza di DNA in esame. Il caso più semplice: la sequenza del gene è nota Nel caso più semplice, è a nostra conoscenza la sequenza del gene. Dopo aver piastrato la library ad alta densità su ogni piastra si applica un filtro di nitrocellulosa. Dopo aver fatto adsorbire i fagi al filtro, questo viene rimosso e trattato in modo simile a quanto descritto per l’ibridazione su colonia, in modo da fissare sul filtro il DNA fagico in forma denaturata. Dopo aver saturato la membrana, questa viene fatta ibridare con una sonda, complementare al gene in analisi, che è stata preventivamente marcato con 32P . Dopo un incubazione, opportunamente lunga, il filtro viene lavato con soluzioni a più alta stringenza ed esposto ad autoradiografia. Dopo aver, infine, identificato il/i cloni positivi, si procede ad uno screening secondario. E’ anche possibile utilizzare come sonda un oligo opportunamente sintetizzato. Se non conosciamo la sequenza del gene, ma è nota quella di un gene omologo, è possibile fare una sonda eterologa, sia come DNA che come oligo, e effettuare ibridazioni a bassa stringenza. Un caso più complesso: la sequenza della proteina è nota (1) Un caso più frequente si presenta quando non è nota la sequenza genica, ma è stato purificato biochimicamente il prodotto genico. In questo caso la cosa più probabile è riuscire ad ottenere la sequenza aminoacidica di un frammento della proteina (una sequenza aminoacidica completa non è facile da ottenere come una sequenza nucleotidica!) Ottenere la sequenza nucleotidica corrispondente ad una sequenza aminoacidica, allo scopo di derivarne una sonda per lo screening, non è un gioco da ragazzi. Per la nota degenerazione del codice, infatti, per specificare un amino acido possono essere usati più di un codone (a parte la metionina). Un caso più complesso: la sequenza della proteina è nota (2) Per codificare il peptide PRATI per esempio possiamo usare: P R A T I CCA CCC CCG CCU AGA AGG CGA CGC CGG CGU GCA GCC GCG GCU ACA ACC ACG ACU AUU AUA AUC 4 X 6 X 4 X 4 X 3 = 1152 possibili combinazioni Siccome per avere un ibridazione stabile con un oligonucleotide occorre un primer lungo almeno 15 bp, ne consegue che per avere qualche chance di isolare il gene corrispondente bisogna derivare almeno 5 aminoacidi, meglio se più. Si sintetitzza quindi un pool di oligonucleotidi contenente, in quantità equimolare ciascuno dei possibili candidati Phe Leu Gly Glu Asp Ala Val Arg C U G A C U G A Ser Lys U A C A G U C A G Ser UC A G G A G U C C C U G A Asn AG UC U G U G A A C C C U U G Tyr U A G U A C G G A Thr C U U G G A C A C U G Met Ile Arg A C C A STOP G Cys U C A STOP G Trp U C A Leu G U C A U Gln His Pro Acido aspartico Acido glutammico Asparagina Glutammina Glicina Alanina Isoleucina Valina Leucina Fenilalanina Prolina Treonina Thr Serina Istidina Triptofano Tirosina Cisteina Arginina Lisina Metionina Asp Glu Asn Gln Gly Ala Ile Val Leu Phe Pro D E N Q G A I V L F P T Ser His Trp Tyr Cys Arg Lys Met S H W Y C R K M In pratica si utilizzano due strategie. 1) Si sceglie una regione aminoacidica con la minor degenerazione del codice e si derivano tutti i possibili oligonucleotidi Data per esempio la sequenza aminoacidica parziale LASCMNEMKRS scegliamo: CMNEM: TGT ATG GAT GAG ATG C C A Per aumentare la lunghezza dell’oligo senza aumentare la complessità del pool, aggiungiamo le prime due basi comuni a tutti i codoni che codificano la lisina AA Possiamo sintetizzare un pool di soli otto nucleotidi. TGT TGC TGT TGC TGT TGC TGT TGC ATG ATG ATG ATG ATG ATG ATG ATG GAT GAT GAC GAC GAT GAT GAC GAC GAA GAA GAA GAA GAG GAG GAG GAG ATG ATG ATG ATG ATG ATG ATG ATG AA AA AA AA AA AA AA AA 2) Si costruisce un “indovinamero” o “guessmer” A partire dallo stesso peptide CMNEM si può sintetizzare un unico oligonucleotide, più lungo, ma costituito da un’unica sequenza. La sequenza viene definita sulla base della frequenza di utilizzo del codone, sulla sua ridondanza e sul caso. E’ dimostrato che, se le zone di complementarietà sono abbastanza lunghe l’indovinamero riuscirà ad appaiarsi con il gene target anche in presenza di qualche mismatch. Esempio di “guessamer” indovinamero 5'-TGC ATG GAC GAG ATG AAG CGC AAC ATC TT-3' TGC ATG GAC GAG ATG AAG CGC AAC ATC TT AGG ACG TAC CTG CTT TAC TTC GCA TTG TAG AAA GAT GAG 5' RACE (Rapid amplification of cDNA ends) Nella costruzione di una libreria a cDNA capita spesso di sotto-rappresentare le estremità al 5‘ o al 3'. Un metodo per minimizzare questo inconveniente consiste nell’amplificazione, per PCR, delle estremità al 5' o al 3', utilizzando un innesco gene-specifico (GSP) e di un innesco universale. mRNA AAAAAAA-3' 5' Primer gene-specifico 1 AAAAAAA-3' 5' 3' 5' 3' 5' Terminal trasferasi + dCTP 3'CCCCCC 5' 5'GGGGGG 3'CCCCCC 5' 5' GGGGGG 3'CCCCCC 3' 5' Primer gene-specificico 2 (nested) Frammento di gene amplificato al 5' 3' RACE mRNA 5' AAAAAAA-3' TTTTTTT-5' transcriptasi inversa RNAsi H TTTTTTT-5' 3' Primer sequenza specifico TTTTTTT-5' 3' AAAAAAA-3' TTTTTTT-5' 5' 3' 5' 3' AAAAAAA-3' 5' oligo dT primer TTTTTTT-5' AAAAAAA-3' TTTTTTT-5' ESPRESSIONE GENICA IN SISTEMI ETEROLOGHI 1. PERCHE’ ESPRIMERE GENI IN SISTEMI ETEROLOGHI. 2. QUALI SISTEMI ETEROLOGHI UTILIZZARE PER L’ESPRESSIONE DEI GENI Il problema di esprimere geni in sistemi eterologhi nasce dall’interesse generale ad ottenere grandi quantità di peptidi di interesse pratico o scientifico e dalla difficoltà di esprimere geni, di qualunque natura, in organismi superiori assai complessi e soggetti a regolazioni non sempre pienamente comprese. Al contrario, invece, il livello di conoscenze accumulate su alcuni organismi “semplici”, specialmente procariotici, ha stimolato lo sviluppo di numerosi sistemi di espressione eterologhi basati essenzialmente sull’utilizzo di appositi vettori di espressione. E’ virtualmente possibile esprimere geni in sistemi di ogni tipo utilizzando vettori d’espressione appropriati, in funzione di esigenze specifiche. I più diffusi sono Escherichia coli, Bacillus subtilis, lievito, cellule d’insetto, cellule vegetali e cellule di mammifero in coltura. L’espressione in E.coli è di gran lunga la più semplice e, forse, per questo la più utilizzata come prototipo di espressione genica in sistemi eterologhi. Per esprimere un gene eterologo bisogna definire due componenti: un vettore d’espressione un ospite per l’espressione Batteri Escherichia coli Bacillus subtilis Funghi Saccaromices cerevisiae Pichia pastoris Aspergillus nidulans Piante Specie modello protoplasti (Arabidopsis thaliana, Nicotiana tabacco,ecc) cellule in coltura piante transgeniche Insetti Dorifera californica drosophila melanogaster Animali oociti cellule in coltura organismi interi cellule d’insetto in coltura organismi interi ESPRESSIONE DI GENI IN SISTEMI ETEROLOGHI. Principali utilizzi di proteine ricombinanti in campo medico Vaccini ricombinanti Ormoni Carie ? Cytomegalovirus Difteria Epatite B Epatite C ? Influenza HIV ? Malaria Morbillo Pertosse Poliomelite Tetano ACTH Ormone follicolo stimolante TSH (Tiretropina) HGH ( Somatotropina) Calcitonina Glucagone Insulina Inibitori di proteasi Anticoagulanti Anti-apoptosi Inibitori generali Peptidi bio-attivi Interferoni Interleuchine emoglobine Fattori neurotrofici HNG (human nerve growth factor) BGNF ( brain-derived neurotropic) NT-3 (Neurotrophin-3) NT-4 (Neurotrophin-4) GDNF (gliale-derived neurotrophin) CNTF ( Rat ciliary neurotrophin) leptina umana (Il prodotto del gene Ob, recentemente identificato) Proteina secreta dalle cellule adipose in grado di controllare il peso corporeo) Ormone della crescita umana hGH (somatotropina) Scoperto nel 1912 l’ormone della crescita umano viene sintetizzato in età giovanile dalla ghiandola pituitaria, nell’ipofisi. La sua deficienza è causa del nanismo ipofisario che può essere efficacemente limitato dalla somministrazione di hGH. Veniva inizialmente estratto dalle ghiandole pituitarie di cadaveri di uomini o scimmie, a costi elevatissimi e con considerevoli problemi pratici e sanitari. Attualmente tutti questi problemi sono risolti dalla produzione del hGH per via ricombinate e l’ormone della crescita è oggetto di un fiorente commercio prevalentemente come farmaco anti-invecchiamento A comparison of some properties of different vaccine types (from Hansson et al. Biotechnol. Appl. Biochem. (2000) 32, 95–107) ____________________________________________________________________________________________________________________________________________________ Vaccine type Advantages Drawbacks ____________________________________________________________________________________________________________________________________________________ Live vaccines (attenuated) One or few doses normally required. Long-lasting protection. Both humoral and cellular responses poorly Controlled attenuation normally required. Risk of reversion to pathogenicity Certain risk of transmission Killed vaccines No risk of reversion to pathogenicity No risk of transmission Multiple doses typically required Poorly defined composition Antigen must be produced by cultivation of a pathogen Mainly humoral responses Adjuvants normally needed Subunit vaccines (non-recombinant) Defined composition Various delivery systems available Antigen must be produced and purified by cultivation of a pathogen Multiple doses typically required Adjuvants needed Subunit vaccines (recombinant) No risk of pathogenicity since the pathogenic organism is not present Multiple doses typically required Adjuvants needed Defined composition Various delivery systems available Simplified large-scale production Further engineering possible VETTORI D’ESPRESSIONE I segnali che assicurano l’espressione genica nei procarioti sono molto diversi e se un gene eucariotico viene semplicemente trasferito in una cellula batterica ha poche probabilità di essere espresso. Costruire un vettore d’espressione significa essenzialmente costruire un vettore di replicazione contenente tutti quei segnali capaci di ottimizzare la corretta trascrizione e traduzione dei geni eterologhi nell’ospite in cui avviene l’espressione. Per aumentare le rese, infine, in genere si cerca di ottimizzare la stabilita’ dei prodotti di espressione, sia a livello trascrizionale che traduzionale. OTTIMIZZAZIONE DELLA TRASCRIZIONE Il livello di espressione di un gene dipende in larga misura dalla forza del promotore che lo controlla determinando la frequenza con la quale la RNA polimerasi inizia la trascrizione. Conseguentemente sono stati isolati ed ottimizzati un certo numero di promotori forti di E.coli che sono presenti nella maggior parte dei vettori d’espressione attuali. In piu’, poichè il livello di conoscenza dei promotori procariotici è molto avanzato, sono stati elaborati anche promotori in parte o totalmente sintetici sulla base delle sequenze consensus ottimali. Un promotore procariotico tipico è costituito da circa 60 bp contenenti due sequenze consenso a -35 (TTCAGA) e -10 (TATAAT). La spaziatura ideale tra -35 e -10 varia tra 16 a 17 bp, quella tra -10 e ATG è di 9 bp Tra i promotori più comuni ricordiamo: lac, lacuv10, trc, tac, t3, t7, lambda pr, lambda pl OTTIMIZZAZIONE DELLA TRADUZIONE L’inizio della traduzione in E.coli, richiede la presenza, sulla porzione non tradotta al 5‘ del mRNA, di una regione di legame al ribosoma (RBS). Nei batteri è costituita da una sequenza, chiamata SHINE-DALGARNO (SD), complementare al 3' del rRNA 16S presente nella subunità ribosomale piccola 30S. La sua sequenza consenso è: 5'-UAAGGAGG-3' Subito dopo la sequenza di Shine-Dalgarno deve essere presente un codone di inizio, quasi sempre AUG. In una piccola percentuale di casi può essere presente il codone GUG. La spaziatura ottimale tra SD e AUG è di 8 bp E’ importante che la sequenza nucleotidica tra la SD e il codone d’inizio non sia disturbata da strutture secondarie (es. hairpin loops) che possono interferire drasticamente con il legame al ribosoma e la conseguente traduzione. OTTIMIZZAZIONE DELLA STABILITA’ (1) La resa di un prodotto di espressione dipende, in larga misura, dalla stabilità della proteina. Sappiamo che la stabilità delle proteine dipende dalla presenza di aminoacidi stabilizzanti all’estremità N-terminale e di aminoacidi destabilizzanti all’estremità C-terminale. Modificando, tramite ingegneria genetica, la sequenza codificante una proteina, possiamo alterarne la composizione aminoacidica ed aumentarne la stabilità. Stabilità conferita alla -galattosidasi da diversi aa all’ N-terminale Aminoacido Tempo di dimezzamento Met, Ser, Ala, Thr, Val, Gly Ile, Glu Tyr, Gln Pro Phe, Leu, Asp, Lys Arg 20 ore 30’ 20’ 10’ 3‘ 1’ OTTIMIZZAZIONE DELLA STABILITA’ (2) Le sequenze PEST Le sequenze PEST , ricche in prolina (P), acido glutammico (E), serina (S) e treonina (T), spesso fiancheggiate da gruppi di aminoacidi positivi, sono target di degradazione e destabilizzano le proteine batteriche che le contengono. L’eliminazione delle sequenze PEST, mediante mutagenesi sito-specifica, può migliorare la stabilità delle proteine ricombinanti L’utilizzo di ceppi carenti in proteasi Un altro modo per ottimizzare la stabilità dei prodotti di espressione, consiste nel minimizzare la degradazione proteolitica a carico delle proteine espresse A causa della presenza in E.coli di più venti proteasi, solo alcune delle quali risultano essere caratterizzate, questo obbiettivo è difficile da ottenere. Sono tuttavia disponibili ceppi di coli mutanti che risultano difettiva in una o Più di queste proteasi, come ad esempio omp Promotore/operatore BamHI Shine-Dalgarno Terminatore Ap ori mRNA 5' RBS AUG (start codon) UAA (stop codon) 3' Espressione di proteine native NcoI BamHI RBS AGGAAAC AGAACCATGGGAGGATCCGTCGGATAATTAGCTGA TCC TTTG TCTT GGTACCCT CCTAGGCAGCCTATTAATCGACT AGGAAAC AGAAC TCC TTTG TCTT GGTAC CATGG C AGGAAAC AGAACCATGG TCC TTTG TCTT GGTACC ATG Met GATCCGTCGGATAATTAGCTGA GCAGCCTATTAATCGACT C-DNA C-DNA G CCTAG GGATCCGTCGGATAATTAGCTGA CCTAGGCAGCCTATTAATCGA CT TAA IL PROBLEMA DELLO SCHEMA DI LETTURA (FRAME) LEI NON AMA CHE LUI. LUI NON AMA PIU’ LEI. NON SAI PIU’ CHI SEI. L EIN ONA MAC HEL UIL UIN ONA MAP IU’L EIN ONS AIPI U’CH ISE I LE INO NAM ACH ELU ILU INO NAM API U’LE INO NSA IPI U’CH ISE I Espressione di proteine di fusione BamHI AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC BamHI GST HindIII GGATCCGTCGAAGCTTGATAATTAGCTGA CCTAGGCAGCTTCGAACTATTAATCGA CT GST G CCTAG AGCTTGATAATTAGCTGA ACTATTAATCGACT HindIII cDNA IgG TAA ATG AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC Met GST GST GGATCC CCTAGG cDNA IgG IgG AAGCTT TTCGAA Glu Ala Gly Ser Val Ala Cys Tyr AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC Met GST GGATCC CCTAGG cDNA IgG AAGCTT TTCGAA IgG GST Glu Ala Gly Ser Lys Phe Met Asp AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC Met GST GST GGATCCAAA CCTAGGTTT ? cDNA IgG AAGCTT TTCGAA Perchè i vettori d’espressione sono (quasi) sempre regolati • L’espressione di una proteina eterologa tende ad essere identificata come “estranea” e degradato dalla cellula che attiva specifiche proteasi. La possibilità di indurre l’espressione della proteina permette di minimizzare le degradazioni proteolitiche aumentando le rese. • Alcune proteine possono essere tossiche o, comunque, interferire con la crescita dell’ospite di espressione. La possibilità di indurre l’espressione della proteina permette alla cellula di crescere, in condizioni non induttive, e di produrre forti quantità di proteina una volta indottane l’espressione. • La possibilità, di indurre sperimentalmente l’espressione della proteina rappresenta un primo strumento di verifica dei livelli di espressione; comparando un estratto proteico indotto con uno non indotto si riesce facilmente ad evidenziare la presenza della proteina eterologa putativa (di cui conosciamo il peso molecolare) TAG per affinità TAG Vettori ______________________________________________________ • Calmodulin binding peptide (CBP) pCAl • 6xHis pQE, pET • Proteina A (IgG binding domain) pEZZ • Chitin binding domain (CBD) Impact • Glutatione S-transferasi (GST) pGEX • MBP (Maltose binding protein) pMAL • Strep tag (Streptavidin binding tag) • Flag tag • Myc tag E.coli + IPTG Clonaggio del gene MLL-ArgBP2 (1) C.F.: LAM FAB M5 Nuovo gene partner di traslocazione di MLL Per studiare il gene di fusione dal punto di vista funzionale e il suo potere leucemogeno, è stato necessario clonarlo Clonaggio del gene MLL-ArgBP2 (2) EcoRI pMVSCneo PflmI XhoI flag MLL (-4178) EcoRI ATG of flag-MLL Polylinker PflMI pMSCVneo NruI flag...MLL pMSCVneo.....GAATTCCATG.GAC....ATT.CCA.GCA.GAT.GGG.TCG.CGA. pMSCVneo.....CTTAAGGTAC.CTG....TAA.GGT.CGT.CTA.CCC.AGC.GCT. (XcaI=) BstZ17I PmlI NsiI XhoI AGT.ATA.CAC.ACG.TGA.TGC.ATCTCGAG...pMSCVneo TCA.TAT.GTG.TGC.ACT.ACG.TAGAGCTC...pMSCVneo