ENZIMI DI RESTRIZIONE Reazione ligasica di frammenti di restrizione Fig 4.20 separation of poly-A mRNA mRNA Purification 1. Total RNA Purification 2. PolyA+ RNA purification using oligo(dT) Gubler Hoffman cDNA Synthesis - 1 mRNA primed mRNA AAAAAn Anneal oligo dT primer AAAAAn TTTTT Reverse Transcriptase and dNTPs mRNA/cDNA hybrid AAAAAn TTTTT Gubler Hoffman cDNA Synthesis - 2 mRNA/cDNA hybrid AAAAAn TTTTT RNase H nicked RNA AAAAAn TTTTT DNA Pol I nicked RNA used as primers by Pol AAAAA TTTTT Gubler Hoffman cDNA Synthesis - 3 2nd strand cDNA in pieces AAAAA TTTTT E. coli DNA Ligase AAAAA TTTTT ds cDNA Clone into vector cDNA Library cDNA synthesis TTTTTTTTT First strand Nick translation cDNA library Vettori e clonaggio Vettori Plasmidi Fagi Cosmidi YAC Vettori e clonaggio Plasmide Molecola circolare di DNA a doppio filamento, normalmente presente nella cellula batterica, in grado di replicarsi autonomamente dal cromosoma. VETTORI DI CLONAGGIO Vettori e clonaggio Replicazione di un plasmide INSERIMENTO DI UN TRATTO DI DNA ESOGENO IN UN VETTORE DI CLONAGGIO CLONAGGIO: -TRASFORMAZIONE -SELEZIONE -CRESCITA COLONIE IDENTIFICAZIONE DELLA COLONIA BATTERICA DI INTERESSE Bromo-chloro-indoyl--galactopyranosidase or X-Gal (Clear) -galactosidase Bromo-chloro-indoyl (Deep blue insoluble) + galactose Inserting chromosomal DNA into a vector Chromosome GAATTC CTTAAG Vector GAATTC CTTAAG GAATTC CTTAAG Cut with EcoRI and add DNA ligase Recombinant vector GAATTC CTTAAG GAATTC CTTAAG Ampicillin resistant; -galactosidase negative (White on X-Gal) LacZ gene codes for -galactosidase Ampicillin resistance gene Bacteria from ligation plated on ampicillin and X-Gal Contains wild type plasmd Contains recombinant plasmd Vettori e clonaggio Vettori e clonaggio Lunghezza massima del DNA clonabile in un plasmide: circa 20 Kb Vettori e clonaggio I virus sono piccoli parassiti non in grado di replicarsi. Dopo aver infettato una cellula-ospite utilizzano i suoi sistemi di replicazione e sintesi delle proteine per riprodursi Vettori e clonaggio I batteriofagi (o fagi) sono virus che infettano i batteri. Vettori e clonaggio Ciclo litico del fago T4 Vettori e clonaggio Il fago più utilizzato in biologia molecolare è il fago Vettori e clonaggio Ciclo litico e lisogenico del fago Vettori e clonaggio Assemblaggio di un fago Vettori e clonaggio Mappa del genoma del fago Vettori e clonaggio Clonaggio di frammenti di DNA nel fago Vettori e clonaggio Formazione di cloni fagici Vettori e clonaggio L’infezione dei batteri con il fago è circa 103 volte più efficiente della trasformazione con un plasmide Vettori e clonaggio Lunghezza del DNA clonabile in un fago: 20-25 Kb Vettori e clonaggio Un cosmide è un plasmide contenente la sequenza COS dal fago Vettori e clonaggio Vettori e clonaggio Clonaggio di frammenti di DNA in un cosmide Vettori e clonaggio Lunghezza del DNA clonabile in un cosmide: circa 45 Kb EcoR I Infect cells Genomic Library AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA cDNA synthesis cDNA library Infect cells Genomic Library Construction • Preparing the insert – Partial digestion preferred Ligation to vector Genomic library cDNA library Source Genomic DNA mRNA Variation Species or strains Species or strains Tissues Developmental stages Insert size 12k -- 20k 0.2k -- 6k Representation Equal Correlate with expression level Type Only one Expression vs. non expression Probe DNA DNA or antibody or protein Purpose Gene structure Infer protein identity Encoded protein Infer protein identity Screening a eukaryotic gene library • Homologous gene from other organism – Mammalian genes are very similar – Thus if trying to get human gene screen with the equivalent gene from another organism – Oligonucleotide based on protein sequence or known sequence of homologous gene – Purify protein and determine sequence – Build a nucleotide sequence which codes for protein sequence Amino acid sequence Met-Asn-Lys-Trp-Glu-Met Met = ATG; Asn = AAT or AAC; Lys = AAA or AAG; Trp = TGG; Glu = GAA or GAG How many probes must we make? ATG AAT AAA TGG GAA ATG ATG AAT AAA TGG GAG ATG ATG AAT AAG TGG GAA ATG ATG AAT AAG TGG GAG ATG ATG AAC AAA TGG GAA ATG ATG AAC AAA TGG GAG ATG ATG AAC AAG TGG GAA ATG ATG AAC AAG TGG GAG ATG CLONAGGI MULTIPLI VETTORI DI ESPRESSIONE PROTEINE DI FUSIONE PRODUZIONE DI LIBRERIE Screening the Library ATTAGCGCCTTTACGCA ……………………TAATCGCGGAAATGCGT………… Screening with DNA probe • Probe is identified cloned – From other organism – Same organism • Looking for variants • Chromosome walk Chromosome walk cDNA library Clone cDNAs Expression vector Screen for gene of interest based on activity or antibodies Genome Projects • Whole genome sequencing • Fragment and clone • Sequence ALL clones! • Computer assembles Bee Cat Chicken Cow Dog Fruit fly Human Malaria parasite Microbial Genomes Mosquito Mouse Nematode Pig Plant Genomes Central Rat Retroviruses Sea urchin Tribolium Sheep Zebrafish Genome Projects • Multiple organisms provide suitable systems for experimentation – – – – Zebrafish-development Rat-physiology Dog- genetic disease Fruit fly- behavior • Some of practical significance – Mosquito/Malaria parasite Il metodo Sanger (o metodo a terminazione di catena) 1) Il sequenziamento a terminazione di catena coinvolge la sintesi di nuovi filamenti di DNA, complementari ad uno stampo a singolo filamento Per la sintesi del DNA si utilizzano DNA polimerasi caratterizzate da •Elevata processività •Bassa attività esonucleasica 5’-3’ •Bassa attività esonucleasica 3’-5’ (es. Klenow, Sequenasi) (1) Produzione dello stampo a filamento singolo Utilizzo della PCR Utilizzo di un fago helper Per M13 e produzione della Forma a singolo filamento Utilizzo di fagemidi Denaturazione del vettore Il metodo Sanger (o metodo a terminazione di catena) Nel sequenziamento a terminazione di catena la reazione oltre ad 1) Uno stampo a singola elica ha bisogno di: 2) un innesco specifico (primer) 3) La marcatura con un dNTP* marcato, di solito con 35S (2,3) Sintesi del filamento marcato PRIMER DNA Polimerasi 5’-A T C T T T T A G A GT A C C 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ PRIMER 5’-A T C T T T T A G A GT A C C T G AG*AGAT GA T AG*A DNA Polimerasi 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ Il metodo Sanger (o metodo a terminazione di catena) Nel sequenziamento a terminazione di catena la reazione oltre ad 1) Uno stampo a singola elica 2) un innesco specifico (primer) 3) La marcatura con un dNTP* marcato, di solito con 35S ha bisogno di: 4) una miscela di ddNTP, uno per ogni reazione di sequenza Terminazione della catena La sintesi del filamento compementare, tuttavia non prosegue indefinitivamente, perché la miscela di reazione contiene, in quattro distinte reazioni piccole quantità di specifici dideossinucleotidi trifosfati, ddATP, ddTTP, ddCTP e ddGTP, che bloccano l’allungamento perché posseggono un solo atomo di idrogeno al posto del gruppo -OH in 3’ PRIMER 5’-A T C T T T T A G A GT A C C T G AG*AGAT GA T AG*A DNA Polimerasi 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ + ddNTP ( per es. ddCTP) STOP 5’-A T C T T T T A G A GT A C C T G AG*AGAT GA T AG*AT G T AddC 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ Il risultato è una serie di frammenti interrotti ciascuno in corrispondenza di ogni dCTP ddCTP ddCTP ddCTP ddCTP ddCTP ddCTP Schema di sequenziamento a terminazione di catena DNA stampo a singola elica 3’-GGCTAAC 5’ Ibridazione con Il primer 3’ 3’-GGCTAAC + [35S]dATP+dCTP,dGTP,dTT (dNTP) +Sequenasi ddATP, dNTP ddCTP, dNTP -CCG ddA -ddC -C ddC A C ddGTP, dNTP ddTTP, dNTP -CC ddG -CCGATT ddG G -CCGA ddT -CCGAT ddT T -CCGATT ddG -CCGAT ddT -CCGA ddT -CCG ddA -CC ddG -C ddC -ddC G T T A G C C Sequenza: 5’-CCGATTG Direzione di lettura Nuovi metodi di sequenziamento Il sequenziamento a ciclo termico ( PCR asimettrica) Il sequenziamento automatizzato con marcatori fluorescenti Il sequenziamento a ciclo termico ( PCR asimettrica) DNA stampo PCR con un solo primer ddATP ddA ddA ddA ddA ddA Vengono effettuate 4 rezioni di PCR, ognuna contiene un solo primer e uno dei 4 dideossi nucleotidi trifosfati. Si generano le consuete famiglie di filamenti a catena terminata che vengono risolti per elettroforesi su gel di poliacrilammide Il sequenziamento automatizzato con marcatori fluorescenti Coniugando a ciascun ddNTP un diverso marcatore fluorescente, è possibile effettuare le quattro reazioni di sequenziamento in un unico tubo da saggio e caricare il tutto in solo pozzetto di gel ddA ddT ddC ddG Le emissioni fluorescenti vengono captate da un rilevatore e le informazioni vengono integrate e trasformate in picchi di colore diverso, con aree proporzionali all’intensità di emissione. Fluorescent DNA Sequencing AGTAC T G G GAT C Gel Electrophoresis Detection of Fluorescently Tagged DNA DNA Fragments Separated by Electrophoresis Optical Detection System Scanning Laser Excites Fluorescent Dyes Output to Computer Fluorescent DNA Sequencing Data Fluorescent DNA Sequence Trace Size of gene library N = ln(1-P) ln (1-A/B) N = Number of clones P = 95 % probability of finding gene A = Average size of DNA fragments B = Total size of genome E. coli has genome of 4,800,000 nucleotides Average size of insert is 10,000 nucleotides Number of clones for 95 % probability is 1700 Size of gene library • If genome is large e.g. human genome (3 x 109) then number of clones to make library becomes unrealistic (1058000) if using a plasmid vector (accepts only 10 kb as larger DNA can’t be transformed) • Therefore need to use vectors that can accept larger pieces of DNA – I.e. if each vector contains a large piece of DNA you don’t need so many clones to make a gene library What vectors for what libraries? Vector Plasmid Insert size <10 kb Lambda phage 18-25 kb Cosmid YAC etc What libraries Bacteria Yeast 34-45 kb Intermediate eukaryotes 0.1 – 1 Mb Higher Eukaryotes Human library requires >1,000,000 plasmid clones Human library requires 14000 YAC clones Vettori e clonaggio YAC=yeast artificial chromosome Vettori e clonaggio Dimostrazione sperimentale degli elementi funzionali di un cromosoma Vettori e clonaggio Vettore YAC: sequenze ARS CEN TEL Vettori e clonaggio Vettori e clonaggio Lunghezza del DNA clonabile in uno YAC: fino a 1000 Kb Vettori e clonaggio Approximate Maximum Length of DNA That Can Be Cloned in Vectors Vector Type Cloned DNA (kb) Plasmid 20 λ phage 25 Cosmid 45 P1 phage 100 BAC (bacterial artificial chromosome) 300 YAC (yeast artificial chromosome) 1000 Whole Genome Shotgun • Celera Genomics Fragment and sequence entire genome Each fragment is sequenced completely and then these pieces are aligned to one another by a computer, based on overlapping sequence between fragments. Overview of Facts Asserted • 2.91 billion base pairs (bp) • 1.1% exons, 24% introns, 75% intergenic DNA • 2.1 million single nucleotide polymorphisms (SNP’s) • less than 1% of all SNP’s reflected changes in proteins Structure of the genome http://genome.ucsc.edu http://www.ncbi.nlm.nih.gov