Genetica medica genoma umano e geni [email protected] Dip. di Genetica Biologia e Biochimica Genetica medica oncologica ASO S. Giovanni Battista - Torino IRCC - Candiolo Sequenziamento del Genoma umano Iniziato nel 1990 completato il 14.04.2003 con 2 anni di anticipo 3 bilioni di paia di basi 20.000 – 25.000 geni accuratezza del 99% “solo” 341 gaps errore: 1/100.000 basi Le regioni codificanti occupano solo il 5% del genoma Più di 3 milioni di SNPs (single nucleotide polymorphisms) identificati SNPs Single Nucleotide Polymorphisms nella regione codificante dei geni - silenti - cambiamento di amino acido nelle regioni regolatorie dei geni negli introni - più o meno efficiente espressione nelle regioni non codificanti Sequenziamento del Genoma umano • Eucromatina: 2.88 bilioni di bp (2.88 Gb) • Genoma umano totale: 3.08 Gb • Regioni ripetute – 24 centromeri (50 Mb) – braccia corte dei cromosomi acrocentrici (13p, 14p, 15p, 21p, 22p) con circa 50 copie tandem dei geni 5S, 18S e 28S – eterocromatina del cromosoma Y, 1q, 9q e 16q • Dati al 2004 (Build 35) – 5.3% del genoma: duplicazioni segmentali recenti (40 milioni di anni) di lunghezza > 1kb e identità > 90% (> 25% dell’Y) con 1183 geni duplicati divergenti e 3300 paraloghi – 1.2% esoni + 0.7% UTR di circa 20.000-25.000 geni codificanti proteine (+ n° ad RNA) – circa 20.000 pseudogeni (circa 32 geni estinti) Nature, October 2004 Sequenziamento del Genoma umano Dati al novembre 2005 (Build 36) Base azotata + zucchero + fosfato = NUCLEOTIDE DNA zucchero : desossiribosio catena nucleotidica : doppia elica appaiamento costante : A:T G:C 5’ 3’ 3’ 5’ Apertura della doppia elica Duplicazione del DNA Trascrizione del DNA in mRNA Flusso dell’informazione : DNA nucleare mRNA Proteine (strutturali regolatorie enzimatiche) mRNA zucchero : ribosio catena nucleotidica : singola elica basi azotate : Adenina Uracile Guanina Citosina Il codice genetico 4 basi -> 20 amino acidi 4 basi 3 = 64 codoni univoco….. ..ma ridondante LOCUS : posizione di uno o più geni lungo un cromosoma GENE : tratto di DNA corrispondente ad una informazione (30-40 mila) 2 nm Mitosi : processo attraverso il quale una cellula si divide in 2 cellule figlie identiche (diploidi) Ciclo cellulare : G0 : quiescenza G1 : verifica dell’integrità del genoma che deve essere duplicato S : sintesi del DNA G2 : verifica dell’integrità cromosomica M : mitosi Check – points prosecuzione del ciclo cellulare apoptosi Genoma umano (n): 3 x 1012 paia di nucleotidi 20-30 mila geni 46 cromosomi (2n): 22 autosomi 2 cromosomi del sesso 46 XX – 46 XY 23 materni (22-X) 23 paterni (22-X o 22-Y) Meiosi : processo attraverso il quale una cellula diploide (2n) si divide in 4 cellule figlie aploidi (n) appaiamento dei cromosomi omologhi e crossing-over separazione dei cromatidi fratelli Mediamente un gene umano : • • • • lunghezza numero di esoni lunghezza dell’esone lunghezza dell’introne 17.000 paia di basi (17 kb) 7-9 100 - 400 nucleotidi 200 - 2.000 nucleotidi Struttura dei geni degli eucarioti “Enhancers” 5’ UTR esone introne 3’ UTR 5’ 3’ Promotore TATA box CCAAT CG-rich ATG Stop Segnale di Poliadenilazione AAUAAA Inizio della traduzione Inizio della trascrizione mRNA cap polyAAAAA Regione codificante “open reading frame” Dal cromosoma al gene : le unità di misura ! Cromosoma 17 78.6 milioni di basi (78.6 x 106 = 81 Mb) Regione genomica del gene BRCA1 (17q23.3) 25 esoni in 80 mila basi (80 x 103 = 80 kb) 1 bp (paia di basi) 1 kb (1.000 bp) 1 Mb (1.000 kb) (1.000.000 bp) mRNA: 5711 basi proteina BRCA1: 1863 aa MDLSALRVEEVQNVINAMQKILECPICLELIKEPVSTKCDHIFCKFCMLKLLNQKKGPSQCPLCKNDITKRSLQESTRFSQLVEELLKIICAFQLDTGLEYANSYNFAKKENNSP EHLKDEVSIIQSMGYRNRAKRLLQSEPENPSLQETSLSVQLSNLGTVRTLRTKQRIQPQKTSVYIELGSDSSEDTVNKATYCSVGDQELLQITPQGTRDEISLDSAKKAACEFSE TDVTNTEHHQPSNNDLNTTEKRAAERHPEKYQGSSVSNLHVEPCGTNTHASSLQHENSSLLLTKDRMNVEKAEFCNKSKQPGLARSQHNRWAGSKETCNDRRTPSTEKKVDLNAD PLCERKEWNKQKLPCSENPRDTEDVPWITLNSSIQKVNEWFSRSDELLGSDDSHDGESESNAKVADVLDVLNEVDEYSGSSEKIDLLASDPHEALICKSERVHSKSVESNIEDKI FGKTYRKKASLPNLSHVTENLIIGAFVTEPQIIQERPLTNKLKRKRRPTSGLHPEDFIKKADLAVQKTPEMINQGTNQTEQNGQVMNITNSGHENKTKGDSIQNEKNPNPIESLE KESAFKTKAEPISSSISNMELELNIHNSKAPKKNRLRRKSSTRHIHALELVVSRNLSPPNCTELQIDSCSSSEEIKKKKYNQMPVRHSRNLQLMEGKEPATGAKKSNKPNEQTSK RHDSDTFPELKLTNAPGSFTKCSNTSELKEFVNPSLPREEKEEKLETVKVSNNAEDPKDLMLSGERVLQTERSVESSSISLVPGTDYGTQESISLLEVSTLGKAKTEPNKCVSQC AAFENPKGLIHGCSKDNRNDTEGFKYPLGHEVNHSRETSIEMEESELDAQYLQNTFKVSKRQSFAPFSNPGNAEEECATFSAHSGSLKKQSPKVTFECEQKEENQGKNESNIKPV QTVNITAGFPVVGQKDKPVDNAKCSIKGGSRFCLSSQFRGNETGLITPNKHGLLQNPYRIPPLFPIKSFVKTKCKKNLLEENFEEHSMSPEREMGNENIPSTVSTISRNNIRENV FKEASSSNINEVGSSTNEVGSSINEIGSSDENIQAELGRNRGPKLNAMLRLGVLQPEVYKQSLPGSNCKHPEIKKQEYEEVVQTVNTDFSPYLISDNLEQPMGSSHASQVCSETP DDLLDDGEIKEDTSFAENDIKESSAVFSKSVQKGELSRSPSPFTHTHLAQGYRRGAKKLESSEENLSSEDEELPCFQHLLFGKVNNIPSQSTRHSTVATECLSKNTEENLLSLKN SLNDCSNQVILAKASQEHHLSEETKCSASLFSSQCSELEDLTANTNTQDPFLIGSSKQMRHQSESQGVGLSDKELVSDDEERGTGLEENNQEEQSMDSNLGEAASGCESETSVSE DCSGLSSQSDILTTQQRDTMQHNLIKLQQEMAELEAVLEQHGSQPSNSYPSIISDSSALEDLRNPEQSTSEKAVLTSQKSSEYPISQNPEGLSADKFEVSADSSTSKNKEPGVER SSPSKCPSLDDRWYMHSCSGSLQNRNYPSQEELIKVVDVEEQQLEESGPHDLTETSYLPRQDLEGTPYLESGISLFSDDPESDPSEDRAPESARVGNIPSSTSALKVPQLKVAES AQSPAAAHTTDTAGYNAMEESVSREKPELTASTERVNKRMSMVVSGLTPEEFMLVYKFARKHHITLTNLITEETTHVVMKTDAEFVCERTLKYFLGIAGGKWVVSYFWVTQSIKE RKMLNEHDFEVRGDVVNGRNHQGPKRARESQDRKIFRGLEICCYGPFTNMPTDQLEWMVQLCGASVVKELSSFTLGTGVHPIVVVQPDAWTEDNGFHAIGQMCEAPVVTREWVLD SVALYQCQELDTYLIPQIPHSHY Genoma umano : 3 x 1012 paia di nucleotidi 20-30 mila geni 46 cromosomi : 22 autosomi 2 cromosomi del sesso 46 XX – 46 XY 23 materni (22-X) 23 paterni (22-X o 22-Y) Terminologia Alleli : forme alternative di un gene o varianti in un punto del DNA es. il codone 6 del gene della beta globina Allele normale A ......GAG..... (acido glutammico) Allele della cellula falcemica S .….GTG..... (valina) mutazione Allele “cristallino” C .………………AAG..... (lisina) mutazione Mutazione : variante dotata di effetto biologico Polimorfismo : variante presente nella popolazione generale (f > 1%) priva di significato patologico Terminologia Omozigote: porta 2 alleli identici ad un locus, bA bA o bS bS Eterozigote: porta 2 alleli differenti ad un locus, bA bS Eterozigote composto: porta 2 alleli non normali (2 mutazioni diverse) ad un locus, bSbC wt wt omozigote wt mut eterozigote mut mut omozigote mut mut eterozigote composto Terminologia Genotipo: costituzione genetica di un individuo nella sua totalità o riferita ad un gene specifico es. mutazione omozigote, bS bS effetto dell’ambiente geni modificatori back-ground genetico Fenotipo: caratteristica osservabile di un individuo o di una cellula es. anemia a cellule falciformi bS b S omozigote Mutazioni • Puntiformi (10-10 x bp x mitosi – 10-5-10-6 x bp x generazione) – silenti – missenso – nonsenso – inserzioni – delezioni di poche bp (frameshift) 5’ C T C C A C G A A T T C T T A Leu - His - Glu - Phe - Leu 3’ 5’ C T C C A C G A A T C C T T A Leu - His - Glu - Ser - Leu 3’ 5’ C T C C A C T A A T T C T T A 3’ Leu - His - Stop - Phe - Leu 5’ C T C C A C T A A T T C T T A Leu - Stop - – splicing • Non puntiformi – delezioni , duplicazioni parziali o complete • Anomalie cromosomiche – di numero – di struttura (10-2 x divisione cellulare) (6 x 10-4 x divisione cellulare) 3’