TESTI UTILI GENETICA MOLECOLARE •Strachan T., Read A.P Genetica Umana Molecolare (UTET) (Human Molecular Genetics 3, Gardland Science) GENETICA STATISTICA •Ott J (1999) Analysis of human genetic linkage. Johns Hopkins University Press, Baltimore •Sham P (1997) Statistics in human genetics. Arnold; Wiley, London, New York VARIABILITA’ DEL GENOMA E MUTAZIONI •Replicazione del DNA -> errori -> meccanismi di riparo (non effic. al 100%) Tasso di mutazione per nucleotide nell’ordine di 1/109 •Agenti esterni (mutageni, radiazioni etc) MUTAZIONI cambiamenti stabili (ereditabili) nella sequenza del DNA Se una mutazione insorge in una porzione del DNA codificante o funzionalmente importante può avere un effetto sul fenotipo. variabilità -> evoluzione Mutazioni patogeniche -> malattie genetiche Possono insorgere a livello di: • cellule somatiche (-> cancro, invecchiamento) • cellule germinali POLIMORFISMI presenza nella popolazione di 2 o piú varianti alleliche, con una frequenza significativamente alta (> 1%) MUTAZIONI SEMPLICI (puntiformi) causate per lo più da errori spontanei nella replicazione del DNA e riparo EFFETTI PATOGENI DELLE MUTAZIONI PUNTIFORMI Nella regione codificante di un gene Sostituzioni sinonime (silenti) La > parte sono neutrali. Talvolta possono creare degli errori di splicing Sostituzioni non sinonime (missense) Spesso deleterie. Nonsense: quasi sempre deleterie. proteina troncata mRNA instabile (nonsense-mediated mRNA decay) exon skipping (raro) Inserzioni/delezioni -> Framshift -> in genere introducono un codone di stop Introni • mutazioni di splicing • assenza di splicing dell’introne • uso di un sito di splicing illegittimo (criptico) • exon skipping Mutaz nel 5’ o 3’ non tradotto es: nel segnale di poliadenilazione AAUAA siti target di microRNA Mutazioni in regioni regolatorie Riarrangiamenti mediati dalla presenza di SEQUENZE RIPETUTE • Slipped strand mispairing • Crossing-over ineguale SEQUENZE RIPETUTE DNA CODIFICANTE: •Famiglie multigeniche •Motivi strutturali conservati •Ripetizioni in tandem di geni per rRNA e istoni DNA NON CODIFICANTE •In tandem •Sequenze ripetute intersperse 1) Famiglie geniche • duplicazione e divergenza da un gene ancestrale es. geni globinici • Famiglie di geni con regioni conservate che codificano per domini funzionali Es fattori di trascrizione (Homeobox, Zinc-finger etc) PSEUDOGENI copie non funzionali Non-processati (espressi/non espressi) Processati 2) Sequenze ripetute extrageniche •Ripetizioni in tandem 1)Altamente ripetuto -> DNA satellite 2) Polimorfiche: minisatelliti microsatelliti •Seq ripetute intersperse Alu DNA SATELLITE LINEs (L1) LINEs > 5 kb 104 Kpn o L1- 6.1kb, molte sono forme troncate al 5’ 2 ORF, ORF1 = RNA binding prot, ORF2 = RT e endonucleasi SINEs <500 bp 105 Alu - 2 ripetizioni di una seq di ~120 bp ~ ogni 4 kb omologia con 7SL RNA-> propagate tramite retrotrasposizione Propagazione delle LINEs e SINEs tramite retrotrasposizione 1)SLIPPED STRAND MISPAIRING Appaiamento sfasato di corte sequenze ripetute in tandem Causa piccole delezioni/inserzioni (che possono essere patogene o generare polimorfismi STR ) Crossing-over ineguale (NAHR: non-allelic homologous recombination) Direct repeats : deletion and/or duplication Inverted repeats : inversion Segmental duplications LCR (low copy repeat) Sequenziamento del genoma -> presenza di duplicazioni di sequenze 10-400Kb, con alta similarità (>95-97%). Rappresentano almeno il 5% genoma Inter-cromosomiche (soprattutto in reg pericentrom e subtelomeriche Intra-cromosomiche (cromosoma specifiche) Causa di riarrangiamenti genomici associati a malattie genetiche Smith Magenis Syndrome, Charcot-Marie-Tooth (crom 17) Prader-Willi/Angelman Syndrome (crom 15). •Regioni pericentromeriche e subtelomeriche contengono alto num di segmental duplications Genomic Disorders Patologie che derivano da riarrangiamenti di una regione di DNA, causati da ricombinazione omologa ineguale tra LCR -> delezione o duplicazione di 1 o + geni sensibili al dosaggio, o inattivazione di uno specifico gene 1) Membri di famiglie geniche/peudogeni ripetuti in tandem Es: Talassemiaalfa-globina Daltonismo pigmenti rosso/verde dei coni 2) Sequenze ripetute che fiancheggiano geni Charcot Marie Tooth (CMT-1A) Ittiosi X-linked Smith Magenis Williams Syndrome PMP22 STS 3) Sequenze ripetute inverse Emofilia A Fattore VIII Polimorfismi •Presenza nella popolazione di 2 o piú varianti alleliche di un gene o una determinata sequenza di DNA •Allele più raro frequenza maggiore 1% •La > parte di polimorfismi sono neutrali, non hanno un effetto sul fenotipo TIPI DI POLIMORFISMI PIU’ COMUNI •Cambiamenti di una singola base (SNPs) •Inserzioni o delezioni di piccole dimensioni •Variazione nel numero di sequenze ripetute in tandem •microsatelliti (Short Tandem Repeats) •minisatelliti (VNTR) SNPs (Single Nucleotide Polymorphisms) •Differenze di singola base •Biallelici •Più frequenti varianti di DNA (circa 1/300 bp) •Sviluppo di tecniche di genotyping automatizzate e in larga scala •Basso tasso di mutazione in confronto ai microsatelliti Varianti Seq DNA Variabilità fenotipica Predisposizione a malattie Caratteristiche fisiche Risposta a influenze ambientali Risposta a farmaci DbSNP http://www.ncbi.nlm.nih.gov/SNP/ SNP variation in humans Number of SNPs in dbSNP total non-redundant SNPs ~ 10 million common SNPs in the human genome double hit validated by genotyping Nature 437:1299 (2005) •Microsatelliti (STR Short Tandem Repeats) Classe di sequenze ripetute, costituite da ripetizioni in tandem di 2-3-4 pb Fiancheggiate da sequenze uniche Es: Ripetiz di dinucleotidi CA/GT CT/AG Molto polimorfici e uniformemente distribuiti nel genoma (1/50-100 Kb) -> utili come marcatori genetici •Minisatelliti •ripetizioni in tandem di una corta sequenza (10-100 bp) •distribuzione non omogenea (vicino ai telomeri) •sequenza comune (core) GGGCAGGAXG + seq specifiche Molto polimorfici : utili come marcatori per mappe genetiche ma distribuz non omogenea Utilizzati in passato per DNA FINGERPRINTING (descritti da Jeffreys) Genetic variation in the human genome Tecniche citogenetiche -> anomalie cromosomiche (> 3 Mb) Tecniche molecolari (sequenziamento) -> varianti del DNA di piccole dimensioni (< 1-10 Kb) Nuove tecnologie hanno recentemente permesso di individuare varianti del DNA di dimensioni intermedie: Varianti strutturali submicroscopiche •Copy Number Variants (CNVs) (inserzioni, duplicazioni, delezioni) •Inversioni ARRAY CGH (Comparative Genome Hybridization) Rivela le differenze tra 2 genomi Arrays: BAC Oligonucleotidi (60-100 bp) ROMA (representational oligonuclotide microarray analysis) Affymetrix SNP arrays AGTGGGTCGAGCTGATCGATCGGTCG Allele A AGTGGGTCGAGCCGATCGATCGGTCG Allele B AGTGGGTCGAGCAGATCGATCGGTCG mismatch AGTGGGTCGAGCGGATCGATCGGTCG mismatch AB PM-A MM-A PM-B MM-B BB AA analisi su 270 individui 1400 CNVs 12% (360 Mb) genoma Effetti delle varianti strutturali sul fenotipo: • dosaggio genico • position effect •285 geni in OMIM morbid map -> overlap con CNVs •Alta densità di CNVs vicino ai breakpoint di genomic disorders •Difficoltà nel risolvere le correlazioni genotipo-fenotipo Database of genomic variants http://projects.tcag.ca/variation