Dipartimento di Biologia Universita’ degli Studi di Padova Mappaggio di geni malattia mediante analisi di linkage: l’esempio della Paraparesi Spastica Ereditaria Analisi di linkage PARAMETRICA NON PARAMETRICA - Caratteri mendeliani - Caratteri complessi - Preciso modello genetico - No modello genetico • modalità di eredità • frequenze geniche • penetranza di ciscun genotipo ASP: Affected Sib Pairs APM: Affected Pedigree Member Calcolo dei lod score (Morton 1955) Lod score - A 2 punti: probabilità di linkage tra 2 loci (MLINK) Lod score Z= log10 probabilità che i due loci siano associati 0<<0.5 probabilità che i due loci non siano associati = 0.5 •Valori soglia Z> +3 accettare il linkage Z< -2 escludere il linkage - A più punti: localizzazione del gene malattia rispetto ad una batteria di marcatori (LINKMAP, GENEHUNTER) Paraparesi Spastica Ereditaria (HSP) • Malattia neurodegenerativa • Esordio variabile (II- IV decade di vita) • Progressiva spasticita' degli arti inferiori • Aumento dei riflessi tendinei •Patogenesi: degenerazione assonale tratti corticospinali e colonna dorsale Forme non complicate clinica Forme complicate ETEROGENEITA’ AD-HSP genetica AR-HSP X-linked HSP SPG 3 SPG 4 SPG 6 SPG 8 SPG 9 SPG 10 SPG 12 SPG 13 SPG 5 SPG 7 SPG 11 SPG 14 SPG 1 SPG 2 SPG15 Spastina Paraplegina L1CAM PLP Paraplegina Spastina (Casari 1998) (Hazan 1999) • SPG7 AR-HSP Locus (De Michele 1998) • SPG4 AD-HSP (Hazan 1994) localizzazione • nucleo • ATPasi funzione biochimica • ATPasi • AAA, peptidasi M41 domini caratteristici • AAA (ATPases • mitocondrio Associated with various cellular Activities) Famiglia con HSP complicata I 1 2 II 1 III 2 3 1 4 2 IV 1 V 2 2 3 2 4 2 3 5 6 3 3 7 2 8 9 2 10 11 12 2 CARATTERISTICHE CLINICHE: • Diagnosi: Paraparesi Spastica Ereditaria • Esordio: 30 anni • Altre caratteristiche: - piede cavo bilaterale - neuropatia motoria distale evidenziata da MCV nervo SPE - disturbi cognitivi Esclusione dei loci noti per la HSP a trasmissione autosomica recessiva Frequenza di ricombinazione Locus Marker 0.00 0.01 0.05 0.10 0.20 0.30 0.40 -5.720 -0.761 -0.146 0.049 0.138 0.110 0.053 -6.317 -2.134 -0.879 -0.430 -0.097 0.002 0.009 -5.698 -1.561 -0.872 -0.576 -0.276 -0.111 0.023 -18.262 -4.380 -2.204 -1.298 -0.520 -0.189 -0.042 D16S303 -5.696 -1.833 -1.106 -0.754 -0.365 -0.151 0.038 D15S1007 -2.20 -0.58 0.02 0.21 0.28 0.19 0.06 D15S1012 - -2.58 -1.24 -0.72 -0.27 -0.09 -0.02 D8S260 SPG5 (8p12-q13) D8S285 D16S520 SPG7 D16S3023 (16q24.3) SPG11 (15q13-15) Simulazione di linkage Calcolo del lod score potenziale mediante i programmi SLINK e MSIM 1. Pedigree file 2. Parameter file 1 1 1 1 1 2 3 4 0 0 1 1 0 1 1 2 0 2 2 1 2 1 2 3 2 2 1 2 3 4 4 4 1 3 2 4 Modello di eredità: autosomica recessiva Frequenza dell’allele malattia: 1:10.000 Penetranza: 100% Alleli del marcatore simulato: 5 alleli equifrequenti Max lod score potenziale Zmax = 2.82 a = 0.0 Metodo: Genomewide Search Caratteristiche dei marcatori • ABI PRISM Linkage Mapping set version 2 (PE Applied Biosystems) - 400 microsatelliti (CA repeats) distribuiti in 28 pannelli - Range di lunghezza: 69-395 basi - Elevata informatività (eterozigosità media: 0.8) - Distribuiti lungo il genoma con una distanza media di 10 cM - Marcati con molecole fluorescenti: FAM blu , HEX verde, NED giallo Metodica utilizzata Amplificazione in piastre da 96 pozzetti Pool di marcatori per un individuo Elettroforesi su sequenziatore ABI 373 Genescan Collection Collection file Genescan analysis 3.0 Results file Geotyper 1.1.1 Lettura alleli MLINK Lod score Genescan Analysis 3.0 file Genotyper 1.1.1 file Linkage Reporter menu genome report exclusion lod score family data -1,2 linkage parameters penetrance 1,00 AR • % di esclusione per ogni cromosoma markers analyzed excluded length cM recalc chromosome 1 chromosome 2 chromosome 3 chromosome 4 chromosome 5 chromosome 6 chromosome 7 chromosome 8 chromosome 9 chromosome 10 chromosome 11 chromosome 12 chromosome 13 chromosome 14 chromosome 15 chromosome 16 chromosome 17 chromosome 18 chromosome 19 chromosome 20 chromosome 21 recalcul chromosome 22 41% 67% 29% 77% 77% 85% 95% 84% 76% 89% 81% 83% 95% 78% 74% 85% 88% 91% 69% 66% 44% 52% 298 245 237 216 224 182 194 180 160 168 157 184 132 128 117 131 130 130 117 112 72 82 total autosomes 73% 3596 • % di Esclusione del genoma Regioni di positività Lod score a = Cromosoma 1 D1S206 D1S2726 D1S252 0.00 0.01 0.05 0.10 0.20 0.30 0.40 -4.53 1.43 -0.28 -0.39 1.41 -0.26 0.87 1.29 -0.20 0.89 1.14 -0.14 0.67 0.82 -0.07 0.36 0.50 -0.03 0.10 0.20 -0.01 Lod score a = Cromosoma 3 D3S1580 D3S1601 D3S1311 0.00 0.01 0.05 0.10 0.20 0.30 0.40 - 2.70 0.00 0.75 2.64 0.00 1.23 2.42 0.00 1.25 2.13 0.00 0.90 1.55 0.00 0.59 0.95 0.00 0.19 0.37 0.00 Lod score a = Cromosoma 9 D9S175 D9S1677 D9S283 0.00 0.01 0.05 0.10 0.20 0.30 0.40 - - - -2.52 0.74 -0.94 -0.67 1.19 0.21 -0.07 1.18 0.51 0.22 0.87 0.52 0.17 0.47 0.30 0.05 0.13 0.08 Report del cromosoma 3 29% excluded D3S1297 - 10 D3S1304 - 23 total chromosome exclusion lod score: 237 -1,2 cM family data: linkage parameters D3S1263 - 34 penetrance 1,00 AR D3S2338 - 41 D3S1266 - 50 D3S1277 - 60 D3S1289 - 71 two-point lod score at theta D3S1300 - 78 marker place 0,00 0,01 0,05 0,1 0,2 0,3 0,4 excl. D3S1297 D3S1304 D3S1263 D3S2338 D3S1266 D3S1277 D3S1289 D3S1300 D3S1285 D3S1566 D3S3681 D3S1271 D3S1278 D3S1267 D3S1292 D3S1569 D3S1279 D3S1614 D3S1565 D3S1262 D3S1580 D3S1601 D3S1311 10 23 34 41 50 60 71 78 94 101 119 122 135 144 153 167 176 183 191 207 208 210 230 -0,33 - - - - - - - 0,69 - -2,02 -8,77 0,00 -1,07 0,00 0,00 -9,15 0,00 -2,23 -8,87 - 2,70 0,00 -0,31 -3,44 -1,14 -1,96 -3,44 -2,40 -3,61 -1,64 0,68 -3,03 -0,42 -1,16 0,00 0,38 0,00 0,00 -0,56 0,00 -0,70 -1,26 0,75 2,64 0,00 -0,25 -1,49 0,04 -0,68 -1,47 -1,02 -1,56 -0,40 0,64 -1,10 0,17 -0,03 0,00 0,87 0,00 0,00 0,23 0,00 -0,09 -0,06 1,23 2,42 0,00 -0,19 -0,75 0,37 -0,23 -0,74 -0,48 -0,78 0,00 0,58 -0,42 0,34 0,39 0,00 0,90 0,00 0,00 0,44 0,00 0,09 0,29 1,25 2,13 0,00 -0,10 -0,17 0,44 -0,03 -0,18 -0,08 -0,18 0,18 0,43 0,02 0,36 0,48 0,00 0,67 0,00 0,00 0,48 0,00 0,15 0,39 0,90 1,55 0,00 -0,04 0,00 0,28 0,06 -0,01 0,01 0,00 0,14 0,25 0,09 0,24 0,32 0,00 0,33 0,00 0,00 0,30 0,00 0,08 0,24 0,59 0,95 0,00 -0,01 0,01 0,09 0,02 -0,01 0,01 0,01 0,04 0,08 0,04 0,08 0,11 0,00 0,04 0,00 0,00 0,12 0,00 0,04 0,06 0,19 0,37 0,00 0 7 0 3 7 4 7 2 0 5 0 0 0 0 0 0 0 0 0 1 0 0 0 D3S1285 - 94 D3S1566 - 101 D3S3681 - 119 D3S1271 - 122 D3S1278 - 135 D3S1267 - 144 D3S1292 - 153 D3S1569 - 167 D3S1279 - 176 D3S1614 - 183 D3S1565 - 191 D3S1580 - 208 D3S1262 - 207 D3S1601 - 210 D3S1311 - 230 Analisi della regione candidata 3q27-q28 • selezione di ulteriori 15 marcatori microsatelliti localizzati nella regione di interesse dalla mappa di UDB: Unified DataBase for Human Genome Mapping http://bioinformatics.weizmann.ac.il/udb/ Marcatore D3S1262 D3S3651 D3S1580 D3S3530 D3S1294 D3S2747 D3S1601 D3S3663 D3S3669 D3S2305 D3S1305 D3S1265 0.00 - - - 2.70 2.71 2.71 2.70 1.28 - 0.99 - 0.99 0.01 -1.20 -1.20 0.75 2.64 2.65 2.65 2.65 1.26 0.96 0.97 -1.03 0.97 LOD SCORE a = 0.05 0.10 0.20 -0.01 0.34 0.42 -0.02 0.30 0.37 1.23 1.25 0.99 2.40 2.10 1.49 2.41 2.11 1.50 2.41 2.11 1.50 2.42 2.14 1.55 1.16 1.02 0.75 1.44 1.47 1.19 0.89 0.79 0.57 -0.39 -0.17 -0.01 0.89 0.79 0.57 0.30 0.26 0.20 0.59 0.89 0.90 0.90 0.95 0.46 0.77 0.35 0.03 0.35 0.40 0.06 0.04 0.20 0.34 0.34 0.34 0.37 0.18 0.32 0.14 0.02 0.14 Zmax 0.42 0.37 1.25 2.7 2.71 2.71 2.70 1.28 1.47 0.99 0.03 0.99 max 0.2 0.2 0.1 0 0 0 0 0 0.1 0 0.3 0 Ricostruzione e analisi degli aplotipi cM I D3S1262 D3S3651 D3S1580 D3S3530 D3S1294 D3S2747 D3S1601 D3S3663 D3S3669 D3S2305 D3S1305 D3S1265 SPG14 (4.5cM) 2 3 1 1 3 3 2 1 1 2 2 2 3 2 2 3 1 1 3 2 2 2 2 1 1 2 2 3 2 3 1 1 3 2 2 2 2 1 1 1 1 2 2 2 1 2 3 1 1 1 II 1 3 2 2 1 3 3 2 1 1 2 2 2 2 1 1 2 3 1 1 3 2 2 2 2 1 3 2 2 3 1 1 3 2 2 2 2 1 3 2 3 2 3 1 1 3 2 2 2 2 1 2 2 2 3 1 1 3 2 2 2 2 1 4 1 1 1 2 2 2 1 2 3 1 1 1 2 3 1 1 3 3 2 1 1 2 2 2 5 2 3 2 3 1 1 3 2 2 2 2 1 2 3 1 1 3 3 2 1 1 2 2 2 6 1 1 1 2 2 2 1 2 3 1 1 1 3 2 2 3 1 1 3 2 2 2 2 1 7 1 1 2 3 1 1 3 2 2 2 2 1 8 3 2 2 3 1 1 3 2 2 2 2 1 9 2 3 2 3 1 1 3 2 2 2 1 1 3 2 2 3 1 1 3 2 2 2 2 1 10 1 1 1 2 2 2 1 2 2 2 2 1 2 3 1 1 3 3 2 1 1 2 2 1 1 1 1 2 2 2 1 2 3 1 1 1 11 2 3 1 1 3 3 2 1 1 2 2 2 1 1 1 2 2 2 1 2 3 1 1 1 12 2 3 1 1 3 3 2 1 1 2 2 2 2 3 2 3 1 1 1 2 3 1 1 1 Lod score MULTIPOINT (Genehunter 1.3) Zmax = 3.9 per D3S1601 Z > 3.00 tra D3S1580 e D3S3669 Analisi di linkage Regione cromosomica candidata Gene malattia (mutazioni patogene) Clonaggio posizionale Costruzione di mappe genetiche e fisiche ad alta risoluzione Costruzione di contigui di cloni Identificazione e sequenziamento dei trascritti Ricerca di mutazioni patogene in pazienti • Mappaggio EST • sequenziamento e ricerca di ORF • screening di librerie di cDNA • “exon trapping” • ricerca di isole CpG ipometilate Limiti del clonaggio posizionale • Dimensioni della regione • N° di geni presenti Progetto Genoma Umano Mb Sviluppo di databases 95 96 97 98 99 Clonaggio posizionale-candidato (candidate positional cloning) Analisi della regione candidata mediante consultazione di DATABASE Individuazione dei geni noti Selezione dei geni candidati Ricerca di mutazioni patogene in pazienti • Espressione • Funzione • omologia con altri geni umani • omologia con geni in organismi modello (Topo, Drosophila...) Regione candidata geni noti GENI NON NOTI Programmi di predizione genica • Ricerca di sequenze codificanti simili • Ricerca di esoni (Genscan, Grail) Pacchetti di software (NIX) Database con previsioni (GENOME BROWSER, ENSEMBL) Analisi della proteina putativa (SMART, PFAM) • Ricerca di omologie • Ricerca di domini • Sequenze segnale Databases Analisi della regione critica 3q27-q28 • 70% sequenziato • 47 cloni • 6 Gap 0.1 Mb 3q27 Hs.98859 Hs.63920 Hs.91453 LPP: lim domain-containing preferred translocation partner in lipoma 8 Geni noti Hs.42824 TP63: tumor protein FLJ10718 CLDN1: claudin 1 CLDN16: claudin 16 Hs.119567 Hs. 298964 PRO1446 IL1RAP: interleukin 1 receptor accessory protein 13 UniGene Clusters (376 ESTs) Hs.25028 Hs.10198 Hs.55098 FGF12/FGF12B: fibroblast growth factor 12 3q28 Hs.275127 Hs.34779 Hs.12251 Hs.152466 Analisi dei geni noti LPP: lim domain-containing preferred translocation partner in lipoma TP63: tumor protein Espressione FLJ10718 Funzione CLDN1: claudin 1 Localizzazione CLDN16: claudin 16 Omologie con altri geni PRO1446 IL1RAP: interleukin 1 receptor accessory protein FGF12/FGF12B: fibroblast growth factor 12 FGF12 • Espressione: SN • Altamente conservato (100% omologia nel topo) • Funzione: implicato nello sviluppo e funzionamento del SN (Smallwood et al.1996) Ex 1A Ex 1B FGF12 gene FGF12 mRNA (A)n 3’ 5’ FGF12B 5’ mRNA IL1RAP (A)n 3’ • Funzione: trasduzione del segnale IL1- IL1RI • Simile a IL1RAPL mutata in forme di ritardo mentale e disturbi cognitivi (Carrie et al. 1999) IL1RAP gene sIL1RAP mRNA mIL1RAP mRNA 5’ 5’ (A)n 3’ (A)n 3’ Risultati Sequenziamento FGF12 e IL1RAP • esclusione sequenze codificanti • siti di splicing • regioni 5’ e 3’ UTR Prospettive •Valutazione delle regioni regolative per FGF12 e IL1RAP •Valutazione di nuovi geni identificati nella regione critica •Analisi delle ESTs e dei trscritti parziali Giovanni Vazza Francesca Boaretto Michela Zortea Andrea Bozzato M. L. Mostacciuolo Progetto finanziato dall’Universita’ degli Studi di Padova V. Sartori G.F. Micaglio