Analisi genetica di caratteri complessi Identificazione di alleli di predisposizione: • Diagnosi precoce e prevenzione (modificando fattori ambientali) • Piu’ facile individuare fattori ambientali • Farmacogenetica • Identificazione dei processi cellulari e molecolari coinvolti nella patogenesi: target per lo sviluppo di farmaci COME VALUTARE SE UN CARATTERE COMPLESSO HA UNA BASE GENETICA RISCHIO RELATIVO R Esprime il grado di aggregazione familiare di un carattere s = rischio nei fratelli/sorelle di un affetto rischio nella popolazione generale CONCORDANZA IN GEMELLI MONOZIGOTICI/DIZIGOTICI Permettono di stabilire se l’aggregazione familiare e’ dovuta all’ambiente familiare in comune oppure a fattori genetici MZ = 100% geni in comune DZ = 50% geni in comune STUDIO DI INDIVIDUI ADOTTATI Confronto freq malattia tra parenti adottivi e biologici di individui affetti STRATEGIE PER L’ANALISI GENETICA DEI CARATTERI COMPLESSI Linkage usando metodi “non parametrici” E/O Studi di associazione allelica (Linkage Disequilibrium mapping) Analisi di LINKAGE “tradizionale” (Metodi “parametrici” ) • • • Dipende dalla specificazione di un modello di ereditarietà Si contano gli eventi di ricombinazione fra due loci Test: frazione di ricombinazione (tetha) < 0.5 D + 1 1 + 2 + 2 D + 1 2 D + 1 3 NR + 1 + 3 + 3 R + 2 + 4 NR + 4 D + 2 4 R L’analisi di linkage tradizionale (parametrica) richiede la specificazione di un modello: •Tipo di ereditarieta’ (autosomica dominante, recessiva, legata al crom X) •Penetranza •Fenocopie •Frequenza dell’ allele “malato” Limiti: •molto efficace, se uno conosce il modello corretto •l’uso di un modello sbagliato puo’ portare a risultati falsi negativi (non identificazione di un linkage vero) o falsi positivi •Se si testano modelli diversi il livello di significativita’ deve essere corretto Nel caso di malattie genetiche “complesse” il modello di ereditarieta’ non e’ conosciuto…. In casi particolari è stato possibile utilizzare metodi di linkage parametrici per l’analisi di malattie complesse: quando è possibile individuare un sottogruppo di famiglie influenzate da un “major locus” con segregazione di tipo Mendeliano Definizione dei criteri di selezione dei pedigrees Es: eta’ di insorgenza della malattia, sintomi piu’ gravi, pedigrees con piu’ individui affetti. Malattia Criteri di selez Geni identif. Cancro della mammella Età di insorgenza Tumori bilaterali Familiarità BRCA1 BRCA2 Dominant early-onset Presenilin1 Presenilin2 APP APOE Morbo di Alzheimer Multicase late-onset Diabete non-insulina-dip. Maturity-onset-diabetes of the young MODY Galactokinase HNF-1a BRCA1- BRCA2 • Tumor suppressor genes • Coinvolti nel riparo del DNA in seguito a danno Coattivatori trascrizionali espressione ubiquitaria • Rischio per portatrici di mutazioni in BRCA1/2 -> 35-80% • Alta frequenza di elementi ripetuti-> instabilità Schizofrenia Prevalenza nella popolaz = 1% Componente genetica complessa MZ : DZ = 45% : 10% s ≈ 9 Sherrington et al, 1988 7 famiglie (UK, Islanda) con numerosi individui affetti Analisi Linkage parametrica -> Lod Score = 6.49 per locus sul crom 5 Non e’ mai stato possibile replicare questo risultato in altre famiglie Problema: criteri diagnostici arbitrari Test numerosi modelli diversi: il risultato positivo e’ stato probabilmente ottenuto per caso Metodi di linkage non-parametrici • Non richiedono la specificazione di un modello • Si basano sulla condivisione di segmenti genomici (condivisione di alleli di marcatori polimorfici) in individui della stessa famiglia 12 34 Genotipo figlio 1 Genotipo figlio 2 13 14 23 24 13 2 1 1 0 14 1 2 0 1 23 1 0 2 1 24 0 1 1 2 Metodi di linkage ‘Non-parametrici’ A,B C,D E,F G,H A,E D,H Famiglie con almeno 2 fratelli affetti Regione qualsiasi Regione vicina ad un gene di “suscettibilità” A,C B,D A,C E,G F,G F,H A,D A,H E,D 2 alleli in comune 1 allele in comune 0 alleli in comune 25% 50% 25% Genome-wide scan Marcatori polimorfici distribuiti su tutto il genoma Testing for linkage based in IBD sharing 2-1-0 sharing IBD 2 1 0 Expected N/4 N/2 N/4 Observed n2 n1 n0 • c2 test (2 df) N number of sib-pairs ni number of sib-pairs sharing i alleles c2 = [(O-E)2/E] maximum likelihood (MLS) Lod = log10 ^ ^ ^ L (z0, z1, z2) L (zo0, zo1, zo2) Genome scan - analisi multipoint Problemi negli studi di linkage non-parametrici di malattie complesse • Sono poco sensibili: è necessario analizzare un grande numero di sibpairs per rilevare un’aumento significativo di condivisione allelica. • Sono poco precisi: non si fanno assunzioni sul numero di geni ed il modello di ereditarietà. Non ci si puo’ basare su singole ricombinazioni per definire la regione critica. -> Picchi di linkage sono larghi ed imprecisi • Soglia di significatività più alta rispetto a malattie monogeniche (Lod>3) MLS > 3.6 • Replicazione indipendente dei risultati positivi Per replicare un risultato positivo è necessario un campione di famiglie di dimensioni molto maggiori rispetto al campione originario Summary of genome scans D M* S A* S C* F* I* B D I* D F** F** 7 6 5 4 3 A I 9 8 11 10 2 C* S A* M a* I M P C* 12 A* A P* 1 I I 13 14 15 16 17 P M D S 18 19 F* D* 20 21 22 X ** MLS > 3.6 * MLS > 2.2 ° MLS > 1 I: IMGSAC (Lamb et al, 2005) Programmi: SPLINK GENEHUNTER MERLIN ALLEGRO