Centro Università di Milano-Scuola per la diffusione delle bioscienze e delle biotecnologie www.cusmibio.unimi.it TUTTI UGUALI, TUTTI DIVERSI Caccia al gene 1 Tutti uguali, tutti diversi Caccia al gene Lo scopo di questa attività pratica è di capire come attraverso l’uso di banche dati bioinformatiche sia possibile, partendo da una sequenza parziale di DNA umano, identificare il gene a cui appartiene la sonda nucleotidica, identificare le differenze tra la sequenza data e quella normale, ottenere informazioni dettagliate sulla proteina codificata dal gene e sui tessuti in cui la proteina è espressa, mettere in relazione le alterazioni del gene con malattie. Ti verrà data una sequenza parziale di DNA (sonda) e con quella dovrai “pescare” il gene corrispondente. Sarà come trovare un ago in un pagliaio!! Obiettivi dell’attività: 1. identificare un gene a partire da una sequenza (sonda) sconosciuta; 2. identificare la regione del cromosoma dove si trova il gene; 3. identificare una mutazione in una data sequenza di DNA; definire la struttura esone-introne del gene ed ottenere la sequenza completa del cDNA; 4. identificare le caratteristiche principali della proteina codificata dal gene normale 5. trovare le conseguenze della mutazione a livello della proteina; identificare le principali caratteristiche del cDNA elaborando uno schema con la posizione del codone di inizio, di stop e del segnale di poliadenilazione; tradurre la molecola di cDNA nella corrispondente proteina; 6. ottenere informazioni sulla struttura in 3D della proteina; 7. capire come correlare la mutazione in un gene ad una malattia. 2 Scenario I test predittivi vengono proposti a individui asintomatici che hanno, nella loro famiglia, casi di malattie genetiche. Nella storia che viene proposta per l’attività di bioinformatica, una donna con casi di cancro al seno in famiglia (vedi l’albero genealogico della famiglia del probando) chiede di sottoporsi ad un test per evidenziare se è portatrice di geni di predisposizione alla malattia (in questo caso il tumore al seno). Anne, una giovane donna di 23 anni, si reca al suo primo appuntamento con il suo nuovo ginecologo; il dottore nota dal racconto di Anne che nella sua famiglia ci sono stati numerosi casi di cancro. La sua nonna paterna morì a 40 anni di cancro al seno; due delle quattro zie paterne sono morte prima dei 50 anni per cancro alle ovaie e ad una terza zia paterna di 39 anni è stato recentemente diagnosticato il cancro al seno. Il ginecologo pensa che nella famiglia di Anne possa essere presente una mutazione in uno dei due geni che controllano la predisposizione allo sviluppo del cancro al seno e/o all’ovaio (BRCA1 or BRCA2). Durante la visita il ginecologo individua un nodulo sospetto nel seno destro di Anne e ne predispone una biopsia. Oltre all’esame istologico, il ginecologo suggerisce ad Anne il test del DNA ma la informa che i risultati potranno essere informativi solo se si può fare il test anche sui famigliari, per individuare esattamente la mutazione tipica della sua famiglia. Anne contatta subito sua zia malata scoprendo che si è già sottoposta al test genetico da cui è risultata portarice di una rara mutazione nel gene BRCA2. Per fare diagnosi di malattie genetiche viene utilizzata dai laboratori una tecnica particolare: la RTPCR (reverse transcription polymerase chain reaction). L’RT-PCR è una tecnica che amplifica un frammento di acido ribonucleico (RNA). La molecola di RNA è dapprima trascritta nel DNA complementare (o cDNA) attraverso l’uso dell’enzima trascrittasi inversa (RT), e in seguito amplificata utilizzando la reazione a catena della polimerasi. L’RT-PCR usa come stampo una molecola di RNA ed è quindi molto utile per l’analisi dell’espressione genica in un tessuto. Sul campione della biopsia di Anne viene eseguita la RT-PCR e il prodotto della reazione viene sequenziato: si scopre che la mutazione nel gene di Anne è la stessa riscontrata nel DNA della zia. Userai una sequenza parziale di cDNA di Anne come sonda per identificare la mutazione presente 3 in questa famiglia e per verificare la presenza della mutazione nel DNA di Anne. 4 Obiettivi 1 e 2: Identificare il gene a cui appartiene la sequenza (sonda) e la sua posizione sul cromosoma. Per raggiungere l’obiettivo della prima parte dell’attività devi usare il software BLAT (BLASTLike Alignment Tool), un algoritmo ottimizzato per confrontare sequenze di cDNA (prive di introni) con intere sequenze genomiche (che contengono introni). Vai al sito: http://genome.ucsc.edu/cgi-bin/hgBlat?db=mm2 Incolla nel box vuoto la sequenza nucleotidica TGCACTAACAAGACAGCAAGTTCGTGCTTTGCAAGATGGTGCAGAGCTTTATGAAGCAGTGAAGAATGCA GCAGACCCAGCTTACCTTGAG TTATACTGAGTATTTGGCGTCCATCATCAGATTTATATTCTCTGTTAAC AGAAGGAAAGAGATACAGAATTTATCATCTTGCAACTTCAAAATCTAAAAGTAA ATCTGAAAGAGCTAAC ATACAGTTAGCAGCGACAAAAAAAACTCAGTATCAACAACTACCG GTTTCAGATGAAATTTTATTTCAGA TTTACCAGCCACGGGAGCCCCTTCACTTCAGCAAATTTTTAGATCCAGACTTTCAGCCATCTTGTTCTGA per trovare la sua localizzazione nel genoma umano (controlla che sia selezionata la scelta “human” tra i genomi disponibili e clicca su “submit”. Bisogna attendere alcuni secondi per avere i risultati della ricerca del software BLAT. Scegli il primo risultato che mostri il migliore allineamento definito con un numero detto score: più alto è lo score migliore è l’allineamento. Scoprirai che la tua sequenza (definita dal software query) è composta da 350 nucleotidi e si trova nel cromosoma 13. Se desideri maggiori dettagli sulla struttura esoni-introni della regione genomica in esame, clicca su “details” (userai questa funzione anche in seguito); ora però clicca su “browser” per trovare la regione cromosomica che contiene la sequenza che ci interessa. Nella schermata che si apre osserva che l’ideogramma del cromosoma ha un tratto rosso nella posizione dove si trova la sequenza che 5 stiamo studiando. Nella finestra sottostante ritrovi la sequenza (your seq) al di sotto della quale c’è la sequenza genomica (known genes) che si allinea nel miglior modo possibile; per capire bene le informazioni contenute in questa finestra bisogna rinfrescare le conoscenze sulla struttura del gene. I geni rappresentano solo l’1% del genoma umano e gli scienziati stanno ancora studiando per capire la composizione e la funzione del restante 99%. Negli eucarioti i geni sono affiancati da lunghe sequenze non codificanti il cui significato risulta ancora abbastanza oscuro (queste sequenze sono anche dette DNA spazzatura); quando viene localizzato un gene si nota che è suddiviso in piccole parti dette esoni, che sono le parti codificanti proteine o molecole di RNA e che gli esoni sono separati da lunghi tratti non codificanti detti introni. Nella finestra di BLAT gli esoni sono rappresentati da blocchetti neri o rossi, mentre gli introni sono raffigurati come linee sottili. domanda1) Prendi nota della posizione della sonda che stai studiando sul cromosoma 13 e della lunghezza della regione. Il gene al quale appartiene la tua sonda è quello che mostra il migliore allineamento, indicato sotto a your seq :come ci attendevamo, è BRCA2. Obiettivo 3 Identificare la mutazione presente nel DNA di Anne e nella sua famiglia Confronta la struttura della tua sequenza (your seq) con la struttura del gene normale sottostante. 6 domanda2) Quanti esoni sono visibili in questa parte di gene? Quanti esoni ci sono nella tua sequenza? Ci sono differenze tra la struttura esoni-introni della tua sequenza e la struttura della sequenza del gene normale? Cosa possiamo dire sulla mutazione genica di Anne? In questa pagina ci sono altre informazioni; sulla sinistra ci sono dei blocchetti grigi e blu: l’interfaccia del browser ti permette di personalizzare ed arricchire la tua ricerca visualizzando informazioni diverse, aggiungendone o nascondendone altre. Infatti cliccando sui blocchetti verticali si accede ad altre pagine e si possono cambiare anche i parametri della ricerca. Osserva attentamente la barra verticale relativa alla conservazione della sequenza (Vertebrate Alignment and Conservation). Nota che le regioni maggiormente conservate corrispondono agli esoni (i rettangoli colorati pieni nella sezione RefSeq genes ) e che queste regioni si conservano anche in specie di vertebrati lontane evolutivamente dall’uomo, come in opossum, pollo o rana. Un discreto livello di conservazione si osserva anche in alcune regioni introniche (conservazione delle sequenze non-codificanti) ma ancora non ne è chiaro il ruolo anche se si può supporre che siano zone coinvolte nella regolazione dell’espressione genica. La penultima barra mostra gli SNPs (single nucleotide polymorphisms) e l’ultima, Repeat masker, mostra le sequenze ripetute. Ora dobbiamo trovare quale è l’esone che manca nella mutazione della famiglia di Anne. Per ottenere questa informazione bisogna trovare la struttura esone-introne completa del gene normale BRCA2. Per fare questo hai bisogno della sequenza codificante completa (CDS) e, con questa, cominciare una nuova ricerca BLAT. Vai alla pagina http://www.ncbi.nlm.nih.gov/ per trovare il codice identificativo del gene BRCA2. Seleziona “Nucleotide” nel campo “search” posizionato in alto a sinistra nella home page e digita “BRCA2 homo sapiens” nel campo “for”. Clicca poi su Go. Nell’elenco che apparirà, trova BRCA2 Homo sapiens breast cancer 2, early onset (BRCA2), mRNA. Prendi nota del numero di accesso identificativo NM_000059 (NM significa mRNA naturale). Clicca su NM_000059 e si aprirà un tipico file di GenBank. Questa pagina è difficile da interpretare ma alcune informazioni sono chiare; prima di tutto ci sono le Reference, 7 cliccando sulle quali si possono trovare le citazioni alle pubblicazioni in letteratura scientifica che riguardano la nostra sequenza. Per leggere un abstract dell’articolo che descrive il gene, clicca sul link PubMed presente in ogni Reference. Scendendo nella pagina puoi trovare informazioni più dettagliate sulla mutazione genica. Alla fine della pagina, nella sezione Features, troverai la sequenza di cDNA (CDS). Questa è la sequenza utile per la ricerca in BLAT. Non si può copiare la sequenza CDS così come si trova nella pagina ma bisogna ottenere un file utile per la ricerca del gene correlato nelle banche dati. Per fare ciò bisogna risalire all’inzio della pagina e di fianco al bottone Display cliccare per far scendere un menù a tendina e selezionare FASTA. Salva su un file di testo con il nome cDNAFASTA.doc la sequenza di basi che apparirà sullo schermo. Tornando in banca dati alla pagina con le caratteristiche di NM_000059, trova il numero identificativo della proteina prodotta dal gene (NP_000050), la sua sequenza di amminoacidi, copiala e salvala in un nuovo file di testo dal nome BRCA2 protein.doc. Prendi nota del numero di amminoacidi che costituiscono la proteina normale. Adesso che hai la sequenza codificante completa (cDNA) del gene BRCA2 puoi cercarne la sequenza genomica usando il software BLAT. Come ricorderai, questo software ti permette di confrontare sequenze di cDNA con sequenze genomiche complete e di identificarne la struttura in esoni ed introni. Ritorna alla pagina http://genome.ucsc.edu/cgi-bin/hgBlat?db=mm2 ed incolla la sequenza di cDNA nella finestra di BLAT. Clicca “submit” e quando comparirà la nuova pagina clicca su “details” alla sinistra del primo record in elenco (score 11.358, 11.386 nucleotides, 100% identity). Nella pagina che si apre troverai la tua sequenza di cDNA, la sequenza di DNA genomico nella quale sono evidenziati in blu scuro e con le lettere maiuscole gli esoni, in nero e con le lettere minuscole gli introni e in azzurro i siti di splicing. Clicca sui links, nella colonna di sinistra, per navigare nella sequenza. Cliccando sui vari blocchi, ti appare ad inizio pagina l’esone corrispondente nella sequenza genomica; noterai che ci sono 27 esoni nel gene BRCA2. Il tuo compito ora è di identificare quale è l’esone che manca nel gene mutato di BRCA2. 8 Nella sequenza genomica ricerca i residui nucleotidici che corrispondono alla posizione della tua sonda sul cromosoma 13 (ricorda: chr13:31,848,838-31,852,238), semplicemente cliccando uno di seguito all’altro i vari blocchi di sinistra e leggendo i numeri dei nucleotidi dell’esone che apparirà in alto nella pagina. domanda3) sei in grado di rispondere alla domanda: qual è l’esone che manca nel gene mutato BRCA2? La perdita dell’esone è dovuta a una mutazione di un sito di splicing (sostituzione di G con A) nell’introne 21, che porta alla perdita completa dell’esone 22 (Wagner TM et al 1999, PMID: 9971877). Copia la sequenza dell’esone mancante e salvala in un file di testo dal nome “missing exon.doc”. Obiettivo 4 Costruire una scheda contenente tutte le informazioni sulle funzioni della proteina codificata dal gene BRCA2 normale. Apri l’ homepage di Swiss Prot all’indirizzo http://www.expasy.org/sprot/sprot-top.html Swiss Prot è un database di sequenze proteiche molto ricco e completo che contiene un livello molto elevato di annotazioni quali: la descrizione delle funzioni delle proteine, i domini strutturali, le modificazioni posttrascrizionali, le varianti ecc. Swiss Prot ha livelli minimi di ridondanza e alti livelli di integrazione con altri database bioinformatici. In alto nella pagina che 9 si apre, digita nel campo “search” la tua QUERY (richiesta): BRCA2 human, e clicca su GO; nella pagina seguente, nella lista di risultati che appaiono, cerca human BRCA2 protein (prendi nota del codice identificativo P51587). Clicca su BRCA2_HUMAN. La nuova pagina contiene informazioni raggruppate in categorie quali: [Entry info], [Name and origin], [Comments], [Keywords], [References], [Cross-references], [Features], [Sequence], [Tools]. Osserva tutta la pagina per raccogliere tutte le informazioni disponibili sulla proteina in esame. Nella sezione [Comments] troverai le informazioni sulle funzioni della proteina e in che tessuti è localizzata. Nella sezione [Cross-references], ci sono i links ad altri database per avere più informazioni su BRCA2. Per esempio la sequenza del gene che codifica per la proteina è disponibile su EMBL Genbank, i domini proteici su SMR, la struttura in 3D in PDB, Prosite, InterPro e Pfam, le malattie associate ad alterazioni del gene o della proteina in OMIM. Prendi nota del numero identificativo in PDB (1NOW), SMR (P51587) e OMIM (ci sono molti records tutti preceduti dalla sigla MIM). Obiettivo 5 Trovare le conseguenze della mutazione a livello della proteina. Puoi fare delle predizioni sulle conseguenze della perdita dell’esone 22 nel gene BRCA2 sulla struttura e sulla funzione della proteina? Per rispondere a questa domanda devi ricostruire la molecola di mRNA (o di cDNA) priva dell’esone 22 e poi tradurla nella corrispondente sequenza di amminoacidi. Apri il file della sequenza normale di cDNA (cDNAFASTA.doc); apri anche il file della sequenza dell’esone 22 (salvata come file “missingexon.doc”). Cerca la sequenza dell’esone 22 nella sequenza di cDNA (ricordati che il cDNA è solo una sequenza di esoni) e cancellala. La funzione di Word “Cerca” potrà aiutarti a trovare l’esone 22 nel cDNA ma devi prestare molta attenzione a cancellare solo l’esone 22. Salva il risultato del tuo lavoro come file “cDNA22del.doc” ( vedi allegato) 10 Ora bisogna usare un nuovo software per tradurre la sequenza di cDNA mutata, cDNA22del.doc (contenente la delezione) in sequenza di amminoacidi; vai al sito: http://arbl.cvmbs.colostate.edu/molkit/translate/index.html. Incolla la sequenza mutata nella finestra bianca e clicca “translate DNA”. Otterrai una immagine su fondo nero che è il risultato della traduzione della sequenza nelle 6 possibili cornici di lettura (3 per ogni elica di DNA): in verde sono rappresentati i possibili codoni di inizio e in viola i codoni di stop. Identifica la cornice di lettura detta anche “Open Reading Frame o ORF” più lunga, senza interruzioni date dai codoni di stop. Nel nostro caso la ORF più lunga è “forward frame 3”. Ora clicca su “Text Output” per visualizzare la sequenza e la sua traduzione in amminoacidi. Scegli la forward frame 3. Puoi facilmente personalizzare l’interfaccia del software scegliendo di visualizzare la sequenza amminoacidica con il codice a una o a tre lettere, con o senza la sequenza di DNA appaiata. Scegli “one letter code” e “amino acids and DNA”. Copia il contenuto della finestra in un nuovo file di Word e salvalo come “mutated protein.doc”); usa come font “courier new” or “courier”, dimensione 8, nero; è necessario utilizzare questo font per gli allineamenti di sequenza perché mantiene fissi e costanti gli spazi tra i caratteri. Localizzazione delle caratteristiche principali del cDNA Ora puoi localizzare le principali caratteristiche del cDNA/mRNA, per esempio: • 5’UTR (5’ UnTranslated Region) • start codon (inizio della traduzione, ATG (AUG) il codone della metionina) • CDS (CoDing Sequence): la sequenza tradotta in proteina • stop codon (fine della traduzione, TAA (UAA)/ TAG (UAG) / TGA (UGA) • 3’UTR (3’ UnTranslated Region) 11 • sito polyA (sito di poliadenilazione) costituito dalla sequenza consenso “AATAAA” generalmente localizzata 20-30 bp (max 10-35 bp) a monte dell’inizio della coda di polyA. Nota che talvolta questo sito può essere leggermente differente dalla sequenza consenso (per esempio ATTAAA). Identifica tutti gli elementi sopra elencati ed evidenziali con il colore verde e giallo. Iniziando dall’estremità 5’ della molecola, trova il codone d’inizio cioè il primo ATG, che corrisponde alla prima metionina (M), non seguita a breve distanza da alcun codone di stop. Una volta identificato il codone di inizio puoi cancellare la sequenza di amminoacidi che lo precede che è la regione 5’UTR, non tradotta dai ribosomi in proteina. domanda 5 Quanto è lunga la proteina mutata? Confrontala con la lunghezza della proteina normale che hai annotato precedentemente. Obiettivo 6 domanda 6 Quali sono i domini principali della proteina BRCA2 normale? Quali domini mancano nella proteina mutata? Vai alla pagina http://pfam.sanger.ac.uk/search Pfam raccoglie una collezione di allineamenti multipli riguardanti di sequenze i domini proteici e le famiglie più comuni. Per ogni famiglia in Pfam puoi trovare la struttura del dominio e della 12 proteina nel suo complesso. Inserisci il codice identificativo di Swiss Prot per la proteina BRCA2, P51587 nella finestra per la ricerca che si trova sotto “Jump to” alla voce “enter ID/acc”. Nella nuova pagina, si trova la lista dei domini conservati identificati all’interno della proteina, con i residui amminoacidici corrispondenti. Cliccando sui singoli domini, si ottiene la rappresentazione grafica e la descrizione . Cerca la regione di circa 500 amminoacidi che mancano nella proteina mutata di Anne: si trovano nella parte finale della proteina ed esattamente appartengono al dominio Pfam-A_BRCA2_OB3 (aa 3052-3190). Clicca ora sul link OB3 per conoscere le funzioni di questo dominio e riassumile qui sotto. ………………………………………………………………………………………………………… ………………………………………………………………………………………………………… Strutture 3D disponibili della proteina BRCA2 Vai alla home page di NCBI e cerca, nel database PROTEIN, BRCA2 Human e scegli la proteina P51587. Alla sua destra clicca sul link “Conserved domains”. Nella pagina che si apre osserva la sequenza della proteina nella sua interezza e cliccando sull’ultimo rettangolino rosso nella riga Specific hits comparirà una finestra che illustra le 13 caratteristiche del dominio OB3, clicca sul bottone “Structure” (nella barra orizzontale azzurra in cima alla pagina); nella pagina seguente inserisci BRCA2 human nella search box. Scegli 1IYJ (la sola struttura in 3D che contiene il dominio che ci interessa). 1IYJ è un frammento della proteina BRCA2 (817 residui) ingegnerizzato in un vettore, espresso in una linea cellulare, purificato e cristallizzato. Clicca su “Structure view in Cn3D”. Si scaricherà un file con estensione .cgi che potrà essere aperto solo con il programma chiamato 'Cn3D' (è possibile scaricare il programma di modellazione 3D gratuitamente dal sito dell’NCBI). In una finestra a fondo nero viene mostrata la struttura in 3D di 1IYJD. Se non si visualizza la sequenza amminoacidica di 1IYJ, apri la finestra “sequence viewer” dal Menu Window in cima alla pagina. Questo programma 3D è interattivo: spostandosi col mouse su un punto qualsiasi della figura e tenendo premuto il tasto sinistro si può ruotare a piacere l’immagine. Sono possibili diverse opzioni: - andando su Style _ Rendering Shortcuts si sceglie il tipo di modellizzazione (a sfere e bastoncini, a tubi, etc). Selezionando worms si ha una struttura “vermiforme” facilmente interpretabile. - andando su Style _ Coloring Shortcuts si sceglie il criterio di colorazione: Secondary Structure evidenzia con colori diversi le strutture ad alfa elica o a foglietto ripiegato; Molecule associa a ciascuna catena polipeptidica un colore diverso; Hydrophobicity evidenzia le zone idrofile e idrofobiche, Charge le cariche, etc. - Con Style _ Favorites _ Add/Replace si può salvare con nome l’immagine tra i favoriti (comparirà nella tendina in basso). - Con Style _ Edit Global Style si ha una visione complessiva delle impostazioni ed è possibile modificarle: in Settings si modifica il tipo di modellizzazione, i colori di catene e sfondo, si decide se visualizzare o meno molecole estranee (esempio ioni zinco, fenolo, etc), gli oggetti che evidenziano la struttura secondaria, i ponti disolfuro. Per prendere familiarità, selezionare e deselezionare queste voci, osservando le variazioni nell’immagine. In Labels è possibile visualizzare i nomi degli aminoacidi (alla voce “Spacing” si sceglie se scrivere un nome ogni uno, due, tre, ... aminoacidi). In Details si modificano le dimensioni del tipo di modellizzazione scelta (ad esempio il diametro della struttura “vermiforme”). - Alla voce Show/Hide _ Pick Structures ... si decide se visualizzare tutte le catene, oppure solo alcune. Può essere utile per identificare quali sono le catene A e B di ciascun monomero. - Con View _ Animation _ Spin si fa partire la rotazione automatica del modello. 14 Scegli dal Menu Style “Rendering shortcuts” e “Worms” in modo da visualizzare la struttura secondaria con cilindri per le alfa eliche e frecce per i beta foglietti. Per vedere dove è posizionato un amminoacido devi cliccare il medesimo in una delle sequenze e la sua posizione apparirà scritta sul fondo della finestra (tra parentesi compare anche la posizione dell’amminoacido nella proteina totale). Cliccando e trascinando il mouse su di una serie di residui amminoacidici nella sequenza cristallizzata (1IYJD) una barra gialla compare sulla struttura 3D nel punto in corrispondenza della posizione dei residui all’interno della struttura. In effetti bisognerebbe allineare la proteina normale con la sua forma mutata. Purtroppo non sono ancora state realizzate le strutture 3D di molte proteine e neanche della varie forme mutanti della stessa proteina. Così bisogna riconoscere la mutazione (nel nostro caso la delezione dell’esone 22) dalla posizione degli aa mancanti e prevedere quali interferenze strutturali potrebbero esserci nella proteina mutata. Questo metodo, non certamente ottimale, sarà migliorato dalla disponibilità di algoritmi più accurati per predire le strutture che eviteranno di dover determinare la struttura 3D sperimentalmente, lasciando al laboratorio solo la fase finale della validazione farmacologica. Obiettivo 7 Malattie associate con l’alterazione del gene BRCA2. Visita il database OMIM per conoscere le malattie associate con le alterazioni di questo gene. Vai all’indirizzo http://www.ncbi.nlm.nih.gov/ e clicca su OMIM nella barra in alto blu. Si aprirà il nuovo database nel quale dobbiamo cercare BRCA2. 15 Il gene BRCA2 (BReast CAncer 2) con il gene BRCA1 rappresentano i geni più importanti le cui mutazioni causano suscettibilità allo sviluppo del cancro al seno e all’ovaio. BRCA2 è stato scoperto e studiato famiglie islandesi in che avevano casi di tumore al seno nel loro albero genealogico. Normalmente i geni BRCA2 e BRCA1 sono geni soppressori dei tumori poiché sono coinvolti nella sintesi di enzimi riparatori dei danni che può subire il DNA; hanno anche altre funzioni complesse che però non sono state completamente chiarite. Solo il 5-10% dei tumori al seno sono forme di tumore ereditario. In questi casi, nel 90% dei pazienti sono presenti mutazioni nei geni BRCA1 o BRCA2. I ricercatori hanno individuato 450 mutazioni solo nel gene BRCA2 e >600 nel gene BRCA1. Le mutazioni in BRCA1 sono responsabili del 50-85% dei casi di cancro al seno ereditari e aumentano del 15-45% il rischio di sviluppare il cancro alle ovaie. Le mutazioni in BRCA2 sono responsabili del 35% del cancro al seno ereditario ma conferiscono un rischio minore (10-20%) di sviluppare tumori alle ovaie. Entrambi i geni sono coinvolti anche nel tumore al seno nel maschio (6%). In tutti i casi ci sono dati che sottolineano un leggero incremento (6-14%) del rischio di sviluppare anche altri tipi di cancro (colon, prostata, pancreas). Nei casi sporadici (non familiari) di cancro al seno le mutazioni in BRCA1 e BRCA2 sono molto rare. La frequenza delle mutazioni nel gene BRCA2 che predispongono al cancro non è ancora stata definita a livello della popolazione generale,; si stima che, nella popolazione globale, la frequenza di soggetti portatori di mutazioni in uno di questi due geni sia fra 1/500 e 1/1000; a causa dell’effetto fondatore, nei diversi gruppi etnici singole o poche mutazioni possono essere predominanti. Qui di seguito vengono illustrati due gruppi etnici con specifiche mutazioni in BRCA2 che predispongono al cancro: 1) la mutazione 999del5 di BRCA2 che predispone al cancro è presente nello 0,6% della popolazione generale Islandese, e rispettivamente nel 7.7% delle donne e nel 40% degli uomini affetti da tumore mammario [Thorlacius et al 1996 , Thorlacius et al 1997]; 16 2) la mutazione 6174delT di BRCA2 presente con una frequenza dell’1% in individui discendenti da Ebrei Ashkenazi [Struewing et al 1995 , Oddoux et al 1996 , Roa et al 1996 , Struewing et al 1997]. Considerando sia il gene BRCA1 Che BRCA2, nella popolazione degli Ebrei Ashkenaziti sono state osservate 3 tipi di mutazioni dovute a effetto fondatore: 187delAG (BRCA1), 5385insC (BRCA1) e 6174delT (BRCA2). Tra gli ebrei Ashkenaziti 1 individuo su 40 presenta una di queste tre mutazioni [Struewing et al 1997] A questo punto hai trovato un ago in un pagliaio!! Non hai solo individuato il gene ma hai fatto un percorso lungo e complicato: partendo da una sequenza “sonda” hai trovato molte informazioni sul gene BRCA2 e sulla sua proteina! Hai anche acquisito un metodo per farti domande e trovare risposte ad altre questioni riguardanti mutazioni geniche di tuo interesse (o di interesse dei tuoi studenti). Congratulazioni! Una caccia davvero di successo. A cura di: • • Prof.ssa Giovanna Viale, Dipartimento di Biologia e Genetica per le Scienze Mediche, Università degli Studi di Milano, Cus-Mi-Bio; Prof.ssa Cinzia Grazioli, docente di scienze del liceo scientifico Vittorio Veneto di Milano, distaccata presso il Cus-Mi-Bio 17