OMICS. 2013 Feb;17(2):61-70. doi: 10.1089/omi.2012.0082. EMERGING TRENDS IN GENOMIC APPROACHES FOR MICROBIAL BIOPROSPECTING. Akondi KB, Lakshimi VV. Main aspects 1. Microorganisms constitute two out of the three domains of life on earth. 2. They exhibit vast biodiversity and metabolic versatility. This enables the microorganisms to inhabit and thrive in even the most extreme environmental conditions, making them all pervading. 3. The magnitude of biodiversity observed among microorganisms substantially supersedes that exhibited by the eukaryotes. 4. These characteristics make the microbial world a very lucrative and inexhaustible resource for prospecting novel bioactive molecules. Over 99% of the microbial world still remains to be explored. The primary reason for this is that the culture-dependent methods used in the laboratories are grossly insufficient, as they support the growth of under 1% of the microorganisms found in nature. This limitation necessitated the development of techniques to circumvent culture dependency and gain access to the outstanding majority of the microorganisms. The development of culture-independent techniques has essentially reshaped the study of microbial diversity and community dynamics. Application of genomic and metagenomic approaches is contributing substantially towards characterization of the real microbial diversity. The amenability of these techniques to high throughput has opened the doors to explore the vast number of "uncultivable" microbial forms in substantially lesser time.. I MICROORGANISMI e il loro AMBIENTE NATURALE In natura le cellule vivono in associazione con altre cellule POPOLAZIONI INSIEME DI NUMEROSI ORGANISMI DELLA STESSA SPECIE Composte da gruppi di cellule che derivano da divisioni cellulari successive a partire da una singola cellula parentale Si definisce habitat il luogo in cui una popolazione microbica vive CONSORZIO MICROBICO L’insieme di più popolazioni che occupano lo stesso habitat e sono metabolicamente correlate COMUNITA’ MICROBICHE sono costituite da diverse popolazioni microbiche (consorzi) che interagiscono tra di loro in un determinato ambiente. I componenti e il num di cellule che costituiscono una comunità microbica dipendono dalle risorse e dalle condizioni presenti in quel determinato habitat ECOSISTEMA è costituito dagli organismi viventi unitamente ai costituenti chimici e fisici dell’ambiente di cui fanno parte In molti casi vi è cooperazione: per esempio i prodotti di scarto delle attività metaboliche di alcune cellule possono fungere da nutrienti per altre cellule Giovanni Vallini © 2006 Le popolazioni in una comunità microbica interagiscono tra loro in modo benefico e/o dannoso I MICROORGANISMI e il loro AMBIENTE NATURALE Un ECOSISTEMA è controllato in modo significativo dalle TRASFORMAZIONI MICROBICHE I microorganismi, conducendo i loro processi metabolici, rimuovono nutrienti dall’ambiente circostante. Allo stesso tempo, liberano nell’ambiente i loro prodotti di scarto Nel tempo, un ECOSISTEMA gradualmente cambia, sia CHIMICAMENTE che FISICAMENTE attraverso le trasformazioni microbiche dei nutrienti ECOLOGIA MICROBICA studio dei microrganismi nei loro habitat naturali MAIN QUESTIONS 1. CHE TIPO DI MICROORGANISMI SONO PRESENTI 2. CHE COSA FANNO 3. IN CHE MODO LE LORO ATTIVITA’ SONO COLLEGATE ALLE FUNZIONI DELL’ECOSISTEMA? 4. COME POSSO UTILIZZARLI? METODI per l’ANALISI dei MICROORGANISMI e delle COMUNITA’ MICROBICHE Metodi CULTURE-DEPENDENT convenzionali Metodi CULTURE-INDEPENDENT molecolari Permettono l’ISOLAMENTO dei Tecniche che prescindono dalla microrganismi mediante l’impiego coltivabilità di un microrganismo. di terreni selettivi specifici per la Consentono di monitorare la crescita seguito da una COMPOSIZIONE e le DINAMICHE di CARATTERIZZAZIONE mediante popolazione delle comunità microbiche saggi fisiologici e metabolici presenti in varie matrici (acqua, suolo, reflui, alimenti etc.) senza ricorrere a isolamenti preventivi Permettono di analizzare le caratteristiche biochimiche e genetiche delle cellule che compongono la comunità Metodi MICROSCOPICI Utilizzando sonde fluorescenti permettono l’identificazione in situ dei microrganismi (FISH) Le tecniche molecolari permettono la frazione coltivabile che di quella non campione ambientale. Con le tecniche invece possibile identificare solo quei crescere su determinati terreni selettivi caratterizzazione sia della coltivabile presente in un di coltivazione standard è microorganismi capaci di La quantità di campione necessaria per lo studio della comunità microbica utilizzando tecniche molecolari è minore rispetto a quella necessaria per l’approccio classico Solo con le tecniche culture-dependent è possibile avere a disposizione il microorganismo isolato per studi di carattere fisiologico e metabolico. È importante cercare di ottimizzare le tecniche di pre-arricchimento e arricchimento selettivi per riuscire a recuperare le popolazioni microbiche meno dominanti, stressate e non coltivabili, che sono presenti a bassa carica CULTURE-INDEPENDENT methods i) Direct lysis of bacterial cells in soil ii) The extraction of the nucleic acids from the matrix iii) The analysis of targeted sequences or of the whole body of genetic information Two main types of molecular technique are available to study bacterial communities using DNA directly extracted from the soil (figure 1): — molecular approaches which usually investigate parts of this information by focusing on genome sequences which are targeted and amplified by PCR that are called ‘partial community DNA analysis’; — molecular approaches which try to investigate all the genetic information in the extracted DNA and that are called ‘whole community DNA analysis’ CULTURE-INDEPENDENT methods 1. RICOSTRUIRE L’EFFETTIVA COMPOSIZIONE DI UNA COMUNITA’ MICROBICA 2. SEGUIRE L’EVOLUZIONE E IL COMPORTAMENTO DI UN CONSORZIO MICROBICO NEL TEMPO (MONITORAGGIO DIACRONICO) O NELLO SPAZIO 3. MONITORARE in situ LA PERSISTENZA DI UNO SPECIFICO TARGET MICROBICO 4. VALUTARE LA SICUREZZA MICROBIOLOGICA TRAMITE MONITORAGGIO in situ DI MICROORGANISMI PATOGENI TECNICHE MOLECOLARI Permettono di rilevare sia microorganismi presenti a basse concentrazioni che microorganismi non coltivabili in laboratorio Acidi nucleici/Proteine/Lipidi ACIDI NUCLEICI A. Tecniche che si basano sull’analisi delle sequenze di DNA indipendentemente da conoscenze pregresse circa la struttura della comunità microbica di interesse. In particolare le tecniche che si basano sulla PCR si sono rivelate un mezzo estremamente veloce ed efficace per l’identificazione, la caratterizzazione e il monitoraggio dei microorganismi in generale e dei batteri in particolare B. Tecniche di ibridazione che impiegano sonde molecolari, utilizzate quando esistono informazioni pregresse riguardo alla comunità microbica di interesse figure 1 Schematic representation of the different molecular approaches for assessing the genetic diversity and structure of soil bacterial communities. DNAs are directly extracted from soil samples and subsequently analysed either by characterizing particular sequences targeted and amplified by PCR (approaches called ‘partial community DNA analysis’) or by characterizing all the genetic information (approaches called ‘whole community DNA analysis’). PCR products can be analysed by cloning or genetic fingerprint. Genetic fingerprint consists in a rapid and simple electrophoretic analysis of the PCR products enabling the analysis of the genetic structure of the community. Characterization of cloned sequences enables assessment of the genetic diversity of a community and can reveal the phylogenetic affiliation of the community members. Similarly, the sequencing of bands of fingerprint profiles can lead to identification of particular populations. Whole community DNA analyses such as cross-DNA hybridization and DNA fractionation by density gradient can help to assess the genetic structure of a community, whereas reassociation kinetics estimates genetic diversity in terms of the number of different genomes present in a community. PARTIAL & WHOLE COMMUNITY ANALYSIS TECHNIQUES PARTIAL COMMUNITY ANALYSIS METHODS These approaches consist in the analysis of PCR-amplified sequences. The most commonly used target sequences are the genes of the ribosomal operon, and particularly the rrs gene (16S rRNA) and the spacer between the rrs and rrl genes (intergenic spacer (IGS) 16S-23S). These methods include: — ‘genetic fingerprinting’, which provides a global picture of the genetic structure of the bacterial community; — PCR fragment cloning followed by restriction and/or sequencing analysis, which enable assessment of the diversity of the community in terms of the number of different species and, to a lesser extent, the relative abundance of these species. TECNICHE DI PCR FINGERPRINTING In generale le metodiche molecolari basate sull’utilizzo della PCR permettono di distinguere entità microbiche strettamente correlate dal punto di vista genetico attraverso l’ottenimento di specifiche impronte molecolari (molecular fingerprinting) PCR con primers per marker genici di interesse TASSONOMICO 16S rRNA, 23S rRNA, regione intergenica 16S-23S 18S e 26S rRNA, ITS rRNA RIBOSOMALI Molecole essenziali per la vita delle cellule Costituiscono la parte non proteica dei ribosomi Elementi chiave della sintesi proteica I rRNA possono essere considerati dei veri e propri CRONOMETRI MOLECOLARI perché caratterizzati dalla presenza al loro interno di zone più o meno conservate,soggette a differente variabilità durante il processo evolutivo. L’informazione contenuta nei rRNA fa si che il sequenziamento dei geni (rDNA) che codificano per le suddette macromolecole permetta l’individuazione,su base genetica, di generi e specie, anche nel caso di batteri di difficile classificazione IL GENE 16S rRNA LA SEQUENZA DEL GENE CHE CODIFICA PER IL16S rRNA NEI MICROORGANISMI PROCARIOTI (EUBATTERI E ARCHEBATTERI) SI E’ RIVELATA UN OTTIMO STRUMENTO TASSONOMICO È una sequenza universale tra i batteri Non è soggetta a trasmissione orizzontale Presenta regioni conservate e regioni variabili intersperse discriminanti le diverse specie batteriche Le regioni al 5’ e 3’ del 16S rDNA sono fortemente conservate mentre quelle interne presentano una maggiore variabilità. I primers per le reazioni di PCR possono essere disegnati su tutte e due le regioni fornendo informazioni differenti: -Se disegnati al 5’ e 3’ permettono amplificazione e sequenziamento di regioni conservate che consentono l’identificazione del genere -Se disegnati sulle regioni ipervariabili è possibile ottenere anche l’identificazione della specie RDP – Ribosomal Database Project – allineamento e identificazione The genetic fingerprints provide complex band profiles (i.e. a high number of different bands per profile) which yield a representative of the genetic structure of the community as a whole or of a section of it, defined by the selected primers. These profiles are not directly interpretable in terms of richness and evenness, since one band may originate from different species and one cell may be represented by several bands. This is particularly true with ribosomal sequences, since a single bacterial species may have several different rRNA sequences and different bacterial species may have closely related rDNA sequences. ARDRA – Amplified Ribosomal DNA Restriction Analysis Tecnica efficace, veloce, semplice ed economica per l’identificazione della composizione di comunità microbiche complesse • Permette analisi simultanea di un elevato numero di microorganismi • Fornisce importanti informazioni sulle popolazioni microbiche presenti in ambienti differenti descrivendo il loro grado di biodiversità e il loro comportamento nel tempo • Riesce a discriminare i microorganismi a livello di specie Consiste nello studio dei profili elettroforetici ottenuti dopo digestione con enzimi di restrizione della sequenza di 16S rDNA ottenuta mediante PCR ARDRA – Amplified Ribosomal DNA Restriction Analysis Su 16S/18S/26S L’ARDRA può essere utilizzata per lo screening di microorganismi coltivabili e non coltivabili 1. Isolamento dei batteri dall’ambiente naturale mediante le tradizionali tecniche di coltura/ottenimento del DNA totale dalla matrice 2. Amplificazione del 16S/18S rDNA dei singoli isolati via PCR 3. Digestione degli ampliconi ottenuti mediante l’impiego di endonucleasi 4. Separazione elettroforetica dei prodotti della digestione per ciascun amplicone e ottenimento di profili elettroforetici tipici (impronta) per ciascun amplicone digerito 5. Suddivisione dei profili ottenuti per ciascun amplicone in gruppi definiti OTU (Operational Taxonomic Units) 6. Sequenziamento del 16S/18S rDNA per il capostipite di ogni OTUs 7. Allineamento delle sequenze ottenute con quelle presente in banca dati mediante programma BLAST 8. Assegnazione dell’appartenenza a genere e specie CLONAGGIO E SEQUENZIAMENTO DEL 16S/18S rDNA COSTRUZIONE DI LIBRARY di 16S/18S rDNA 1. Estrazione del DNA totale dalla matrice ambientale di interesse 2. Amplificazione dell’intero gene16S/18S rDNA o di una regione interna di interesse 3. Inserimento del gene in vettore di clonaggio (pGEM, pBS) e ottenimento di un numero di cloni compreso tra 100 e 200 4. Screening dei cloni ottenuti mediante analisi RFLP sull’inserto (metodica ARDRA) 1kb 100bp AluI Profili ARDRA ottenuti dagli isolati da matrice ambientale PbIsol 1 2 3 4 5 6 100bp 7 8 1kb HhaI PbIsol 1 2 3 4 5 6 7 8 T-RFLP (Terminal-Restriction Fragment Lenght Polymorphism) È una tecnica che si basa sulla digestione con endonucleasi di restrizione di prodotti di PCR ottenuti direttamente dal DNA totale estratto dalla matrice ambientale Detti frammenti vengono generati da primers complementari a sequenze consenso del 16S rRNA gene, entrambi marcati all’estremità ‘5 Gli ampliconi digeriti provenienti da tutti i batteri presenti all’interno di una comunità sono separati o con elettroforesi su gel o con elettroforesi capillare. Solo i frammenti che portano l’estremità marcata vengono rilevati e contemporaneamente analizzati da un sequenziatore automatico. La T-RFLP unisce il vantaggio di poter essere facilmente applicabile per l’analisi di più campioni con quello di fornire in breve tempo informazioni a carattere tassonomico mediante il diretto sequenziamento degli ampliconi Svantaggio: tecnica molto costosa ARISA (Automated Ribosomal Intergenic Spacer Analysis) Tecnica di fingerprinting molecolare delle comunità microbiche basato sul polimorfismo di lunghezza della regione spaziatrice compresa tra i geni codificanti il 16S e il 23S rRNA (ITS – Internal Transcribed Spacers) 16S rDNA, 23S rDNA, regione intergenica 16S-23S I primers vengono disegnati su regioni conservate in modo da garantire l’amplificazione di un ampio spettro tassonomico Un primer viene marcato al 5’ con un fluoroforo → per rilevare presenza e dimensioni dell’amplicone mediante sequenziatore automatico ARISA (Automated Ribosomal Intergenic Spacer Analysis) Gli operoni ribosomali (anche gli ITS) son presenti in un ceppo microbico in copie multiple Le singole copie possono differire nelle regioni ITS a causa di inserzioni e delezioni di una o poche basi o anche di interi geni per tRNA Specie batteriche diverse avranno regioni intergeniche di lunghezza diversa Ceppi diversi appartenenti ad una stessa specie batterica possono differire per la lunghezza delle regioni ITS 1. STIMARE NUMERO DI SPECIE DIVERSE 2. STIMARE LA VARIABILITA’ ESISTENTE ALL’INTERNO DELLA STESSA SPECIE DGGE (Denaturing Gradient Gel Electrophoresis) Tecnica comunemente impiegata per studi di ecologia microbica È UNA TECNICA SEPARATIVA ELETTROFORETICA CHE PERMETTE DI IDENTIFICARE SINGOLE VARIAZIONI DI SEQUENZA IN UN FRAMMENTO DI DNA 1. Estrazione del DNA totale dalla matrice ambientale 2. Amplificazione di regioni ipervariabili del 16S o altri geni codificanti per rRNA 3. Separazione elettroforetica su gel di poliacrilammide in presenza di un denaturante chimico(urea e formammide) Come avviene la separazione elettroforetica La separazione si ottiene sfruttando la diversa mobilità elettroforetica, su gel di poliacrilammide contenente un gradiente lineare di denaturante, di molecole di DNA a doppio filamento di medesima lunghezza ma differente sequenza nucleotidica Frammenti con sequenze diverse possiedono profili di denatuazione differenti e cessano di migrare lungo il gel in corrispondenza di posizioni non uguali La denaturazione dei frammenti di DNA procede per domini di melting ovvero stretch di paia di basi aventi la stessa temperatura di denaturazione (Tm). Una volta che il dominio avente la temperatura di denaturazione più bassa raggiunge raggiunge il punto nel gel a cui corrisponde la sua Tm, si assiste al passaggio da una conformazione a elica ad una conformazione parzialmente svolta del frammento di DNA ARRESTO DELLA MIGRAZIONE DELLA MOLECOLA IN QUEL DETERMINATO PUNTO DEL GEL Quale tipo di informazione si ottiene L’analisi PCR-DGGE fornisce una serie di profili elettroforetici con una distribuzione caratteristica di bande, ciascuna riconducibile ad una specie batterica, descrivendo nel suo complesso la struttura tassonomica e il grado di diversità della comunità microbica associata alla matrice ambientale in studio I primers utilizzati All’estremità 5’ del primer forward viene aggiunto un clamp (stringa di basi nuceotidiche) in GC di circa 30-40 paia di basi, caratterizzato da una Tm più elevata rispetto a qualsiasi altra regione del frammento del DNA 16S amplificato. Il GC-clamp quindi funge da dominio ad alta temperatura di melting impedendo così la completa dissociazione del filamento di DNA in molecole a singolo filamento Questa sequenza viene co-amplificata nella reazione di PCR e incorporata nei frammenti LA DGGE VIENE CONSIDERATA UN POTENTE STRUMENTO IN GRADO DI MONITORARE ILCOMPORTAMENTO DELLE COMUNITA’ BATTERICHE A SEGUITO DI CAMBIAMENTI AMBIENTALI IN QUANTO POSSONO ESSERE ANALIZZATI SIMULTANEAMENTE MOLTI CAMPIONI COLLEZIONATI A DIVERSI INTERVALLI DI TEMPO, COSA CHE NON PUO’ ESSERE FATTA ALTRETTANTO AGEVOLMENTE CON PROCEDIMENTI DI CLONAGGIO • conoscere la composizione di una comunità microbica complessa • seguire nel tempo l’evoluzione di una comunità microbica, per esempio a seguito di un intervento di bonifica o a causa di una pressione sellettiva esercitata da un agente contaminante • monitorare la persistenza di alcuni ceppi microbici all’interno di una comunità complessa a seguito di inoculo massivo (bioaugmentation) • monitorare la presenza di genotipi di interesse all’interno della comunità microbica e la loro evoluzione nel tempo Per conoscere la composizione di una comunità microbica complessa: le bande caratteristiche dei profili possono essere tagliate da gel e successivamente sequenziate per avere una correlazione filogenetica dei membri della comunità microbica 1. 2. 3. 4. 5. Taglio delle bande maggiormente rappresentative Eluizione della banda da gel Ri-amplificazione del frammento di interesse Sub-clonaggio del frammento in un opportuno vettore Sequenziamento e confronto in banca dati il profilo DGGE può essere ibridato con sonde gruppospecifiche per determinare la presenza di una specifica popolazione batterica DG-DGGE (Double Gradient – Denaturing Gradient Gel Electrophoresis Il doppio gradiente è costituito dal gradiente chimico e da un gradiente di porosità (% di poliacrilammide) Il gradiente in porosità viene realizzato parallelamente a quello di denatura La presenza del gradiente in porosità aumenta il grado di risoluzione delle singole bande RT-DGGE (Reverse Trascriptase – DGGE) In questa variante migrano nel gel di poliacrilammide i cDNA derivanti dalla retrotrascrizione dell’RNA estratto dal campione Questa analisi fornisce importanti informazioni sulla vitalità dei microrganismi che compongono la comunità microbica di interesse TGGE (Temperature Gradient Gel Electrophoresis) In questo caso il gradiente non è costituito da un agente chimico ma dalla temperatura. Un apposito dispositivo infatti crea un gradiente di temperatura nello spazio. Gli ampliconi ottenuti con PCR vengono ancora una volta separati sfruttando la loro diversa Tm DGGE (Denaturing Gradient Gel Electrophoresis) LIMITI • La DGGE è in grado di evidenziare solo gli amplificati ottenuti dalle specie predominanti presenti nella comunità, infatti non è possibile ottenere la separazione di tutti i frammentidi16S rDNA (o di altri geni target)ottenuti dall’intera gamma di microorganismi presenti all’interno di una matrice complessa Numerosi studi hanno mostrato che solo le popolazioni batteriche rappresentanti l’1% o aliquote maggiori della comunità microbica possono essere evidenziate mediante PCR-DGGE • Con la DGGE è possibile separare solo frammenti di piccole dimensioni,fino a 500 bp • spesso si osserva la migrazione nella stessa posizione di frammenti di DNA di diversa sequenza ma con comportamento di melting molto simile che rende difficile il recupero di essi dal gel di poliacrilammide D2 D1 I II III I II E1 D3 III I II III I E2 II III I II E3 III I II F1 III I II F2 III I II F3 III I II G III H SSCP (Single-Stranded Conformational Polymorphism) Come la DGGE è una tecnica che permette di studiare le diversità di comunità microbiche complesse attraverso l’analisi dei geni 16S rDNA I prodotti di PCR ottenuti vengono digeriti con esonucleasi in modo da ottenere singoli filamenti In condizioni non denaturanti i singoli filamenti assumono una diversa conformazione in base alla loro sequenza nucleotidica Quindi, a causa della loro diversa mobilità elettroforetica, le diverse conformazioni possono essere separate per elettoforesi su gel di poliacrilammide in condizioni non denaturanti Le analisi SSCP richiedono un’elevata ottimizzazione delle condizioni operative e basse temperature di lavoro. La capacità discriminatoria della SSCP, generalmente più efficiente per frammenti fino a 400 bp, dipende dalla posizione delle variazioni nella sequenza del gene studiato I prodotti possono essere rilevati marcando uno o entrambi i primers con composti fluorescenti METODICHE DI TIPIZZAZIONE RAPD (Random amplified polymorphic DNA) Analisi di variabilità tra ceppi batterici Non impiegata per analisi di comunità Amplificazione sul DNA genomico utilizzando un singolo oligonucleotide, generalmente molto corto (10 bp), come innesco generazione di più frammenti di diversa bassa stringenza lunghezza (variabile da 100 a 2000 bp) Separazione elettroforetica su gel di agarosio o poliacrilammide: ottengo impronta molecolare del microrganismo analizzato Ceppi batterici diversi possono dare profili RAPD diversi: tanto maggiore è la differenza tra ceppi tanto maggiore è la differenza tra i profili ottenuti Repetitive element sequence based PCR – rep-PCR genomic fingerprinting Rep-PCR is molecular biology based method very suitable for rapid grouping and tentatively identification of microorganisms. Eukaryotic and prokaryotic DNA contains socalled repetitive DNA elements distributed more or less randomly over the genome. In rep-PCR primers that anneals to these repetitive elements are used. The PCR-products are separated using agarose gel electrophoresis and a species (sometimes strain)-specific pattern is obtained. These patterns can be analysed using e.g. BioNumerics. Isolates with similar patterns (i.e. belonging to the same species) will cluster together. Full identification can be achieved by e.g. sequencing a limited number of isolates from each group within the cluster. Various rep-PCRprimers have been developed. The primer GTG5 (5’GTG GTG GTG GTG GTG 3’) seems to be very suitable for grouping of LAB and yeast at the species level, but other primers may prove better depending on the specific task (use the same over all approach, just change primers and possibly annealing and elongation temperature). Repetitive element sequence based PCR – rep-PCR genomic fingerprinting Three categories of conserved repetitive sequences are used for bacterial typing: 1. the enterobacterial repetitive intergenic consensus sequence ERIC; they are127-bp imperfect palindromes that occur in multiple copies in the genomes of enteric bacteria and vibrios 2. the repetitive extragenic palindromic sequence REP; 3. The BOX element. Often, the three categories are used in combination in order to achieve better discrimination. rep-PCR BOX-PCR FINGERPRINTING A highly conserved repeated DNA element has been identified in the chromosome of Streptococcus pneumoniae (pneumococcus) and given the name of the BOX repetitive element. This was the first demonstration of the presence of such a repetitive DNA moiety in a Gram positive bacterial species. Approximately 25 of these elements are found in noncoding regions dispersed throughout the entire pneumococcal genome. The BOX repeat is found to consist of three discriminate regions: boxA, boxB, and boxC, which are 59, 45, and 50 basepairs in length, respectively. Various different combinations of these three elements are found to be present in different BOX loci and limited sequence heterogeneity is encountered among different elements from the same strain or elements sequenced from different strains. The first publication on the BOX repetitive elements also described its intricate secondary structure, supported by compensating basepairing in different loci where the repeat is Encountered. Moreover, their location in the vicinity of genes involved in the regulation of various aspects of bacterial competence, genetic transformation and virulence suggest that the elements might well be involved in coordination of the control of gene expression. More recently has been demonstrated that the presence of a BOX element is associated with variation in colony opacity of the pneumococcus. The frequency with which the colonies switched from transparent to opaque clearly depended on the presence of boxA and boxC elements. It has also been shown that BOX elements form targets for site-specific recombination events, which provides another possibility AFLP (Amplified Fragment Lenght Polymorphism) Tecnica di fingerprinting molecolare che si basa sulla restrizione e amplificazione del DNA 1. Restrizione – il DNA viene digerito con enzimi di restrizione in modo da produrre frammenti di dimensioni inferiori a 1kb 2. Ligazione – i frammenti vengono ligati ad adattatori che presentano le estremità complementari ai siti di taglio 3. Amplificazione – con primer disegnati su sequenza oligonucleotidica degli adattatori. L’aggiunta di una o due basi al 3’ della sequenza dei primers riduce il numero dei frammenti che vengono amplificati 4. Separazione – elettroforesi su gel di poliacrillamide; elettroforesi capillare mediante l’uso di sequenziatori automatici Applicazioni: identificazione di ceppi batterici (patogeni), studi di genetica di popolazioni microbiche PULSED FIELD GEL ELECTROPHORESIS PFGE uses molecular scissors, called restriction enzymes, to cut bacterial DNA at certain locations known as restriction sites. These molecular scissors are selected to generate a small number of DNA pieces that can be separated based on size. Usually these DNA pieces, or restriction fragments, are large and need to be specially treated and separated to generate a DNA fingerprint. - First the bacteria are loaded into an agarose suspension, similar to gelatin, - then the bacterial cell is opened to release the DNA. - Once the DNA is released then the agarose and DNA suspension, also known as a plug, is treated with restriction enzymes. - The treated plugs are then loaded onto an agarose gel and the restriction fragments are separated based on size using an electric field. - What makes PFGE different from how scientists usually separate DNA is because PFGE can separate several large restriction fragments. To do this an electric field that constantly changes direction to the gel is used to generate a DNA fingerprint. Advantages of PFGE PFGE subtyping has been successfully applied to the subtyping of many pathogenic bacteria and has high concordance with epidemiological relatedness. PFGE has been repeatedly shown to be more discriminating than methods such as ribotyping or multi-locus sequence typing for many bacteria. PFGE in the same basic format can be applied as a universal generic method for subtyping of bacteria. Only the choice of the restriction enzyme and conditions for electrophoresis need to be optimized for each species. DNA restriction patterns generated by PFGE are stable and reproducible. Limitations of PFGE Time consuming Requires a trained and skilled technician Does not discriminate between all unrelated isolates Pattern results vary slightly between technicians Can’t optimize separation in every part of the gel at the same time Don’t really know if bands of same size are same pieces of DNA Bands are not independent Change in one restriction site can mean more than one band change “Relatedness” should be used as a guide, not true phylogenetic measure Some strains cannot be typed by PFGE FISH (Fluorescence In situ Hybridisation) È una metodica frequentemente utilizzata in microbiologia ambientale per lo studio di comunità microbiche complesse L’ibridazione,basata sull’impiego di oligonucleotidi marcati con composti fluorescenti, viene indotta su cellule intere fissate Le cellule bersaglio vengono osservate con un microscopio a epifluorescenza L’impiego di sonde molecolari prevede la conoscenza del gene da studiare. Quando il gene target è il 16S possono essere costruite sia sonde universali in grado di appaiarsi con gli rRNA di eubatteri o archebatteri su regioni conservate,sia sonde specie-specifiche aventi come bersaglio le regioni altamente variabili dell’rRNA La FISH può essere applicata sia per monitorare la presenza di particolari gruppi di microorganismi in una matrice complessa, sia per individuare la presenza di una determinata specie batterica The sample is first fixed to stabilize the cells and permeabilize the cell membranes. The labelled oligonucleotide probe is then added and allowed to hybridize to its intracellular targets before the excess probe is washed away. The sample is then ready for single-cell identification and quantification by either epifluorescence microscopy or flow cytometry. FISH CULTURE-INDEPENDENT methods IBRIDAZIONE SU MICROARRAY TECNOLOGIA GENOMICA utilizzata per lo studio dell’espressione genica e per la ricerca di mutazioni puntiformi MICROARRAY: supporto solido (plastica, vetro) cui sono adesi in modo covalente e in una disposizione ordinata acidi nucleici che funzionano come sonde Estrazione del DNA o RNA dal ceppo batterico Frammentazione e marcatura con fluorocromi Ibridazione con le sonde fissate sul microarray Analisi con uno scanner a fluorescenza per rilevare quale sonda ha ibridato 1. Quali sequenze e quali geni sono presenti anche nel ceppo o campione ambientale analizzato 2. Quanti e quali geni sono espressi in quel ceppo IBRIDAZIONE SU MICROARRAY In contesto microbiologico-ambientale: Collezioni di geni funzionali Per evidenziare la presenza di geni che codificano enzimi coinvolti nei processi biogeochimici Collezioni di geni marcatori tassonomici (16S rDNA) Per identificare le specie presenti in un campione ambientale Metodo molto potente in quanto permette di descrivere una comunità batterica in ‘tempo reale’ Interi genomi di ceppi di riferimento Per valutare le differenze nel contenuto genomico tra un ceppo di riferimento e un ceppo naturale isolato nell’ambiente METAGENOMICA ISOLAMENTO DIRETTO DI DNA DALL’AMBIENTE E SUO SUCCESSIVO CLONAGGIO E SEQUENZIAMENTO è un potente strumento per la scoperta della genetica e fisiologia dei microrganismi non coltivabili isolamento del DNA genomico dall’ambiente clonaggio del DNA in apposito vettore trasformazione di un ceppo ricevente screening della libreria metagenomica così ottenuta Selezione dei cloni Sequenziamen per PCR o ibridazione to casuale (per la presenza di massivo marcatori filogenetici o di geni di interesse) Selezione dei cloni per espressione di un fenotipo particolare (specifiche attività enzimatiche o produzione di antibiotici) L’ANALISI STATISTICA I trattamenti statistici utilizzati includono quattro diversi livelli di analisi Quantificazione della diversità genetica Confronto dei profili (aplotipi): numero di bande diverse o in comune Misura della distanza genetica Misura del rapporto tra le bande condivise tra i due campioni rispetto alle bande totali presenti Analisi della struttura genetica Per correlare la diversità osservata alle variabili presenti nell’ambiente e quindi dare significato biologico-funzionale alle differenze osservate AMOVA (analisi della varianza molecolare) Analisi multivariata Analisi delle relazioni genetiche tra le popolazioni Stima della distanza tra sequenze con numero di nucleotidi differenti UPGMA L’evoluzione è il processo per il quale i cambiamenti che intervengono in una linea di discendenti portano, nel tempo, alla formazione di nuove varietà, ed eventualmente di nuove specie di organismi. L’evoluzione avviene in ogni sistema autoreplicantesi in cui la variazione è il risultato del processo di mutazione e la selezione si basa sulla capacità adattativa differenziale. Così nel tempo evolvono sia le cellule sia i virus. Le relazioni evolutive tra gli organismi sono oggetto di studio della filogenesi. Le relazioni filogenetiche tra cellule possono essere dedotte confrontando l’informazione genetica (sequenza nucleotidica o amminoacidica) che esiste nei loro acidi nucleici o nelle proteine. Le macromolecole che formano il ribosoma , RNA ribosomali, sono strumenti eccellenti per valutare le relazioni evolutive. ATTTTGTTCACTAATAGGGGGCGATTGGGCCGACGTCGCATGCTCCCGGCCGCCATGGCGGCCGCGG GAATTCGATTACGGCTACCTTGTTACGACTTCACCCCAGTCATCGGCCACACCGTGGCAAGCGCCCTCC CGAAGGTTAAGCTACCTGCTTCTGGTGCAACAAACTCCCATGGTGTGACGGGCGGTGTGTACAAGGCC CGGGAACGTATTCACCGCAGCAATGCTGATCTGCGATTACTAGCGATTCCGACTTCATGGAGTCGAGTT GCAGACTCCAATCCGGACTGAGATAGGGTTTCTGGGATTGGCTTACCGTCGCCGGCTTGCAGCCCTCT GTCCCTACCATTGTAGTACGTGTGTAGCCCTGGCCGTAAGGGCCATGATGACTTGACGTCATCCCCACC TTCCTCCGGTTTGTCACCGGCGGTCTCCTTAGAGTTCCCACCATTACGTGCTGGCAACTAAGGACAAGG GTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACGCGAGCTGACGACAGCCATGCAGCACCTG TGTTCGAGTTCCCGAAGGCACCAATCCATCTCTGGAAAGTTCTCGACATGTCAAGGCCAGGTAAGGTTC TTCGCGTTGCATCGAAATTAAACCACATACTCCACCGCTTGTGCGGGCCCCCGTCAATTCCTCTGAGTTT CAGTCTTGCGACCGTACTCCCCAGGCGGCGAACTTAACGCGTTAGCTTCGATACTGCGTGCCAATTGCA CCCCAACATCCAGTTCGCATCGTTTAGGGCGTGGACTACCAGGGTATCTAATCCTGTTTGCTCCCCACG CTTTCGTGCCTCAGTGTCAGTGTTGGTTCCAGGTAGCTGCCTTTCGCCAATGAGATGTTCCTTCCCGATC TCTACGCATTTCCACTGCTACACCGGGAATTTCCGCTACCCTTCTACCACACTTCTAGTTGTCAGTTTCCA CCTGCAGTTCCCAGGGTTGGAGGCTCAGGGCTTTTCCACAACAGACTTAAACAAACCCACCCTACGCA CGCCTTTAGCGCCCAGGTAATTCCGGAGTTACGGCTTGCACCCCTTTCGTATTACCGGCGGCTGCCTGG ACGAAGTTACCGGTGCCTTATTCTTTGGAACCGTCTATCCCGACCAAGATTACGCTTGAATCCTTTCCAC AAGCCTTTACAACTCGGAGCCTCTATTTCA http://www.ncbi.nlm.nih.gov/genbank/ GenBank Overview What is GenBank? GenBank ® is the NIH genetic sequence database, an annotated collection of all publicly available DNA sequences (Nucleic Acids Research, 2013 Jan;41(D1):D36-42). GenBank is part of the International Nucleotide Sequence Database Collaboration , which comprises the DNA DataBank of Japan (DDBJ), the European Molecular Biology Laboratory (EMBL), and GenBank at NCBI. These three organizations exchange data on a daily basis. The complete release notes for the current version of GenBank are available on the NCBI ftp site. A new release is made every two months. GenBank growth statistics for both the traditional GenBank divisions and the WGS division are available from each release. An example of a GenBank record may be viewed for a Saccharomyces cerevisiae gene. Choose a BLAST program to run. Program Program Description nucleotide blast Search a nucleotide database using a nucleotide query Algorithms: blastn, megablast, discontiguous megablast protein blast Search protein database using a protein query Algorithms: blastp, psi-blast, phi-blast, delta-blast blastx Search protein database using a translated nucleotide query tblastn Search translated nucleotide database using a protein query tblastx Search translated nucleotide database using a translated nucleotide query 1) Connect to the NCBI BLAST Homepage with your browser. http://www.ncbi.nlm.nih.gov/BLAST/ 2) In the Nucleotide section on the page choose the link to the Nucleotide-nucleotide BLAST (blastn) search algorithm 3) Enter your DNA sequence into the Search text box Copy your DNA sequence by either selecting the sequence with the mouse and using the Copy command in the Edit menu of your browser. Click on the Search dialog box in the NCBI window and paste your DNA sequence into the box by choosing the Paste command under the Edit menu, or the paste keyboard command. If you only want to search with a subset of your sequence you can select these bases by putting in the appropriate numbers in the Set subsequence dialog boxes. However it is often easier just to edit the sequences that you want in text edit program (Word), and paste them in. . 4) Seelct the default (nr) database in the Choose database menu box. There are many different databases that you can choose among to do your searches. Some databases only contain DNA or protein sequences for a specific organism, such as humans or mouse. Others contain different types of DNA (genomic vs cDNA sequences, etc.). To search only a specific database, click on the Database Menu box and while holding on the mouse button, scroll to the database you want, and release the mouse button. The nr is the default value. The nr nucleotide database search includes all Nonredundant GenBank + EMBL + DDBJ + PDB sequences (but no EST, STS, GSS, or HTGS sequences). The nr peptide sequence database includes all non-redundant GenBank CDS (coding sequence) translations + PDB + SwissProt + PIR + PRF. Note that the program is smart enough to determine which nr database to search according to which blast program you run (e.g. peptide database for blastp, nucleotide database for blastn). If you want to search the EST sequences, you have to do a separate blast 5) Click on the BLAST! button to perform the search. To run the Blast search click on the BLAST! button. However, if desired, there are other options that you may want to alter before doing your search to reduce or increase the number of matches or to change the output from of the data from the search. A short description of these options is shown below. http://eztaxon-e.ezbiocloud.net/ezt_identify Task s R a Name n k 1 2 3 4 5 6 7 8 Strain Authors Taxonomy Pairw ise Diff/ Access Simil Total ion arity nt (%) Lysobacter Bacteria; Proteobacteria; Gammaproteobacteria; GH19- Weon et al. yangpyeong Xanthomonadales; Xanthomonadaceae; Lysobacter; 3(T) 2006 ensis Lysobacter yangpyeongensis; Bacteria; Proteobacteria; Gammaproteobacteria; Lysobacter YC6269 Aslam et al. Xanthomonadales; Xanthomonadaceae; Lysobacter; oryzae (T) 2009 Lysobacter oryzae; Bacteria; Proteobacteria; Gammaproteobacteria; Lysobacter GH1- Weon et al. Xanthomonadales; Xanthomonadaceae; Lysobacter; daejeonensis 9(T) 2006 Lysobacter daejeonensis; Stenotropho Bacteria; Proteobacteria; Gammaproteobacteria; ICB Ramos et al. monas Xanthomonadales; Xanthomonadaceae; 89(T) 2011 pavanii Stenotrophomonas; Stenotrophomonas pavanii; ATCC Gray and Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomona 23328( Thornton Xanthomonadales; Xanthomonadaceae; s pictorum T) 1928 Stenotrophomonas; Pseudomonas pictorum; ATCC Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomona 19867( Moniz 1963 Xanthomonadales; Xanthomonadaceae; s hibiscicola T) Stenotrophomonas; Pseudomonas hibiscicola; Stenotropho Bacteria; Proteobacteria; Gammaproteobacteria; TR6Yang et al. monas Xanthomonadales; Xanthomonadaceae; 01(T) 2006 koreensis Stenotrophomonas; Stenotrophomonas koreensis; Bacteria; Proteobacteria; Gammaproteobacteria; Lysobacter ZLDZhang et al. Xanthomonadales; Xanthomonadaceae; Lysobacter; bugurensis 29(T) 2011 Lysobacter bugurensis; Comp leten ess (%) meg aBLA BLASTN ST score score DQ191 47.47 622/1 99.7 179 47.47 184 0 EU376 47.17 626/1 97.0 963 47.17 185 0 DQ191 45.95 640/1 99.7 178 45.95 184 0 FJ748645.62 640/1 100 83 45.62 177 0 AB021 45.62 640/1 98.7 392 45.62 177 0 AB021 45.54 641/1 98.8 405 45.54 177 0 AB166 45.42 644/1 99.7 885 45.42 180 0