Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Tecniche di spettrometria di massa applicabili all’analisi del proteoma
In proteomica, la spettrometria di massa non rappresenta soltanto la procedura di
elezione per ottenere misure precise della massa dei polipeptidi o dei loro prodotti
di frammentazione proteolitica. Le informazioni più rilevanti che si possono avere
dalle analisi effettuate con le configurazioni più evolute dello spettrometro di
massa (tandem MS) consentono infatti di descrivere degli stessi polipeptidi anche
la struttura primaria e, quindi, di ottenerne la completa identificazione.
Peraltro, l’elevata affidabilità delle identificazioni ottenibili utilizzando i dati forniti
dall’analisi spettrometrica si basa proprio sulla altissima precisione con la quale si
possono misurare le masse molecolari. La misura sperimentale della massa di un
polipeptide comporta infatti un errore non superiore allo 0,001%. Per fare un
esempio la massa relativa di un polipeptide di PM 35.000 si determina con un
errore inferiore a 4 unità di massa atomica. Con questa precisione delle misure è
quindi possibile rilevare con accuratezza anche modificazioni post-traduzionali
delle proteine allo studio. Diminuendo la Mr delle molecole, la precisione delle
misure è ancora più elevata.
Per esempio, la misura della massa di un
oligopeptide di Mr = 1000 dà un errore minore di 10 ppm.
Come è fatto uno spettrometro di massa
Sono applicabili all’analisi proteomica molteplici configurazioni strumentali dello
spettrometro di massa. Tali configurazioni si differenziano per il sistema di
ionizzazione, per il sistema di rivelazione e, soprattutto, per l’analizzatore, cioè per il
componente che definisce l’intervallo delle masse rilevabili e conferisce allo
strumento le sue caratteristiche di sensibilità e risoluzione.
Ogni spettrometro di massa è costituito di tre componenti fondamentali:
1. la sorgente di ioni, dove le molecole (che nell’analisi proteomica sono
peptidi) vengono ionizzate.
2. l’analizzatore; applicando un campo elettrico, i peptidi carichi vengono
trasferiti dalla sorgente all’analizzatore dove sono separati in funzione del
valore del loro rapporto massa/carica (m/z).
1
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
3. il detector; una volta separati nell’analizzatore, gli ioni vengono rilevati dal
detector e i dati (intensità del segnale per ciascun valore di m/z) sono
raccolti in un foglio elettronico dal quale viene esportato in forma grafica lo
spettro di massa (valore m/z in ascisse e intensità del segnale in ordinate).
sorgente
di
ioni
analizzatore
Introduzione
del
campione
detector
data
system
Fig. 1. Le parti componenti uno spettrometro di massa.
Le molecole dell’analita vengono ionizzate nella sorgente e gli ioni sono accelerati da un
campo elettrico. L’analizzatore separa gli ioni provenienti dalla sorgente in base al loro rapporto
massa/carica (m/z). Per ogni valore del rapporto m/z il detector rileva la quantità degli ioni che
provengono dall’analizzatore. I dati rilevati vanno a popolare una tabella alla quale fanno
riferimento i successivi processi di elaborazione informatica.
Nell’analizzatore e nel detector si
mantiene un alto vuoto per limitare la probabilità che collisioni con molecole gassose disturbino la
migrazione degli ioni provenienti dalla sorgente.
La sorgente di ioni
Le modalità di introduzione del campione nella sorgente di ioni dipende dal tipo
di sorgente presente nello strumento. In alcune sorgenti il materiale da analizzare
deve venire introdotto “manualmente” mentre in altre viene trasferito da un
sistema cromatografico o elettroforetico opportunamente interfacciato.
La ionizzazione che si produce nella sorgente può essere elettronica o chimica, le
due tecniche storiche di ionizzazione per piccole molecole volatili e termolabili. Si
può
produrre
la
ionizzazione
anche
mediante
protonazione
o
per
bombardamento con atomi veloci (Fast atom bombardment, Fab, la tecnica
antesignana nella spettrometria di massa applicata alle proteine) oppure
applicando metodi di desorbimento che consentono di ottenere in un unico step
l’evaporazione e la ionizzazione dei peptidi.
Nella sorgente, oltre alla ionizzazione, si ha il passaggio dell’analita dallo stato
2
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
solido o di soluzione allo stato aeriforme.
Sorgente MALDI (Matrix assisted laser desorption ionisation)
La tecnologia MALDI (Matrix-Assisted Laser Desorption Ionization) e la sua
evoluzione denominata con l’acronimo SELDI (Surface-Enhanced Laser Desorption
Ionization) sono basate su un metodo di desorbimento/ionizzazione che permette
di studiare in maniera semplice ed altamente produttiva molecole non volatili
quali proteine e acidi nucleici tramite spettrometria di massa.
La tecnologia di ionizzazione MALDI si basa sull’eccitazione delle molecole del
campione con un raggio laser per produrne la vaporizzazione e la ionizzazione.
Nella sorgente MALDI il campione contenente un peptide o una miscela di peptidi
viene dissolto in un eccesso di matrice (acido sinapinico o alfa-ciano-4idrossicinnamico), sostanze che assorbono le frequenze emesse dalla sorgente
laser che viene utilizzata per l’eccitazione.
ac sinapinico
ac α-ciano-4-idrossicinnamico
Fig. 2. Struttura chimica di due acidi frequentemente utilizzati come matrice nelle sorgenti MALDI
Un piccolo volume della miscela (1-2 µl) viene deposto in uno dei pozzetti scavati
sulla superficie del target. In un’analisi-tipo si fa in modo che la quantità di
campione contenuto in ciascun pozzetto sia dell’ordine delle picomoli.
L’operazione viene ripetuta per tutti i campioni da analizzare. Dopo avere
allontanato il solvente, quando la miscela campione/matrice contenuta in
ciascun pozzetto si trova allo stato di solido amorfo, il target viene collocato nella
3
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
sorgente MALDI. La sorgente viene messa sotto vuoto e quindi, in sequenza, i
pozzetti vengono investiti da un raggio laser pulsato (337 nm).
Quando uno dei pozzetti viene investito dal raggio laser, le molecole della matrice
assorbono l’energia della radiazione incidente (le molecole dei peptidi disciolti
nella matrice non vengono direttamente eccitati dai fotoni della luce incidente e
quindi non subiscono modificazioni chimiche di alcun genere, ad eccezione di un
processo di protonazione).
Fig. 3. I pozzetti del target contengono gli analiti disciolti in un eccesso della matrice. Dopo avere
posizionato il target, nel comparto sorgente si fa il vuoto. I pozzetti vengono colpiti in sequenza dal
raggio laser pulsato.
L’energia assorbita dalle molecole della matrice è sufficiente a portarle dalla fase
di solido amorfo alla fase di vapore. In questo processo di vaporizzazione della
matrice anche le molecole di soluto (peptide) vengono trascinate in fase vapore.
Gli ioni peptidici in fase vapore sono sottoposti ad un forte campo elettrico che li
accelera verso la griglia, superata la quale entrano nell’analizzatore.
4
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Laser pulsato
ioni del peptide
All’analizzatore
di massa
ioni della
matrice
Miscela
peptidipeptidi-matrice
Fig. 4. Rappresentazione schematica dei processi che si verificano in una sorgente MALDI
Electrospray ionisation
L’ESI (electrospray ionization) è una delle più semplici e flessibili tecniche di
ionizzazione che si possono adottare per l’analisi di massa dei peptidi, opera a
pressione ambiente e a temperature moderate ed è probabilmente il metodo di
ionizzazione più blando. Questo metodo di ionizzazione può venire applicato
all’analisi spettrometrica di molecule polari, quali sono i polipeptidi, in un range di
massa compreso fra 102 e 106 Da.
Nella ionizzazione ESI il campione, trasportato da un flusso di 1-2 µl/min di solvente
contenente tracce di un acido volatile (acido metanoico o trifluoroacetico),
emerge da un capillare di acciaio di diametro interno 75-100 µm (in rosso nella
figura). Un flusso coassiale di gas inerte (azoto) produce la formazione di un
aerosol
all’uscita
del
capillare
metallico.
Fra
il
capillare
metallico
e
il
controelettrodo è applicata una differenza di potenziale di circa 5000 V. In queste
condizioni, le molecole di soluto dissolte nelle particelle liquide che formano
l’aerosol assumono carica positiva. Nel breve spazio che separa il capillare e il
controelettrodo, per evaporazione del solvente, si ha un aumento della carica
5
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
specifica delle particelle di liquido che, per repulsione coulombiana fra cariche
omologhe, si frammentano in particelle di minori dimensioni. Il processo di
frammentazione si ripete più volte fino alla completa evaporazione del solvente
ed alla formazione di una popolazione di ioni positivi singoli non solvatati.
Nel campo elettrico applicato gli ioni positivi vengono accelerati verso il polo
negativo e, passando attraverso il cono campionatore, entrano in una zona a
bassa pressione dalla quale, attraversando lo skimmer, entrano nell’analizzatore
dove è praticato un vuoto molto più spinto.
Nell’esempio sopra descritto la carica positiva dei peptidi è dovuta alla
protonazione di uno o più gruppi funzionali basici. È possibile operare anche
mediante ionizzazione negativa, aggiungendo alla soluzione carrier tracce di
ammoniaca invece che di acidi (nella ionizzazione negativa viene ovviamente
invertito il campo elettrico fra capillare metallico e controelettrodo). Per l’analisi di
peptidi si usa sempre la ionizzazione positiva.
cono campionatore
skimmer
-
+
Eluato HPLC
ANALIZZATORE
Flusso coassiale
di gas inerte
pressione
atmosferica
basso vuoto
alto vuoto
(10-7 . 10-8 bar)
Fig. 5. Rappresentazione schematica di una sorgente ESI
Il fatto che alcuni peptidi possono portare cariche multiple risulta essere un
vantaggio perché consente di analizzare anche molecole con elevato PM.
6
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
È d’altra parte possibile conoscere lo stato di carica di un peptide: se il peptide
porta una sola carica elettrica lo ione monocarica (M+H)+ ha un rapporto m/z pari
a (M+H)/1 mentre se lo ione ha due cariche (M+2H)2+, il rapporto m/z sarà
(M+2H)/2 e così via. Lo spettro di massa è ovviamente più complesso di quello che
si avrebbe se
tutti i peptidi avessero carica unitaria ma questa maggiore
popolazione dello spettro di massa può essere semplificata valutando la
corrispondenza fra i valori di M che derivano, applicando un semplice calcolo, da
diversi valori m/z.
Un’altra apparente complicazione deriva dalla presenza in natura di quantità non
trascurabili di isotopi del carbonio con massa 13. Per ogni peptide, oltre alle righe
spettrali con il valore di m/z atteso si possano quindi osservare righe di minore
intensità con rapporto m/z maggiore di una unità. Anche questa “complicazione”,
dovuta al fatto che nel peptide un atomo di carbonio di massa 12 è sostituito
dall’isotopo naturale di massa 13, fornisce un’ informazione importante: ci dice
che lo ione analizzato è monocarica. Se lo ione fosse stato bi-carica (due volte
protonato), la differenza del rapporto massa carica fra la riga principale e quella
a m/z maggiore non sarebbe stata di una unità ma di 0,5 unità di massa.
Un vantaggio importante della tecnica ESI sulla tecnica MALDI è che la sorgente
può essere facilmente interfacciata con un sistema cromatografico, ciò
consentendo di analizzare miscele complesse di proteine o peptidi, la cui
separazione può venire effettuata a monte dello spettrometro, senza bisogno di
ricorrere alla loro separazione con metodi cromatografici o elettroforetica off-line.
In uno strumento MALDI-TOF, la massa degli ioni generati nella sorgente viene
misurata per mezzo di un analizzatore a tempo di volo (time of flight, TOF). In
questo dispositivo, il rapporto m/z (massa su carica) dello ione peptidico viene
derivato dal tempo impiegato dallo ione, che nella sorgente è stato accelerato
dal campo elettrico, per percorrere il tubo di volo (uno spazio confinato, libero da
campi elettrici), e giungere al rivelatore. Considerando il tipo di misura che viene
usato per ottenere i valori di massa, è evidente la necessità di usare impulsi della
sorgente laser di durata molto breve (quanto più breve è la durata di ogni singolo
impulso tanto maggiore è la precisione delle misure che si ottengono).
7
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Analizzatore di massa
a) TOF (analizzatore a tempo di volo)
La spettrometria di massa MALDI-TOF è molto usata in proteomica, essendo
sensibile, veloce e affidabile. Un ulteriore vantaggio deriva dal fatto che piccole
quantità di sali non volatili presenti nel campione o residui dei tamponi
comunemente utilizzati per il trattamento delle proteine prima dell'analisi
spettrometrica sono ben tollerate dallo spettrometro di massa MALDI-TOF. Lo
svantaggio che presenta questa tecnica è che, per poterla identificare con un
sistema MALDI-TOF, la proteina da studiare deve essere quasi pura. Se in uno spot
ottenuto da 2DE sono presenti più proteine e se queste non sono presenti nello
stesso rapporto molare, la strumentazione MALDI-TOF non consente talora una
sufficientemente buona identificazione delle proteine componenti la miscela.
vaporizzazione
Ionizzazione
accelerazione
a
uls
rp
e
s
La
+
+
+
+
+
“volo”
to
detector
+
+
+
ddp
Fig. 6. Il tempo di volo di uno ione è una funzione del suo rapporto m/z.
Gli ioni con valore più alto del rapporto m/z raggiungono il detector più lentamente (hanno un
tempo di volo maggiore) degli ioni con valori di m/z più basso.
La relazione fra tempo di volo e rapporto m/z si può derivare come segue:
a) l’energia cinetica Ec di uno ione di carica z accelerato nel campo elettrico
generato dalla differenza di potenziale applicata V è:
8
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
m • v2
Ec = z • V =
2
b) la velocità v con cui lo ione si muove dopo l’iniziale accelerazione è data
dal rapporto fra la lunghezza del volo L e il tempo t impiegato a percorrerlo
L
t
V=
L’equazione precedente si può quindi scrivere nella maniera seguente:
m
z
2V • t2
=
L2
Da ciò deriva che, per un dato valore del rapporto m/z il tempo di volo t è:
t=L•
1
2V
•
m
z
Fig. 7. MALDI-TOF corredato con dispositivo reflectron
La risoluzione di uno spettrometro MALDI-TOF è stata ulteriormente migliorata
disponendo di fronte alla sorgente di ioni, invece del rivelatore, un reflectron. Il
9
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
reflectron è costituito da una serie di anelli che, essendo loro applicato un
potenziale crescente, agiscono da specchi elettrostatici. Gli ioni con uguale
massa ma con una leggera differenza di energia vengono rallentati, riflessi e
accelerati nuovamente dal reflectron.
L'aumento del tempo di volo che ne consegue consente il raggiungimento di una
maggior precisione della misura del valore del rapporto m/z.
b) Analizzatore a quadrupolo
Gli ioni accelerati dal campo elettrico nella sorgente vengono “sparati” all’interno
del quadrupolo analizzatore. Nel loro percorso all’interno del quadrupolo gli ioni
vengono separati in base al loro rapporto m/z sfruttando la deflessione della
traiettoria indotta da un campo elettrico sul moto di una particella carica che lo
attraversi.
Il quadrupolo è costituito da quattro barre cilindriche di acciaio disposte come
mostrato in fig. 8.
Figura 8. Alcuni quadrupoli montati negli spettrometri di massa. Il quadrupolo analizzatore è
costituito di quattro barre metalliche. Ogni coppia di barre opposte è connessa elettricamente. Fra
le due coppie di barre è applicata una differenza di potenziale che oscilla con una
radiofrequenza variabile nel tempo.
A
due
barre
diametralmente
opposte
viene
applicato
un
potenziale
+(U+Vcos(ω
ωt)) (+ nella fig. 9) mentre alle altre due barre (- nella fig. 9) viene
applicato un potenziale -(U+Vcos(ω
ωt)), dove U è un potenziale costante e
10
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Vcos(ω
ωt) è il prodotto della ampiezza V della radiofrequenza per il coseno del
prodotto della frequenza ω per il tempo t..
I potenziali applicati alle coppie di barre opposte variano sinusoidalmente nel
tempo così che la traiettoria degli ioni che attraversano il quadrupolo, sottoposti a
forze che variano con legge sinusoidale, percorrono traiettorie complesse
dipendenti dal loro rapporto m/z. Per una determinata combinazione di U, V, w,
soltanto gli ioni che hanno un determinato valore m/z entrano in risonanza con il
campo elettrico variabile e riescono quindi ad attraversare tutto il quadrupolo e a
raggiungere il detector. Tutti gli altri ioni con rapporto m/z diverso non
raggiungono il detector.
Variando la radiofrequenza da un valore ad un altro cambia il valore del rapporto
m/z per il quale si ha la risonanza. Applicando al quadrupolo radiofrequenze
variabili nel tempo si ottiene quindi lo spettro di massa del campione sotto analisi,
si rileva cioè ciascuno degli ioni di differente rapporto m/z contenuti nel
campione.
ione risonante
ione non risonante
sorgente
Figura 9. Fra gli ioni “sparati”dalla sorgente all’interno del quadrupolo soltanto quelli che hanno
un determinato valore del rapporto massa/carica (m/z) possono compiere l’intera traiettoria che
consente di uscire dal quadrupolo e raggiungere il detector. Gli ioni che, per il loro valore m/z, non
risuonano con la radiofrequenza imposta cambiano traiettoria, collidono con le barre e non
vengono rilevati. Cambiando radiofrequenza, altri ioni raggiungono il detector. Lo spettro di massa
si ottiene facendo variare la radiofrequenza e rilevando gli ioni che raggiungono il detector per
ogni radiofrequenza applicata.
11
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Detector
I sistemi di rilevazione utilizzati negli spettrometri di massa possono essere di natura
diversa. I principali sono il “channeltron” e il “tubo elettromoltiplicatone”.
Il Channeltron è un dinodo, la cui struttura ricorda quello di un corno, rivestito
(all’interno) di materiale semiconduttore. I capi del channeltron sono mantenuti
ad un elevata differenza di potenziale (l’ingresso è a terra per permettere la
raccolta di ioni di entrambe le polarità); gli ioni incidenti sulle pareti interne del
channeltron provocano l’emissione di elettroni. Il segnale viene amplificato per
effetto cascata. L’amplificazione del channeltron è elevata (108): per ogni ione
incidente si genera alla fine del cono un segnale che viene registrato dal sistema
di conteggio. Il segnale di base dei channeltron è molto basso (circa un
conteggio al secondo) e il tempo di desaturazione è di circa 10-6 s.
I tubi a moltiplicazione di elettroni (EMT), sono molto simili nel funzionamento ai tubi
fotomoltiplicatori. Consistono di una serie di dinodi che producono elettroni
secondari quando vengono investiti da ioni. La serie di dinodi, amplificano il
segnale moltiplicando la corrente ionica fino a renderla quantificabile.
EMT
channeltron
Figura 10. Channeltron e EMT sono i detector più frequentemente impiegati negli spettrometri di
massa
12
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Applicazione della spettrometria di massa all’identificazione di un polipeptide
Uno degli obiettivi principali della proteomica è l’identificazione non ambigua
delle proteine, sia quando vengono analizzati campioni sottoposti a precedenti
processi di purificazione (quali elettroforesi bidimensionale, elettroforesi capillare,
cromatografia liquida) sia quando si analizzano miscele complesse come lisati
cellulari totali o fluidi biologici, quali ad esempio plasma, urina, o liquido
cerebrospinale.
Per identificare una proteina è necessario ottenere informazioni strumentali che
siano unicamente riferibili a quella determinata molecola. Ad esempio,
l’elettroforesi
bidimensionale
ci
fornisce
informazioni
riguardanti
il
punto
isoelettrico (pI) e il peso molecolare (PM) di una proteina, ma questi valori non
indicano univocamente una proteina in quanto possono esistere tantissime
proteine che presentano lo stesso pI o lo stesso PM.
L’informazione che ci consentirebbe di identificare senza alcun dubbio un
polipeptide può derivare soltanto dall’analisi della sua sequenza amminoacidica.
Se questo è vero, è altrettanto vero che il sequenziamento di un polipeptide
ottenuto adottando la classica procedura di Edman [Edman, P. Acta Chem.
Scand. 1950, 4, 283.] è un procedimento molto laborioso e “time consuming”. In
questa procedura occorre l’identificazione della sequenza comporta la necessità
di percorrere tanti cicli di analisi quanti sono gli amminoacidi costituenti la
sequenza stessa. Un non trascurabile problema è che ognuno di questi step,
benché gestito senza intervento dell’operatore, se si usa un sequenziatore
automatico, ha la durata di circa un’ora.
Oggi il sequenziamento di Edman dei polipeptidi non è più conveniente perché
sono disponibili numerose tecnologie che, utilizzando la spettrometria di massa
come tecnica di base per lo studio delle proteine, possono dare informazioni del
tutto affidabili sulla sequenza amminoacidica di un polipeptide e anche fornire
dati quantitativi sui livelli della sua espressione in campioni biologici diversi.
13
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Peptide Mass Fingerprinting
La prima informazione utile per giungere all’identificazione di un polipeptide si
può ottenere mediante peptide mass fingerprinting.
Il nome attribuito a questo metodo si riferisce alla modalità di analisi seguita per
identificare il polipeptide. In particolare, l’impronta altro non è che lo spettro di
massa degli oligopeptidi generabili da quel polipeptide adottando una
determinata procedura chimica o enzimatica di frammentazione. Il metodo si
basa sul confronto per omologia tra i dati sperimentali (lo spettro di massa) e i
dati ottenuti dalla digestione “in silico” (o virtuale) delle proteine presenti nelle
banche dati disponibili in rete.
La digestione con un enzima proteolitico, nella maggior parte dei casi tripsina, va
a frammentare il polipeptide o la miscela di proteine in oligopeptidi. L’analisi
spettrometrica dei frammenti ottenuti fornisce una misura accurata dei loro valori
di massa nella forma di uno spettro di massa (Fig. 9).
Figura 9 Spettro di massa MALDI-TOF di un digerito triptico di β-caseina. Una ricerca in database
tramite PMF è solitamente utilizzata in esperimenti che utilizzano spettrometria di massa MALDITOF, in cui i peptidi vengono rilevate come specie cariche singolarmente ([M+H]+). In ascisse si
trovano i valori di m/z corrispondenti ai peptidi rilevati.
Se si sottopone a proteolisi con tripsina un determinato polipeptide, la miscela di
oligopeptidi che si ottiene come prodotto è del tutto riproducibile in quanto la
tripsina frammenta
la catena polipeptidica agendo quasi esclusivamente sui
legami peptidici in cui lisina e arginina impegnano la loro funzione carbossilica.
14
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Le masse degli oligopeptidi ottenuti dalla digestione triptica vengono messi a
confronto con database proteomici disponibili in rete (vengono anche utilizzate le
banche-dati genomiche, adottando software che provvedono a convertire le
informazioni riguardanti le sequenze nucleotidiche in sequenze amminoacidiche).
Il confronto viene quindi effettuato, adottando software dedicati, fra le masse dei
frammenti ottenuti in vitro dalla proteina incognita e le masse dei frammenti
ottenuti dalla digestione in silico (o virtuale) di tutte le proteine presenti in bancadati.
I risultati che si ottengono vengono successivamente valutati per identificare la
sequenza per cui la corrispondenza dei valori è massima. Dal grado di
sovrapposizione tra il set di dati sperimentali e il set di dati ottenuti in silico viene
ricavato, mediante semplici procedimenti matematici e statistici, un punteggio
(score) che definisce la probabilità che l’identificazione sia corretta.
In figura 10 è illustrato un tipico esempio di workflow sperimentale di PMF,
utilizzando dati spettrometrici MALDI-TOF.
Figura 10 Workflow di un esperimento di Peptide Mass Fingerprinting. La proteina viene digerita
con un enzima proteolitico, generalmente tripsina, dando luogo a specifici frammenti peptidici
tipici di quella particolare specie proteica. I peptidi derivanti dalla digestione vengono analizzati
tramite spettrometria di massa MALDI-TOF, che ne misura il rapporto massa/carica. Il set di masse
sperimentali viene confrontato mediante specifici tool, con il set di masse virtuali derivanti dalla
digestione “in silico” delle proteine presenti nelle banche dati
15
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Il principio del PMF si basa essenzialmente sull’accuratezza della misurazione
della massa e sulla specificità di taglio dell’enzima. Senza queste due premesse, il
riconoscimento di proteine in banche dati non sarebbe ovviamente possibile.
Il vantaggio del metodo sta nel fatto che si può identificare una proteina senza
determinarne la sequenza amminoacidica ma semplicemente conoscendo le
masse dei peptidi ottenuti per proteolisi.
A questa semplicità si contrappongono molteplici limitazioni della procedura:
1. la proteina incognita non può essere identificata se la sua sequenza non è
contenuta nella banca-dati a cui si fa riferimento
2. Gli algoritmi utilizzati per effettuare il confronto fra il set di dati sperimentali e il set
di dati ottenuti in silico assumono che tutti i dati sperimentali derivino da una
singola proteina; questo comporta che se il campione analizzato contiene più di
una proteina il confronto può dare identificazioni di basso livello qualitativo.
3. Un’ulteriore limitazione del PMF è la possibile presenza di modificazioni posttraduzionali nella sequenza analizzata. In tal caso, aggiungendosi una valore di
massa non identificato alla sequenza presente in banca-dati, il matching dei dati
teorici con quelli sperimentali diventa evidentemente impossibile.
E’ evidente che, sebbene semplice, sensibile e rapida, questa procedura
analitica presenta evidenti punti deboli.
Infatti, per avere un’identificazione
corretta, almeno l’80% della sequenza del polipeptide da individuare deve essere
presente nelle banche-dati e correlare significativamente con il set dei valori m/z
sperimentali.
Inoltre, benché sia possibile identificare più proteine presenti nella stessa
miscela (se il loro numero non è superiore a 3-5 nella spettrometria con sorgente
MALDI) e se il loro rapporto molare è prossimo all’unità, qualora si voglia dare un
nome alla proteina contenuta in uno spot 2DE che risulti differenzialmente
espresso in due gel messi a confronto, l’identificazione tramite PMF non risponde
alle esigenze. In questi casi, prima del PMF occorre separare le proteine contenute
in quello spot utilizzando i classici metodi elettroforetici o cromatografici.
16
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Sequenziamento degli oligopeptidi mediante spettrometria di massa-massa
I problemi che presenta il metodo PMF di base possono essere superati adottando
metodiche di analisi che fanno uso della spettrometria di massa tandem. La
spettrometria di massa-massa, anche detta spettrometria di massa “tandem”,
richiede una strumentazione diversa da quella della quale è stata fatta menzione
fino ad ora.
In uno spettrometro di massa tandem sono messi in sequenza più di un
quadrupolo. Nella sua forma più semplice, uno spettrometro di massa “tandem”
risulta praticamente costituito dalla combinazione di due spettrometri di massa. Il
primo spettrometro seleziona una singola massa (ione precursore). Lo ione
selezionato passa attraverso una camera di collisione (un altro quadrupolo). In
questa camera, per frammentazione causata da collisioni con molecole di un gas
inerte, dallo ione precursore si originano ioni figli. Gli ioni figli vengono separati nel
secondo quadrupolo.
Fig. 11. Rappresentazione schematica di uno spettrometro di massa tandem. Con questa
configurazione strumentale, da ogni oligopeptide genitore possono ottenersi più ioni figli.
Elaborando i dati analitici con software dedicati, il processo di frammentazione dello ione genitore
consente di effettuarne in maniera del tutto strumentale il sequenziamento.
Nella camera di collisione possono essere frammentati tre diversi tipi di legame
della sequenza amminoacidica: I legami NH-CH, CH-CO e CO-NH. Per rottura di
17
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
ciascun legame si ottengono due frammenti: il primo è neutro mentre l’altro
(l’unico da considerare perché rilevabile dallo spettrometro) è carico. La carica
può trovarsi in uno qualsiasi dei due frammenti; quale dei due dipende dalla loro
affinità relativa per il protone.
I frammenti che si possono ottenere sono convenzionalmente indicati con le
lettere a, b, o c se la carica è trattenuta nel frammento N-terminale e con le
lettere x, y o z se la carica è mantenuta nel frammento C-terminale. Il pedice
indica il numero di residui amminoacidici contenuti nel frammento mentre l’apice
è talora utilizzato per indicare perdite neutre (* per la perdita di ammoniaca, ° per
la perdita di acqua).
Di conseguenza, per ogni amminoacido della catena ci sono sei possibili ioni
prodotti dalla frammentazione: gli ioni a, b e c, con la carica elettrica nel
frammento N-terminale, e gli ioni x, y e z che hanno la carica nel frammento Cterminale. Il sito di frammentazione più probabile è il legame peptidico, cioè
legame
CO-NH, e quindi i frammenti carichi più probabili sono b e/o y. La
differenza di massa fra due ioni b o y adiacenti, dà la misura della massa di quel
particolare residuo amminoacidico.
Fig. 12. Il sito di frammentazione più probabile è il legame CO-NH e quindi i frammenti carichi più
probabili sono b e/o y. La differenza di massa fra due ioni b o y adiacenti consente di identificare
l’amminoacido prima (bn) e dopo(bn+1) il quale si è prodotta la frammentazione.
Il terzo quadrupolo dello spettrometro di massa tandem, usando la stessa
18
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
logica descritta in precedenza, rileva i valori m/z di tutti i frammenti figlio, così
fornendo del peptide analizzato un’impronta digitale molto più affidabile di quella
ottenibile con uno spettrometro di massa ad un solo quadrupolo.
Un altro modello di spettrometria tandem è quello che fa uso della trappola
ionica, un dispositivo che consente di effettuare sia la frammentazione del
peptide genitore che l’analisi dei peptidi figli.
Una trappola ionica è costituita da due elettrodi semisferici, detti elettrodi endcaps. Tra le due emisfere è posizionato un elettrodo di forma anulare. Fra gli
elettrodi emisferici e l’elettrodo anulare è applicata una differenza di potenziale
modulata in radio-frequenza. Gli ioni genitori entrano nella trappola attraverso
l’orifizio di entrata posto su un end-cap. Agendo sui valori della radiofrequenza, si
può far sì che gli ioni che entrano nella trappola vengano accumulati al centro
della trappola stessa e rilasciati successivamente all’end-cap opposto dal quale
sono quindi convogliati verso il rivelatore. La trappola serve sia come luogo
d'isolamento degli ioni precursori, come luogo di frammentazione e come luogo
dove viene effettuata la separazione e l’analisi delle masse degli ioni figli. Il
vantaggio più grande della trappola è che gli ioni possono venire intrappolati al
suo interno per un tempo finito, contrariamente alla spettrometria in tandem nella
quale gli ioni che escono dal primo quadrupolo vengono immediatamente
accelerati e mandati al detector. L’operatore può adattare la trappola ionica in
modo adeguato alla soluzione del suo problema, decidendo quali ioni analizzare,
per quanto tempo accumularli, per quanto tempo frammentarli.
Figura 13. Rappresentazione schematica di una trappola ionica
19
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Oltre ad ottenere spettri di massa-massa, con la trappola si possono ottenere
anche spettri di massa multipli perché lo stesso analizzatore può essere predisposto
per effettuare nello stesso spazio processi successivi di frammentazione.
20
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Dai risultati dell’analisi spettrometrica all’identificazione del polipeptide
Negli ultimi venti anni sono stati messi a punto numerosi metodi di elaborazione dei
dati spettrometrica ai fini della identificazione delle proteine. È infatti agli inizi degli
anni ’80 che sono state sviluppate le prime strategie per il sequenziamento dei
polipeptidi adottando tecniche spettrometriche MS/MS.
Dopo soli dieci anni, con la crescita esponenziale dei database di sequenze
genomiche e proteiche, si è assistito ad un radicale cambiamento della strategia.
Il motivo del cambiamento è stato essenzialmente determinato dalla possibilità di
sfruttare i database di sequenze genomiche (e, successivamente, anche
database proteici) per effettuare il lavoro di identificazione delle proteine. La
semplificazione computazionale è stata notevole, come si può arguire da un
semplice esempio.
Si consideri l’endecapeptide ELVISLIVESK. Se non si conoscessero gli amminoacidi
costituenti l’endecapeptide, occorrerebbe effettuare l’elaborazione dei dati
sperimentali considerando un numero di combinazioni e disposizioni pari a 2 x 1014.
Se invece il calcolo viene ristretto alle proteine codificate nel database di tutte le
sequenze genomiche NCBI, le possibili combinazioni si riducono a 2 x 1010. Se si
restringe ulteriormente il calcolo ai peptidi derivanti dalla digestione triptica delle
sole sequenze codificate nel genoma umano si ottiene un numero di possibili
combinazioni pari a 4 x 106.
La diminuzione delle sequenze di otto ordini di
grandezza comporta vantaggi enormi in termini di tempo necessario per
effettuare il lavoro computazionale e in termini di costi dell’hardware informatico
da utilizzare. Come è evidente, infatti, il lavoro che segue la rilevazione degli
spettri di massa tandem viene effettuato facendo uso della velocità di calcolo
che
soltanto
un
elaboratore
elettronico
può
garantire.
A
partire
dall’immagazzinamento dei dati spettrali in formato digitale, in tutte le fasi del
lavoro si fa uso di programmi dedicati per arrivare all’identificazione della proteina
ed al calcolo della affidabilità di tale identificazione.
Esiste un’ampia varietà di sistemi dedicati alla valutazione del grado di affidabilità
con cui una proteina viene identificata. In ognuno di questi sistemi vengono
definiti parametri sui quali si basa l’assegnazione di un punteggio (score) ai risultati
di una identificazione. Due esempi di tali sistemi sono rappresentati dal software
21
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
PeptideSearch [Mann, M., Wilm, M., Anal. Chem. 1994,66, 4390–4399] e dal
software PepFrag [Fenyo,D.,Qin,J.,Chait, B.T.,Electrophoresis1998,19,998–1005], che
usano un semplice schema di scoring basato sul numero di masse coincidenti
quando lo spettro sperimentale viene messo a confronto con lo spettro teorico.
Uno dei primi programmi a sfruttare gli spettri di massa per effettuare il PMF è stato
il software MOWSE, acronimo di Molecular Weight Search [Pappin DJ, Hojrup P,
Bleasby AJ.Rapid identification of proteins by peptide-mass fingerprinting.Curr Biol.
1993 Jun 1;3(6):327-32.],, da cui in seguito è stato sviluppato MASCOT, tuttora uno
dei software più utilizzati per il riconoscimento di sequenze proteiche in banche
dati, (http://www.matrixscience.com/). Altri tool disponibili online sono MS Fit
[Clauser,K.R.,Baker,P.,Burlingame, A.L.,Anal.Chem.1999 71, 2871–2882.] Aldente
[Tuloup M, Hernandez C, Coro I, Hoogland C, Binz PA, Appel RD. 2003. Aldente
and BioGraph: An improved peptide mass fingerprinting protein identification
environment. Swiss Proteomics Society 2003 Congress [Fontis Media], 174–176, 12th
Feb, 2003.
PMF tramite MASCOT
Mascot è uno dei tool più utilizzati per il PMF di proteine, esso è disponibile come
web server liberamente utilizzabile, ma con alcune limitazioni per la quantità di
dati analizzabili contemporaneamente. Alternativamente, è possibile acquistare
una licenza che permette di utilizzare il software in house senza alcuna
limitazione.
In figura 14 è rappresentata la finestra di immissione dati del web server Mascot,
dalla quale si può impostare il tipo di database su cui effettuare la ricerca, il tipo
di enzima proteolitico utilizzato, la tipologia di modificazioni post-traduzionali che
il programma deve considerare per effettuare la ricerca.
Questa ultima opzione è particolarmente importante. Infatti nel caso di analisi di
spot proteici provenienti da elettroforesi bidimensionale o di bande provenienti
da SDS-PAGE bisogna considerare che le proteine sono state sottoposte a
passaggi di derivatizzazione dei residui di cisteina con iodoacetammide. Deve
quindi
essere
selezionata
sempre
come
modificazione
fissa
la
carbammidometilazione (+57 kDa). Ulteriori tipi di modificazioni fisse e variabili
22
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
sono disponibili: ad esempio l’ossidazione delle metionine e la fosforilazione delle
funzioni alcoiliche o fenoliche di serina, treonina e tirosina.
Figura 14. Finestra di avvio del web server Mascot per il PMF di proteine.
Il metodo di calcolo del punteggio per l’identificazione delle proteine deriva
dall’algoritmo MOWSE, come sopra accennato. Il primo passo della ricerca
consiste nel confronto tra il set di masse derivanti dal database delle sequenze
presenti in banca dati con il set di masse sperimentali. Ogni valore calcolato che
cade in un range di massa vicino ad un valore sperimentale viene considerato
come un match. Il range di massa viene pre-definito dallo sperimentatore come
tolleranza consentita.
Nella processazione dei dati sperimentali tramite MASCOT, piuttosto che valutare
semplicemente il numero delle coincidenze del set teorico di peptidi con il set
sperimentale, MOWSE assegna ad ogni match un peso statistico, usando
parametri specifici prefissati. I fattori che determinano il peso statistico sono
calcolati in una matrice che viene costruita durante la processazione del
database di sequenze proteiche. La matrice dei fattori di frequenza, denominata
23
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
F, viene costruita mettendo in ogni riga un intervallo di 100 Da nella massa del
peptide, in ogni colonna un intervallo di 10 kDa nella massa intatta della proteina.
Quando le sequenze presenti nel database vengono processate, i generici
elementi fij della matrice sono incrementati, in modo tale da accumulare dati
sulla forma della distribuzione delle masse dei peptidi come funzione della massa
della proteina. Gli elementi di F sono in seguito normalizzati dividendo i singoli
elementi della colonna da 10 kDa per il valore più grande in quella stessa
colonna per dare il fattore della matrice MOWSE denominato M.
Dopo il confronto tra masse sperimentali e masse teoriche il punteggio per ogni
proteina è calcolato secondo:
in cui il denominatore è costituito dal prodotto tra MProt, il peso molecolare della
sequenza, e il prodotto tra i fattori MOWSE per ogni match tra i dati sperimentali e
le masse dei peptidi calcolati in base alla sequenza della proteina presente nel
database.
In Mascot il sistema di scoring MOWSE è stato implementato secondo un
approccio probabilistico. Questa implementazione comporta alcuni vantaggi.
Infatti, l’operatore può:
a) definire la soglia di significatività;
b) combinare in una singola ricerca tipologie differenti di matching (masse
intatte dei peptidi o ioni frammentati in seguito a MS/MS)
c) mettere a confronto i punteggi ottenuti effettuando la ricerca in database
differenti.
A tutti i match positivi ottenuti utilizzando i dati spettrali, siano essi riferiti alle masse
dei peptidi o a quelle dei frammenti sono assegnati punteggi calcolati come -
24
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
10*LOG10(P), dove P è la probabilità assoluta che l’identificazione sia corretta. Per
fare un esempio, ad una probabilità di 10-20 corrisponde uno score di 200.
Limite di significatività
Score =67
Match corretto
Score =108
Figura 15 Grafico di distribuzione dei punteggi di identificazione utilizzando Mascot
Un tipico valore di soglia normalmente utilizzato è quello per cui un evento risulta
significativo se la frequenza di eventi casuali è minore del 5%.
In figura 15 è riportato un tipico esempio di grafico proveniente dalla pagina dei
risultati di PMF tramite Mascot, cioè l’istogramma relativo alla distribuzione dei
punteggi di identificazione.
La zona evidenziata con tratteggio verde corrisponde alla zona di non
significatività, cioè tutti i risultati che cadono all’interno della zona non risultano
significativi nel modello probabilistico utilizzato. La proteina con score 108 risulta
invece chiaramente distinguibile dalla zona di non significatività (il cui limite
corrisponde ad uno score di 67) e rappresenta quindi un match significativo o, nel
Figura 16.
Grafico di distribuzione dei punteggi di identificazione utilizzando Mascot,
aumentando la tolleranza di massa.
25
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
caso di altre identificazioni rappresentate fuori dall’area verde, quello con il più
alto grado di significatività o omologia.
Occorre aggiungere che è importante distinguere tra un match significativo e un
match corretto. Infatti, se si ripete la ricerca precedente aumentando il valore di
tolleranza di massa da ± 0,1 Da a ± 1.0 Da si ottiene quanto rappresentato nella
figura 16. Il potere discriminante della ricerca viene largamente ridotto in questo
caso e il miglior match, pur essendo ancora corretto, risulta ora poco significativo.
Un esempio dei risultati ottenibili con Mascot è riportato in figura 17.
Figura 17. Esempio dei risultati di una ricerca di PMF con Mascot. Il grafico della distribuzione dei
punteggi sperimentali indica come match valido solamente una proteina, con il punteggio (194)
evidenziato in rosso nella lista
26
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
SELDI -TOF-MS
Il SELDI-TOF-MS (Surface-Enhanced Laser Desorption/Ionization Time-Of-Flight
Mass Spectrometer) è uno strumento estremamente versatile e particolarmente
utile per l’analisi di proteine su grande scala e per operazioni di screening
preliminare di campioni complessi finalizzate alla ricerca di biomarcatori. Il SELDI è
stato studiato per compiere analisi in massa di pool di proteine trattenuti all’interno
di un array o ProteinChip. Nella configurazione standard il ProteinChip è una sottile
striscia di alluminio che presenta 8 piccoli pozzetti per l’inserimento dei campioni.
Campioni come siero, plasma, saliva o urine possono essere direttamente
applicati sulla superficie del ProteinChip perché la tecnica SELDI tollera bene sali e
ad altre impurità presenti nei campioni proteici. La quantità di proteine totali
necessaria per un’analisi è bassa (1-10 µg di proteine totali per spot) e il volume
può essere liberamente scelto tra 0,5 e 400 µl (ovviamente in dipendenza delle
dimensioni dei pozzetti). I limiti di massa relativa dei polipeptidi da rilevare sono
compresi fra 1.500 e 20.000.
Per costruire il ProteinChip, in base al campione da analizzare e da ciò che si
vuole analizzare, possono essere utilizzate diverse tipologie di superfici, con diverse
caratteristiche fisico-chimiche (Idrofobiche, cationiche, anioniche, con presenza
di ioni metallici o idrofiliche) o diversamente preattivate per legare diversi tipi di
molecole (proteine DNA o RNA).
Una volta applicato il campione alla superficie dell’array, vengono effettuati
una serie di lavaggi per allontanare tutti i contaminanti e le proteine che non si
sono legate alla superficie scelta dall’operatore. Ciò riduce la complessità del
campione e fa aumentare la probabilità di rilevare marcatori presenti in basse
concentrazioni.
27
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Figura 18. Nei pozzetti dei cinque ProteinChip sono immobilizzate molecole che conferiscono alla
superficie caratteristiche diverse: cationiche, anioniche, idrofiliche, idrofobiche. Possono essere
anche immobilizzati composti contenenti atomi metallici o, se la ricerca riguarda una specifica
proteina nota, un suo specifico anticorpo monoclonale. Arrays con diversa chimica di superficie
adsorbono selettivamente molecole con caratteristiche superficiali diverse. In questa maniera il
campione biologico è frazionato e l’analisi è semplificata.
Dal siero, tramite prefrazionamento, possono essere allontanate o separate le
proteine altamente abbondanti in modo da diminuire la complessità del siero e
aumentare la capacità di trovare proteine meno abbondanti. Occorre però tener
conto del fatto che allontanando proteine molto abbondanti come l’albumina
possono venire escluse proteine di interesse legate all’albumina stessa. Inoltre il
prefrazionamento può contribuire ad abbassare la riproducibilità dell’analisi.
Una volta caricati i pozzetti con il campione ed effettuati i lavaggi, a ciascun
pozzetto viene applicata una matrice di quelle descritte presentando la tecnica
di ionizzazione MALDI.
Per l’analisi delle proteine adsorbite nei singoli pozzetti si adottano le stesse
procedure descritte per le sorgenti MALDI.
Un raggio laser pulsato colpisce
sequenzialmente i pozzetti così portando in fase aeriforme e ionizzando le proteine
legate alla matrice e consentendone l’analisi TOF-MS.
Da un singolo esperimento, caratterizzato da un ridotto numero di operazioni
che richiedono l’intervento dell’operatore, si ottengono, almeno teoricamente, gli
spettri di tutte le proteine espresse nel campione analizzato.
28
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Poiché utilizzando questo approccio è possibile analizzare giornalmente
centinaia di campioni biologici, la tecnologia SELDI è considerata la più
promettente per la ricerca di biomarker di interesse clinico [3].
1. Applicazione della mix
4. Ionizzazione con
raggio laser pulsato
2. Lavaggio delle proteine
aspecificamente adsorbite
3. aggiunta di matrice
(es.: ac.
ac. sinapinico)
sinapinico)
5. Rilevazione degli
Spettri di massa
Fig. 19. Fasi della analisi del proteoma con la tecnica SELDI-TOF
29
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
Multi-Dimensional Protein Identification Technology (MuDPIT)
Caratteristiche simili alla tecnologia SELDI ha la Multi-Dimensional Protein
Identification Technology (MuDPIT), almeno per quanto riguarda la possibilità di
analizzare un campione con un numero molto limitato di fasi che richiedono
l’intervento dell’operatore e con alto rendimento in termini di numero di proteine
identificabili. Questo è il motivo per cui l’uso di queste due tecnologie è riferito
come “shotgun proteomics” o “high throughput proteomics”.
La
tecnica
MuDPIT
conserva
molte
delle
caratteristiche
descritte
in
precedenza, rispetto alle quali sfrutta maggiormente le potenzialità di calcolo
degli strumenti informatici.
In breve, la tecnica MuDPIT si basa sull’uso di uno spettrometro di massa con
ionizzazione ESI e trappola ionica, interfacciato con uno strumento HPLC dotato di
due pompe con possibilità di gradiente ternario o quaternario.
L’insieme delle proteine contenute nel campione biologico da analizzare viene
sottoposto alla frammentazione triptica sopra descritta, senza ricorrere ad alcuna
precedente separazione cromatografica o elettroforetica. Ogni polipeptide
genitore viene quindi frammentato in una serie di peptidi figli. L’insieme dei peptidi
figli ora contenuto nella miscela viene iniettato nella prima colonna capillare dello
strumento HPLC. La colonna è impaccata con uno scambiatore cationico forte
(SCX). I peptidi figli vengono eluiti dalla colonna SCX con un gradiente discontinuo
formato di 15-20 step. Gli eluati di ciascuno step vengono ulteriormente risolti in un
secondo processo cromatografico in fase inversa su ottadecil-silica.
Al termine del lungo processo cromatografico, l’insieme delle masse dei peptidi
genitori e dei peptidi figli (ulteriormente frammentati nella trappola ionica per
determinarne la sequenza) viene elaborato da algoritmi che prendono in
considerazione tutta la tabella popolata dai dati analitici come se questa tabella
riportasse il risultato di un’unica analisi cromatografica. In altre parole, se un
polipeptide ha generato per frammentazione 20 frammenti oligopeptidici,
ciascuno dei quali viene eluito in frazioni diverse della colonna SCX, durante la
deconvoluzione dei dati finali i 20 frammenti genitore ed i relativi ioni figlio
vengono riconosciuti ed utilizzati per l’identificazione del polipeptide contenuto
30
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
nel campione. La stessa operazione viene effettuata su ciascun set di peptidi
riconducibili ad un polipeptide presente nelle banche-dati.
Questa tecnica è ovviamente
caratterizzata da una enorme capacità di
identificazione di sequenze, potenza analitica che può essere ulteriormente
aumentata sottoponendo a prefrazionamento cromatografico il campione
biologico da analizzare.
Figura 20. 2DHPLC-MS/MS
Il sistema è composto di due pompe HPLC che garantiscono un flusso di circa 2 µl/min, un iniettore
HPLC con loop di 20 µl, una valvola a 10 vie, una colonna capillare a scambio cationico forte
(SCX) e due colonne capillari impaccate con ottadecil-silica (ODS1 e ODS2). La colonna SCX viene
sviluppata con gradiente discontinuo di cloruro di ammonio (5-500 mM). I peptidi eluiti dalla
colona SCX nel primo step (5 mM cloruro di ammonio) vengono adsorbiti nella colonna capillare
ODS1 (traccia blu). In questo settaggio della valvola a 10 vie, la seconda pompa mantiene un
flusso del solvente di condizionamento nella colonna ODS2. Terminato il primo step, la valvola a 10
vie viene posizionata in modo tale che l’eluato della colonna SCX sia raccolto dalla colonna
ODS2. Mentre la colonna SCX viene eluita con il nuovo tampone (10 mM cloruro di ammonio), la
colonna ODS1 viene sviluppata con gradiente lineare 0,01% HCOOH in acqua – 0,01% HCOOH in
acetonitrile. I peptidi eluiti dalla colonna ODS1 vengono analizzati dallo spettrometro di massa.
Terminato il secondo step della colonna SCX e lo sviluppo della colonna ODS1, la valvola a 10 vie
viene riposizionata a collegare le colonne SCX e ODS1. La colonna SCX viene ora eluita con 15 mM
acetato di ammonio mentre la colonna ODS2 viene sviluppata con gradiente di acetonitrile. Il
procedimento viene ripetuto più volte fino alla fine del gradiente discontinuo.
31
Tecniche MS utilizzate in Proteomica – F.Susta, D.Chiasserini, P.L.Orvietani, L. Binaglia
32
Scarica

Tecniche di spettrometria di massa