UNIVERSITÀ DEGLI STUDI DI MILANO
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di Laurea in Genomica Funzionale e Bioinformatica
SVILUPPO DI UN SISTEMA ROBOTICO IBRIDO
ELETTRONICO/BIOLOGICO
ATTRAVERSO L’ANALISI DEI SEGNALI RILEVATI
DA RETI DI NEURONI UMANI
Relatore: Prof.ssa Rita PIZZI
Correlatore: Dott.Giovanni CINO
Tesi di Laurea di:
Damiano Carne
Mat. 670378
Anno Accademico 2004-2005
INDICE
INDICE
Pag.
INTRODUZIONE………………………………………………………… 1
CAPITOLO 1: Il sistema nervoso e le sue proprietà
1.1 Le cellule gliali……………………………………………………………..
1.2 Le cellule nervose…………………………………………………………..
1.3 L’attività elettrica del neurone……………………………………………...
1.4 Il potenziale d’azione……………………………………………………….
1.5 I principi dell’organizzazione cerebrale……………………………………
1.6 Reti di neuroni……………………………………………………………...
1.7 Plasticità sinaptica…………………………………………………………..
4
6
9
11
13
16
18
CAPITOLO 2: I sistemi complessi: le reti neurali artificiali
2.1 Cervello e computer………………………………………………………
2.2 Caratteristiche dei sistemi complessi……………………………………….
2.3 Le reti neurali artificiali…………………………………………………….
2.4 Architettura di una rete neurale artificiale………………………………….
2.5 SOM e ITSOM……………………………………………………………...
22
25
27
28
34
CAPITOLO 3: Tecnologie di integrazione elettronico/biologiche
3.1 Sistemi ibridi………………………………………………………………..
3.2 I passi salienti……………………………………………………………….
3.3 Integrazione tra neuroni e circuiti elettronici……………………………….
3.4 Voltage-clamp e Patch-clamp………………………………………………
3.5 Micro-Electrode Array (MEA)……………………………………………..
3.6 Voltage-clamp vs Micro-Electrode Array………………………………….
3.7 Cellule staminali e Micro-Electrode Array……………………………........
38
40
42
48
51
53
56
CAPITOLO 4: Materiali e metodi
4.1 Preparazione dei MEA……………………………………………………...
4.2 Sistema di acquisizione……………………………………………………..
4.3 Protocollo di stimolazione e di registrazione dei segnali…………………...
4.4 Funzionamento della rete neurale…………………………………………..
4.5 Interfaccia grafica e applicazione robotica…………………………………
4.6 Schema generale dell’apparecchiatura……………………………………...
59
62
65
68
73
77
INDICE
CAPITOLO 5: Analisi dei segnali rilevati
5.1 Segnali e sistemi……………………………………………………………
5.2 Il campionamento dei dati…………………………………………………..
5.3 Architettura del sistema di analisi…………………………………………..
5.4 Analisi dei segnali.………………………………………………………….
80
81
83
90
CAPITOLO 6: Processo di taratura della rete neurale artificiale
6.1 Risultati dell’esperimento in tempo reale…………………………………..
6.2 Parametri per la taratura di una rete neurale………………………………..
6.3 Processo di taratura della rete neurale e analisi dell’informazione…………
6.4 Valutazione del modello……………………………………………………
6.5 Analisi dei neuroni vincenti………………………………………………...
103
106
108
118
121
CONCLUSIONI…………………………………………………................ 127
BIBLIOGRAFIA…………………………………………………………... 131
INTRODUZIONE
INTRODUZIONE
Negli ultimi anni sono stati condotti numerosi studi sulla connessione diretta
tra neuroni e circuiti elettronici. Ricerche in campi come la biologia, l’informatica e
l’ingegneria, hanno trovato in questo progetto un comune denominatore. Tutto ciò
trova riscontro in numerose applicazioni scientifico-tecnologiche, che vanno dallo
sviluppo di protesi riabilitative di nuova generazione, sino all’evoluzione della
tecnologia robotica.
L’idea di connettere i neuroni al calcolatore prende origine dal fatto che
entrambi i sistemi comunicano elettricamente. Proprio la comunicazione tra questi
due sistemi di natura diversa è oggetto dello studio condotto durante il periodo di
tesi.
Il progetto ha come obiettivo lo sviluppo di un sistema in grado di guidare i
neuroni alla memorizzazione ed all’apprendimento di pattern sensoriali e di
decodificare i segnali provenienti dai neuroni. A riscontro di queste funzionalità, il
sistema è dotato di un attuatore robotico che è comandato dalle cellule neurali.
Ciò che sarà proposto nelle pagine seguenti è un protocollo innovativo per la
decodifica dei segnali. L'idea di partenza è che solo sistemi con proprietà simili a
quelle delle reti nervose si possano interfacciare direttamente ad una rete di neuroni.
Queste proprietà sono essenzialmente: l’apprendimento, l’adattività, la flessibilità e
l’auto-organizzazione dei dati.
Questa struttura biologico/elettronica è resa possibile grazie all’utilizzo dei
Micro-Electrode Array (MEA), array di microelettrodi su cui è possibile coltivare
cellule o depositare dissezioni di tessuti e permettono la registrazione dei segnali in
uscita dal sistema biologico. Su questi array sono coltivati i neuroni utilizzati negli
esperimenti, che derivano da cellule staminali neurali.
Per lo studio di questa comunicazione si è partiti a testare il protocollo
neurale artificiale adattandolo ai neuroni naturali. Queste cellule pertanto sono
sottoposte ripetutamente a stimoli sensoriali simulati da pattern digitali e si è
indagato sulla loro capacità di memorizzarli proprio come si fa per le reti neurali
artificiali.
1
INTRODUZIONE
Tutto questo è possibile perché la rete artificiale è direttamente connessa alla
rete naturale. Come conseguenza lo stimolo dato in input alla rete naturale genera
una risposta nella rete biologica, questa funge da input per la rete neurale artificiale
che, essendo autoorganizzante, per stimoli classificati come simili dovrebbe generare
risposte uguali. Questo significa che se la rete di neuroni si comporta bene per
stimoli identici in input otterremo risposte uguali in output.
Per consentire un funzionamento corretto del sistema si sono studiate le
proprietà statistiche del segnale in uscita dalla rete biologica, tramite apposito
software implementato per tale scopo. L'ottimizzazione della rete neurale ha
permesso di studiare il comportamento autoorganizzante dei segnali in output dalle
rete di neuroni.
Alla luce dei risultati ottenuti possiamo concludere che l’utilizzo di una rete
neurale nello studio dei segnali provenienti da una rete di neuroni evidenzia come
neuroni adulti generati da cellule staminali neurali reagiscano in modo organizzato a
stimoli simulati differenziati. Ha inoltre permesso una decodifica fine dei segnali
provenienti dalle cellule, in modo tale da poter utilizzare il sistema per muovere un
attuatore robotico.
2
INTRODUZIONE
Struttura:
Capitolo 1: Riporta la descrizione della struttura e del comportamento del
neurone biologico fino alle proprietà delle reti nervose.
Capitolo 2: Sono descritti i sistemi complessi con particolare riferimento alle
reti neurali. Nel capitolo è inoltre descritta la rete neurale ITSOM, tipologia di rete
utilizzata e implementata nel protocollo sperimentale.
Capitolo 3: L’evoluzione scientifica dell’interfacciamento tra neuroni e
circuiti elettronici viene trattata facendo riferimento agli esperimenti più importanti
ritrovati in letteratura. In questo capitolo sono inoltre riportate le proprietà e la
tecnologia su cui si basa lo strumento utilizzato per interfacciare i neuroni alla rete
neurale artificiale: i Micro-Electrode Array (MEA).
Capitolo 4: Facendo riferimento alle nozioni teoriche fornite dai primi
capitoli si procede nell’illustrazione dell’apparecchiatura hardware ed il protocollo di
sperimentazione. Nel capitolo sono descritte nel dettaglio anche le diverse
applicazioni che sono utilizzate per gestire il sistema.
Capitolo 5: Contiene la descrizione in ogni sua parte del sistema
informatizzato prodotto per l’analisi dei segnali. Si illustrano le analisi statistiche
eseguite sui segnali prodotti dalla rete biologica tracciando delle linee guida per la
loro interpretazione. Contemporaneamente, per ogni analisi sono riportate le
osservazioni di carattere generale tratte dall’osservazione dei segnali.
Capitolo 6: Si espone il processo di taratura della ITSOM con i relativi
risultati. Nel capitolo è presentata anche una valutazione del modello descritta da
parametri statistici.
3
CAPITOLO 1
Il sistema nervoso e le sue proprietà
CAPITOLO 1
Il sistema nervoso e le sue proprietà
Nel sistema nervoso esistono due classi principali di cellule:
•
cellule gliali (glia);
•
cellule nervose (neuroni).
1.1 Le cellule gliali
Nel sistema nervoso dei vertebrati le cellule gliali sono da dieci a cinquanta
volte più numerose dei neuroni e circondano gli assoni e i dendriti dei neuroni.
Esse si suddividono a loro volta in due classi principali:
•
microglia;
•
macroglia.
Le cellule dei microglia sono costituiti da elementi fagocitari che si
mobilitano in seguito a lesioni, infezioni o altri disturbi. Esse prendono origine da
macrofagi al di fuori del sistema nervoso, e non hanno alcun rapporto embriologico o
funzionale con altri tipi di cellule del sistema nervoso.
Tre sono i tipi di macroglia presenti nel sistema nervoso umano:
•
astrociti;
•
oligodendrociti;
•
cellule di Shwann.
Gli astrociti che sono le cellule gliali più numerose, devono il nome alla
forma irregolare e somigliante una stella dei loro corpi cellulari. Sono spesso dotati
di lunghi processi, alcuni dei quali formano delle espansioni terminali che prendono
4
CAPITOLO 1
Il sistema nervoso e le sue proprietà
contatto, nel cervello e nel midollo spinale, con la superficie di cellule nervose per le
quali svolgono una funzione nutritiva. Altre espansioni pedicellari degli astrociti
prendono contatto con i vasi sanguigni cerebrali e inducono la formazione di
giunzioni strette fra le cellule endoteliali, contribuendo a formare la barriera ematoencefalica protettiva (Figura 1.1).
Fig.1.1 Astrociti e barriera emato-encefalica
Gli astrociti contribuiscono inoltre a mantenere normale la concentrazione di
ioni potassio extracellulare negli spazi intercellulari che separano i neuroni. Essi
sono anche in grado di captare i neurotrasmettitori liberati dalle terminazioni
sinaptiche, contribuendo così a regolarne l’attività allontanando i neurotrasmettitori
stessi. Tuttavia la funzione principale degli astrociti è quella di cellule di sostegno.
Gli oligodendrociti e le cellule di Schwann sono cellule piccole, fornite di un
numero limitato di processi. Entrambi questi tipi di cellule svolgono l’importante
funzione di isolare gli assoni formandovi attorno, con i loro processi membranosi,
una guaina di mielina che li circonda concentricamente in strette spirali. Gli
oligodendrociti sono presenti nel sistema nervoso centrale e possono avvolgersi
lungo numerosi tratti internodali. Le cellule di Schwann presenti nel sistema nervoso
periferico, al contrario circondano un unico tratto internodale di un solo assone.
Alcune cellule gliali (“glia radiale”) guidano la migrazione dei neuroni e
dirigono la crescita dei loro assoni [Perry96].
1.2 Le cellule nervose
5
CAPITOLO 1
Il sistema nervoso e le sue proprietà
Da un punto di vista morfologico, in una cellula nervosa possiamo
caratterizzare quattro zone ben distinte: il corpo cellulare (o soma), i dendriti,
l’assone e le terminazioni presinaptiche (Figura 1.2).
Il corpo cellulare o soma è il centro metabolico del neurone ed è costituito dal
nucleo che contiene il patrimonio genetico della cellula e il reticolo endoplasmatico,
dove vengono sintetizzate le proteine. Il corpo cellulare genera due categorie di
processi: i dendriti e un lungo processo tubolare detto assone. I dendriti
rappresentano il principale apparato destinato a ricevere i messaggi che arrivano
dalle altre cellule nervose. L’assone, al contrario, si estende per lunghe distanze
allontanandosi dal soma e rappresenta il principale elemento di conduzione capace di
trasmettere i messaggi ad altri neuroni (Figura 1.2).
Fig.1.2 Illustrazione delle principali parti del neurone
Un assone è in grado di trasmettere segnali elettrici a distanze variabili fra 0,1
millimetri e 3 metri. Questi segnali elettrici vengono detti potenziali d’azione e sono
impulsi nervosi rapidi e transitori con carattere di tutto o nulla che prendono origine
a livello di una zona di innesco specializzata e localizzata all’origine dell’assone,
detta cono d’emergenza. L’ampiezza del potenziale d’azione non si modifica lungo il
suo decorso, ma rimane costante in quanto si rigenera ad intervalli regolari.
6
CAPITOLO 1
Il sistema nervoso e le sue proprietà
I potenziali d’azione sono i segnali che il sistema nervoso impiega per
ricevere, analizzare e trasmettere le informazioni. Questi segnali sono altamente
stereotipati in tutto il sistema nervoso anche se prendono origine da una grande
varietà di eventi come stimoli di diversa natura. Ci troviamo di fronte a uno dei
principi fondamentali su cui si basa l’attività celebrale, ossia che l’informazione
trasportata da un potenziale d’azione non dipende dalla morfologia del segnale ma
dal cammino che quel segnale percorre nel cervello.
I punti in cui due neuroni entrano in comunicazione sono chiamati sinapsi. La
cellula nervosa che trasmette il segnale viene detta cellula presinaptica mentre quella
che lo riceve postsinaptica. La cellula presinaptica non entra in contatto
anatomicamente con la cellula postsinaptica, ma le due sono separate da uno spazio
detto fessura sinaptica. La maggior parte delle terminazioni presinaptiche termina a
ridosso dei dendriti del neurone postsinaptico, ma possono entrare in rapporto anche
con il corpo cellulare o con il segmento iniziale dell’assone.
La caratteristica che più distingue un neurone dall’altro è la forma; in
particolare, il numero e il tipo dei processi nervosi che dipartono dal soma. In
funzione di questa caratteristica i neuroni possono essere classificati in tre gruppi
(vedi figura 1.3):
•
unipolari;
•
bipolari;
•
multipolari.
A
B
C
Fig.1.3 Tipologia di neuroni: A. neuroni unipolari
B. neuroni bipolari C. neuroni multipolari
7
CAPITOLO 1
Il sistema nervoso e le sue proprietà
I neuroni unipolari costituiscono la classe più semplice di neuroni. Hanno un
solo processo primario, in generale fornito di molte ramificazioni. Una di queste è
l’assone, le altre servono come strutture dendritiche di ricezione. Le cellule unipolari
nei vertebrati vanno a formare i gangli del sistema nervoso autonomo.
I neuroni bipolari hanno un corpo ovoidale che dà origine a due processi: un
dendrite, che porta informazioni provenienti dalla periferia del corpo, e un assone,
che invia informazioni al sistema nervoso centrale. Molti di questi tipi di neuroni
sono di natura sensitiva.
I neuroni multipolari sono la classe predominante nel sistema nervoso dei
vertebrati. Queste cellule hanno un unico assone e una o più branche dendritiche che
possono nascere da ogni parte del corpo cellulare. Le forme dei neuroni multipolari
variano notevolmente, specialmente per ciò che riguarda la lunghezza dell’assone e il
numero, la lunghezza e la complessità dell’albero dendritico.
Se classifichiamo i neuroni cerebrali rispetto alla loro funzione, questi
possono essere classificati in tre gruppi principali:
•
sensitivi;
•
motoneuroni;
•
interneuroni.
I neuroni sensitivi portano dalla periferia del corpo al sistema nervoso
centrale le informazioni necessarie sia per la percezione, che per la coordinazione
motoria. I motoneuroni portano ordini dal cervello o dal midollo spinale, ai muscoli o
all’apparato ghiandolare. Gli interneuroni costituiscono la classe di neuroni di gran
lunga più numerosa e comprendono tutte le cellule del sistema nervoso che non siano
specificatamente sensitive o motrici. Gli interneuroni vengono a loro volta suddivisi
in due classi: gli interneuroni di ritrasmissione (o proiezione) che trasmettono
informazioni a lunga distanza da una regione cerebrale all’altra, e gli interneuroni
locali che hanno assoni brevi ed elaborano informazioni all’interno di circuiti locali
[Kandel03].
8
CAPITOLO 1
Il sistema nervoso e le sue proprietà
1.3 L’attività elettrica del neurone
Quasi tutti i neuroni, indipendentemente dalle dimensioni e dal tipo di
neurotrasmettitore impiegato, possono essere descritti da un modello generale di
neurone con quattro elementi: un elemento locale d’ingresso (o recettivo), un
elemento di innesco dove il segnale ha inizio (di sommazione o di integrazione), un
elemento di conduzione a distanza e un elemento di uscita (o secretorio).
Ogni cellula nervosa genera in successione, quattro tipi diversi di segnali che
hanno origine a livello delle quattro diverse zone del neurone: un segnale d’ingresso,
un segnale di innesco, un segnale di conduzione e un segnale d’uscita.
I diversi segnali impiegati dal neurone sono in gran parte determinati dalle
proprietà elettriche della membrana cellulare. A riposo i neuroni mantengono una
differenza di potenziale elettrico ai capi della membrana plasmatica. Questo è detto
potenziale di membrana a riposo e il suo valore è di circa 65mV. Poiché la carica
netta presente all’esterno viene arbitrariamente definita come pari a zero, il
potenziale di membrana a riposo è di -65mV. La differenza di potenziale elettrico in
una cellula a riposo dipende da due fattori: l’ineguale distribuzione degli ioni
elettricamente carichi sulle due facce della membrana (in particolare sodio e
potassio), e la permeabilità selettiva della membrana verso uno di questi due ioni, il
potassio.
Le cellule nervose differiscono da tutte le altre perché il loro potenziale di
membrana a riposo può subire notevoli variazioni (sono quindi eccitabili), e queste
variazioni vengono utilizzate come meccanismo di segnalazione. Quando il
potenziale di membrana si riduce di 10mV (da -65mV a -55mV), la membrana
diviene molto più permeabile agli ioni sodio che agli ioni potassio. L’ingresso di
sodio caricato positivamente determina una riduzione ancora maggiore del potenziale
di membrana (da -55mV a +55mV). Questa riduzione prende il nome di potenziale
d’azione (o spike).
Oltre al potenziale d’azione, che è un segnale a lungo raggio, le cellule
nervose producono anche segnali locali, come i segnali di recettori e i potenziali
sinaptici, che non si propagano attivamente e che perciò, in generale, si riducono di
9
CAPITOLO 1
Il sistema nervoso e le sue proprietà
ampiezza fino a scomparire entro pochi millimetri. Sia segnali a lungo raggio che
quelli locali sono il prodotto di variazioni che determinano un aumento o una
diminuzione del potenziale di membrana rispetto al suo valore di riposo.
Il potenziale d’azione viene condotto lungo l’assone della cellula fino alle sue
terminazioni, dove ha inizio il processo di comunicazione con altre cellule. In
generale il potenziale d’azione dura circa un millisecondo, al termine del quale la
membrana riacquista le sue proprietà di riposo.
Il potenziale d’azione è dunque un evento tutto o nulla. Ciò significa che i
segnali sotto soglia non daranno origine ad alcun segnale, mentre tutti gli stimoli
sopra la soglia determineranno sempre la comparsa dello stesso segnale. Per quanto
grande possa essere la variazione di intensità e di durata degli stimoli, l’ampiezza e la
durata di tutti i potenziali d’azione sono all’incirca sempre le stesse. Questa
caratteristica fu messa in evidenza da Edgar Adrian intorno al 1920, mediante un
oscilloscopio.
Pur essendo distinguibili i potenziali d’azioni rilevati degli assoni sensitivi,
rispetto a quelli rilevati dagli assoni motori, sono solo due le proprietà del segnale di
conduzione che contengono informazioni: il numero di potenziali d’azione e
l’intervallo di tempo che intercorre fra di essi. Ciò che quindi determina l’intensità di
una sensazione o la velocità di un movimento, non è l’ampiezza o la durata dei
singoli potenziali, ma la loro frequenza. Quanto più l’ampiezza del potenziale di
recettore (di ingresso) eccede il valore della soglia, tanto maggiore sarà la
depolarizzazione, di conseguenza, tanto maggiore la frequenza dei potenziali
d’azione che si generano nell’assone. Analogamente, la durata del segnale d’ingresso
determina il numero dei potenziali d’azione scaricati. L’informazione contenuta nel
numero e nella frequenza dei potenziali d’azione viene trasmessa fedelmente lungo
tutto l’assone [Kandel03].
Va però detto che il significato di un messaggio non è determinato dalle
caratteristiche del messaggio stesso, ma dalla particolare via lungo la quale esso
viene condotto. Quando un potenziale d’azione raggiunge la terminazione del
neurone determina la liberazione da parte della cellula del neurotrasmettitore. La
10
CAPITOLO 1
Il sistema nervoso e le sue proprietà
liberazione dei neurotrasmettitori costituisce il segnale d’uscita del neurone. Questo
segnale, analogamente a quello d’ingresso, è graduato.
La quantità di neurotrasmettitore che viene liberata dipende dal numero e
dalla frequenza dei potenziali d’azione scaricati dalle terminazioni presinaptiche. Il
neurotrasmettitore liberato dalla terminazione presinaptica diffonde attraverso la
fessura sinaptica verso le molecole recettrici, localizzate sulla membrana della cellula
postsinaptica. Il legame con questo recettore determina l’insorgenza di un potenziale
sinaptico nella cellula postsinaptica. Il fatto che il potenziale sinaptico abbia un
effetto eccitatorio o inibitorio dipenderà poi dal tipo di recettori presenti nella cellula
postsinaptica, e non dalla natura chimica del neurotrasmettitore.
Il modello di segnalazione dei neuroni sopra descritto costituisce una
semplificazione applicabile nella maggior parte dei casi, ma si possono osservare
delle modificazioni importanti. In alcuni interneuroni locali privi di un elemento di
conduzione o che ne hanno uno così breve da non richiedere alcun segnale condotto
a distanza, i segnali di ingresso vanno incontro a sommazione e si diffondono
passivamente verso la regione d’uscita dove viene liberato il neurotrasmettitore
[Nicholls92].
1.4 Il potenziale d’azione
La scarica del neurone rappresenta l’informazione in uscita dal neurone
stesso. Tale output è il risultato dell’elaborazione che la cellula ha fatto delle
informazioni in ingresso provenienti da altre cellule (attraverso sinapsi,
neurotrasmettitori, giunzioni elettriche), oppure dall’ambiente esterno (sotto forma di
stimoli sensoriali). E’ la struttura della membrana plasmatica con le varie molecole
connesse, i recettori, i meccanismi di modulazione, i canali ionici, a rappresentare il
livello più importante nel quale si verifica il confronto tra i vari tipi di informazione e
dove avviene il processo decisionale.
Il potenziale d’azione è un segnale elettrico impulsivo con un’ampiezza di
circa 100mV, durata di 1ms e con una velocità che varia da 1 a 100m/s. L’ampiezza
del segnale d’uscita è determinata dall’ampiezza della depolarizzazione che, a sua
11
CAPITOLO 1
Il sistema nervoso e le sue proprietà
volta, è determinata dal numero e dalla frequenza degli impulsi. Dopo aver generato
il potenziale d’azione, il neurone entra in fase refrattaria e per 10ms non potrà più
generarne.
In risposta ad uno stimolo statico, il numero di potenziali d’azione emessi
durante il tempo di osservazione cresce in modo proporzionale all’ampiezza dello
stimolo. Il segnale si pensa quindi venga codificato nella frequenza di scarica, ovvero
nella frequenza dei treni di spike. Questa è ovviamente solo una teoria in quanto ad
oggi nessuno è riuscito a decifrare i segnali dei neuroni né, tanto meno, a capire il
“linguaggio” che permette la codifica dell’impulso in rilascio chimico di
neurotrasmettitori.
Esiste una relazione lineare tra numero di potenziali d’azione e l’ampiezza
dello stimolo, ma questa relazione è valida solo fino ad una determinata frequenza.
La frequenza di spike non può infatti superare un certa soglia (Figura 1.4). Questa
soglia dipende dal periodo refrattario e crea una sorta di saturazione al di sopra della
quale non è possibile andare. Se uno stimolo viene applicato per un lungo periodo, il
numero di potenziali d’azione emessi durante il tempo di osservazione inizia a
decrescere a causa di un adattamento del neurone. Molti neuroni non creano
potenziali d’azione in risposta a stimoli con ampiezza piccola. Questa proprietà
introduce una soglia inferiore che è variabile in funzione del neurone considerato
(Figura 1.4).
Fig.1.4 Andamento della relazione ampiezza dello stimolonumero di potenziali d’azione
12
CAPITOLO 1
Il sistema nervoso e le sue proprietà
Risulta difficile quindi stabilire quali siano i parametri rilevanti nella risposta
neurale, parametri che sicuramente possono variare in base alla natura del neurone,
allo stimolo e alla situazione.
Il “codice di frequenza”, ossia il numero di spike durante un dato periodo che
contiene informazioni circa la natura e l’ampiezza dello stimolo in questione, non è
sempre valido. A volte infatti il numero di potenziali d’azione emessi durante il
tempo di osservazione non varia come una funzione dell’ampiezza dello stimolo, ma
il numero resta costante, mentre la frequenza aumenta in funzione dell’ampiezza; la
finestra di osservazione diventa così più piccola.
In altri casi, a variare in funzione dell’ampiezza, è il primo intervallo di
interspike, oppure la distribuzione degli intervalli di interspike durante la risposta.
Questi infatti risultano essere proporzionali all’ampiezza dello stimolo.
Gli studi condotti finora sono basati sull’assunzione che lo stimolo elettrico
sia definito unicamente dal potenziale d’azione, e tutte le evidenze di possibili
“codici” sono state trovate analizzando la proporzionalità con l’ampiezza di
stimolazione. In realtà, tutto questo flusso di stimoli elettrici sembra determinare
delle modifiche morfologiche e sinaptiche a livello dei neuroni e tali modifiche,
grazie alle moderne tecniche di imaging, non sono più un mistero. Il problema però
rimane, poiché si conosce l’effetto ma si sa poco o nulla sui meccanismi che lo
determinano.
E’
quindi
indispensabile
capire
come
l’organizzazione,
anatomicamente definita dei neuroni, determini un flusso di informazione.
1.5 I principi dell’organizzazione cerebrale
Fu Ramòn y Cajal a fornire la maggior parte delle prove sperimentali in
favore della nozione, ormai assodata, che i neuroni sono le unità elementari
responsabili dei messaggi nervosi e che ogni neurone è una cellula distinta dotata di
processi che prendono origine dal corpo cellulare (teoria del neurone). Egli fu anche
il primo a intuire altri due principi dell’organizzazione cerebrale che si rilevarono di
notevole importanza per lo studio dei sistemi di comunicazione del sistema nervoso.
13
CAPITOLO 1
Il sistema nervoso e le sue proprietà
Il primo principio è ora noto come principio della polarizzazione dinamica
(Figura 1.5). Esso afferma che , in ogni neurone, i messaggi nervosi viaggiano
sempre in una sola direzione: dalle zone di ricezione alle zone d’innesco (cono
d’emergenza) a livello dell’assone. Da qui il potenziale d’azione si propaga poi
unidirezionalmente per tutta la lunghezza dell’assone fino alle terminazioni
presinaptiche.
Fig.1.5 Illustrazione del principio della polarizzazione dinamica
Il secondo principio, o principio di specificità delle connessioni (Figura 1.6),
afferma che le cellule non si connettono indifferentemente le une con le altre
formando reti casuali; ciascuna cellula invece stabilisce connessioni specifiche, a
livello di zone specializzate di contatto, solo con particolari cellule bersaglio
postsinaptiche ma non con altre [Ramon y Cajal37].
14
CAPITOLO 1
Il sistema nervoso e le sue proprietà
Fig.1.6 Illustrazione del principio della specificità delle connessioni
Il principio della polarizzazione dinamica e quello della specificità delle
connessioni costituiscono nel loro insieme, i fondamenti cellulari del connessionismo
moderno.
Tutte le funzioni cerebrali relative al comportamento, all’analisi delle
informazioni sensitive, alle risposte emozionali e alla fondamentale facoltà mentale
di conservare le informazioni ricevute (apprendimento), vengono svolte da gruppi di
neuroni specificatamente interconnessi [Nicholls92].
Esistono due tipi di connessioni, di cui uno noto con il nome di divergenza
neuronale, particolarmente diffusa negli stadi di ingresso del sistema nervoso. Questa
connessione consente a un solo neurone di far pervenire i suoi messaggi a molte
cellule bersaglio, un solo neurone può quindi esercitare influenze diverse e diffuse (1
Æ molti). L’altro genere di connessione, detto convergenza, è strutturato in maniera
opposta, ossia più neuroni attivano una singola cellula e questo si ritrova
comunemente negli stadi di uscita del sistema nervoso (molti Æ 1).
Non tutti i segnali nervosi sono eccitatori, risulta infatti che circa la metà di
tutti i neuroni generano segnali inibitori. I neuroni inibitori liberano un
neurotrasmettitore che riduce la probabilità che si generi un potenziale d’azione.
Classifichiamo due tipi di inibizioni: l’inibizione anterograda (o feed-forward) e
l’inibizione retrograda (o feed-back).
Nell’inibizione anterograda, l’interneurone inibitorio può stabilire contatto
con due neuroni eccitatori antagonisti, in questo modo, quando il neurone da cui
15
CAPITOLO 1
Il sistema nervoso e le sue proprietà
riceve il segnale entra in attività, l’interneurone inibitorio viene eccitato e a sua volta
inibisce il neurone antagonista. L’inibizione anterograda è spesso reciproca.
Nell’inibizione retrograda, invece, un neurone può stabilire connessioni di
tipo eccitatorio sia con una cellula bersaglio che con un interneurone inibitorio che, a
sua volta, stabilisce una connessione inibitoria con il neurone di origine. In tal modo,
quando il neurone di origine entra in attività, esso eccita contemporaneamente la
cellula bersaglio che l’interneurone inibitorio e quest’ultimo acquista pertanto la
facoltà di limitare l’efficienza con cui il neurone attivo eccita la propria cellula
bersaglio.
1.6 Reti di neuroni
La diversa localizzazione delle funzioni rappresenta una delle strategie
fondamentali impiegate dal sistema nervoso. L’analisi che riguarda aspetti specifici
dell’informazione afferente è localizzata in zone ben definite del sistema nervoso.
Vengono create delle mappe specifiche nelle quali convergono le informazioni
provenienti da una specifica parte dell’organismo. Queste mappe costituiscono il
primo stadio del processo che porta alla creazione di una rappresentazione cerebrale
del mondo in cui viviamo.
I neuroni che costituiscono queste mappe, di qualsiasi tipo siano, non
differiscono sostanzialmente per quanto riguarda le loro proprietà elettriche. Essi
svolgono funzioni diverse perché stabiliscono connessioni diverse nel sistema
nervoso. Tali connessioni si formano nel corso dello sviluppo e determinano quale
sarà il ruolo di ogni cellula nervosa nella manifestazione di un certo comportamento.
Risulta ormai chiaro che la logica delle operazioni che stanno alla base di una
rappresentazione mentale può essere compresa solo se si conosce la sequenza con cui
il flusso delle informazioni percorre le connessioni che costituiscono le diverse
mappe celebrali. I meccanismi nervosi che impiegano diversi aggregati di neuroni o
diverse vie nervose per convogliare informazioni similari prendono il nome di analisi
in parallelo, più neuroni prendono parte contemporaneamente allo stesso tipo di
analisi.
16
CAPITOLO 1
Il sistema nervoso e le sue proprietà
I meccanismi di analisi in parallelo rappresentano un mezzo di fondamentale
importanza nella strategia dell’evoluzione naturale, in quanto sono in grado di dare
origine a strutture cerebrali sempre più efficienti, aumentando sia la velocità che la
precisione delle funzioni del sistema nervoso. L’importanza delle connessioni in
parallelo è oggi universalmente riconosciuta anche nella costruzione di modelli
informatici che cercano di ricostruire le funzioni celebrali. I ricercatori che si
occupano della cosiddetta intelligenza artificiale si sono presto resi conto che i
modelli seriali erano in grado di svolgere operazioni modeste se paragonate
all’attività cerebrale, proprio per la natura intrinseca del modello stesso.
Di conseguenza la maggior parte degli informatici che si occupano di
intelligenza artificiale, sono oggi orientati verso lo studio di sistemi costituiti da
dispositivi in parallelo. I risultati ottenuti da questi modelli sono il più delle volte in
accordo con le ricerche fisiologiche. I modelli connessionisti prevedono che i singoli
elementi non trasmettano grandi quantità di informazioni. Non è infatti la
complessità dei singoli neuroni che rende il cervello una sorprendente “macchina”
d’analisi delle informazioni, quanto la molteplicità degli elementi della rete e la
complessità delle loro connessioni. Il fatto che i neuroni stabiliscano reciprocamente
connessioni specifiche non spiega però le modificazioni a cui è soggetto il
comportamento umano, l’apprendimento e l’aumento delle capacità cognitive con il
passare del tempo. La soluzione che si è dimostrata essere la più ragionevole è
l’ipotesi della plasticità. La formulazione più moderna di questa ipotesi risale al 1948
ed è citata dallo psicologo polacco Jerzy Konorski nel seguente modo:
“L’applicazione di uno stimolo mette capo, nel sistema nervoso, a due tipi di
modificazioni… La prima proprietà, in virtù della quale la cellula nervosa reagisce
allo stimolo afferente… viene detta eccitabilità e… chiameremo variazioni dovute
all’eccitabilità… le variazioni che derivano da questa proprietà. Chiameremo invece
plasticità la seconda proprietà in virtù della quale, in determinati sistemi neuronali,
si stabiliscono talune modificazioni funzionali permanenti a seguito di particolari
stimoli o di particolari loro combinazioni, e indicheremo queste modificazioni con il
nome di modificazioni plastiche.”
17
CAPITOLO 1
Il sistema nervoso e le sue proprietà
Esistono oggi numerose prove della plasticità delle sinapsi chimiche. Le
sinapsi chimiche mostrano spesso delle modificazioni funzionali a breve termine che
aumentano o diminuiscono notevolmente la loro efficacia funzionale. Si osservano
poi anche delle modificazioni a lungo termine, che comportano modificazioni
anatomiche, come l’eliminazione di connessioni preesistenti e perfino lo sviluppo di
nuove connessioni. E’ proprio questa plasticità a conferire a ogni singolo individuo
una propria singolare individualità [Konorski48].
1.7 Plasticità sinaptica
La caratteristica fondamentale che distingue i sistemi neurali dai sistemi
informatici classici è la loro abilità di apprendimento. Due motivi fondamentali
hanno forzato l’evoluzione di questa capacità: innanzitutto i continui cambiamenti
dell’ambiente in cui viviamo e delle nostre caratteristiche fisiche (che il cervello
deve controllare) fanno sì che il nostro controllore debba avere una flessibilità
immensa. Secondariamente, la complessità delle funzioni che il cervello deve
svolgere, e la ridondanza necessaria a garantirne l’affidabilità, richiedono un enorme
numero di neuroni ed un numero ancor più grande di sinapsi; determinare a priori
(cioè geneticamente) il valore di tutte le connessioni sarebbe chiaramente
improponibile. L’apprendimento è mediato da due meccanismi: durante il periodo
dello sviluppo si ha la creazione di connessioni tra neuroni e la morte di connessioni
e neuroni non utilizzati; in seguito connessioni pre-esistenti vengono rinforzate od
indebolite. Analizziamo brevemente i meccanismi che mediano questi ultimi
processi.
Il termine plasticità sinaptica si riferisce alla proprietà delle sinapsi di
cambiare la loro efficacia, cioè l’entità dell’effetto post-sinaptico indotto da un
evento pre-sinaptico. In prima approssimazione tale efficacia può essere espressa
come:
R=n·p·q
18
CAPITOLO 1
Il sistema nervoso e le sue proprietà
dove “n” indica in numero totale di vescicole presenti nei siti pre-sinaptici di
tutte le connessioni tra il neurone pre-sinaptico ed il neurone post-sinaptico, “p”
indica la probabilità di rilascio di una singola vescicola di trasmettitore, e “q” è una
misura dell’entità dell’effetto post-sinaptico causato dal rilascio di un quanto di
neurotrasmettitore.
Va notato che, nel definire “n”, abbiamo indicato come vi possano essere
molteplici connessioni tra gli stessi due neuroni. Mentre in molti casi (specialmente
tra neuroni corticali) vi è infatti una sola connessione tra due neuroni, spesso vi è
un’elevata ridondanza di connessioni, che può essere interpretata come un metodo
per garantire l’affidabilità della trasmissione. Esempi di questo tipo sono
rappresentati dalle connessioni tra la retina ed il nucleo genicolato, tra le fibre
rampicanti e le cellule di Purkinje nel cervelletto, e dalle giunzioni neuromuscolari.
In quest’ultimo caso “n” può raggiungere valori dell’ordine del migliaio.
Anche se questo non è ancora stato stabilito con certezza in tutti i casi,
sembra che il meccanismo che porta alla modifica dell’efficacia di una connessione
passi attraverso un cambio della probabilità di rilascio del neuro-trasmettitore. Per
indicare ciò, “p” viene quindi espressa come:
p(t) = p0 + ( pmax- p0 ) · e –t/τ
La probabilità cambia quindi istantaneamente, per poi tornare al suo valore
originale seguendo un andamento esponenziale caratterizzato da una costante di
tempo “τ” . Il valore della costante di tempo può variare da qualche centinaia di
millisecondi (nel qual caso si parla di facilitazione o di depressione) fino ad ore,
giorni, settimane od anche più (nel qual caso si parla di long-term potentiation [LTP]
(Figura 1.7) o di long-term depression [LTD]) [Tank89].
19
CAPITOLO 1
Il sistema nervoso e le sue proprietà
Fig.1.7 Illustrazione schematica di un paradigma di induzione LTP
A. Un impulso debole (schematizzato a sinistra) evoca la risposta post-sinaptica abbozzata dal
lato destro della figura. B. Una forte sequenza di stimoli (schematizzata a sinistra) innesca
propagazione post-sinaptica (il picco del potenziale d’azione di destra). C. L’impulso della
prima prova applicato in un tempo successivo evoca una più grande risposta post-sinaptica
(linea continua di destra) della risposta iniziale (linea tratteggiata di destra).
Gli eventi che portano all’induzione di una variazione della probabilità “p”
sono molteplici; in generale, variazioni di breve durata possono venir indotte da
eventi esclusivamente pre-sinaptici (per esempio nel caso in cui uno spike presinaptico sia seguito immediatamente da un altro, il secondo avrà una maggior
probabilità di provocare il rilascio di trasmettitore), mentre variazioni di lunga durata
solitamente richiedono una combinazione di eventi pre-sinaptici e post-sinaptici. Per
esempio, è stato stabilito che per poter indurre LTP in certe sinapsi è necessario che
il raggiungimento della sinapsi da parte di uno spike pre-sinaptico sia seguito, entro
un tempo ben definito, da una depolarizzazione della membrana post-sinaptica
(provocata, per esempio, dalla propagazione all’indietro di uno spike dalla zona di
trigger del neurone post-sinaptico, attraverso l’albero dendritico e fino alla zona postsinaptica). Nel caso in cui la tempistica non venga rispettata nulla accade, mentre se
l’ordine degli eventi viene invertito è possibile indurre LTD. In questa maniera,
sinapsi che hanno contribuito alla generazione dello spike vengono potenziate,
mentre sinapsi che non sono correlate con la generazione degli spikes vengono
20
CAPITOLO 1
Il sistema nervoso e le sue proprietà
indebolite (è inoltre possibile che vi sia una generale tendenza ad indebolire tutte le
sinapsi, cosicchè sinapsi che non vengono periodicamente potenziate tendono a
morire). Questo tipo di apprendimento, che è stato proposto inizialmente su base
teorica da Hebb (da cui il nome Hebbian learning), è quello più usato nelle reti
neurali artificiali, e costituisce la base delle memorie autoassociative [Hebb49].
Siano xi e yi due nodi, allora la variazione dei pesi avverrà secondo la
seguente legge ∆wij = xiyj; come conseguenza lo stimolo fornito da un neurone ad un
altro attraverso l’assone rinforzerà la connessione (il peso). Il peso della sinapsi sarà
quindi variato in funzione del prodotto degli stati dei due neuroni. Il peso verrà
aumentato se i neuroni hanno valori concordi, diminuito in caso di valori discordi.
Le reti neurali artificiali, la loro capacità di apprendimento e memorizzazione
saranno argomento centrale nel seguito di questa tesi.
21
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
2.1 Cervello e computer
Dopo l’avvento del calcolatore negli anni sessanta, nello studio delle attività
mentali, accanto alla psicologia ed alle neuroscienze, si è proposta un’altra
disciplina: l’intelligenza artificiale. Essa ha posto alla base della sua indagine degli
assunti teorici così vicini a quelli dell’indirizzo dominante di psicologia, la
psicologia cognitiva, da giungere ben presto a formare con essa il nucleo delle
“scienze cognitive”.
Negli anni ottanta si è proposto nell’ambito dell’intelligenza artificiale un
nuovo “paradigma”, chiamato connessionismo, che si è proposto come antagonista
rispetto
all’intelligenza
artificiale
“classica”,
legata
al
paradigma
della
rappresentazione simbolica della conoscenza [McClelland86].
L’idea di base di questo paradigma è che “la mente è ciò che fa il cervello”.
Questo significa che il modo migliore per studiare il comportamento sia costruire
modelli che riprendano le caratteristiche fondamentali del dispositivo che lo
generano: il cervello.
Il connessionismo afferma che la totalità dei processi cognitivi dei sistemi
naturali, ed in particolare la flessibilità, la sensibilità al contesto, la robustezza al
rumore, la capacità di apprendere dall’esperienza, siano producibili solo da sistemi
che presentano alcune caratteristiche tipiche del cervello [Parisi90].
Per questo il connessionismo ha assunto come suo modello fondamentale le
“reti neurali”. Una rete neurale cattura alcuni tratti essenziali del cervello. Essa è
composta da unità (neuroni), connessioni tra unità (sinapsi), propagazione delle
attivazioni da un’unità all’altra (potenziali di attivazione), attivazione delle unità
sulla base delle eccitazioni ed inibizioni provenienti dalle altre unità, modificazioni
della conduttività delle connessioni attraverso l’esperienza.
22
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
Le reti neurali costituiscono un’alternativa rispetto ai modelli delle scienze
cognitive e dell’intelligenza artificiale classica. In particolare, le reti neurali si
differenziano da questi modelli in quanto prendono in considerazione i seguenti
aspetti del cervello.
L’informazione, al pari di quanto avviene nel cervello, circola nelle reti
neurali in forma quantitativa. In particolare la “memoria” del sistema risiede nella
conduttività delle connessioni delle unità della rete, che nella simulazione è
sintetizzata da un numero (peso). Anche le informazioni che sono scambiate tra le
unità sono di carattere quantitativo (numeri che sintetizzano l’intensità degli impulsi
scambiati). Le elaborazioni che sono realizzate dalle unità, poi, consistono in
funzioni matematiche, cioè in una associazione di impulsi (numeri) in uscita ad
impulsi (numeri) in entrata.
Esistono però delle limitazioni tecniche nell’implementare le reti neurali sul
calcolatore. Se confrontiamo il numero di neuroni presenti in un cervello umano con
il numero di bit presenti in una tipica workstation di fascia alta, ci rendiamo presto
conto come questi siano molti di più. Questo limite è tuttavia stato superato da alcuni
supercomputer. Il cervello umano, infatti, si evolve molto lentamente, mentre le
memorie del computer crescono in fretta.
In ogni caso, la differenza in capacità di immagazzinamento è minima
rispetto a quella in velocità e parallelismo. I chip dei computer possono eseguire
un’istruzione in qualche decina di nanosecondi, mentre i neuroni richiedono
millisecondi per essere attivati. Il cervello va però oltre, tanto da recuperare e
superare questo svantaggio, questo perché tutti i neuroni e tutte le sinapsi possono
lavorare contemporaneamente mentre la gran parte dei computer attuali ha al più
qualche CPU.
Una rete neurale artificiale che giri su un computer seriale richiede centinaia
di cicli per decidere se una singola unità-neurone deve essere attivata, mentre nel
cervello tutti i neuroni svolgono questa operazione in un singolo passo. Quindi,
anche se un computer è un milione di volte più veloce in velocità di commutazione,
il cervello finisce con l’essere un miliardo di volte più veloce nell’ottenere il
risultato. Una delle attrattive dell’approccio basato su reti neurali artificiali è la
23
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
speranza che possa essere costruita una macchina che combini il parallelismo del
cervello con la velocità di commutazione del computer [Haken91].
La caratteristica fondamentale delle reti neurali, da cui derivano diverse
proprietà, è la mancanza di simbolismo. Le informazioni, diversamente da quanto
accade per i sistemi di intelligenza artificiale classica, non sono codificate attraverso
simboli che hanno un significato univoco e corrispondono ognuno ad una particolare
entità del mondo. Il motivo di fondo è che due simboli possono essere tra loro del
tutto identici o del tutto diversi. Due numeri invece, possono avere infiniti gradi di
libertà.
Le informazioni relative alle entità reali del mondo, proprio in quanto sono
contenute nei pesi delle connessioni delle unità che sono collegate in rete e
concorrono collettivamente ad esprimere le risposte date dal sistema agli stimoli
provenienti dall’ambiente, sono distribuite su più punti della rete e l’informazione
risulta così diffusa. Inoltre sono sovrapposte, nel senso che un peso concorre ad
immagazzinare più contenuti di memoria. Questo, se da una parte può portare a
produrre interferenza tra i ricordi, dall’altro consente il funzionamento della memoria
associativa, cioè della memoria che recupera i ricordi sulla base di frammenti di essi
o stimoli in qualche modo legati ad essi. La memoria associativa è probabilmente
alla base delle abilità come la creatività, la capacità di generalizzazione, la sensibilità
al contesto e la robustezza al rumore, che come detto manca ai sistemi prodotti
dall’intelligenza artificiale classica.
Il cervello e le reti neurali, non sono dotati di un elaboratore centrale di
informazione né di particolari magazzini di memoria in cui sono contenute le
informazioni come accade per i calcolatori. Sono piuttosto dotati di un grande
numero di unità particolari, ciascuna in grado di svolgere delle elaborazioni molto
semplici dei segnali (come la somma o l’amplificazione). Le prestazioni complessive
del sistema sono l’espressione dell’operare in parallelo di queste unità.
La natura di sistema complesso del cervello, accanto alla natura quantitativa e
diffusa dell’informazione contenuta in esso che consente di togliere ai simboli il
ruolo di unico veicolo della conoscenza, rappresenta un salto epocale nella storia
dello studio del pensiero e della conoscenza. Infatti l’avere riconosciuto che alcuni
24
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
caratteri sono strettamente legati alla natura di sistema complesso del cervello,
richiede dei cambiamenti drastici sia nella visione della loro essenza, sia nelle
tecniche utilizzabili per la loro indagine. La ragione di questo risiede nel fatto che i
sistemi complessi hanno dei caratteri così radicalmente diversi dai sistemi semplici.
2.2 Caratteristiche dei sistemi complessi
Un sistema complesso è un insieme molto grande di elementi che
interagiscono localmente tra di loro in modo tale che dalle loro interazioni emergono
le proprietà globali del sistema. Queste proprietà globali sono emergenti nel senso
che, diversamente da quanto accade nei sistemi semplici, non sono previste o
deducibili dalla conoscenza degli elementi e dalle regole che governano le interazioni
locali. Nel loro studio quindi, il riduzionismo incontra seri limiti.
La non riducibilità del comportamento di un sistema complesso alle leggi di
interazione locale delle unità di cui è composto, sebbene tale comportamento derivi
da esse, dipende da una serie di proprietà dei sistemi complessi.
I sistemi complessi tendono ad organizzarsi su più livelli gerarchici. Questi
livelli hanno dei legami e delle interazioni che non sono univoci e deterministici: un
cambiamento ad un livello può riflettersi sul livello superiore o inferiore in modo
molto differente a seconda di una serie di condizioni al contorno.
Le singole unità elementari dei sistemi complessi hanno poco peso nel
determinare il comportamento del sistema. Ciò che determina tale comportamento è
l’azione collettiva e parallela di tante unità interagenti. Questo di per sé limita la
possibilità di “ridurre” la spiegazione di un fenomeno osservato a livello globale del
sistema, all’azione di poche variabili sottostanti. Essa comporta che una
perturbazione di entità limitata possa dar luogo a cambiamenti catastrofici nel
sistema mentre una perturbazione importante possa essere riassorbita senza
particolari conseguenze. Inoltre due sistemi possono partire da stati iniziali molto
simili e divergere poi moltissimo tra di loro mentre in altri casi due sistemi, partendo
da stati iniziali parecchio dissimili, convergono con il tempo.
25
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
Le unità e i livelli dei sistemi complessi sono caratterizzati da “legami
sistemici”, cioè da relazioni circolari, da meccanismi omeostatici e da relazioni di
feedback, che tendono a sostituire le relazioni lineari di causa o di effetto tipiche dei
sistemi semplici.
I sistemi di interesse biologico per lo studio del comportamento sono inoltre
adattativi, si modificano cioè in funzione dell’ambiente in cui si trovano. I sistemi
complessi adattativi hanno l’importante caratteristica di possedere dei meccanismi
sofisticati che consentono dei cambiamenti a livello delle unità elementari come
riflesso di eventi accaduti a livello globale. I sistemi complessi adattativi hanno una
natura intrinsecamente evolutiva. Essi tendono a portare dentro, in ogni momento,
delle tracce della loro storia passata, che accumula informazione a livello di struttura.
I sistemi complessi sono spesso caratterizzati dalla presenza di eventi casuali.
Il rumore costituisce spesso la fonte di creazione di nuove strutture ed organizzazioni
che consentono al sistema di far fronte a nuove situazioni, consentendo così il
processo di adattamento stesso. Essi hanno una struttura tipicamente dinamica. La
dinamicità ed il cambiamento sono essenziali per consentire i processi circolari, di
adattamento, di emergenza dell’organizzazione dal rumore.
Il cervello è un tipico sistema complesso: i neuroni costituiscono le sue
componenti elementari, le eccitazioni e le inibizioni, le funzioni di trasferimento
all’interno dei neuroni, le modificazioni delle sinapsi, costituiscono le leggi di
interazione locale del sistema.
Il sistema complesso cervello è organizzato su più livelli gerarchici, si
possono individuare in esso almeno i livelli seguenti:
•
livello dei singoli neuroni, sinapsi, neuro-trasmettitori, potenziali;
•
livello dei “circuiti” di neuroni;
•
livello delle aree funzionali del cervello, aventi una certa specializzazione;
•
livello del comportamento e dell’attività mentale dell’organismo.
Il comportamento e la cognizione sono le proprietà globali emergenti del
sistema complesso cervello. Questo implica che solo usando dei modelli che
26
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
incorporano le caratteristiche essenziali dei sistemi complessi, come le reti neurali,
potremo sperare di comprendere a fondo le relazioni esistenti tra il livello
microscopico del cervello, quello dei neuroni, ed il livello macroscopico, quello del
comportamento [Haykin94].
2.3 Le reti neurali artificiali
La base teorica delle reti neurali artificiali è il connessionismo, già citato in
precedenza. La teoria del connessionismo parte dal presupposto che le reti neurali
artificiali sono in grado di apprendere dall’esperienza tramite semplici modulazioni
della forza delle connessioni tra le unità. Questa teoria, oltre ad avvicinare questi
sistemi a quelli biologici dal punto di vista teorico, offre una convincente alternativa
all’apprendimento basato sulla costruzione di regole esplicite: non vi è nessun centro
di costruzione di regole del sistema; semmai le regole emergono da una descrizione
di livello più astratto, mentre ad un livello più basso tutta l’informazione è
immagazzinata nelle connessioni delle unità.
Una rete neurale è composta da un certo numero di nodi, o unità, connesse da
collegamenti. Ciascun collegamento ha un peso numerico associato ad esso. I pesi
sono il principale mezzo di memorizzazione a lungo termine nelle reti neurali e
l’apprendimento ha luogo aggiornando i pesi. Alcune unità sono collegate con
l’ambiente esterno e possono essere designate come unità di ingresso e di uscita. I
pesi vengono modificati in modo tale da portare il comportamento della rete, in
termini di associazione delle uscite agli ingressi, ad essere più in linea con quanto
richiesto dall’ambiente che fornisce gli input [Hopfield84].
Ciascuna unità ha un insieme di collegamenti d’ingresso che proviene da altre
unità, un livello di attivazione corrente, e un modo per calcolare il livello di
attivazione all’istante successivo dati i suoi ingressi e i relativi pesi. L’idea è che
ciascuna unità effettui un calcolo basato sugli ingressi provenienti dai suoi vicini
senza bisogno di alcun controllo globale sull’insieme di unità nel suo complesso.
Nella pratica la maggior parte delle reti neurali è implementata tramite software, e
27
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
usa dei controlli sincroni per aggiornare tutte le unità secondo una sequenza
prefissata.
Per costruire una rete neurale che svolga un qualche compito si deve
dapprima decidere quante unità occorre usare, che tipo di unità sono adatte, e come
tali unità devono essere connesse per formare una rete. Dopodichè si inizializzano i
pesi della rete e li si addestra impiegando un algoritmo di apprendimento che si serve
di un insieme di esempi di addestramento specifici per quel compito. L’uso di esempi
implica anche che si debba decidere in che modo codificare gli esempi in termini di
ingressi e di uscite dalla rete.
2.4 Architettura di una rete neurale artificiale
Una rete neurale artificiale può essere schematizzata come segue (Figura 2.1):
X1
W1
Funzione di
attivazione
X2
…..
Uscita
W2
Σ
…..
f
y
…..
…..
W3
X3
θ
Soglia
Fig 2.1 Schematizzazione di una rete neurale artificiale
Esistono “n” canali d’ingresso xi..xn a ciascuno dei quali è associato un peso. I
pesi wi sono numeri reali che corrispondono al segnale prodotto dalle sinapsi. Se
28
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
wi>0, il canale è detto eccitatorio, se wi<0, il canale è detto inibitorio. Il valore
assoluto del peso rappresenta la forza della connessione.
Il segnale con cui il neurone trasmette la sua attività all’esterno (l’uscita) è
calcolato applicando la funzione di attivazione alla somma pesata degli ingressi.
Indicando con:
La somma pesata degli ingressi si ottiene:
La funzione di attivazione f(a) è detta anche funzione di trasferimento.
Nel modello di rete rappresentato in figura 2.1 è stata inclusa anche una
soglia (θ) che ha l’effetto di abbassare il valore in ingresso della funzione di
attivazione. Di conseguenza la somma pesata degli ingressi si ottiene nel seguente
modo:
Interpretando la soglia come il peso associato ad un ulteriore canale in
ingresso x0 di valore sempre costante pari a -1 si può scrivere:
con w0 = θ
La funzione soglia definisce l’uscita di un neurone in relazione al livello di
attivazione.
L’uscita può essere un numero reale o un numero intero appartenente a un
certo intervallo discreto (tipicamente {0,1} oppure {-1,+1}).
Esistono diversi tipi di funzione di attivazione:
29
CAPITOLO 2
•
I sistemi complessi: le reti neurali artificiali
Funzione soglia (Figura 2.2)
L’uscita di un neurone che usa una funzione di attivazione a soglia è:
Fig.2.2 Funzione di attivazione a soglia
•
Funzione lineare (Figura 2.3)
L’uscita di un neurone che usa una funzione di attivazione lineare è:
Fig.2.3 Funzione di attivazione lineare
•
Funzione lineare a tratti (Figura 2.4)
30
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
L’uscita di un neurone che usa una funzione di attivazione lineare a tratti
è:
Fig. 2.4 Funzione di attivazione lineare a tratti
•
Funzione sigmoide (Figura 2.5)
Le funzioni sigmoidi insieme alle funzioni soglia sono tra le più usate.
Un esempio di funzione sigmoide è la funzione logistica definita come:
Fig 2.5 Funzione di attivazione sigmoide
31
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
Si può osservare che, mentre la funzione soglia assume solo valori 0 e 1, una
funzione sigmoide assume tutti i valori da 0 a 1. Notiamo inoltre che la funzione
sigmoide è derivabile ovunque mentre la funzione soglia non lo è.
Esistono molti tipi di reti neurali che sono differenziati sulla base di alcune
caratteristiche funzionali di seguito citate:
•
tipo di utilizzo;
•
tipo di apprendimento;
•
architettura dei collegamenti;
•
algoritmo di apprendimento.
Per quanto riguarda l’architettura dei collegamenti, le reti neurali si
classificano in base al modo con cui i nodi (neuroni) si dispongono. Questi possono
disporsi su uno o più strati, in particolare si distinguono reti a uno strato, reti a due
strati e reti a più strati. In questi ultimi due tipi, gli strati esterni svolgono la funzione
di strato di input e strato di output, simulando all’incirca ciò che avviene nel cervello
dove ci sono neuroni a contatto diretto con gli organi di senso e neuroni che
governano il movimento.
Si possono identificare diversi tipi di architettura di una rete.
•
Reti completamente connesse o non stratificate (Figura 2.6)
Fig.2.6 Scema di una rete completamente connessa
32
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
In una rete completamente connessa ogni neurone è connesso in modo
bidirezionale con tutti gli altri.
•
Reti stratificate (Figure 2.7-2.8)
Nelle reti stratificate si individuano degli strati di neuroni tali che ogni
neurone è connesso con quelli dello strato successivo, ma non esistono connessioni
tra i neuroni all’interno dello stesso strato, né tra neuroni di strati diversi, né tra
neuroni di strati non adiacenti.
Nello strato di ingresso non avviene alcuna computazione, i neuroni di
ingresso devono semplicemente passare allo strato successivo i segnali ricevuti
dall’ambiente esterno.
Strato d’ingresso
Strato d’uscita
Fig.2.7 Schema di rete stratificata a due strati
33
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
Strato d’ingresso
Strato nascosto
Strato d’uscita
Fig.2.8 Schema di rete con strato nascosto
Prima di passare a una descrizione dettagliata della rete neurale utilizzata nel
protocollo dell’esperimento (descritta nel capitolo 4), vediamo alcune informazioni
di carattere generale sulle sue proprietà e il perché è stato scelto questo tipo di rete.
2.5 SOM e ITSOM
La rete neurale da noi utilizzata è la ITSOM (Inductive Tracing Self
Organizing Maps). Tale categoria di reti neurali rientra nelle reti auto-organizzanti o
SOM (Self Organizing Maps). Si tratta di reti con apprendimento non supervisionato,
in grado di apprendere senza nessuna indicazione esterna. Il modello più famoso e
utilizzato è quello proposto da Teuvo Kohonen e noto appunto con il nome di
Kohonen [Kohonen90].
L’apprendimento avviene secondo la regola di Winner Take All, vengono
calcolate le distanze D (wi,xi) tra gli input xi = (x1,..,xn)T e i pesi delle connessioni
wi = ( w1,..,wn)T secondo una funzione distanza D, per esempio quella euclidea. La
SOM prevede a questo punto un meccanismo cosiddetto di inibizione laterale, che è
presente anche in natura sotto forma di trasformazioni chimiche a livello sinaptico
[Kohonen97].
Nella regione corticale del cervello, neuroni fisicamente vicini ad un neurone
attivo mostrano legami più forti, mentre ad una certa distanza iniziano a mostrare
34
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
legami inibitori. In questa architettura ciascun elemento riceve sia stimoli eccitatori
da parte degli elementi adiacenti (la cosiddetta neighborhood), sia stimoli inibitori da
parte degli elementi più lontani, secondo la cosiddetta forma a cappello messicano
(Figura 2.9).
Fig.2.9 Andamento della funzione a cappello messicano
L’esistenza della neighborhood è utile per non polarizzare la rete su pochi
neuroni vincenti, in tal modo vengono attivati solo gli elementi con distanza inferiore
a un certo valore, in casi restrittivi solo l’unità con minima distanza [Pizzi02a].
Le ITSOM sono state costruite poiché, nel caso di input strettamente non
lineari e tempovarianti, le prestazioni delle SOM sono limitate. Il motivo è che se la
non linearità della topologia di input è troppo accentuata lo strato di output non è in
grado di dipanarsi a sufficienza su questa forma di topologia. La seconda ragione
riguarda la difficoltà di pervenire ad una convergenza certa (non essendoci la
possibilità di stabilire un errore della rete per ciascuna epoca), e dal numero ridotto
dei neuroni dello strato competitivo. Un altro problema delle SOM è la mancanza di
esplicitazione dell’output. Una volta ottenuta la classificazione dell’input, l’utente
deve estrapolarne il significato con una procedura ad hoc, che in applicazioni in
tempo reale può penalizzare ulteriormente il carico computazionale [Ritter86],
[Ritter88].
Osservando la sequenza temporale dei neuroni vincenti di una SOM si nota
che questa tende a ripetersi creando una serie temporale, costituente attrattori caotici
35
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
o precisi cicli limite, e che questi caratterizzano univocamente l’elemento di input
che gli ha prodotti. La regola di apprendimento delle ITSOM fa sì che il peso
vincitore rappresenti un’approssimazione del valore d’input. Ad ogni epoca il nuovo
peso vincitore, insieme al peso che ha vinto nell’epoca precedente, va a costruire
un’approssimazione del secondo ordine del valore di input e così via. È quindi
possibile ricavare il valore dell’input confrontando le configurazioni caratteristiche di
ciascun input con le configurazioni proprie dei bit del middambolo, di cui è noto il
valore. Viene così effettuato un vero e proprio processo di induzione, perché una
volta prodotta una quantizzazione vettoriale molti-a-pochi dall’input sullo strato dei
pesi, si opera un passaggio pochi-a-molti da configurazioni di neuroni note alla
totalità degli input (Figura 2.10).
Fig.2.10 Schema che illustra il funzionamento di una ITSOM
Va sottolineato che tale rete non necessita di essere portata a convergenza,
perché le configurazioni di neuroni vincenti raggiungono la stabilità entro poche
decine di epoche. Per ottenere migliori risultati, la rete non deve polarizzarsi su pochi
neuroni ma nemmeno disperdersi su tutto lo strato. L’algoritmo ottimale per
riconoscere le configurazioni create dalla rete si basa sul metodo degli z-score. I
punteggi cumulativi relativi a ciascun input vengono normalizzati secondo la
distribuzione della variabile standardizzata “z” data da:
36
CAPITOLO 2
I sistemi complessi: le reti neurali artificiali
Fissata una soglia “τ” compresa tra 0 e 1, che costituisce quindi uno dei
parametri di questo tipo di rete, si pone poi:
In questo modo ogni configurazione dei neuroni vincenti è rappresentata da
un numero composto da zeri e uni, tanti quanti sono i pesi dello strato di output.
Diventa poi immediato confrontare tra loro questi numeri binari.
Il meccanismo delle SOM è stato scritto tenendo conto di quanto avviene
sulla neurocorteccia. Risulta infatti che input simili siano mappati su luoghi vicini
della corteccia in modo ordinato conservando la topologia. Sia le SOM che le altre
reti neurali artificiali apprendono grazie alla ripetizione ciclica dello stimolo di input.
Anche nel cervello esiste la prova dell’esistenza di circuiti in grado di rinforzare
l’impressione dell’informazione di input. Sembra però improbabile che la medesima
configurazione di input possa attivare un unico bersaglio, ma è più ragionevole
pensare che le mappe corticali siano costituite da un insieme di neuroni attivati, la
cosiddetta traccia mnestica che servirà per il recupero successivo dell’informazione.
Per questo motivo il meccanismo delle ITSOM sembra essere più vicino a quanto
accade sulla neurocorteccia. Anche l’idea che l’apprendimento di nuove
informazioni avvenga utilizzando la traccia mnestica di un insieme di informazioni
preesistenti sembra essere confermato da esperimenti. Sembra essere confermato da
diversi studi che l’apprendimento non sia un processo completamente basato su
esempi, ma nemmeno completamente non supervisionato e necessiti di punti noti
[Pizzi02b].
37
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
CAPITOLO 3
Tecnologie di integrazione elettronico/biologiche
3.1 Sistemi ibridi
Il passo successivo all’emulazione delle proprietà biologiche è quello di una
vera e propria integrazione tra neuroni e circuiti elettronici. Il tentativo di connettere
il cervello al calcolatore prende origine dal fatto che entrambi, anche se in modo
diverso, comunicano elettricamente. L’idea di provare ad interfacciare direttamente i
due sistemi è una sfida non solo tecnologica, ma i cui risultati potrebbero portare alla
comprensione di molti misteri delle scienze cognitive.
Allo stato attuale delle conoscenze teoriche e della tecnologia a disposizione
non siamo in grado di stabilire che cosa ci riservi il prossimo futuro, se dovremo
aspettarci tessuti cerebrali integrati nei computer oppure chip integrati direttamente
nel nostro cervello. Una cosa però è certa: qualunque siano le ricerche svolte in
questo campo, ci aiuteranno a capire meglio l’architettura del cervello. Tutto ciò
porterà ad uno sviluppo di applicazioni scientifico-tecnologiche fino ad ora
impensate.
Cercare di comprendere come l’informazione si conservi in una rete di
neuroni è un’operazione alquanto complessa a causa delle numerose variabili in
gioco. E’ pensiero comune dire che gli impulsi scambiati tra i neuroni “codificano”
informazione. Questo trova riscontro in numerosi lavori ritrovati in letteratura, dove
si ricerca un linguaggio all’interno del segnale neurale. In realtà facendo questo
dimentichiamo che gli impulsi scambiati “sono” informazione, e ciò che si tenta di
fare è quindi decodificare qualcosa che solo apparentemente è codificato, ma in
realtà sappiamo essere privo di simbolismo. Per esempio potremmo dire che una
serie di stimoli scambiati all’interno di una mappa corticale determinano una traccia
mnestica, che servirà per il successivo recupero dell’informazione (memoria); in
realtà quella traccia “è” l’informazione.
38
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Per questo motivo ciò che verrà proposto nelle pagine seguenti è uno studio
integrato tra reti nervose e reti neurali artificiali, un metodo plausibile che consente
una comprensione della comunicazione neurale priva di simbolismi. L’utilizzo delle
reti neurali artificiali che, come visto nel capitolo precedente, presentano in maniera
semplificata le proprietà delle reti di neuroni, è un approccio diverso ai comuni
metodi di integrazione tra i sistemi biologico-elettronici che si basano su algoritmi
tradizionali e indagano su alcune caratteristiche del segnale.
Prima di presentare il progetto svolto dal nostro gruppo di ricerca, è
indispensabile citare alcuni dei lavori più significativi ritrovati in letteratura, per
meglio comprendere quanto sia nuovo e innovativo l’argomento trattato.
Ciò che è stato fatto in materia è frutto di studi condotti in tempi recenti a
partire dai primi anni novanta. Ripercorrendo i primi lavori fino a giungere ai giorni
nostri, ci si rende conto come l’introduzione di tecnologie innovative, e le teorie nate
a seguito dei primi esperimenti, abbiano permesso grossi passi da gigante in un lasso
di tempo piuttosto breve. L’argomento si è così ritrovato negli ultimi anni al centro di
numerosi dibattiti e conferenze in diverse parti del mondo e oggetto di studio di vari
gruppi di ricerca.
Nell’ultimo decennio molti laboratori nel mondo hanno effettuato esperimenti
sull’integrazione diretta neuro-elettronica al fine di sostenere la ricerca
neurofisiologica ma anche per sperimentare dispositivi ibridi, protesi bioelettroniche
e computazioni biologiche.
Poiché microelettrodi inseriti nel cervello determinano forme di rigetto e
infezioni, le ricerche si sono avviate verso la sperimentazione di un’adesione diretta
tra il tessuto neurale e i circuiti elettronici, con importanti risultati [Egert88],
[Akin94], [Wilson94], [Breckenridge95], [Bove96], [Canepari97], [Jenkner97],
[Jimbo00].
Le ricerche riguardanti campi come la biologia, l’informatica, l’ingegneria,
hanno trovato un comune denominatore. Gli scienziati che si occupano di queste
discipline hanno scoperto un modo di unire gli sforzi, applicando le loro conoscenze
in ambiti di ricerca comuni. Lo studio che unisce queste discipline apparentemente
diverse tra loro, prende il nome di “Biomorphic Robotics” e lo scopo di questa
39
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
disciplina è quello di creare delle interfacce che permettano la comunicazione tra
organismi animali ed apparecchiature elettroniche.
3.2 I passi salienti
Già nei primi anni novanta fu stabilita per la prima volta un’interfaccia
elettrica tra cellule nervose e microstrutture semiconduttrici, utilizzando i neuroni
delle sanguisughe, notoriamente grandi e quindi facili da manipolare, uniti a
transistor disposti su una piastra di silicio [Fromherz91].
In seguito a questi primi rudimentali esperimenti si è passati a studiare sia la
natura microscopica delle giunzioni neurone-silicio, sia nuovi sistemi ibridi che
combinavano neuroni a reti neurali con dispositivi microelettronici semiconduttori.
Tutto questo facendo molta attenzione a rispettare la struttura e le proprietà elettriche
e utilizzando contatti non invasivi, al fine di descrivere in modo corretto tali
giunzioni e ottimizzare l’interfaccia tra neuroni e chip. Lo scopo di questi sistemi
ibridi era quello di studiare i processi dinamici distribuiti, come l’apprendimento e la
memoria [Fromherz93], [Lindner96].
Nel 1999 sono stati condotti dal professor William Ditto e dai suoi
collaboratori, presso l’università di Atlanta (Georgia), alcuni esperimenti volti a
creare delle semplici computazioni attraverso i neuroni di sanguisughe.
L’esperimento consisteva nel collegare due neuroni tra di loro e ad un computer in
grado di inviare dei segnali in modo selettivo ad ognuno di essi. Ditto è stato in grado
di far compiere ai due neuroni una semplice addizione. In realtà, simulazioni al
computer hanno mostrato come grandi gruppi di neuroni siano in grado di compiere
moltiplicazioni e operazioni logiche. Le porte aperte da Ditto sono estremamente
affascinanti perché prospettano un futuro lontano in cui i biocomputer saranno in
grado di trovare soluzioni adatte a problemi che solo l’uomo oggigiorno è in grado di
risolvere [Garcia03].
Nel 1999 un altro gruppo di ricercatori ha condotto degli esperimenti su delle
reti neurali coltivate. Il loro scopo era quello di capire le correlazioni morfologiche
dell’apprendimento e della memoria. Questo progetto, sviluppato al Pine Lab del
40
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
California Institute of Technology, ha utilizzato sistemi di neuroni coltivati su di un
substrato di silicio. I neuroni prelevati dall’ippocampo di topi sono stati cresciuti su
delle piastre. Questi hanno formato rapidamente delle sinapsi, e hanno sviluppato
spontaneamente complessi schemi di connessione. Stimolando gruppi di neuroni con
vari schemi di potenziali d’azione simulati, si è sperato di osservare dei cambiamenti
nelle reti di neuroni. Questi segnali hanno indotto dei cambiamenti nel numero e
nella grandezza delle sinapsi, nella crescita dendritica e nell’interazione con le
cellule gliali [Pine99], [Maher99].
Nel 2000 un team di ricercatori della Northwestern University di Chicago,
dell’Università dell’Illinois e dell’Università di Genova, hanno presentato il risultato
delle loro ricerche: la realizzazione di una creatura ibrida costituita da un corpo
meccanico controllato dal cervello di un pesce. Il robot possiede pochi neuroni
prelevati dalla lampreda marina Petromyzon marinus, un vertebrato primitivo simile
alle anguille. Di fronte ad alcuni stimoli luminosi il robot ha presentato diversi
comportamenti: ha seguito la luce, ha evitato la luce, si è messo a “camminare” in
circolo. La ricerca originariamente avrebbe dovuto studiare gli adattamenti delle
cellule del cervello di fronte a stimoli che cambiano in continuazione, tuttavia
l’esperimento è andato oltre permettendo di comprendere in parte come i neuroni
comunichino con le macchine artificiali [Reger00].
Nel 2002, un team di ricercatori guidati da Catherine Schmidt dell’Università
di Austin (Texas), è riuscito a posizionare un semiconduttore esattamente nel punto
desiderato della superficie di una cellula nervosa umana, fatto di fondamentale
rilevanza, visto che fino ad ora le cellule nervose utilizzate erano solo quelle di topi,
sanguisughe e lumache.
Nel 2002 Peter Fromherz, un neuroscienziato del Max Planck di Monaco, ha
coltivato delle cellule nervose su una piastrina da cui emergevano minuscoli elettrodi
di silicio, rivestiti di un polimero spugnoso: dopo qualche giorno le cellule nervose
hanno stabilito rapporti tra loro, proprio come avviene nel sistema nervoso, ma
soprattutto hanno formato sinapsi con gli elettrodi di silicio, formando una rete
biologico-artificiale in cui i neuroni rispondevano ai segnali elettrici degli elettrodi e
questi ultimi ai segnali dei neuroni [Fromherz02], [Bels02].
41
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
L’elaborazione di reti neurali “miste” potrebbe aprire nuove strade sia nel
campo dell’informatica che in quello medico. Questi esperimenti sembrano fatti
apposta per indicare come le cellule nervose abbiano la proprietà di interconnettersi,
di interfacciarsi con materiali non biologici, di estrarre informazioni da ambienti e
realtà artificiali: in altre parole, i neuroni sono dotati della capacità di associarsi in
reti intelligenti e di interfacciarsi con circuiti elettronici, purché questi siano in grado
di recepire i loro segnali e ritrasmetterli alla rete di neuroni.
3.3 Integrazione tra neuroni e circuiti elettronici
Una cellula nervosa ha un diametro di circa 10-100µm ed è avvolta da una
membrana composta da un doppio strato lipidico elettricamente isolante. Il doppio
strato lipidico separa gli ioni sodio che circondano la cellula dagli ioni potassio
presenti nell’ambiente intracellulare. Le correnti attraverso la membrana, in entrambi
i sensi, sono mediate da specifici canali proteici per il sodio e per il potassio con una
conduttanza di circa 10-100pS.
I chip di silicio sono rivestiti da un sottile strato di biossido di silicio, che
rende i chip perfettamente inerti alle coltivazione di neuroni, impedendo il
danneggiamento delle proprietà elettrofisiologiche. Questo sottile strato evita la
corrosione del silicio e il conseguente danneggiamento delle cellule, in quanto blocca
il trasferimento di elettroni.
I neuroni sono conduttori di ioni, mentre il silicio è un conduttore di elettroni.
Una volta soppressa la corrente di Faraday all’interno dell’interfaccia del biossido di
silicio, l’accoppiamento tra cellule e chip può essere raggiunto solo attraverso la
polarizzazione elettrica. Se il doppio strato lipidico della cellula è direttamente in
contatto con lo strato di biossido di silicio colpito si forma un compatto dielettrico
che non permette il flusso di elettroni (Figura 3.1). Il campo elettrico che attraversa
la membrana cellulare, causato dall’attività neuronale, polarizza il biossido di silicio
così che la struttura elettronica del silicio risulta alterata. Al contrario, il campo
elettrico causato dal voltaggio applicato al chip, polarizza la membrana in modo da
alterare le conformazioni dei canali ionici e delle proteine di trasporto di membrana.
42
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Fig.3.1 Compatto dielettrico tra neurone e chip
Questo accade se la membrana del neurone e lo strato di biossido di silicio
sono a stretto contatto tra loro. Se facciamo crescere un neurone su un chip, il
compatto dielettrico non viene a crearsi, perché le proteine che sporgono dalla
membrana cellulare fanno si che tra il doppio strato lipidico e lo strato di biossido di
silicio si crei una pellicola elettrolitica (Figura 3.2).
La pellicola non è altro che uno spazio conduttore che scherma il campo
elettrico e annulla la polarizzazione dello strato di biossido di silicio e della
membrana cellulare. Tra la giunzione cellula-semiconduttore si forma così uno strato
centrale che funge da conduttore planare. Gli strati di biossido di silicio e della
membrana isolano lo spazio conduttore interno dall’ambiente conduttore del silicio e
del citosol. Questo fenomeno disaccoppia elettricamente il chip dalla cellula.
Fig.3.2 Pellicola elettrolitica e conduzione tra cellule e chip
Le correnti elettriche e la diffusione degli ioni in questa struttura governano la
stimolazione e la registrazione dell’attività dei neuroni sul chip.
Il primo passo per una interfaccia neurone-chip è determinato dal flusso di
corrente nello strato conduttore interno. L’attività del neurone porta correnti ioniche
e di spostamento attraverso la membrana cellulare, e la concomitante corrente lungo
lo strato interno crea un potenziale extracellulare transdotto (TEP) tra la cellula e il
43
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
chip. Un voltaggio transiente applicato al silicio porta le correnti di spostamento
attraverso lo strato di biossido di silicio.
Nell’interfacciamento neurone-chip, il TEP nello strato conduttore viene
registrato da strumenti voltaggio-sensibili nel chip o nella cellula:
•
il TEP indotto dal neurone genera un campo elettrico nel biossido di silicio;
•
il TEP indotto dal chip crea un campo elettrico attraverso la membrana cellulare.
Per descrivere la giunzione silicio-neuroni può essere usato il modello 2D
area-contatto di seguito mostrato (Figura 3.3):
Fig.3.3 Modello 2D area contatto
La corrente lungo lo spazio tra cellula e silicio è bilanciata dalla corrente di
spostamento attraverso il silicio e dalla corrente ionica e di spostamento attraverso la
membrana. La conservazione della carica elettrica per unità di area della giunzione è
espressa dalla seguente formula (1):
La parte sinistra dell’equazione si riferisce al bilancio di corrente per unità di
lunghezza nello spazio tra il silicio e la membrana, mentre la parte destra si riferisce
44
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
alla corrente per unità di area attraverso la membrana e l’ossido. Nella parte di
sinistra compare il TEP della giunzione (VJ), e la resistenza dello spazio tra cellula e
silicio (rJ). “ ” è l’operatore di derivata bidimensionale. Nella parte di destra
compare il potenziale elettrico della cellula (VM), e il potenziale elettrico del
substrato (VS) con le rispettive capacità specifiche di area della membrana (cM) e del
substrato (cS), e la conduttanza della membrana attaccata allo spazio conduttore
interno (gJM).
Un altro modello che può essere usato è il modello che segue (Figura 3.4):
Fig.3.4 Modello a “punto di contatto”
Questo modello è detto a “punto di contatto”. Per molte applicazioni è
conveniente descrivere lo spazio conduttore interno con il circuito sopra mostrato.
Qui il bilancio di voltaggio è espresso dalla seguente formula:
Lo spazio conduttore interno è rappresentato da una conduttanza ohmica (gJ).
La membrana del neurone e il biossido di silicio, a contatto con lo spazio conduttore,
sono rappresentate rispettivamente dalle capacità globali (cM, cS). I voltaggi inversi
(ViO), generati dalle differenze di concentrazione ionica tra cellula e ambiente, sono
considerati uguali anche per la condizione di membrana libera. Nella formula
compare anche la conduttanza inversa della membrana attaccata allo spazio
conduttore interno (giJM).
45
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Un potenziale d’azione conduce una corrente elettrica attraverso la membrana
della cellula e attraverso il gap che separa cellula e chip. Il voltaggio extracellulare
VJ(t), che modula la struttura a banda del semiconduttore, nasce da una
sovrapposizione di tutte le correnti ioniche e capacitive, presenti nel contatto.
La forma e l’ampiezza del segnale è controllata dall’accumulo e dal rilascio
delle conduttanze di ioni (nella membrana), e dalla specifica conduttanza della
giunzione.
Monitorando l’attività dei neuroni si può osservare una certa varietà di segnali
che possono in qualche modo essere compattati in tre classi (Figura 3.5):
A. Il voltaggio extracellulare è proporzionale alla derivata prima del potenziale
d’azione. Questa risposta di tipo A-type avviene quando tutte le conduttanze
di ioni sono rilasciate nella giunzione e le correnti capacitive sono controllate.
B. Il voltaggio extracellulare è proporzionale al potenziale d’azione stesso.
Questa risposta di tipo B-type è stata osservata quando una non specificata
conduttanza prevale nel contatto in modo che una corrente ohmica attraverso
la membrana e il gap controlli il voltaggio extracellulare.
C. Il voltaggio extracellulare assomiglia all’inversa della derivata prima del
potenziale d’azione (C-type). Il segnale si presenta quando tutte le
conduttanze di ioni pertinenti sono accumulate nella giunzione.
46
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Fig.3.5 Rappresentazione delle tre classi di segnali
Possiamo quindi concludere che l’interfacciamento neuroni-chip è mediato
dal potenziale extracellulare transdotto (TEP). Un grande TEP risulta da grandi
correnti attraverso la membrana e il biossido di silicio, e da una bassa conduttanza
della giunzione. La registrazione e la stimolazione dell’attività dei neuroni sono
promosse da una piccola distanza tra membrana e silicio, da un’alta resistenza
specifica e da un grande raggio della giunzione cellula-silicio. Una registrazione
efficiente richiede un’alta conduttanza ionica (gJM) nella membrana attaccata allo
strato conduttore, mentre un’efficiente stimolazione richiede un’alta capacità area
specifica del chip [Fromherz03].
La distanza tra cellula e chip (~ 40-100nm) può essere misurata con un
metodo detto FLIC (FLuorescence Interference Contrast), che utilizzando la
microscopia, tiene conto dei diversi modi in cui una luce si comporta di fronte alla
superficie riflettente del silicio.
Lo spazio tra neurone e silicio ha una resistenza elettrica che corrisponde ad
un sottile film di elettroliti. La resistenza del film (rJ) è dell’ordine di 10 Mohm, con
una resistenza globale (gJ-1) intorno a 1 Mohm. Si può osservare che la larghezza
dello spazio è più grande dello spessore del doppio strato, elettricamente diffuso nel
47
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
biossido di silicio e nella membrana. Potrebbe essere un obiettivo rendere maggiore
la resistenza del film diminuendo la larghezza o aumentando la resistenza specifica
dello spazio.
La stimolazione del neurone attraverso l’interfaccia elettrica senza la presenza
di correnti di Faraday richiede un’alta capacità per area unitaria del chip, per far in
modo di iniettare corrente sufficiente nella giunzione. Sono stati costruiti punti di
stimolazione molto efficienti utilizzando silicio fortemente drogato con un sottile
strato di biossido di silicio [Bonifazi02].
3.4 Voltage-clamp e Patch-clamp
La tecnica del blocco di voltaggio o voltage-clamp è stata sviluppata alla fine
degli anni quaranta da Cole ed è stata ampiamente sfruttata in quegli anni per
studiare le caratteristiche elettrofisiologiche della membrana dell’assone gigante di
calamaro, permettendo a Hodgkin e Huxley di caratterizzare le conduttanze
all’origine del potenziale d’azione (o spike). Questo sistema consente di misurare
l’intensità e la direzione delle correnti ioniche che fluiscono attraverso la membrana,
in funzione del potenziale di membrana che viene imposto, e del tempo. Gli
esperimenti vengono condotti in condizioni ioniche intracellulari ed extracellulari
controllate. L’andamento delle correnti nel tempo è legato alla conduttanza di
membrana (G) dalla relazione di Ohm:
I = G • (Em - Eioni)
In blocco di voltaggio si studia quindi come varia la conduttanza di
membrana in seguito a variazioni di potenziale [Cole49], [Hodgkin39].
Il blocco di voltaggio viene ottenuto con un meccanismo a feedback negativo:
il segnale del voltaggio misurato a cavallo della membrana è inviato a un circuito di
controllo, un amplificatore operazionale, che provvede a confrontarlo con il segnale
di comando, ovvero con il valore che si desidera imporre alla membrana (Figura 3.6).
48
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Fig.3.6 Schema circuitale del blocco del voltaggio
Ogni differenza tra il potenziale di membrana effettivo e il potenziale che si
desidera imporre viene pressoché istantaneamente corretta, fornendo alla membrana
corrente di intensità e carica opportuna. Il sistema è così in grado di mantenere
costante il potenziale della membrana, nonostante vari nel tempo la sua conduttanza
totale (per l’apertura o la chiusura di canali ionici).
Ciò che si registra sono l’intensità e la direzione della corrente che è
necessario pompare per portare e mantenere la membrana ai potenziali desiderati,
cioè la corrente che si deve fornire per caricare la componente capacitiva della
membrana e per controbilanciare la corrente che fluisce attraverso i canali, quella che
altrimenti determinerebbe la variazione di potenziale.
Per realizzare una registrazione con la tecnica del blocco di voltaggio sono
necessari due microelettrodi in contatto con il citoplasma della cellula e un elettrodo
di riferimento immerso nel bagno di registrazione. Dei primi due citati, uno misura il
potenziale di membrana, l’altro serve a pompare corrente all’interno della cellula.
Prendiamo ora in considerazione un esperimento di registrazione, in voltageclamp, delle correnti che fluiscono attraverso la membrana. In seguito a
depolarizzazioni crescenti queste correnti presentano un andamento prima verso il
basso (per convenzione questo rappresenta un flusso di cariche positive entranti) e
poi nel tempo la deflessione diventa positiva (flusso di cariche positive uscenti).
Questo andamento delle correnti, anche se a potenziali bloccati, è già indicativo di
quanto avviene nel potenziale d’azione. La corrente entrante è depolarizzante in
condizioni fisiologiche e genererà la fase ascendente del potenziale d’azione. In un
tempo successivo si attiva una corrente di cariche positive uscente, che ci può
spiegare la ripolarizzazione della membrana durante lo spike.
49
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Il patch-clamp inventato da E. Neher e B. Sakmann misura il potenziale a
cavallo
della
membrana
cellulare utilizzando una micropipetta di vetro
opportunamente forgiata, con un diametro della punta di circa 1µm. La micropipetta
di vetro è riempita da una soluzione elettrolitica. Un filo di argento clorurato è
immerso in questa soluzione e assicura il collegamento con lo strumento di
registrazione.
All’atto della registrazione, la micropipetta viene appoggiata sulla membrana
cellulare, quindi viene applicata una leggera depressione al suo interno migliorando
l’adesione della cellula. Il vetro dell’elettrodo e la membrana cellulare stabiliscono
così un contatto ad elevatissima resistenza elettrica. Se nella membrana sottesa dalla
punta della pipetta di vetro è presente anche un solo canale, è possibile registrare la
corrente che lo attraversa. Questa configurazione si chiama cell-attached. Da questa
configurazione una ulteriore depressione all’interno della pipetta provoca la
perforazione della membrana sottesa alla punta dell’elettrodo, mettendo quindi in
continuità la soluzione della micropipetta con l’interno della cellula. In queste
condizioni è possibile registrare le correnti che fluiscono attraverso tutti i canali
presenti nella membrana della cellula. La configurazione di questo tipo è detta di
whole-cell. Esistono altri due tipi di configurazioni che consentono registrazioni di
singolo canale. Dalla configurazione di whole-cell, se la pipetta viene leggermente
allontanata dalla cellula, si stacca un piccolo frammento di membrana. In questo caso
si registra l’attività dei canali rimasti nel pezzettino di membrana e la configurazione
è detta di outside-out, perché la superficie esterna del pezzettino di membrana
(outside) rimane rivolta verso la soluzione extracellulare (out). Un altro tipo di
configurazione viene raggiunto partendo ancora una volta dalla configurazione di
cell-atteched. Allontanando la pipetta dalla cellula si stacca una vescicola di
membrana. La vescicola esposta all’aria si apre. Una volta riimmersa nel bagno la
superficie interna del pezzetto di membrana (inside) rimarrà rivolta verso la
soluzione extracellulare (out), questa configurazione è detta di inside-out. Tutte
queste configurazioni causano dei danni alla cellula, indispensabili per rilevare il
segnale.
50
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Lo schema circuitale per il patch-clamp è concettualmente simile a quello già
spiegato per il blocco di voltaggio (Figura 3.6).
3.5 Micro-Electrode Array (MEA)
Un Micro-Electrode Array (MEA) è un array di microelettrodi su cui è
possibile coltivare diversi tipi di cellule o depositare dissezioni di tessuti per poter
effettuare studi di elettrofisiologia in modo veloce e innovativo (Figura 3.7).
Fig.3.7 Schema di registrazione elettrofisiologica effettuata
con Micro-Electrode Array
Esso è costituito da un disco di vetro o plastica, dove sono riportati dei piccoli
elettrodi. Ogni singolo elettrodo è connesso tramite una sottile pista isolata ad una
piazzola adibita al collegamento esterno del sistema. Questa può essere connessa al
calcolatore tramite appositi connettori che isolano l’intero sistema dall’ambiente
esterno.
Esistono diversi tipi di MEA che, pur essendo utilizzati per il medesimo
scopo, presentano caratteristiche strutturali e proprietà fisiche diverse. La distinzione
deriva dal tipo di materiale impiegato nella costruzione, dalle proprietà strutturali, e
dal numero di alloggiamenti per singolo MEA. Esistono MEA in grado di ospitare un
solo campione, altri invece permettono di registrare contemporaneamente da più
campioni.
Se per esempio consideriamo i MEA utilizzati nel protocollo che vedremo nel
capitolo successivo, prodotti dalla Panasonic (Figura 3.8), hanno un numero di
51
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
microelettrodi pari a sessantaquattro. Gli strati conduttori che portano il segnale
all’ambiente esterno hanno uno spessore di 0,15µm e lo strato isolante in
poliacrilammide che li separa è di 1,5µm.
Fig.3.8 Micro-Electrode Array (MEA)
I sessantaquattro microelettrodi sono arrangiati in una griglia 8x8 fissati al
centro di una piastra di vetro o plastica 50x50mm con uno spessore di 1,1mm. Ogni
elettrodo è 50x50µm e determina un bassissima impedenza (< di 22 KΩ) critica per
avere un buon rapporto segnale rumore. Ne esistono quattro modelli, con distanza
interpolare di 100, 150, 300, 450µm, per permettere misurazioni di piccole regioni
con interazioni a larga scala. Il cilindro entro il quale viene depositato il campione ha
un diametro interno di 20mm ed esterno di 25mm.
Di seguito (Figura 3.9) è mostrato uno schema che illustra come sono disposti
i microelettrodi e come vengono misurate le proprietà sopra citate.
Fig.3.9 Schema rappresentante la disposizione dei microelettrodi
52
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
I MEA utilizzati nei primi esperimenti erano costruiti con materiale diversi e
avevano altre proprietà strutturali. Il disco comprendeva quattro parti, ognuna delle
quali a sua volta suddivisa in cinque piccole aree contenenti circa tredici elettrodi
ciascuna. Approssimativamente il numero totale degli elettrodi presenti sull’intero
disco ammonta a circa 300 connessioni. La distanza tra gli elettrodi, in tungsteno,
variava in funzione del layout presente in ogni singola area, mediamente tale distanza
si aggira tra i 70 e i 100µm.
3.6 Voltage-clamp vs Micro-Electrode Array
La tecnologia dei MEA ha introdotto un nuovo modo per effettuare studi di
elettrofisiologia, eseguiti solitamente con le tecniche del voltage-clamp e patchclamp.
Le principali caratteristiche che rendono i MEA un valido strumento per
l’elettrofisiologia
sono
la
non
invasività
e
la
possibilità
di
registrare
contemporaneamente su diversi canali l’attività di materiale biologico vivente. La
prima caratteristica permette di poter registrare l’attività cellulare per lunghi periodi
di tempo senza determinare danni al tessuto oggetto di studio. La seconda permette
di poter registrare simultaneamente diversi canali e di poter analizzare i cambiamenti
indotti dalle stimolazioni elettriche [Borkholder97].
L’attività elettrica delle cellule, pur essendo la stessa, viene registrata
diversamente a causa delle proprietà strutturali e della tipologia di collegamento tra
elettrodi e materiale biologico che caratterizzano i MEA.
I segnali elettrici misurati nello spazio extracellulare sono dovuti al verificarsi
dei seguenti eventi tra lo spazio che separa le cellule dai microelettrodi:
•
l’attività della cellula che corrisponde alla variazione della conduttanza di
membrana (dovuta hai canali ionici) produce un flusso di corrente attraverso
il fluido circostante;
•
il flusso di corrente attraverso lo spazio conduttore instaura un campo
elettrico;
53
CAPITOLO 3
•
Tecnologie di integrazione elettronico /biologiche
il campo elettrico genera gradienti spaziali di potenziale.
Come si può osservare dai grafici sotto mostrati (Figura 3.10), l’andamento
del potenziale extracellulare registrato tramite MEA, che corrisponde all’incirca alle
correnti transmembrana, è approssimativamente equivalente alla derivata prima del
potenziale trasmembrana registrato in voltage-clamp. Vi è inoltre una stretta
relazione tra la frequenza contenuta nel segnale e l’andamento del segnale registrato
[Schatzthauer98].
Fig.3.10 Confronto tra segnali registrati tramite voltage-clamp e
segnali registrati tramite Micro-Electrode Array
Come si osserva dall’immagini sotto riportate (Figura 3.11) l’andamento del
segnale registrato con i MEA per correnti in bassa frequenza è equivalente
all’andamento della derivata prima del potenziale, mentre per correnti ad alta
frequenza varia avvicinandosi all’andamento del potenziale.
54
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
Fig.3.11 Dipendenza tra la frequenza e andamento del segnale registrato con i MEA
(a sinistra bassa frequenza a destra alta frequenza)
In ascissa, nei due casi sopra mostrati, il tempo è indicato con due scale
diverse; rappresentando con la stessa scala le due correnti avremmo ottenuto, nel
secondo caso, un picco rappresentato da un'unica riga (ciò che accade quando
registriamo da soluzioni elettrolitiche).
Particolare interesse suscita lo studio dei tessuti neurali tramite questi
strumenti di nuova generazione. Poiché sappiamo abbastanza sull’elettrofisiologia
del singolo neurone, ma poco sulla dinamica di una rete di neuroni, avere a
disposizione uno strumento come i MEA, che consente di correlare le attività tra i
differenti canali e definire la dinamica della rete, è un passo tecnologico importante
[Zeck01].
I segnali raccolti dalle reti di neuroni tramite MEA mostrano un’ampiezza
tipica nel range di 0.1-0.4mV (100-400µV), e sono circondati da un rumore
biologico e termico.
L’estrazione del segnale reale, espresso come ampiezza in funzione del tempo
è fatta grazie all’impiego di particolari filtri che eliminano il rumore di fondo e
rendono il segnale nitido e analizzabile. Per estrarre le caratteristiche degli spike e
burst è indispensabile processare i dati con un algoritmo ad hoc, in modo da rilevare i
potenziali d’azione.
55
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
3.7 Cellule staminali e Micro-Electrode Array
Gli esperimenti che vedremo nel capitolo successivo utilizzano i MEA per
registrare l’attività elettrica di una rete di neuroni. La differenza sostanziale tra
quanto ritrovato in letteratura e quanto verrà presentato riguarda la tipologia di
cellule utilizzate e di conseguenza la modalità con cui queste cellule si connettono tra
loro.
Oggetto di studio, in entrambi i casi, sono le cellule del sistema nervoso
(gliali e neurali), ma, mentre nei lavori citati in precedenza il tessuto neurale veniva
portato dal vivo ai MEA, per effettuare studi di elettrofisiologia (Figura 3.12); nel
caso dell’esperimento che troverete nelle prossime pagine le cellule vengono
coltivate direttamente in vitro a partire dalle cellule staminali.
Fig. 3.12 Rappresentazione schematica di un tessuto adeso al Micro-Electrode Array
Le cellule staminali utilizzate nel protocollo di preparazione delle cellule
neurali provengono da tessuti di cervelli ottenuti da feti umani abortiti naturalmente
dopo dieci settimane di gestazione. Le cellule staminali sono state prelevate dal
telencefalo e dal diencefalo e differenziate con apposito protocollo in vitro [Gritti01].
Prima di vedere nel dettaglio l’esperimento, riportiamo alcune proprietà
generali di queste cellule, in modo da comprendere meglio il perché sono state
utilizzate.
Il primo carattere distintivo delle cellule staminali è il loro stato altamente
indifferenziato. Questo significa che non possiedono le caratteristiche morfologiche,
56
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
strutturali, molecolari o antigeniche che si ritrovano nelle cellule differenziate del
tessuto cui appartengono.
Le cellule staminali sono inoltre dotate di capacità proliferativa. La
proliferazione è quel processo che ha come risultato finale la divisione della cellula.
Il processo avviene attraverso l’espressione ordinata e ciclica di pattern di geni
caratteristici, i cui prodotti possono variare in modo graduale o brusco. Se vengono
generate due cellule con lo stesso fenotipo (entrambe uguali alla cellula di origine o
entrambe progenitori), la divisione é detta “simmetrica”. Se invece si ottengono due
cellule con fenotipo diverso (una staminale e una progenitrice) si parla di divisione
“asimmetrica”.
Caratteristica fondamentale delle cellule staminali è la multipotenzialità, in
altre parole, la capacità di dare luogo a una progenie differenziata comprendente tutti
i tipi cellulari del tessuto di appartenenza o, nel caso delle embrionali, a tutte le
cellule dell’organismo adulto. La formazione di cellule differenziate a partire da
cellule staminali avviene dando origine a cellule intermedie, che costituiscono il
cosiddetto “compartimento dei progenitori di transito”, cellule più differenziate
rispetto alle staminali ma che mantengono la capacità di proliferare per un numero
limitato e predeterminato di cicli mitotici, generando alla fine un elevato numero di
cellule differenziate. Così, da una singola divisione di una cellula staminale, grazie al
compartimento di transito, vengono generate numerosissime cellule differenziate.
Un'altra
proprietà
che
caratterizza
questo
tipo
di
cellule
è
l’automantenimento. L'automantenimento è la capacità di una singola cellula, o di
una popolazione cellulare, di perpetuare se stessa; in molti casi il periodo di
automantenimento si estende su tutta la vita dell’organismo, ed in vitro può
permanere in maniera illimitata nelle opportune condizioni sperimentali.
La proprietà delle cellule staminali di mantenere la funzionalità dei tessuti
nell’organismo adulto è la diretta conseguenza della loro capacità proliferativa e
della multipotenzialità. Per mantenere l’omeostasi del tessuto, l’organismo utilizza
una strategia che prevede l’esistenza di una popolazione di cellule posta a metà
strada fra le cellule staminali e le cellule terminalmente differenziate dal punto di
vista della capacità proliferativa e differenziativa e che abbiamo già definito in
57
CAPITOLO 3
Tecnologie di integrazione elettronico /biologiche
precedenza come progenitori. La loro esistenza è dovuta al fatto che la via che porta
da una cellula staminale ad una funzionalmente competente può essere vista come
una transizione da un estremo, ovvero cellule staminali, in cui si ha capacità
proliferativa, all’estremo opposto, ovvero cellule terminalmente differenziate non più
in grado di dividersi. Poiché il passaggio avviene per stadi, fra questi due estremi si
colloca una popolazione di cellule eterogenea che possiede entrambe le potenzialità,
anche se in modo più limitato: queste ad esempio possono proliferare solo per un
numero limitato di cicli, poi la loro capacità proliferativa si arresta e si differenziano
in modo terminale [Galli03].
Negli ultimi anni il cervello umano e quello dei roditori hanno dimostrato di
possedere cellule precursori indifferenziate, mitoticamente attive e multipotenti, in
grado di rigenerare neuroni e cellule gliali. Mentre molti esperimenti hanno
individuato la presenza di cellule staminali nel cervello adulto in vivo, testato la
proliferazione e la capacità di rigenerarsi, molti altri hanno portato avanti
metodologie che hanno fatto sì che queste stesse cellule staminali potessero
espandersi e maturare in vitro [Vescovi99].
Grazie ad opportune condizioni chimico-fisiche è possibile generare in vitro
un tessuto neurale che presenta, per quanto sappiamo da diversi studi, caratteristiche
simili a quelle riscontrabili in vivo.
Il vantaggio è quello di poter coltivare cellule direttamente sui MEA,
ottenendo così una rete di neuroni che formi delle connessioni migliori con i
microelettrodi, e che quindi sia il più possibile integrata al circuito artificiale.
58
CAPITOLO 4
Materiali e metodi
CAPITOLO 4
Materiali e metodi
4.1 Preparazione dei MEA
Prima di entrare in merito all’esperimento di apprendimento, è bene fornire
alcune informazioni sulla preparazione dei MEA. Come accennato nel capitolo
precedente, le cellule staminali si prestano molto bene ad essere utilizzate in questo
tipo di esperimenti, per le proprietà di adattamento e proliferazione che le
caratterizzano. Queste cellule, sotto apposite condizioni, sono in grado di
differenziarsi e maturare sui MEA senza richiedere dissezioni multiple.
Prima di essere utilizzati i MEA, assemblati mediante silicone, devono essere
lavati accuratamente. Esiste un preciso protocollo di lavaggio che è indispensabile
seguire al fine di renderli idonei ad ospitare le cellule. Questo protocollo che
riportiamo di seguito consiste in:
•
lavare in alcool 70% la piastra servendosi di un bastoncino di cotone;
•
lasciare la piastra per 6 ore sotto l’acqua corrente, possibilmente distillata;
•
lasciare la piastra per 6 ore in alcool 70%;
•
lavare con 4 brevi risciacqui la piastra con detergente non saponato e acido;
•
sciacquare con alcool 70%;
•
lavare con acqua distillata;
•
lasciare in acqua distillata sotto raggi UV ventiquattrore;
•
aspirare l’acqua e lasciare asciugare sotto cappa sterile.
Al termine del processo di lavaggio è possibile fare aderire il matrigel ai
MEA. Il matrigel è composto essenzialmente da laminina, collagene IV,
proteoglicani, entactina e nidogeno. Esso è una molecola di adesione ricavata dal
sarcoma di verme, che si trova allo stato liquido a 4° C e gelifica a 37° C su plastica
o vetro in soli venti minuti. Il matrigel deve gelificare sui MEA formando lo strato
59
CAPITOLO 4
Materiali e metodi
necessario ad ospitare le cellule. Per impedire il distaccamento del matrigel e quindi
delle cellule adese dopo soli 2 o 3 giorni, il processo di gelificazione è prolungato a
ventiquattro ore. In questo modo il matrigel si stabilizza perfettamente permettendo
la maturazione cellulare nei venticinque giorni successivi.
Le staminali neurali, che si trovano sotto forma di neurosfere, sono dissociate
meccanicamente e piastrate sul matrigel come singole cellule. Per ogni MEA si
piastrano circa 50000 cellule staminali singole in presenza di fattori di crescita come
FGF2 (basic fibroblast growth factor), GDNF (glial cell line-derived neurotrophic
factor), BDNF (brain-derived nurotrophic factor), CTNF (ciliary neurotrophic
factor). Questi fattori di crescita servono rispettivamente per:
•
FGF2 Æ fondamentale per la neurogenesi e viene rilasciato dalle neurosfere;
•
GDNF Æ previene l’apoptosi dei neuroni e migliora la crescita di assoni e
dendriti;
•
BDNF Æ permette la sopravvivenza e il differenziamento dei neuroni in vitro
ed è coinvolto nelle sinapsi;
•
CTNF Æ aumenta la proliferazione, aumentando l’attività metabolica e
riducendo lo stress da differenziamento.
Dopo l’esposizione delle cellule staminali ai fattori di crescita per circa dieci
giorni e la loro rimozione, l’aggiunta di un medium di controllo arricchito con FCS
2% (fetal calf serum 2%) permette la generazione dei neuroni seguiti da astroglia e
oligodendrociti.
Un’interessante considerazione deriva dall’osservazione al microscopio del
MEA al quindicesimo giorno, quando sono ben visibili delle zone senza più matrigel
dove le cellule poggiano direttamente sugli elettrodi che formano il circuito del MEA
(Figura 4.1).
60
CAPITOLO 4
Materiali e metodi
Fig.4.1 Immagine al microscopio dei neuroni connessi agli elettrodi del MEA
Osservando il MEA si può vedere come ogni elettrodo è connesso attraverso
un sottile percorso isolato ad un collegamento esterno. Di tutti i collegamenti situati
nel supporto, alcuni fungono da input, altri da output, ed altri ancora mettono a massa
il sistema.
Il MEA viene collegato all’apposita morsettiera di collegamento (Figura 4.2)
per facilitarne la connessione al sistema di acquisizione.
Fig 4.2 Micro-Electrode Array connesso alla morsettiera di registrazione
I MEA vengono posti dentro ad un box termoregolato. La temperatura viene
mantenuta costante grazie una sonda termometrica, posta all’interno del suddetto
61
CAPITOLO 4
Materiali e metodi
box, connessa ad un circuito elettronico di controllo che provvede ad alimentare
alcune resistenze. Queste sono situate all’interno dell’alloggiamento delle vaschette
delle cellule, al fine di mantenere la temperatura costante a 37° C. Le resistenze sono
realizzate in carbone e alimentate in corrente continua. Per ottenere una buona
schermatura da disturbi di natura elettromagnetica, l’intero contenitore, realizzato in
plexiglass, è rivestito con una rete d’ottone con maglia da 1mm.
Il box termoregolato non risolve il problema dell’ossigeno e dell’anidride
carbonica che dovrebbero essere mantenuti ai livelli ottimali (ossigeno 20%, anidride
carbonica 5%), per permettere alle cellule una migliore sopravvivenza. Per ovviare a
questo problema, poiché non è possibile effettuare le registrazioni mantenendo le
cellule in un incubatore insieme al box termoregolato, viene utilizzato un buffer
Tyrode che permette di mantenere il PH e i livelli di glucosio necessari alle cellule.
Questo particolare buffer è costituito da 250ml di soluzione madre contenente NaCl e
KCl, 0,5ml di CaCl2 1M, 0,5ml di MgCl2 1M e 1,5gr di glucosio, per un PH finale di
7.4. Il buffer viene aggiunto al medium di coltura poco prima delle registrazioni.
L’aggiunta del Tyrode mantiene le cellule stabili, ovvero senza scatenare la
formazioni di vescicole apoptotiche per un tempo sufficiente a terminare le
registrazioni (circa due ore).
A causa delle limitazioni imposte dagli strumenti a disposizione, non è
possibile collocare le cellule esattamente nei punti desiderati. Le architetture
elettriche realizzate hanno costituito una sorta di letto sul quale sono state depositate
le cellule che hanno creato collegamenti tra loro al di là di quelli elettrici.
4.2 Sistema di acquisizione
Dagli elettrodi posti a contatto con le cellule viene prelevato, tramite un cavo
schermato, il segnale elettrico da misurare.
Il segnale entra in un amplificatore ad alta impedenza d’ingresso per una
prima amplificazione e successivamente passa attraverso due filtri Notch, accordati
sulla frequenza di 50Hz, al fine di eliminare eventuali disturbi generati dalla rete
elettrica. Dopo i filtri il segnale subisce un’ulteriore amplificazione e tramite
62
CAPITOLO 4
Materiali e metodi
accoppiamenti isolati viene trasferito alla scheda d’acquisizione istallata a bordo del
computer di gestione e di registrazione.
Il segnale della stimolazione, proveniente da un generatore interno, transita
attraverso dei relé allo stato solido per essere inviato alle cellule. I relé sono
comandati esternamente tramite l’uscita digitale della scheda di acquisizione in
sintonia con il relativo software di gestione.
Tutto il circuito elettronico (Figura 4.3) è completamente isolato e racchiuso
in uno spesso contenitore metallico il cui corpo viene connesso ad un conduttore di
terra.
Al fine di evitare che eventuali segnali spuri possano influenzare il sistema di
amplificazione, si è provveduto ad isolare completamente tutto il circuito elettronico
della sezione di preamplificazione. I segnali analogici entranti (acquisizione) e
uscenti (dopo amplificazione) sono completamente isolati dal mondo esterno tramite
circuiti elettronici realizzati dalla Texas Instruments; questi circuiti impediscono di
fatto qualsiasi accoppiamento tra i circuiti esterni e quelli interni.
Anche i segnali digitali di controllo sono completamente disaccoppiati dal
circuito interno tramite fotoaccoppiatori.
In questa maniera gli elettrodi connessi alle cellule non vengono a contatto in
nessun modo con il mondo esterno di misura/controllo. Quattro batterie ricaricabili a
ioni di litio provvedono ad alimentare tutti i circuiti elettronici: in questo modo viene
garantita una tensione pulita.
Tutto il sistema, alloggiamento vaschette e circuito di preamplificazione, è
connesso a terra.
La scheda di acquisizione, modello NI6052E DAQ, utilizzata negli
esperimenti è costruita dalla Soc. National Instruments ed ha le seguenti
caratteristiche:
•
velocità 333 kS/s a 16bit;
•
frequenza di acquisizione 10 kHz;
•
16 input analogici;
•
2 output analogici;
•
8 linee I/O digitali.
63
CAPITOLO 4
Materiali e metodi
Fig.4.3 Schema del circuito preamplificatore
64
CAPITOLO 4
Materiali e metodi
4.3 Protocollo di stimolazione e di registrazione dei segnali
L’esperimento riportato nelle pagine seguenti è stato applicato a tre tipi di
culture:
•
Neuroni ottenuti dalla coltivazione di cellule staminali neurali umane;
•
Cellule staminali neurali indifferenziate;
•
Neuroni ottenuti dalla coltivazione di cellule staminali neurali umane
sottoposte a trattamento con tetratossina (TTX).
La TTX è un’alcaloide che appartiene al gruppo delle neurotossine. Il
trattamento con TTX determina il blocco del trasporto degli ioni sodio attraverso la
membrana plasmatica, ciò si traduce in una profonda modificazione dell’eccitabilità
e nel blocco della conduzione dell’ impulso nervoso.
Il protocollo dell’esperimento che sotto riportiamo si basa sul presupposto
che una rete di neuroni umani può essere trattata come una rete neurale artificiale.
L’esperimento necessita quindi di una fase di training e di una fase di testing.
Nella fase di training le cellule sono state sottoposte per diverse volte a
stimoli sensoriali simulati da pattern digitali. Alle cellule sono stati forniti quattro
pattern, che per comodità sono stati indicati con le quattro direzioni canoniche
(avanti, indietro, destra, sinistra). Questa in realtà è una convenzione, determinata dal
fatto che il fine ultimo di questa applicazione è far muovere un robot. Non vi è infatti
alcun tipo di correlazione tra gli stimoli forniti e la reale informazione che si riflette a
livello biologico. Ciò che interessa è guidare i neuroni alla memorizzazione ed
all’apprendimento di pattern sensoriali verificando che vi sia una risposta coerente da
parte della rete di neuroni riprodotta in vitro.
Nella vaschetta contenente le cellule sono stati attivati otto canali utili per
riprodurre la stimolazione sensoriale. Questi canali sono stati selezionati dai
sessantaquattro elettrodi a disposizione imitando il processo pochi-a-molti molti-apochi che caratterizza il sistema nervoso.
65
CAPITOLO 4
Materiali e metodi
Ogni pattern è costituito da una matrice di otto bit per otto bit. Ogni bit ha la
durata di 300ms a 300mV ognuno. Le cellule sono state quindi stimolate per 2.4
secondi. La stimolazione è stata seguita da un secondo di pausa ed è stata ripetuta per
dieci volte. Ognuno dei quattro pattern è stato somministrato dieci volte per
permettere alla rete di neuroni collocata sui MEA di rafforzare alcune iterazioni e
non altre, in modo tale da apprendere la configurazione dei pattern e ricordarla
successivamente.
Al termine della decima stimolazione è stata attivata la registrazione della
risposta delle cellule nervose. Tale risposta è servita a fare apprendere alla rete
neurale artificiale le quattro direzioni.
I pattern forniti sono schematizzati di seguito (Figura 4.4). Le ordinate
rappresentano gli otto canali attivati contemporaneamente, mentre in ascissa è
riportato il tempo. Ogni casella mi rappresenta un bit, se la casella è annerita
significa che è stato fornito lo stimolo, altrimenti lo stimolo è nullo.
Fig.4.4 Pattern inviati alla rete di neuroni
66
CAPITOLO 4
Materiali e metodi
Terminata la fase di training si è passati a testare l’apprendimento della rete di
neuroni (fase di testing). Nella fase di testing si è inviata alla rete di neuroni una
stimolazione corrispondente ad uno dei quattro pattern. Tale stimolazione, della
durata di 2.4 secondi è stata seguita da una registrazione della risposta delle cellule
nervose. I pattern sono stati forniti in maniera casuale. Lo stimolo generato è stato
acquisito dalla rete neurale, la quale ha classificato tale risposta, sulla base di quanto
ricevuto nella fase di training, individuando una specifica direzione.
Il segnale di stimolazione è un segnale alternato a bassa tensione che può
essere preimpostato nel circuito di preamplificazione come un segnale in onda
quadra. La scelta di un segnale alternato è per evitare fenomeni di elettrolisi
all’interno delle colture delle cellule.
Nella figura sottostante (Figura 4.5) è mostrato un esempio di segnali inviati
ai
MEA
durante
l’esperimento:
come
si
può
vedere
vengono
inviati
contemporaneamente otto stimoli in zone differenti dei MEA.
Fig 4.5 Esempio di segnali di stimolazione inviati alle cellule
67
CAPITOLO 4
Materiali e metodi
4.4 Funzionamento della rete neurale
Il fine ultimo dell’esperimento, come detto, è quello di far apprendere a un
circuito di neuroni creato in vitro, dei pattern di segnali.
Poiché a priori non conosciamo nulla dei segnali in uscita dai MEA, per
capire se vi sia stato o meno l’apprendimento dei pattern potremmo ricorrere a
strumenti informatici classici, andando ad estrarre particolari proprietà dal segnale e
utilizzando degli algoritmi per decifrare l’informazione.
Questo però non garantirebbe la riuscita dell’esperimento, perché la
decodifica del contenuto informativo di una rete di neuroni non è possibile con i
metodi classici, che si applicano con evidenti limitazioni, allo studio dell’andamento
di singoli segnali.
Nel sistema presentato, invece di effettuare questo tipo di processazione ai
dati, si ricorre all’utilizzo di sistemi complessi, come le reti neurali. Le reti neurali,
grazie a proprietà come la flessibilità, la gradualità del cambiamento, l’adattamento
progressivo e la capacità di operare per analogia, riescono a classificare i segnali
uscenti dati, dai segnali in input. Tutto questo senza limitare l’informazione a
particolari proprietà del segnale, sapendo che il segnale stesso è informazione.
L’utilizzo delle reti neurali risolve questo problema andando a considerare l’insieme
dei segnali in parallelo.
La rete neurale utilizzata è una ITSOM, le cui caratteristiche generali sono
state ampiamente trattate nel capitolo 2. L’obiettivo della rete, generata in linguaggio
C, è la classificazione dei segnali provenienti dai neuroni in una delle quattro
direzioni: avanti, indietro, destra e sinistra.
Sappiamo che una rete neurale artificiale necessita di due fasi: una fase di
addestramento (o training) e una fase di validazione (o testing).
Nel caso di una rete neurale ITSOM, la prima fase serve per generare gli zscore di riferimento utilizzati, poi per la classificazione, mentre la seconda fase è la
vera e propria classificazione dei segnali direzionali grazie agli z-score acquisiti nella
fase precedente.
68
CAPITOLO 4
Materiali e metodi
Prima però di poter utilizzare la rete neurale, è indispensabile definire alcuni
parametri di fondamentale importanza che incidono profondamente sul suo
comportamento, che sono:
•
il numero di neuroni dello strato di input;
•
il numero di neuroni dello strato competitivo (o di Kohonem);
•
il numero di epoche per campionamento;
•
il tasso di apprendimento (ε) e il tasso di dimenticanza (α);
•
il valore soglia utilizzato nel calcolo degli z-score (τ);
•
la dimensione totale del file contenente i campioni da analizzare intesa come
numero di campioni presenti.
Dei valori assunti da questi parametri avremo modo di parlare nello specifico
nel capitolo 6, dove verrà presentato il lavoro sperimentale di taratura della rete.
Per poter classificare, la rete deve innanzitutto memorizzare i quattro stati
indicanti lo spostamento, acquisendo i segnali di risposta delle cellule nella fase di
training.
La ITSOM acquisisce tali informazioni attraverso una matrice di valori
decimali in virgola mobile (double per il linguaggio C). Questa matrice ha le
dimensioni di 10000 x 8, dove diecimila è il numero di campionamenti e otto sono i
canali da cui vengono prelevati i segnali. Una volta iniziata la fase di training la rete
scarta tutti i file di addestramento precedenti al decimo. Arrivato il decimo file di
training indicante lo spostamento, la rete inizia a generare gli z-score che serviranno
per il confronto nella fase successiva all’esperimento: il testing.
La rete acquisisce quindi 80.000 dati racchiusi in una matrice bidimensionale
composta da otto colonne e diecimila righe. Essa non viene analizzata in un'unica
volta, ma si divide il numero totale di dati (rappresentati da valori di potenziale) per
il numero di z-score di riferimento da generare per ogni direzione in ogni
campionamento. Tale nuovo valore viene diviso per il numero di neuroni di input
ottenendo il numero di campionamenti necessari per processare tutti i dati (Vedi
diagramma mostrato in figura 4.6). Tramite test empirici si è scelto di generare otto
69
CAPITOLO 4
Materiali e metodi
z-score di riferimento per ogni direzione. In pratica, ogni neurone ha in ogni
campionamento otto valori di 0 e 1, che indicano il suo stato vincente o perdente
risultante dall’elaborazione di quella parte di dati in input.
80.000 dati
Suddivisi in una
matrice da
8x10.000
:
1. Numero di
z-score per ogni
direzione
Stabilito da test
empirici assume
valore 8 per ogni
direzione.
80.000:8 =10.000
:
2. Numero di
neuroni in input
Il numero di
neuroni in input è
500.
10.000:500=20
=
Numero di
campionamenti
necessari per
processare tutti i
dati
Il numero di
campionamenti
per ogni
direzione è 20.
Da cui deriva la
matrice mostrata
in Figura 4.7
Fig.4.6 Diagramma che illustra il calcolo della matrice tridimensionale
degli z-score di riferimento
70
CAPITOLO 4
Materiali e metodi
Prendendo i valori di tutti i venti neuroni per campionamento si ha uno zscore di riferimento. Esiste una matrice tridimensionale per ogni direzione e in essa
si memorizzano tutti gli z-score di riferimento (Figura 4.7).
Fig.4.7 Matrice tridimensionale in cui si memorizzano gli z-score di riferimento
(esiste una matrice per ogni direzione)
Per ogni campionamento si determina il neurone vincente in base alla
distanza minima, quindi si provvede a punire o premiare tale neurone mediante la
modifica dei pesi. La premiazione del vincente si compie spostando il valore del peso
verso il valore della media degli input di una percentuale di tale distanza, determinata
dal tasso di apprendimento (ε). Si tiene conto delle vittorie di ogni neurone e si
definisce un numero oltre al quale è meglio scoraggiarne ulteriori. In questo caso e in
caso di neuroni perdenti, si attua una punizione mediante un lieve allontanamento del
peso dal valore medio degli input, questa volta grazie ad una percentuale indicata dal
tasso di dimenticanza (α). Più precisamente in questa fase si applicano le seguenti
regole:
•
Se il neurone viene selezionato per la prima volta come vincente viene
premiato:
71
CAPITOLO 4
•
Materiali e metodi
Se il neurone raggiunge una determinata soglia di vittorie e viene
riselezionato come vincente, viene punito e il contatore che tiene traccia delle
volte che ha vinto viene azzerato:
•
Se il neurone non è fra quelli vincenti allora viene punito:
Nelle formule Winew rappresenta il nuovo valore di peso che viene assegnato
al neurone, mentre Wiold il valore del peso prima del nuovo assegnamento.
Il tasso di apprendimento (ε) indica quanto vengono premiati i neuroni
vincenti, il tasso di dimenticanza (α) indica invece quanto vengono puniti i neuroni.
Tasso di apprendimento e di dimenticanza (ε,α) sono delle costanti comprese tra 0 e
1.
Questa fase viene ripetuta per un dato numero di epoche al fine di generare la
serie temporale di vittorie e approssimazioni necessarie alla creazione degli z-score
significativi. Questi ultimi vengono poi calcolati mediante l’algoritmo descritto nel
capitolo due e si arriva a rappresentare con sequenze di 1 e 0 le configurazioni dei
neuroni vincenti per ogni campionamento.
La differenza tra le fasi di training e di testing è data dal fatto che nella prima
fase non si procede a classificare gli z-score generati, ma li si memorizza in
un’apposita matrice. Si hanno così i riferimenti rappresentanti le configurazioni dei
neuroni vincenti in relazione ai diversi pattern di training ricevuti in input.
Tutto questo non avviene nella fase di testing, dove si procede invece alla
classificazione. Una volta generati gli z-score si procede al confronto con quelli
memorizzati nella matrice e non appena si riscontra una corrispondenza nella
configurazione degli z-score si classifica quel segnale di test come indicante quella
direzione. Si memorizza la classificazione e la si invia all’applicazione grafica.
72
CAPITOLO 4
Materiali e metodi
4.5 Interfaccia grafica e applicazione robotica
L’intero sistema è interfacciato graficamente per renderlo più gestibile da
parte dell’utente. La rete è una parte dell’intera applicazione creata tramite LabView.
LabView è un ambiente grafico con funzionalità incorporate per
l’acquisizione, l’analisi delle misure e la presentazione dei dati, che garantisce la
flessibilità di un potente linguaggio senza la complessità dei tradizionali tool di
sviluppo. Esso offre avanzate capacità di acquisizione, analisi e presentazione in un
unico ambiente.
Sul video sono presenti quattro tasti (Figura 4.8) che indicano le quattro
direzioni. Premendo uno di questi tasti, si invia alla rete di neuroni posta sui MEA,
una stimolazione corrispondente a uno dei quattro pattern citati in precedenza.
Fig.4.8 Interfaccia LabView per l’invio dei segnali
I segnali direzionali vengono generati da un’applicazione server. Essa li invia
alla scheda che li converte in segnali elettrici atti a stimolare i neuroni, quindi,
mediante la medesima scheda, riceve i segnali di ritorno dalle cellule e li memorizza
in file binari. La scheda di acquisizione istallata nel pc trasmette i segnali ad un
controller (Figura 4.9) e alle cellule mediante otto canali di trasmissione.
73
CAPITOLO 4
Materiali e metodi
Fig 4.9 Dettagli del controller
Una volta che il file binario è pronto, viene inviata una notifica che attiva
l’applicazione in cui è inclusa la DLL (Dinamic Link library) e nella quale si
provvede a visualizzare la direzione derivante dalla classificazione effettuata dalla
rete.
Entrambe le operazioni di training e di testing sono sufficientemente veloci e
quindi non si corre il rischio di rimanere indietro rispetto all’invio di segnali, fase
critica nell’applicazione di algoritmi di intelligenza artificiale al tempo reale.
Una volta terminata l’elaborazione dei dati, questa restituisce, sotto forma di
numero intero, la direzione in cui dovrà muoversi il robot virtuale o reale. Nel caso
della fase di training viene restituito un valore 0 detto di default, mentre nel caso in
cui un valore non venga classificato, non rientrando in nessuno degli z-score di
riferimento precedentemente generati, viene restituito il valore 5, anch’esso trattato
come caso di default.
Si è deciso di differenziare i due valori nonostante in LabView si abbia lo
stesso comportamento dal punto di vista della generazione dell’immagine e il robot
in entrambi i casi non si muoverà: ma le due situazioni hanno concettualmente
significati molto diversi.
In base al numero ricevuto LabView posiziona l’immagine sullo schermo nel
seguente modo e il robot si muove nelle seguenti direzioni:
1 Æ verso il basso (direzione del robot Æ indietro);
2 Æ verso l’alto (direzione del robot Æ avanti);
3 Æ verso destra (direzione del robot Æ destra);
74
CAPITOLO 4
Materiali e metodi
4 Æ verso sinistra (direzione del robot Æ sinistra).
Avviando l’applicazione si visualizza uno spazio bianco nel quale si muoverà
l’immagine rappresentante il robot (Figura 4.10) oppure se è attivo il sistema di
connessione al telecomando ad infrarossi si avrà il movimento del robot stesso
(Figura 4.12).
Fig.4.10 Interfaccia LabView per la visualizzazione dei movimenti del robot
e dei segnali in tempo reale
Il tempo di acquisizione dei segnali uscenti dalla coltura dei neuroni deve
essere inferiore a cinque secondi. Tale tempo comunque può essere variato anche
durante la fase sperimentale, per trovare il migliore valore per una corretta
elaborazione dei segnali ricevuti.
L’applicazione effettuata con attuatore robot (Figura 4.12) richiede l’invio dei
segnali non solo all’applicazione server ma anche al robot. I segnali in uscita che
comandano il robot devono essere come nell’esempio riportato nella figura
sottostante (Figura 4.11).
75
CAPITOLO 4
Materiali e metodi
Fig.4.11 Esempio di come devono essere i segnali in uscita che comandano il robot
Un’apposita scheda gestisce l’invio dei segnali infrarossi che consentono al
robot di muoversi. Per quanto riguarda il robot reale, la durata minima del comando è
di un secondo, la massima non ha limiti ma dipende dallo spazio disponibile per i
movimenti. La distanza tra un comando e l’altro deve essere uguale o maggiore di 5
ms.
La velocità media di spostamento in avanti/dietro del robot è di circa 80 cm/s
mentre per lo spostamento a destra e a sinistra sono necessari comandi con tempo
maggiore per far ruotare il robot su se stesso. Anche i tempi di attivazione di ogni
singolo comando dovrebbero essere variabili in modo da trovare sperimentalmente la
migliore performance.
I segnali di pilotaggio del trasmettitore a infrarossi che comanda il robot
provengono dalla porta parallela del computer.
Fig.4.12 Robot comandato a infrarossi
76
CAPITOLO 4
Materiali e metodi
4.6 Schema generale dell’apparecchiatura
Dopo aver visto tutte le componenti hardware e software prodotte per
eseguire il protocollo dell’esperimento, vediamo di capire, osservando lo schema
riportato di seguito (Figura 4.13), come tutte queste parti siano interconnesse tra loro.
Fig 4.13 Schema che mostra la connessione tra tutte le apparecchiature sopra illustrate
Le parti software, indicate per convenzione nel computer, sono costituite dal
programma per la generazione dei pattern e dalla rete neurale. Questa accoglie gli
stimoli in uscita dai MEA (indicati con il riquadro blu) grazie alla scheda
d’acquisizione e rielabora gli input inviando un segnale direzionale al robot.
Come si osserva dallo schema, le diverse componenti sono tutte isolate tra
loro e dall’ambiente esterno, questo per evitare fenomeni di disturbo del segnale.
Possiamo riassumere la fase di training con lo schema riportato in figura 4.14:
77
CAPITOLO 4
Materiali e metodi
FASE DI TRAINING
Generazione ed invio dei segnali, tramite controller, ai neuroni
I neuroni ricevono le stimolazioni e producono un output
che viene accolto dalla scheda di acquisizione
L’applicazione server registra le risposte dei neuroni in appositi file
Viene segnalata la presenza di un file alla ITSOM
La rete genera gli z-score di riferimento
x4
Fig.4.14 Schema riassuntivo della fase di training
Nella fase di testing la rete neurale artificiale non ha più movimenti da
memorizzare, ma solo segnali che devono essere classificati, quindi devono essere
confrontati con le quattro configurazioni binarie memorizzate in training. Prima del
confronto, i valori devono essere trasformati in z-score con una procedura analoga a
quanto descritto sopra. L’intera procedura relativa allo schema sopra mostrato può
essere riassunto per la fase di testing come riportato di seguito (Figura 4.15).
L’esecuzione della fase di testing, come si vede, comporta il movimento del
robot virtuale o, se connesso, di quello reale.
78
CAPITOLO 4
Materiali e metodi
FASE DI TESTING
Nell’applicazione server sono presenti i tasti delle quattro direzioni,
premendone uno si genera il segnale che viene inviato ai neuroni
I neuroni ricevono lo stimolo e producono una risposta
che viene accolta dalla scheda di acquisizione
Viene segnalata la presenza di un file pronto all’applicazione dedicata,
la quale ne estrae i contenuti e lo passa alla rete neurale
La rete neurale artificiale elabora i dati ricevuti
e cerca di classificare il segnale
Il segnale classificato viene inviato all’applicazione grafica
che visualizza il movimento / al robot che genera il movimento
Fig.4.15 Schema riassuntivo della fase di testing
Al fine di migliorare le prestazioni della rete neurale e al tempo stesso
d’indagare sulle proprietà dei segnali neurali in uscita dai MEA, nei capitoli seguenti
verrà presentato un software per l’analisi del segnale. Questo software, generato ad
hoc per l’apparecchiatura presentata e adattato nello specifico per l’esperimento di
robotica, consente di indagare su proprietà di statistica avanzata del segnale.
La potenzialità dell’intero sistema presentato in questo capitolo permette di
memorizzare in appositi file i segnali in uscita, e quindi di ripetere virtualmente
l’esperimento. Questo consente di agire off-line sui parametri della rete neurale con il
fine di migliorarne le prestazioni, come si vedrà nel capitolo 6.
79
CAPITOLO 5
Analisi dei segnali rilevati
CAPITOLO 5
Analisi dei segnali rilevati
5.1 Segnali e sistemi
I concetti di segnale e sistema sono presenti in un’ampia gamma di discipline
e campi applicativi, e le idee tecniche associate a questi concetti giocano un ruolo
importante in diverse aree scientifiche e tecnologiche. Le tensioni e le correnti
(funzioni del tempo) in ingresso o in uscita da una rete di neuroni sono esempi di
segnali , mentre la rete di neuroni è un esempio di sistema.
Sebbene la natura fisica dei segnali e dei sistemi possa essere differente, essi
sono dipendenti l’uno dall’altro. I segnali, che sono funzioni di una o più variabili
indipendenti, contengono informazioni riguardo lo stato di un sistema o di qualche
fenomeno, mentre i sistemi rispondono a sollecitazioni prodotte dai segnali
producendo a loro volta segnali o qualche comportamento desiderato.
La principale problematica che si affronta nello studio di un sistema è
l’analisi, ossia lo studio delle caratteristiche del comportamento di un dato sistema. Il
comportamento di un sistema viene descritto attraverso la relazione ingresso-uscita
mostrata in figura 5.1 [Ziemer83].
Fig.5.1 Schema della relazione ingresso-uscita
Come accennato nel protocollo di sperimentazione, le cellule sono state
sottoposte per diverse volte a stimoli sensoriali simulati da pattern digitali
(rappresentati dalla figura 4.4), e hanno generato un segnale. Questo segnale descrive
il comportamento del sistema biologico poiché può essere visto come un mezzo per
veicolare informazione sul suo stato o sul suo comportamento. L’informazione
80
CAPITOLO 5
Analisi dei segnali rilevati
veicolata da questo segnale può essere a sua volta utilizzata per comunicare,
prevedere, controllare, prendere decisioni.
Nel modello di memoria a disposizione sulla piastra dei MEA, l’elaborazione
dei segnali avviene in modo parallelo. In tale architettura, l’attività di un neurone
dipende sia da proprietà intrinseche, che dai segnali che gli inviano le altre cellule
nervose, pertanto una modifica nella dinamica delle sue connessioni può causare un
cambiamento nell’attività di tutto il sistema [Potter01].
Analizzando il segnale in uscita, pur non comprendendo fisicamente come la
dinamica delle rete possa modificarsi, è possibile verificare se vi sia una variazione
dell’intero sistema coerente con lo stimolo fornito. Possiamo inoltre verificare per
quanto tempo questa variazione si propaghi nel tempo. Queste analisi sono
importanti perché ci danno informazioni di carattere biologico e ci permettono di
modellare sistemi informatici.
5.2 Il campionamento dei dati
Dal momento della conversione A/D del segnale analogico di partenza
proveniente dalla rete di neuroni, questo si trasforma in una serie di valori digitali
discreti: non abbiamo quindi più a disposizione il segnale originale, ma solo la serie
di punti campionati, che dovrebbero esserne una rappresentazione corretta.
Questa rappresentazione non sarà corretta nel caso in cui la cadenza del
campionamento effettuato sia inferiore alla frequenza del segnale campionato. Il
segnale acquisito riprodurrà anzi in questo caso una forma d’onda inesistente o
fantasma chiamata alias. Questo fenomeno è definito aliasing, e l’errore connesso
“errore di aliasing”. Nell’analisi in frequenza, l’antitrasformata della trasformata di
Fourier non coincide più con il segnale acquisito, e questo fenomeno è definito
“ripiegamento nel dominio della frequenza”. Per questo motivo grosso interesse
riveste la frequenza di campionamento del segnale analogico emesso dalla rete di
neuroni [Shanmugan79].
Il teorema di Nyquist afferma che, per non incorrere in questo tipo di errore,
occorre campionare il segnale da acquistare ad una cadenza almeno due volte
81
CAPITOLO 5
Analisi dei segnali rilevati
superiore alla componente di massima frequenza contenuta nel segnale analogico.
Quindi nel caso per esempio di un segnale in ingresso di frequenza 1000Hz, la
velocità di campionamento dovrà essere superiore a 2000 campioni al secondo.
Nella pratica corrente si usa campionare a valori almeno tre o cinque volte
superiori la frequenza massima attesa del segnale analogico, cercando così di porsi in
condizioni di relativa sicurezza rispetto all’errore di aliasing.
Nei casi in cui si desideri ottenere, oltre ad una corretta informazione del
contenuto in frequenza del segnale analogico di partenza, anche una sua riproduzione
temporale abbastanza fedele, occorre campionare ad almeno dieci volte la frequenza
massima del segnale. Con l’apparecchiatura a disposizione riusciamo a campionare a
10 KHz, frequenza considerevole che ci permette di riprodurre il segnale piuttosto
fedelmente.
In molte applicazioni, inoltre, è preferibile registrare sequenze di dati di
lunghezza finita, per migliorare alcune caratteristiche dell’analisi spettrale (analisi
nel dominio delle frequenze). Il processo di terminazione di una sequenza, dopo un
numero finito di periodi, può essere pensato come la moltiplicazione di un segnale di
lunghezza infinita per una funzione finestra di lunghezza finita. In altre parole, la
funzione finestra determina quanto della sequenza impulsiva originale debba essere
osservata attraverso questa finestra.
Un altro parametro molto importante è la risoluzione, che definisce la più
piccola variazione nel segnale di ingresso misurabile dal sistema di acquisizione dati.
Nel nostro caso la scheda di acquisizione è dotata di un convertitore A/D a 16 bit e la
risoluzione vale 1/216 , che corrisponde a 1/65536, ovvero lo 0.0015% del fondoscala
selezionato. Quindi, per un fondoscala da 0 a 100mV, la risoluzione è 1,5µV.
Variazioni inferiori a questo valore non sono rilevate dal convertitore A/D
[Gibson93].
In questa trattazione è indispensabile considerare un'altra componente che
ritroviamo in fase di registrazione: il rumore. Il rumore è il peggior nemico delle
misure di segnali analogici. Si può presentare in varie forme ed è caratterizzato da un
andamento random. Le fonti di rumore sono varie e numerose e il livello di rumore
acquisito è generalmente maggiore per le schede con alta velocità di campionamento
82
CAPITOLO 5
Analisi dei segnali rilevati
(la scheda utilizzata ha una velocità di velocità 333kS/s), che acquisiscono rumore ad
alta frequenza. Quando il livello picco-picco del rumore è superiore alla risoluzione
della scheda, allora non sarà possibile usufruire di tutta la risoluzione del convertitore
A/D.
Per migliorare questa situazione difficile, l’apparecchiatura è stata dotata di
un sistema esterno di condizionamento del segnale per filtrare a monte il rumore.
Anche la stessa scheda A/D è sorgente di rumore, e le schede più veloci ne emettono
usualmente di più. Purtroppo non è possibile eliminare questa fonte di rumore
[Schwartz90].
5.3 Architettura del sistema di analisi
La caratterizzazione dell’attività elettrofisiologica di popolazioni di neuroni
coltivate in vitro richiede l’utilizzo di algoritmi, non contemplati dai classici
strumenti software reperibili sul mercato. Questi algoritmi permetto di estrapolare dal
segnale registrato parametri statistici inerenti ai neuroni collocati sui MEA. Di
seguito verrà presentato il software sviluppato e utilizzato durante il periodo di
tirocinio presso il gruppo di ricerca Living Networks Lab.
Negli esperimenti effettuati con il sistema hardware descritto nel capitolo
precedente, vengono registrati un numero considerevole di segnali, e questi devono
essere gestiti al meglio e soprattutto analizzati per estrarre delle osservazioni.
Analizzare i dati in uscita dai MEA con i comuni software commerciali
richiede un tempo considerevole e, talvolta, i risultati che si ottengono non sono
quelli desiderati. Per poter effettuare queste analisi statistiche ed evitare la
conversione in diversi formati dei dati in uscita dalla rete rischiando di perdere delle
informazioni importanti, è stato quindi sviluppato un software specifico per
l’apparecchiatura hardware presentata. Esso ha una base comune anche per altre
applicazioni del gruppo di ricerca ed è stato adattato ad hoc per il protocollo di
robotica.
L’intero sistema, chiamato DSP system (Digital Signal Processing System), è
stato
implementato
in
ambiente
Windows
XP,
mediante
linguaggio
di
83
CAPITOLO 5
Analisi dei segnali rilevati
programmazione interpretato dall’ambiente Matlab, e permette di gestire le matrici
dati memorizzate in uscita dai MEA, rendendo l’analisi più sbrigativa e allo stesso
tempo completa. A queste matrici viene associato un nome corrispondente alla fase
dell’esperimento, e successivamente vengono salvate in un apposita cartella. In
questo modo i dati sono sempre reperibili e soprattutto è possibile ripetere gli
esperimenti virtualmente anche in un secondo momento.
Questi file dati in formato csv sono molto grandi a causa del considerevole
numero di dati che viene fornito dalla scheda di acquisizione che permette di
registrare 10000 campionamenti al secondo su tutti gli otto canali a disposizione, per
un totale di 80000 valori decimali in virgola mobile al secondo. Le matrici che
otteniamo riportano nella prima colonna il tempo espresso in secondi mentre nelle
altre colonne le uscite dei diversi canali espresse in millivolt.
Riportiamo di seguito un diagramma a blocchi (Figura 5.2) che mostra
schematicamente l’organizzazione del sistema sviluppato; esso è interfacciato
graficamente, poiché reso più gradevole e funzionale all’utente.
DSP system
Selezione del file di riferimento
Visualizzazione
finestre
temporali del
segnale
Analisi sul
singolo canale
Analisi
comparative
tra i canali
Analisi
comparative
tra i file
Fig.5.2 Diagramma a blocchi dell’architettura del sistema
Il software per poter funzionare necessita dell’istallazione di Matlab e
funziona come se fosse un Toolbox di questo programma. Quindi è sufficiente
84
CAPITOLO 5
Analisi dei segnali rilevati
copiare il sistema nella cartella lavoro e lanciare il file “start.m”, per aprire
l’applicazione e far comparire il primo menù a scelta multipla (Figura 5.3).
Fig.5.3 Interfaccia utente DSP system
Da questo menù principale si passa, dopo avere caricato il file, ad altri
sottomenù in base al tipo di analisi che intendiamo effettuare. Selezionando “CARICA
IL FILE” compare nella finestra di lavoro di Matlab un elenco dei file che possiamo
analizzare
che
sono
stati
salvati
in
precedenza
nell’apposita
cartella
(“cartella_segnali”).
Per facilitare la scelta è sufficiente digitare il numero corrispondente al file
che intendiamo analizzare e, immediatamente, ci vengono forniti dei grafici relativi
al segnale. A seguito di questa selezione vengono visualizzati due tipi di grafici: il
primo mostra separatamente l’andamento degli otto canali in uscita dalla rete di
neuroni coltivata sui MEA, il secondo li sovrappone mettendo in evidenza come
varia il loro andamento.
Di seguito riportiamo un esempio dei segnali rilevati dalla piastra in una
registrazione (Figure 5.4 e 5.5). Come si osserva dall’immagine, ogni canale è
indicato con un colore diverso e, nella legenda, abbiamo l’indicazione del canale che
stiamo visualizzando. Può essere che in alcune registrazioni non tutti i canali siano
attivi (per esempio nella registrazione con cellule sottoposte a trattamento con TTX):
85
CAPITOLO 5
Analisi dei segnali rilevati
il sistema mostra allora solamente quelli attivi. I grafici, in ascissa, riportano il tempo
espresso in secondi di registrazione e, in ordinata, il potenziale espresso in mV.
Plot dei segnali uscenti dai MEA(mV/s)
0
1 Channel
-0.5
-1
00
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
2 Channel
-0.5
-1
0
0.5
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
3 Channel
0
-0.5
-0.5 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
4 Channel
-1
-0.5 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
-1.5
0.5 0
1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
6 Channel
0
-0.5
00
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
7 Channel
-0.5
-1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
8 Channel
-1
-2
0.9
5 Channel
-1
0
0.1
0.2
0.3
0.4
0.5
Time(s)
0.6
0.7
0.8
0.9
1
Fig.5.4 Plot relativo a una fase dell’esperimento che mostra gli otto canali separati
0.6
0.4
0.2
0
Potential(mV)
-0.2
-0.4
-0.6
-0.8
-1
-1.2
-1.4
0
0.1
0.2
0.3
0.4
0.5
Time(s)
0.6
0.7
0.8
0.9
1
Fig.5.5 Plot relativo a una fase dell’esperimento che mostra gli otto canali a confronto
86
CAPITOLO 5
Analisi dei segnali rilevati
La prima azione che possiamo selezionare dal menù principale è
“VISUALIZZZAZIONE PARZIALE”: questa ci consente di spezzare il segnale degli
otto canali in finestre temporali dalle dimensioni desiderate, in modo da poter
effettuare una prima analisi incrociata sui diversi canali in specifiche zone di
interesse.
Una volta osservato l’intero segnale possiamo procedere in tre direzioni:
analizzare le proprietà di un singolo canale, comparare i segnali in uscita dai diversi
canali, comparare due file diversi (quindi nel caso specifico due pattern).
Nel primo caso si sceglie dal menù principale “ANALISI SINGOLO CANALE”
e si apre così un sottomenù (Figura 5.6), che riporta le principali analisi che
possiamo eseguire sul singolo canale.
Fig.5.6 Interfaccia utente DSP system
Selezionando “SELEZIONA CANALE” dal menù a scelta multipla ci viene
fornito il numero di canali su cui è possibile effettuare l’analisi, e ci viene chiesto su
quale canale vogliamo effettuare le analisi elencate nel menù. A questo punto è
possibile procedere effettuando l’analisi su tutta la registrazione del canale oppure
andare a selezionare una frazione di tempo (per esempio i primi 400ms). Per fare
questo è sufficiente selezionare l’opzione “SELEZIONA INTERVALLO” e nella
87
CAPITOLO 5
Analisi dei segnali rilevati
finestra di lavoro di Matlab verranno richiesti gli estremi dell’intervallo che
intendiamo analizzare. Una volta forniti gli estremi, viene visualizzata in dettaglio la
frazione del segnale che intendiamo analizzare.
Per esempio se selezioniamo l’intervallo 0-150ms di un canale otteniamo il
grafico riportato in figura 5.7.
Plot del segnale
-0.6
Segnale
-0.7
-0.8
Potential
-0.9
-1
-1.1
-1.2
-1.3
0
0.05
0.1
0.15
0.2
Time(s)
0.25
0.3
0.35
0.4
Fig.5.7 Plot relativo a una fase dell’esperimento che mostra una finestra temporale di
150ms
Una volta selezionato il canale e la frazione di tempo che vogliamo analizzare
possiamo procedere con l’analisi vera e propria delle proprietà statistiche del segnale.
Il primo tasto ci permette di identificare i potenziali d’azione e ci dà una
stima della loro frequenza mediante l’istogramma ISI.
Selezionando dal sottomenù l’opzione “AUTOCORRELAZIONE” si ottengono
a confronto il plot del segnale che stiamo analizzando, e l’autocorrelazione del
segnale stesso. Nei grafici relativi all’autocorrelazione del segnale, le unità di misura
sono il tempo di ritardo in funzione del coefficiente di correlazione.
Il tasto “PERIODOGRAMMA“ permette il calcolo del periodogramma
nell’intervallo selezionato, questo ci dà una stima della densità spettrale.
L’ultimo
tasto
permette
di
eseguire
la
trasformata
di
Fourier
(“TRASFORMATA DI FOURIER”) del segnale, fornendoci un’indicazione delle
frequenze contenute all’interno del segnale.
Ritornando al menù principale (opzione “ESCI”) e scegliendo “ANALISI
COMPARATIVE”, si apre un secondo sottomenù (Figura 5.8 di sinistra), che riporta le
88
CAPITOLO 5
Analisi dei segnali rilevati
principali analisi che possiamo eseguire, comparando i segnali provenienti da due
canali, che sono le medesime effettuabili selezionando “ANALISI MULTI FILE” dal
menù principale (Figura 5.8 di destra).
Fig.5.8 Interfaccia utente DSP system
Selezionando “SELEZIONA CANALI” dal menù a scelta multipla ci viene
fornito il numero di canali su cui è possibile effettuare l’analisi e ci viene chiesto,
nella finestra di lavoro di Matlab, di indicare i due canali che intendiamo comparare
con le analisi sotto riportate. A questo punto come nel caso precedente è possibile
procedere effettuando l’analisi su tutta la registrazione del canale, oppure
selezionando una frazione di tempo ben definita. Per fare questo è sufficiente
selezionare
l’opzione
“SELEZIONA INTERVALLO”,
e inserire
gli
estremi
dell’intervallo che intendiamo analizzare, in questo modo viene visualizzata la
medesima porzione di segnale per entrambi i canali. La stessa cosa avviene per
l’analisi in multi file, in questo caso però, prima di selezionare canale e intervallo,
viene chiesto di caricare il file (definito di test) che si vuole comparare con il file
precedentemente caricato (definito di riferimento).
Una volta selezionato file, canale e la frazione di tempo che vogliamo
analizzare, possiamo procedere con l’analisi indicate nel sottomenù che sono
coerenza e cross-correlazione.
89
CAPITOLO 5
Analisi dei segnali rilevati
Selezionando dal sottomenù l’opzione “COERENZA” si ottiene il confronto
delle frequenze dei due segnali che stiamo analizzando. Il grafico relativo alla
coerenza, in ascissa riporta le frequenze, mentre in ordinata, un coefficiente che
assume valori compresi tra 0 e 1.
La seconda analisi che possiamo eseguire sui due segnali (selezionando
“CROSSCORRELAZIONE”) è la crosscorrelazione; anche in questo caso in ordinata
è presente il coefficiente di crosscorrelazione compreso tra 0 e 1.
5.4 Analisi dei segnali
•
Le funzioni di correlazione: Autocorrelazione e Crosscorrelazione:
I segnali rilevati dal sistema biologico riprodotto in vitro sono aleatori e sono
caratterizzati da proprietà statistiche. E’ quindi possibile analizzarli con tecniche
statistiche [Bendat71].
Le funzioni di correlazione sono molto importanti nell’elaborazione dei
segnali. Una funzione è detta di correlazione quando fornisce la misura di quanto due
segnali hanno proprietà comuni, si assomigliano in funzione di un loro ritardo
reciproco nel tempo.
La funzione è detta d’autocorrelazione quando fornisce una misura di quanto
un segnale assomigli, si correli, abbia proprietà comuni con se stesso ritardato di un
tempo tau (senza ritardo il segnale è sempre lo stesso). L’autocorrelazione per i
segnali aleatori è molto importante, poiché ci fornisce una misura della regolarità del
processo. Ritardando un segnale, possiamo verificare se esistono delle periodicità.
Riportiamo di seguito due grafici relativi all’autocorrelazione di segnali in
uscita da un canale dei MEA (Figure 5.9 e 5.10). Le registrazioni si riferiscono alla
rete di neuroni maturi, nel secondo caso però sono trattati con TTX. Il segnale
estrapolato si riferisce in entrambi i casi ai primi 150ms che otteniamo al termine
della registrazione.
90
CAPITOLO 5
Analisi dei segnali rilevati
0.35
Waveform
0.3
Amplitude (mV)
0.25
0.2
0.15
0.1
0.05
0
-0.05
0.04
0.06
0.08
0.1
0.12
Time (s)
0.14
0.16
0.18
0.2
1
Autocorrelation
Correlation coeff.
0.8
0.6
0.4
0.2
0
-0.2
-0.4
0
100
200
300
400
Delay
500
600
700
800
Fig.5.9 Esempio di autocorrelazione dei primi 150ms di registrazione
provenienti dalla rete di neuroni
0.15
Waveform
Amplitude (mV)
0.1
0.05
0
-0.05
-0.1
0.04
0.06
0.08
0.1
0.12
Time (s)
0.14
0.16
0.18
0.2
1.2
Autocorrelation
1
Correlation coeff.
0.8
0.6
0.4
0.2
0
-0.2
-0.4
0
100
200
300
400
Delay
500
600
700
800
Fig.5.10 Esempio di autocorrelazione dei primi 150ms di registrazione
provenienti dalla rete di neuroni trattati con TTX
L’autocorrelazione contiene l’informazione relativa alle variazioni sull’asse
dei tempi. Dato un segnale in un determinato intervallo di tempo 0-T, di una funzione
x(t), valutandone l’autocorrelazione, è possibile scoprirne eventuali periodicità. Se la
funzione di correlazione diminuisce rapidamente all’allontanarsi dallo 0, non è
possibile fare stime attendibili sulla futura evoluzione del segnale. Se ciò non accade,
91
CAPITOLO 5
Analisi dei segnali rilevati
è possibile predire per il futuro in modo inperfetto, ma con grande precisione,
l’evolversi del segnale [Papoulis73], [Luise99].
Osservando i grafici sopra riportati si vede come l’andamento del segnale nei
primi 150ms presenti delle periodicità, che sono caratteristiche per ogni canale e sono
differenti per ogni stimolo che forniamo in input alla rete di neuroni. La caratteristica
che più sorprende è come nella parte iniziale, successiva la stimolazione, queste
periodicità sono molto accentuate (ciò non accade sempre per tutti i canali), facendo
intendere che probabilmente siano conseguenza dell’eccitazione delle cellule poste sui
MEA, mentre successivamente al passare del tempo questo andamento pur essendo
presente si appiattisca notevolmente. Questo è verosimilmente legato alla normale
attività ritmica delle cellule in stato di eccitazione.
Dal grafico della rete di neuroni trattata con TTX si osserva come la funzione
di correlazione diminuisca rapidamente allontanandosi da 0: questo non permette di
prevedere la possibile evoluzione del segnale, facendo presupporre che il trattamento
con TTX abbia causato un danno ai neuroni. Nel nostro caso il differente
comportamento con e senza TTX sta ad indicare che abbiamo prelevato effettivamente
da una cellula vitale, che cessa di funzionare correttamente in presenza di TTX.
La crosscorrelazione compara, invece, l’output di due diversi canali.
Quando si esaminano due serie temporali di parametri diversi, come possono
essere i segnali provenienti da due canali differenti del medesimo pattern di
stimolazione, o due identici canali per due pattern di stimolazione diversi, è utile capire
quanto i valori delle due serie siano fra loro correlati. Ciò significa capire se le due
serie sono rappresentative della stessa fenomenologia.
Quanto sopra detto, porta a definire la funzione di crosscorrelazione fra due
serie temporali:
Dove:
92
CAPITOLO 5
Analisi dei segnali rilevati
xi = i-esimo valore della serie X
yi = i-esimo valore della serie Y
µx = media della serie X
µy = media della serie Y
Si definisce coefficiente di crosscorrelazione fra i valori delle serie la quantità:
Il cui valore assoluto varia tra 0 (nessuna correlazione) e 1 (le due serie sono
totalmente rappresentative dello stesso fenomeno) [Sarwate80].
Nell’analizzare il segnale sono stati calcolati i coefficienti di correlazione tra le
serie temporali provenienti da canali differenti per il medesimo pattern. Un’ulteriore
analisi è stata fatta sul medesimo canale per pattern (uguali o diversi), dati in un
secondo momento. Inoltre si sono crosscorrelati intervalli diversi di questi segnali. Di
seguito riportiamo alcuni esempi. Il primo è generato dal confronto di due canali
differenti con il medesimo pattern (Figura 5.11), il secondo, lo stesso, selezionando i
primi 150ms (Figura 5.12) di registrazione e l’ultimo gli ultimi 850ms (Figura 5.13).
93
CAPITOLO 5
Analisi dei segnali rilevati
Cross-Correlazione dei segnali selezionati
0.4
0.3
Correlation Coeff.
0.2
0.1
0
-0.1
-0.2
-0.3
0
0.2
0.4
0.6
0.8
1
Sample
1.2
1.4
1.6
1.8
2
4
x 10
Fig.5.11 Esempio di correlazione tra due canali differenti del medesimo pattern
Cross-Correlazione dei segnali selezionati
0.8
0.7
0.6
Correlation Coeff.
0.5
0.4
0.3
0.2
0.1
0
-0.1
0
500
1000
1500
2000
2500
3000
3500
Sample
Fig..5.12 Correlazione dei primi 150ms
94
CAPITOLO 5
Analisi dei segnali rilevati
Cross-Correlazione dei segnali selezionati
0.5
0.4
Correlation Coeff.
0.3
0.2
0.1
0
-0.1
-0.2
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
Sample
Fig.5.13 Correlazione degli ultimi 850ms
Dall’osservazione
dei
risultati
ottenuti
dalle
diverse
analisi
di
crosscorrelazione, possiamo trarre alcune informazioni generali sul segnale derivato
dallo stimolo della rete di neuroni.
Guardando nell’insieme i grafici dei coefficienti di crosscorrelazione si nota
come lo stimolo fornito tramite pattern abbia generato in alcuni canali segnali molto
crosscorrelati per un tempo non superiore ai 400ms (per la maggior parte compreso
nei primi 150ms). Il valore assoluto di crosscorrelazione, pur non portandosi a
parametro 0 (totalmente non crosscorrelato), si attenua con il procedere del segnale.
Per altre combinazioni di canali la crosscorrelazione è molto bassa, indicando che la
rete di neuroni ha generato una risposta differente in diversi punti della piastra, dove
è connessa con gli elettrodi.
Altre osservazioni si possono estrarre dal confronto del medesimo canale con
il medesimo pattern dato in un secondo momento o con pattern differenti. Nel primo
caso si ottengono segnali piuttosto crosscorrelati, mentre nel secondo caso non è
possibile trarre un'unica conclusione a causa della varietà dei comportamenti.
95
CAPITOLO 5
•
Analisi dei segnali rilevati
Analisi spettrali: Trasformata di Fourier, Periodogramma, Coerenza:
Nelle analisi che riportiamo di seguito si parlerà di spettri. Lo spettro è una
relazione, tipicamente rappresentata dal valore relativo di un qualche parametro, in
funzione della frequenza.
I fenomeni descritti come detto sono trattati in termini di segnali,
rappresentati da grandezze elettriche variabili (voltaggi). Queste quantità sono
tipicamente descritte nel dominio del tempo. Sappiamo però che, per ogni funzione
del tempo x(t) può essere trovata una equivalente funzione nel dominio delle
frequenze X(w), che descrive specificatamente il contenuto componente-frequenza
richiesto per generare x(t).
Uno studio delle relazioni fra il dominio tempo e la sua corrispondente
rappresentazione nel dominio frequenza è il soggetto dell’analisi di Fourier e delle
trasformate di Fourier. La trasformata di Fourier è un algoritmo che permette di
esprimere qualsiasi funzione, periodica e non, attraverso funzioni sinusoidali.
Poiché un calcolatore digitale opera solo con dati discreti, la computazione
numerica della trasformata di Fourier di x(t) richiede valori di campionamento discreti
di x(t). Inoltre un computer può calcolare la trasformata X(w) solo per valori discreti di
w, cioè può fornire in output solo valori discreti della trasformata [Bracewell86].
Ricordando il teorema di Nyquist, possiamo dire che la massima frequenza
contenuta nella trasformata di Fourier risulta uguale alla metà della frequenza di
campionamento. Ciò significa che nei grafici che riportiamo di seguito il massimo
valore di frequenza rilevabile è pari a 5000Hz.
Il troncamento ad un tempo T (1000ms) fa sì che la trasformata di Fourier
venga calcolata solamente sulle frequenze fk = k/T. Per migliorare la risoluzione in
frequenza bisognerebbe aumentare il tempo di misura. Questo però limita la praticità:
allungare il tempo di misura porta infatti all’elaborazione di una grossa mole di dati,
con problemi di spazio e di velocità di elaborazione.
Di seguito, in figura 5.14, riportiamo un grafico relativo alla trasformata di
Fourier, ovviamente, per non ridurre ulteriormente il tempo T, non effettuiamo
nessun sottocampionamento, ma prendiamo tutti e 10000 dati a disposizione.
96
CAPITOLO 5
Analisi dei segnali rilevati
FFT SEGNALE
0.35
0.3
0.25
Amplitude
0.2
0.15
0.1
0.05
0
0
500
1000
1500
2000
2500
Frequency [Hz]
3000
3500
4000
4500
5000
Fig.5.14 Esempio di trasformata di Fourier del segnale registrato con i MEA
Dall’analisi delle trasformate di Fourier dei segnali registrati possiamo
stimare le frequenze contenute nel segnale rilevato. La trasformata di Fourier di un
set di dati, di per sé, non fornisce però informazioni sulle caratteristiche del
fenomeno fisico che quei dati rappresentano.
Interessante è invece la stima dello spettro di potenza. In letteratura
s'incontrano molte definizioni di spettro di potenza, spesso indicato come PSD
(Power Spectral Density). In alcuni testi come PSD viene semplicemente riportato il
modulo quadro della trasformata di Fourier. Un'altra definizione molto usata di PSD
è quella di periodogramma [Pagano00].
Il grafico riporta la variazione del PSD al variare della frequenza. Se la
funzione fosse continua nel dominio delle frequenze (ovvero se il set di dati fosse
una funzione continua di t), i picchi individuabili nel PSD rappresenterebbero con
esattezza le frequenze caratteristiche del sistema e le eventuali armoniche.
Nell'ipotesi cioè che ogni funzione continua possa essere approssimata da una serie
di funzioni seno e coseno, si otterrebbero le frequenze caratteristiche di ognuna di
queste funzioni periodiche e, dall'intensità del picco, si potrebbe ricavare il
97
CAPITOLO 5
Analisi dei segnali rilevati
contributo allo sviluppo in serie. Chiaramente un grafico privo di picchi ben marcati
corrisponderebbe ad un andamento aperiodico. Purtroppo non è possibile disporre di
un set infinito di valori, quindi anche il periodogramma non è una funzione continua
della frequenza, e non si può avere la certezza di individuare tutti i picchi, anche
perchè, tranne che in pochi e rari casi, lo sviluppo di una funzione necessita di un
numero infinito di funzioni seno e coseno.
Il periodogramma consente però di mettere in rilievo quali sono le frequenze
più importanti individuate misurando l’intensità della frequenza K-esima all’interno
della serie di valori e quindi di determinare l’importanza che assume ogni periodo
della serie. I picchi che emergono nel periodogramma corrispondono alle sinusoidi
che spiegano la varianza della serie.
Raw Periodogram
-10
-20
Power Spectral Density (dB/ rad/sample)
-30
-40
-50
-60
-70
-80
-90
-100
-110
0
500
1000
Normalized Frequency (×π rad/sample)
1500
Fig.5.15 Esempio di periodogramma del segnale registrato da MEA
I dati ottenuti (vedi esempio riportato in figura 5.15) confermano quanto
ritrovato in letteratura sulle frequenze di neuroni corticali depositati su MEA, ossia la
presenza di una zona lineare che va dai 50Hz (per piccoli interneuroni anche 20Hz)
fino a 300Hz, mentre la massima frequenza di scarica è attorno ai 1000Hz (valore
variabile in funzione del tipo di neuroni). Interessante è osservare come, effettuando
98
CAPITOLO 5
Analisi dei segnali rilevati
il periodogramma sui primi 150ms (Figura 5.16), eliminiamo dallo spettro di potenza
tutte quelle frequenze che non determinano picchi importanti. Nel caso specifico il
grafico presenta un picco emergente a 640Hz.
Raw Periodogram
-10
-20
Power Spectral Density (dB/ rad/sample)
-30
-40
-50
-60
-70
-80
-90
0
500
1000
Normalized Frequency (×π rad/sample)
1500
Fig.5.16 Esempio di periodogramma del segnale registrato da MEA
( intervallo dei primi 150ms)
I grafici relativi al periodogramma hanno in ascissa la frequenza (espressa
come Hz x π rad) e in ordinata il PSD [Ziemer85].
Le analisi spettrali viste fino ad ora si riferiscono al singolo segnale. La
relazione che mostriamo di seguito coinvolge invece l’ampiezza del cross-spettro fra
due segnali:
Questa relazione da luogo alla definizione di funzione di coerenza:
99
CAPITOLO 5
Analisi dei segnali rilevati
La funzione di coerenza è importante nell’analisi di due segnali raccolti da
due canali differenti, perché ci dà un’indicazione di come questi siano separati di una
certa quantità. Lo scostamento dal valore 1 della funzione di coerenza ci dice con
quale bontà possiamo supporre che una determinata frequenza misurata da un canale
corrisponda allo stesso fenomeno misurato alla medesima frequenza dall’altro
canale. Se la funzione di coerenza si avvicina a 1 significa che la causa che genera i
due segnali è la medesima [Ziemer85].
Questo si ripercuote sull’analisi del sistema, permettendo di stabilire se è
l’impulso inviato a tale sistema (rete di neuroni) a determinare la risposta rilevabile
nei primi 400ms del segnale. Cosa interessante da notare dai grafici a nostra
disposizione è come vi sia una forte coerenza alle basse frequenze in tutti i segnali
rilevati (Figura 5.17).
Coerenza tra segnali Vaschetta A e Vascheta B
1
0.9
0.8
0.7
Correlation Coeff
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.05
0.1
0.15
0.2
0.25
0.3
Frequenza (x 10000Hz)
0.35
0.4
0.45
0.5
Fig.5.17 Esempio di grafico coerenza tra due segnali registrati da MEA
Nel DSP è stato inoltre sviluppato un algoritmo particolare, che consente di
individuare gli spike presenti nel segnale. L’algoritmo fa uso di una soglia piccopicco, che permette di seguire le eventuali oscillazioni del segnale.
100
CAPITOLO 5
Analisi dei segnali rilevati
L’algoritmo “cammina” sul segnale e identifica i punti di massimo e di
minimo. Una volta identificati, questo effettua una differenza tra valore massimo e
valore minimo e se questa differenza è superiore a una soglia stabilita viene
segnalato uno spike.
In aggiunta l’algoritmo calcola l’istogramma ISI, ossia (l’Inter Spike
Interval). Questo è definito come l’intervallo temporale che intercorre tra due spike
successivi, e l’istogramma si costruisce raggruppando gli ISI.
Questo metodo è sperimentale e presenta delle limitazioni. Prima fra tutte è la
determinazione corretta della soglia che si dovrebbe attestare tra i 100 e 400µV per
segnali rilevati tramite MEA. In figura 5.18 mostriamo l’output ottenuto processando
un segnale campione.
Fig.5.18 Esempio di individuazione degli spike e istogramma ISI
Il confronto delle proprietà ricavate dall’indagine statistica con la letteratura a
disposizione ha dimostrato effettivamente che i neuroni ottenuti da cellule staminali
neurali hanno un comportamento elettrofisiologico compatibile con i neuroni
asportati da tessuti celebrali e posti su MEA.
101
CAPITOLO 5
Analisi dei segnali rilevati
Un'altra conclusione cui si è giunti attraverso l’analisi è che i segnali
provenienti da stimolazioni effettuate con il medesimo pattern hanno evidenziato
alcune analogie, facendo pensare che il modello di memoria proposto possa
effettivamente apprendere. Queste analogie sono state verificate in termini di output
del medesimo canale.
Le analisi statistiche hanno però mostrato come la grande varietà delle
risposte ottenute dalle diverse stimolazioni, non permetta di ricavare con metodi di
analisi statistica proprietà standardizzate da questi segnali per veicolare informazione
e controllare un attuatore robot. Per questo motivo si è deciso di abbandonare
l’utilizzo di algoritmi tradizionali nella comunicazione elettronica/biologica, e si è
pensato di operare attraverso l’impiego di tecniche computazionali neurali basate
sull’apprendimento.
Per decodificare lo stimolo di risposta è stata utilizzata una rete neurale
artificiale che, ricevendo questa codifica in input ha cercato di interpretare il suo
andamento dinamico, andando a leggere la successione temporale delle ampiezze dei
segnali rilevati. Funzionando come una scatola nera, la rete artificiale è riuscita così a
decodificare l'informazione nascosta in questa sequenza utilizzando i valori in
ampiezza dei voltaggi , rinormalizzandoli in modo da cogliere l'andamento temporale
degli spike all'interno dei segnali.
L’analisi statistica effettuata sui segnali rilevati ha permesso però di ricavare
alcune osservazioni utili a questo scopo. Queste informazioni risiedono soprattutto
nell’intervallo di tempo successivo alla stimolazione che la rete neurale deve
apprendere per discriminare un pattern fornito come diverso. Nel capitolo successivo
si è operato andando a verificare quanto ricavato dalle analisi sopra mostrate, ossia
che vi è una risposta specifica per ogni canale a seguito della stimolazione e che, tale
risposta è concentrata nei primi 400ms.
102
CAPITOLO 6
Processo di taratura della rete neurale artificiale
CAPITOLO 6
Processo di taratura della rete neurale artificiale
6.1 Risultati dell’esperimento in tempo reale
Per verificare se la rete di neuroni fosse in grado di apprendere dei pattern
digitali simulati, come descritto nei capitoli precedenti, si è utilizzato una rete
neurale artificiale. La ITSOM ha utilizzato in input i segnali generati dalla rete
biologica e, grazie alle sue caratteristiche, è riuscita nella fase di training a
discriminarli e, nella fase di testing, a classificarli verificando l’apprendimento.
Questa verifica si è ripercossa sulla classificazione corretta dei pattern simulati
forniti alla rete biologica, di cui in questo capitolo riportiamo i risultati.
Il protocollo di robotica descritto nel capitolo 4 è stato eseguito inizialmente
su cellule immature. Dalle registrazioni si è osservato come cellule indifferenziate
generano un segnale non compatibile con i segnali derivati normalmente da una rete
di neuroni, presentando cioè un comportamento atipico. Questo comportamento è
dovuto alla mancanza delle caratteristiche morfologiche e molecolari che
contraddistinguono il neurone. Dalle osservazioni effettuate al microscopio si vede
come queste cellule non siano interconnesse tra loro, né tanto meno ai microelettrodi,
mancando di assoni e dendriti. Non essendosi quindi sviluppate connessioni tra le
diverse unità, il modello in vitro di memoria non è in grado di autoorganizzarsi e non
è pertanto possibile guidare queste cellule ad apprendere pattern digitali simulati.
Questo si traduce in una non classificazione o in una classificazione casuale dei
segnali in input della rete neurale artificiale.
Un’ulteriore osservazione deriva dalle registrazioni dei segnali derivati dalla
rete di neuroni trattati con TTX: si nota infatti come vi sia un abbattimento
dell’attività elettrica della rete di neuroni. Bloccare selettivamente il trasporto degli
ioni sodio attraverso la membrana plasmatica si traduce in una profonda
modificazione dell’eccitabilità e nel blocco della conduzione dell’ impulso nervoso, e
anche in questo caso ripercussioni sulla rete biologica osservabili dall’output della
103
CAPITOLO 6
Processo di taratura della rete neurale artificiale
rete neurale artificiale. Il controllo operato con cellule immature e trattate con TTX
permette di affermare che i risultati ottenuti con cellule mature sono dovuti alla loro
struttura morfologica ed alle proprietà funzionali che ne derivano.
Durante il primo esperimento robotico si sono forniti alla ITSOM i quattro
stimoli provenienti dal training della rete biologica (il decimo segnale per ogni
direzione). Questo ha permesso la costruzione delle matrici tridimensionale in cui si
sono memorizzati gli z-score di riferimento (una matrice per ogni direzione). Nella
fase di validazione (o testing) alla rete biologica sono stati forniti venticinque pattern
che hanno generato a loro volta segnali che sono stati classificati dalla rete neurale
artificiale in una delle quattro direzioni. Questi rappresentano il 100% della
classificazione e sono distribuiti secondo quanto riportato in tabella 6.1.
Tabella 6.1 Distribuzione dei pattern utilizzati nell’esperimento
PATTERN F
PATTERN B
PATTERN L
PATTERN R
5
6
7
7
Nella tabella che viene mostrata di seguito (Tabella 6.2) sono riassunte le
caratteristiche della rete neurale artificiale utilizzata nel primo esperimento, che
impiega i parametri stimati tramite appositi test.
Tabella 6.2 Parametri della rete neurale utilizzata nell’esperimento in tempo reale
Intervallo temporale analizzato
Numero di campioni esaminati
Tasso di apprendimento
Numero di neuroni dello strato di input
Numero di neuroni nello strato di output
Numero di epoche
1-1000ms
80.000
0,03
500
20
10
La ITSOM ha classificato in tempo reale i segnali in uscita dalla rete di
neuroni secondo i dati riportati in tabella 6.3. I segnali che vengono classificati sono
determinati dalla somministrazione di stimoli corrispondenti ai pattern sopra
mostrati.
104
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Tabella 6.3 Classificazione dei pattern in funzione della direzione
input 1-1000ms
Classificati correttamente
Non classificati correttamente
Non classificati
Totale dei pattern forniti
% Classificati
% Classificati correttamente
Direzioni
Pattern F Pattern B Pattern L Pattern R
3
5
0
0
1
1
6
6
1
0
1
1
5
6
7
7
80%
100%
85,71%
85,71%
60%
83,33%
0%
0%
Totale
8
14
3
25
88%
32%
Percentuale di classificazione nelle quattro direzioni
100%
80%
60%
Non classificati
40%
Non classificati correttamente
20%
Classificati correttamente
0%
Pattern F Pattern B Pattern L Pattern R
Totale
Direzioni
Fig.6.1 Istogramma relativo alla classificazione in funzione della direzione
I risultati sopra mostrati (Tabella 6.3 e Figura 6.1) indicano un non perfetto
funzionamento del sistema sulla totalità dei pattern forniti. Il numero di pattern che la
rete è riuscita ad associare ad una delle quattro direzioni è pari all’88% del totale
degli stimoli forniti, mentre per quanto riguarda la percentuale di classificazioni
corrette, questa raggiunge in media il 32% delle direzioni fornite. In realtà, se
andiamo a valutare direzione per direzione, il numero di classificazioni corrette ci
accorgiamo come il sistema sia riuscito a riconoscere quasi perfettamente due delle
quattro direzioni. Le direzioni che la rete è riuscita a classificare con un margine di
errore limitato corrispondono ai “pattern F” e “pattern B” dove le rispettive
percentuali di classificazione sono 60% e 83,33%.
105
CAPITOLO 6
Processo di taratura della rete neurale artificiale
6.2 Parametri per la taratura di una rete neurale
Come detto la ITSOM, creata per classificare gli stimoli in uscita dalla rete di
neuroni non era mai stata testata su dei campioni reali. I dati mostrati nel paragrafo
precedente corrispondono al primo esperimento di robotica e sono stati pertanto
ottenuti senza tarare la rete neurale artificiale, utilizzando i parametri di default.
Sappiamo che con il sistema a disposizione abbiamo la possibilità di
registrare i segnali in uscita dalla rete di neuroni e quindi di ripetere l’esperimento
virtualmente tutte le volte che vogliamo. Grazie a queste registrazioni, è stato
pertanto possibile implementare il processo di taratura della rete neurale, al fine di
migliorarne le prestazioni.
Il processo di taratura consiste nella variazione dei parametri che
caratterizzano le reti neurali ed in particolare la ITSOM utilizzata. Questi parametri
sono:
•
campioni da fornire in input;
•
tasso di apprendimento (ε);
•
numero di epoche;
•
numero di neuroni dello strato competitivo.
Prima di presentare i risultati del processo di taratura vediamo in dettaglio
questi parametri per avere un’idea di cosa comporta la modifica di ognuno di essi.
Sappiamo che prima di utilizzare una rete neurale artificiale è indispensabile
selezionare dei dati in input che siano i più significativi possibili al fine della
classificazione. Nel caso specifico i dati sono rappresentati dai segnali in uscita dagli
otto canali dalla rete di neuroni. Questi segnali sono espressi come variazione di
potenziale (mV) in funzione del tempo (s).
La registrazione totale dopo il termine della stimolazione dura un secondo.
Poiché l’acquisizione di un segnale continuo avviene a tempo discreto con una
scheda di acquisizione in grado di rilevare 10000 campioni al secondo su otto canali,
il numero totale di campioni registrati è 80000 al secondo.
106
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Nel primo esperimento sono stati forniti alla rete neurale artificiale tutti gli
80000 dati. Successivamente si è andati a testare diversi intervalli temporali in modo
da capire, in funzione del comportamento della rete neurale, quale era la parte più
informativa del segnale. Questo significa stabilire per quanto tempo lo stimolo generi
una perturbazione (stato eccitatorio) nel sistema prima di ritornare allo stato di
normalità. Includendo infatti nell’input della rete neurale artificiale i dati del sistema
in condizioni di normalità attenuiamo l’informazione di quella parte di dati che
permette di discriminare i diversi pattern.
Il tasso di apprendimento (ε) rappresenta la percentuale di avvicinamento del
valore del peso della connessione del neurone premiato al valore medio degli input.
Questo significa che, se agisco modificando questa percentuale, modifico il valore
con cui premio il neurone vincente. Se aumento troppo il valore del tasso di
apprendimento rischio invece di convergere immediatamente verso un neurone
vincente e questo si ripercuote in termini di output con la non classificazione del
segnale; viceversa, se il tasso di apprendimento assume valori troppo bassi, non
riesco a selezionare i neuroni vincenti quindi rischio di classificare casualmente.
Il numero di epoche indica quante volte viene ripetuto il calcolo dei neuroni
vincenti: in tal modo si raffinano sempre di più i pesi delle connessioni, migliorando
quelli dei neuroni vincenti. Il numero di epoche nelle reti neurali ITSOM non assume
grandi valori come nelle altre tipologie di reti. La caratteristica di questa rete è che
non necessita di essere portata a convergenza, perché le configurazioni di neuroni
vincenti raggiungono la stabilità necessaria entro poche decine di epoche. Per questo
motivo, come vedremo di seguito, questa variabile è stata modificata rimanendo
nell’ordine delle decine.
Il numero di neuroni dello strato competitivo (output) determina il numero di
z-score di riferimento per ogni campionamento in uscita dalla rete di neuroni.
Diminuendo il numero di neuroni che competono, ogni neurone avrà più peso. In
questo senso, se riduciamo troppo il numero di neuroni, la rete convergerà più volte
sullo stesso neurone, determinando una scarsa separazione delle classi (le quattro
direzioni). In opposizione, aumentando troppo il numero dei neuroni, il rischio è che
107
CAPITOLO 6
Processo di taratura della rete neurale artificiale
si associno agli stessi pattern configurazioni troppo varie e quindi la classificazione
sia casuale.
Un’ultima considerazione riguarda la matrice tridimensionale in cui si
memorizzano gli z-score di riferimento (vedi capitolo 4) nella fase di training.
Modificando i campioni forniti in input e il numero di neuroni dello strato
competitivo, determiniamo una variazione nelle sue dimensioni, come verrà
specificato di seguito.
Dato l’alto numero di combinazioni possibili risultanti dalla variazione dei
parametri sopra indicati, il processo di taratura è stato guidato dai risultati.
I test di seguito riportati sono stati distinti in funzione di quali e quanti
campioni fornire alla rete neurale artificiale nel tempo reale, per ottenere la migliore
classificazione dei segnali provenienti dalla rete biologica.
Per ognuno di questi intervalli si è andati con l’ordine riportato di seguito a
ricercare la configurazione migliore:
1. modifica del tasso di apprendimento (ε);
2. modifica del numero delle epoche;
3. modifica del numero di neuroni dello strato competitivo.
Durante il processo sopra indicato si è andati anche ad analizzare gli z-score
ottenuti.
6.3 Processo di taratura della rete neurale e analisi dell’informazione
Prima di andare a selezionare dal segnale un intervallo di registrazione
specifico, si è deciso di procedere utilizzando tutti i dati iniziali dell’esperimento
(1000ms), variando il tasso di apprendimento e verificando eventuali miglioramenti
nella classificazione. In questa prova i parametri della rete sono settati con i
parametri riportati in tabella 6.4.
108
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Tabella 6.4 Parametri della rete neurale utilizzata nel primo test
1-1000ms
80.000
500
20
10
Intervallo temporale analizzato
Numero di campioni esaminati
Numero di neuroni dello strato di input
Numero di neuroni nello strato di output
Numero di epoche
I valori del tasso di apprendimento testati sono indicati nella tabella
successiva (Tabella 6.5) e nel relativo grafico (Figura 6.2). Ad ogni valore sono
associate le percentuali di classificazione e le percentuali di classificazione corrette
della rete neurale artificiale.
Tabella 6.5 Classificazione dei pattern in funzione del tasso di apprendimento
Input 1-1000ms
Classificati correttamente
Non classificati
correttamente
Non classificati
Totale dei pattern forniti
% Classificati
% Classificati correttamente
0,03
8
0,3
4
14
3
25
88%
32%
0
21
25
16%
16%
Tasso di apprendimento
0,003
0,01
0,02
5
4
7
20
0
25
100%
20%
21
0
25
100%
16%
15
3
25
88%
28%
0,04
9
0,05
4
11
5
25
80%
36%
3
18
25
28%
16%
Percentuale di classificazioni in funzione del tasso di apprendimento
100%
80%
60%
Non classificati
40%
Non classificati correttamente
20%
Classificati correttamente
0%
0,03
0,3
0,003
0,01
0,02
0,04
0,05
Tasso di apprendimento
Fig.6.2 Istogramma relativo alla classificazione in funzione del tasso di apprendimento
La rete neurale raggiunge una percentuale massima di classificazioni corrette
del 36% con un tasso di apprendimento pari a 0,04. Questa percentuale va però a
scapito del numero di segnali che la rete non riconosce (non classificati), che
109
CAPITOLO 6
Processo di taratura della rete neurale artificiale
aumenta passando da 3 a 5. Ad essere riconosciuti però, in questo caso, non sono
solo “pattern F” e ”pattern B”: in alcune circostanze anche il “pattern R”; questo può
essere considerato un risultato importante.
Una volta selezionato il miglior tasso di apprendimento per i campioni a
disposizione, si è passati alla modifica del numero delle epoche. Come detto, la
variazione delle epoche nel caso delle ITSOM rientra nell’ordine delle decine, in
quanto, non è necessario arrivare alla convergenza.
Le variazioni apportate alle epoche non hanno portato ad alcun
miglioramento nell’efficienza di classificazione, per questo motivo si sono
mantenute le dieci epoche iniziali (dati non riportati).
L’ultimo parametro da modificare è il numero di neuroni dello strato
competitivo:
variando
questo
parametro
modifichiamo
anche
la
matrice
tridimensionale degli z-score di riferimento per ogni direzione, nella fase di training.
Utilizzando come tasso di apprendimento il valore 0,04 e mantenendo le epoche
invariate, si è andato a diminuire il numero di neuroni dello strato competitivo. Con
un numero di neuroni pari a dodici, per la prima volta si è riusciti a classificare tutte
e quattro le direzioni. La percentuale di classificazione totale non è però la migliore
ottenuta tra le prove descritte. Di seguito, in tabella 6.6, è riportata la classificazione
nelle diverse direzioni, utilizzando tasso di apprendimento 0,04 e numero di neuroni
dello strato competitivo 12 (vedi anche grafico relativo in figura 6.3).
Tabella 6.6 Classificazione dei pattern in funzione della direzione
Direzioni
Totale
Pattern F Pattern B Pattern L Pattern R
2
2
2
2
8
Classificati correttamente
3
3
4
4
14
Non classificati correttamente
0
1
1
1
3
Non classificati
5
6
7
7
25
Totale dei pattern forniti
100%
83,33%
85,71%
85,71%
88%
% Classificati
40%
33,33%
28,57%
28,57%
32%
% Classificati correttamente
Input 1-1000ms
110
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Percentuale di classificazione nelle quattro direzioni
100%
80%
60%
Non classificati
40%
Non classificati correttamente
Classificati correttamente
20%
0%
Pattern F Pattern B Pattern L Pattern R
Totale
Direzioni
Fig.6.3 Istogramma relativo alla classificazione in funzione della direzione
La rete neurale così tarata è in grado di riconoscere tutti i pattern, e questa
sembra essere la configurazione ottimale utilizzando l’intero set di dati a
disposizione (intervallo del segnale da 1-1000ms).
Dai segnali registrati, abbiamo osservato che la risposta della rete biologica
avviene nei primi millisecondi successivi alla stimolazione. Il passo successivo è
stato quello di estrarre dall’intero segnale (1000ms) i primi 400ms. Se in un secondo
otteniamo la registrazione di 10000 dati per ognuno degli otto canali, per un totale di
80000 dati, avremo che i primi 400ms corrisponderanno ai primi 4000 dati per ogni
canale per un totale di 32000 dati da processare.
Fig.6.4 Matrice tridimensionale
in cui sono memorizzati gli z-score di riferimento
111
CAPITOLO 6
Processo di taratura della rete neurale artificiale
In questo caso la matrice tridimensionale in cui sono memorizzati gli z-score
di riferimento subirà delle modificazioni, ossia mantenendo gli otto z-score di
riferimento per ogni direzione avremo (32000 : 8) 4000 dati da distribuire sui 500
neuroni (4000:500) in 8 campionamenti, e non più 20 come nella fase precedente. Il
training verrà effettuato sui primi 400ms generando una nuova matrice si riferimento
riportata in figura 6.4.
Anche in questo caso si è partiti dalla configurazione della rete neurale
utilizzata nel protocollo e si è andati a modificare il tasso di apprendimento. La rete
neurale artificiale si è comportata come riportato nella tabella (Tabella 6.7) e
nell’istogramma di seguito (Figura 6.5).
Tabella 6.7 Classificazione dei pattern in funzione del tasso di apprendimento
Input 1-400ms
Classificati correttamente
Non classificati correttamente
Non classificati
Totale dei dati analizzati
% Classificati
% Classificati correttamente
0,03
5
18
2
25
92%
20%
Tasso di apprendimento
0,001 0,003 0,107
0,09
0,1
5
5
2
6
7
19
18
20
19
18
1
2
3
0
0
25
25
25
25
25
96%
92%
88%
100% 100%
20%
20%
8%
24%
28%
0,2
4
7
14
25
44%
16%
Percentuale di classificazioni in funzione del tasso di apprendimento
100%
80%
60%
Non classificati
40%
Non classificati correttamente
20%
Classificati correttamente
0%
0,03
0,001
0,003
0,107
0,09
0,1
0,2
Tasso di apprendimento
Fig.6.5 Istogramma relativo alla classificazione in funzione del tasso di apprendimento
112
CAPITOLO 6
Processo di taratura della rete neurale artificiale
In questo caso i risultati che si ottengono sono inferiori a quelli ottenuti
utilizzando l’intero segnale, ma rispetto a quanto ottenuto nel precedente test,
variando solamente il tasso di apprendimento, riusciamo a classificare tre delle
quattro direzioni, e inoltre tutti i segnali vengono classificati. Più precisamente con
tasso di apprendimento pari a 0,1 classifichiamo correttamente “pattern F”, “pattern
B”, “pattern L”. Le relative percentuali sono mostrate a seguire nella tabella 6.8 e nel
grafico relativo in figura 6.6.
Tabella 6.8 Classificazione dei pattern in funzione della direzione
Direzioni
Totale
Pattern F Pattern B Pattern L Pattern R
Classificati correttamente
4
1
2
0
7
Non classificati correttamente
1
5
5
7
18
Non classificati
0
0
0
0
0
Totale dei pattern forniti
5
6
7
7
25
100%
100%
100%
100%
100%
% Classificati
80%
16,67%
28,57%
0%
28%
% Classificati correttamente
Input 1-400ms
Percentuale di classificazione nelle quattro direzioni
100%
80%
60%
Non classificati
40%
Non classificati correttamente
20%
Classificati correttamente
0%
Pattern F Pattern B Pattern L Pattern R
Totale
Direzioni
Fig.6.6 Istogramma relativo alla classificazione in funzione della direzione
Mantenendo il valore del tasso di apprendimento pari 0,1 si è andati a
modificare il numero di epoche. Da questa variazione otteniamo che il numero di
epoche che consente di aumentare il numero di classificazioni corrette è pari a 50.
Con questo numero di epoche classifichiamo correttamente nel 36% dei casi (vedi
tabella 6.9 e figura 6.7).
113
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Tabella 6.9 Classificazione dei pattern in funzione del numero di epoche
Input 1-400ms
Classificati correttamente
Non classificati correttamente
Non classificati
Totale dei dati analizzati
% Classificati
% Classificati correttamente
10
7
18
0
25
100%
28%
20
3
22
0
25
100%
12%
Numero di epoche
30
50
55
5
9
4
20
16
21
0
0
0
25
25
25
100%
100%
100%
20%
36%
16%
70
8
17
0
25
100%
32%
Percentuale di classificazione in funzione
del numero di epoche
100%
80%
Non classificati
60%
Non classificati
correttamente
40%
20%
Classificati
correttamente
0%
10
20
30
50
55
70
Numero delle epoche
Fig.6.7 Istogramma relativo alla classificazione in funzione del numero di epoche
Variando il numero di neuroni dello strato competitivo, utilizzando tasso di
apprendimento 0,1 e numero di epoche pari a 50, si è raggiunta una percentuale di
classificazione del 60%. Questa percentuale è ottenuta utilizzando 12 neuroni nello
strato competitivo. Sotto questo numero di neuroni la rete non classifica più
correttamente. Questo risultato è confermato, sia considerando l’intero intervallo, che
per i primi 400ms. Si può concludere che 12 neuroni dello strato competitivo sono
sufficienti a discriminare i segnali in uscita dalla rete biologica in seguito allo
stimolo proveniente dai quattro pattern. La configurazione migliore utilizzando i
primi 400ms è di seguito riportata e, a seguire, sono riportate anche le percentuali di
classificazione relative ai diversi pattern. Questa configurazione sarà poi utilizzata
114
CAPITOLO 6
Processo di taratura della rete neurale artificiale
nell’esperimento successivo perché ritenuta la configurazione migliore (Tabella
6.10).
Tabella 6.10 Parametri della rete neurale dopo il processo di taratura
1-400ms
32000
0,1
500
12
50
Intervallo temporale analizzato
Numero di campioni esaminati
Tasso di apprendimento
Numero di neuroni dello strato di input
Numero di neuroni nello strato di output
Numero di epoche
Osservando i dati ottenuti da questa ultima prova, riportati nella tabella 6.11 e
nel relativo grafico (Figura 6.8), possiamo trarre diverse considerazioni.
Tabella 6.11 Classificazione dei pattern in funzione della direzione
Direzioni
Totale
Pattern F Pattern B Pattern L Pattern R
Classificati correttamente
4
5
3
3
15
Non classificati correttamente
1
0
3
3
7
Non classificati
0
1
1
1
3
Totale dei pattern forniti
5
6
7
7
25
100%
83,33%
85,71%
85,71%
88%
% Classificati
80%
83,33%
42,86%
42,86%
60%
% Classificati correttamente
Input 1-400ms
Percentuale di classificazione nelle quattro direzioni
100%
80%
60%
Non classificati
40%
Non classificati correttamente
20%
Classificati correttamente
0%
Pattern F Pattern B Pattern L Pattern R
Totale
Direzioni
Fig.6.8 Istogramma relativo alla classificazione in funzione della direzione
115
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Le percentuali di classificazione dei “pattern F” e “pattern B” raggiungono
valori considerevoli di classificazione, 80% e 83,33%, mentre per quanto riguarda i
“pattern R” e “pattern L”, che rappresentano le direzioni laterali, la percentuale è del
42,86%. Un’ulteriore osservazione deriva dal confronto delle percentuali dei segnali
classificati (riconosciuti come appartenenti ad una direzione) con quelli classificati
correttamente. Se eliminiamo i segnali non riconosciuti le percentuali di
classificazione corrette si innalzano notevolmente e nel caso dei pattern B si
raggiunge una classificazione del 100%.
Proseguendo nella taratura della rete neurale si è passati ad utilizzare altri
intervalli temporali, e più precisamente gli intervalli compresi tra 400-800ms e tra
400-1000ms i cui dati sono riportati in tabella 6.12-6.13 e nei rispettivi istogrammi
(Figura 6.9-6.10). I risultati ottenuti operando in questi intervalli temporali secondo
la procedura sopra mostrata, lasciano pensare che, oltre i 400ms, la rete di neuroni
ripristini il suo stato di normalità, non consentendo alla ITSOM di estrarre dal
segnale delle informazioni tali da determinare la classificazione tramite z-score.
Il numero di dati processati per l’intervallo compreso tra 400-800ms è pari a
32000 e la matrice tridimensionale in cui si memorizzano gli z-score di riferimento
presenta le medesime dimensioni della prova precedente. Per quanto riguarda invece
l’intervallo temporale compreso tra 400-1000ms, il numero di dati processato è
48000 (6000 dati ogni canale di registrazione); in questo caso il numero di
campionamenti è 12 (48000dati : 8 : 500neuroni) con conseguente modifica della
matrice tridimensionale. Con i parametri iniziali della rete si è ottenuto per entrambi
gli intervalli una classificazione massima del 12%, modificando il tasso di
apprendimento.
Tabella 6.12 Classificazione dei pattern in funzione del tasso di apprendimento
Input 400-800ms
Classificati correttamente
Non classificati correttamente
Non classificati
% Classificati
% Classificati correttamente
Tasso di apprendimento
0,03
0,3
0,003
0,001
0
0
1
3
5
14
12
17
20
11
12
5
20%
56%
52%
80%
0%
0%
4%
12%
116
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Percentuale di classificazione in funzione del tasso
di apprendimento
100%
80%
Non classificati
60%
Non classificati
correttamente
40%
20%
Classificati correttamente
0%
0,03
0,3
0,003
0,001
Tasso di apprendimento
Fig.6.9 Istogramma relativo alla classificazione in funzione del tasso di apprendimento
Tabella 6.13 Classificazione dei pattern in funzione del tasso di apprendimento
Tasso di apprendimento
0,03
0,01
0,1
0,001
0
1
0
3
5
8
1
18
20
16
24
4
20%
36%
4%
84%
0%
4%
0%
12%
Input 400-1000ms
Classificati correttamente
Non classificati correttamente
Non classificati
% Classificati
% Classificati correttamente
Percentuale di classificazione in funzione del tasso
di apprendimento
100%
80%
Non classificati
60%
Non classificati
correttamente
40%
20%
Classificati
correttamente
0%
0,03
0,01
0,1
0,001
Tasso di apprendimento
Fig.6.10 Istogramma relativo alla classificazione in funzione del tasso di apprendimento
117
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Procedendo nel processo di taratura si sono ottenuti dei risultati poco
significativi, pertanto non si è ritenuto di riportarli. Negli esperimenti successivi la
rete sarà configurata con i parametri migliori del processo di taratura riportati nella
tabella 6.10.
6.4 Valutazione del modello
Quando si costruisce un modello che intende spiegare un fenomeno a partire
dai dati bisogna valutarlo. Costruito il modello si possono associare degli indici che
misurino l’accuratezza del modello nel descrivere i dati. Questo è stato fatto durante
l’esperimento svolto in tempo reale e durante la taratura della rete neurale artificiale,
dove si è andati a verificare la percentuale di apprendimento al variare dei parameri
della rete. Questi risultati ci hanno fornito una stima di quanto il classificatore (la
ITSOM) sia in grado di generalizzare un problema con i parametri fornitegli.
Con i dati a disposizione nella tabelle possiamo calcolarci la percentuale
d’errore in validazione del modello che ci fornisce una valutazione interna al
modello (equivale a: 100% - percentuale di classificazioni corrette).
Errore% _ val. =
N _ class. _ corrette
∗ 100
TOT _ campioni _ val.
Secondo questa formula, l’errore compiuto in validazione dalla rete neurale
utilizzando i parametri migliori è del 40%.
Nel caso di problemi di classificazione, uno strumento noto in letteratura
come “matrice di confusione” può essere utile per misurare le potenzialità del
modello, permettendo una validazione esterna. La valutazione esterna è in grado di
fornire il valore netto del modello. Infatti, il tasso di accuratezza trovato utilizzando
le tecniche viste precedentemente è valido solo per il set di dati con il quale è stato
costruito il modello. Nella tabella 6.14 è mostrata la matrice di confusione relativa al
modello presentato.
118
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Tabella 6.14 Matrice di confusione relativa alla classificazione delle direzioni
Direzione fornita (REALE)
Matrice di confusione
Direzione classificata
(PREVISTA)
F
B
L
R
F
4
0
0
0
B
1
5
3
2
L
0
0
3
1
R
0
0
0
3
N.C.
0
1
1
1
La matrice sopra mostrata ci fornisce indicazioni su come sono state sbagliate
le classificazioni. Come si vede sulla diagonale sono indicate le direzioni che sono
state apprese correttamente, mentre al di fuori della diagonale dove è avvenuto
l’errore in classificazione.
Con questa matrice di confusione non è tuttavia possibile identificare il tipo
di errore commesso in classificazione; ovvero, non è possibile stabilire se ci si trova
in presenza di un falso positivo o di un falso negativo. Per indagare ulteriormente è
stato fatto per, ogni pattern, una matrice di confusione a due classi come riportato di
seguito nelle tabelle 6.15. Per fare questo si sono eliminati i pattern non classificati.
Tabella 6.15a Matrice di confusione pattern F
Matrice di confusione pattern F
F
Non F
4
0
F
1
17
Non F
Tabella 6.15b Matrice di confusione pattern B
Matrice di confusione pattern B
B
Non B
5
6
B
0
11
Non B
Tabella 6.15c Matrice di confusione pattern L
Matrice di confusione pattern L
L
Non L
3
1
L
3
15
Non L
119
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Tabella 6.15d Matrice di confusione pattern R
Matrice di confusione pattern R
R
Non R
3
0
R
3
16
Non R
Per ogni matrice di confusione si possono definire quattro importanti
parametri:
•
False Positive (FP): è la probabilità che un pattern sia stato erroneamente
classificato come appartenente ad un altro pattern.
•
False Negative (FN): è la probabilità che uno specifico pattern sia stato
erroneamente classificato non nel suo specifico pattern.
•
True Positive (TP): è la probabilità che un pattern sia stato correttamente
classificato come appartenente ad uno specifico pattern.
•
True Negative (TN): è la probabilità che un pattern sia stato correttamente
classificato come non appartenente ad uno specifico pattern.
Considerando una tabella di confusione come ad esempio quella del pattern F
(Tabella 6.16); possiamo quindi collocare questi quattro parametri nel modo
seguente:
Tabella 6.16 Esempio di matrice di confusione
Matrice di confusione pattern F
F
Non F
TP
FN
F
FP
TN
Non F
Ora è possibile definire altri due importanti indici che indicano la bontà del
classificatore:
•
Sensitività: è la probabilità che il test sia positivo dato che un determinato pattern
possiede le caratteristiche di quella classe di appartenenza.
120
CAPITOLO 6
Processo di taratura della rete neurale artificiale
Sensitivity = (TP / ( TP + FN))*100
•
Specificità: è la probabilità che il test sia negativo dato che un determinato
pattern non possiede le caratteristiche di quella classe di appartenenza.
Specificity = (TN / (TN + FP))*100
Alla luce di queste considerazioni riportiamo, nella seguente tabella (Tabella
6.17), i valori di sensitività e specificità di tutti e quattro i pattern:
Tabella 6.17 Sensitività e specificità
Pattern F
Pattern B
Pattern L
Pattern R
Totale
Sensitività
100%
45,45%
75%
100%
80,11%
Specificità
94,44%
100%
83,33%
84,21%
90,50%
Dall’osservazione dei dati ottenuti possiamo considerare il modello di
classificatore efficiente e dire che è rappresentativo del comportamento della rete
neurale biologica. Evidenziamo quindi come il modello appare corretto.
La sensitività (accuratezza) media di astrazione del modello è dell’80,11%,
mentre la specificità (precisione) è del 90,50%. L’unico pattern che presenta una
percentuale di sensitività bassa è il “pattern B”, di seguito vedremo di spiegarne il
motivo.
6.5 Analisi dei neuroni vincenti
Analizzando i file generati dalla ITSOM è possibile andare a vedere quali
sono i neuroni vincenti e stimare se vengano generate delle serie di neuroni vincenti
tali da far presupporre che vi sia una correlazione logica dei pattern. Possiamo
analizzare la serie dei neuroni vincenti in due modi:
•
orizzontalmente;
121
CAPITOLO 6
•
Processo di taratura della rete neurale artificiale
verticalmente.
Orizzontalmente la sequenza indica i neuroni vincenti in quell’epoca, uno per
campionamento. In questo modo si può osservare che alcuni neuroni, pur venendo
puniti continuano a vincere. Verticalmente si osserva la serie temporale vera e
propria, ed essa permette di capire se, nelle varie epoche, si crea una sequenza di
neuroni vincenti che si ripete nel tempo.
Controllando tali dati per ogni pattern inviato, si nota che i neuroni vincenti
assumono effettivamente delle sequenze che si ripetono periodicamente e che
caratterizzano l’informazione di quel determinato pattern. Abbiamo considerato sia
l’intero secondo di registrazione (1000ms), sia i primi 400ms. Nelle prove relative
agli intervalli da 400-800ms e 400-1000ms ciò non avviene, ad ulteriore conferma
che il metodo degli z-score rileva ottimamente i dati presenti nella prima parte di
segnale, ma risulta essere insufficiente nell’analizzare quella parte di segnale
giudicata povera di informazione.
L’analisi effettuata sui neuroni vincenti (Figura 6.10-6.11-6.12-6.13) mostra
la presenza di una differenza funzionale nei segnali: deve per questo esistere una
procedura in grado di individuare queste specificità; che sia uno z-score ben tarato,
oppure un qualsiasi altro algoritmo.
Un possibile algoritmo appare essere quello che ricerca la maggioranza dei
neuroni vincenti in una serie di epoche. Infatti, spesso nelle configurazioni dei
neuroni vincenti è sempre un medesimo neurone a vincere. Ad esempio, nella
configurazione di rete che analizza l’intero segnale con i seguenti parametri: 12
neuroni sullo strato competitivo, un tasso di apprendimento dello 0,04 ed un numero
di epoche pari a 10, compaiono particolari serie di neuroni vincenti. Riportiamo di
seguito degli esempi di serie di neuroni relative agli specifici pattern. Queste serie di
neuroni sono molto simili per ogni specifica direzione, ciò avvalora ulteriormente i
risultati riportati nelle pagine precedenti e ci permette di trarre alcune considerazioni
sul perché alcune direzioni non sono state classificate correttamente.
122
CAPITOLO 6
10
5
2
10
6
10
6
5
7
6
10
2
5
7
6
5
5
2
7
6
10
6
6
7
6
10
2
5
7
6
5
5
7
7
6
10
6
5
7
6
10
2
5
7
6
5
7
7
7
6
10
6
5
7
6
10
2
5
7
6
Processo di taratura della rete neurale artificiale
7
7
7
7
6
10
6
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
7
7
7
7
6
10
5
5
7
6
10
2
5
7
6
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
11
3
3
3
5
3
11
7
11
5
11
11
11
11
11
11
3
3
3
5
3
11
7
11
5
11
11
11
11
11
11
3
3
3
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
Fig 6.10 Serie di neuroni vincenti relative al “pattern B”
5
7
7
7
11
11
6
6
6
7
7
7
7
7
8
5
7
7
7
11
11
7
7
7
7
7
7
7
7
7
5
7
7
7
11
11
7
7
7
7
7
7
7
7
7
5
7
7
7
11
11
11
11
3
3
3
3
3
3
3
5
7
7
7
11
11
11
11
11
3
3
3
3
3
3
5
7
7
7
11
11
11
11
11
3
3
3
3
3
3
5
7
7
7
11
11
11
11
11
11
3
3
3
3
3
5
3
11
7
11
11
11
11
11
11
3
3
3
3
3
5
7
7
7
11
5
11
11
11
11
3
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
5
3
11
7
11
5
11
11
11
11
11
3
3
3
3
Fig 6.11 Serie di neuroni vincenti relative al “pattern F”
5
8
2
10
9
1
5
10
2
5
9
5
9
8
10
6
8
2
10
9
1
5
10
2
5
9
5
9
8
10
6
8
2
10
9
1
5
10
2
5
9
5
9
8
10
6
8
2
10
9
1
5
10
2
7
9
5
9
8
10
7
8
2
10
9
1
5
10
2
7
9
7
9
8
10
6
8
2
10
9
1
5
10
2
7
9
7
9
8
10
7
8
2
10
9
1
5
10
2
7
9
7
9
8
10
7
8
2
10
9
1
5
10
2
7
9
7
7
8
10
7
8
2
10
9
1
5
10
2
7
9
7
7
8
10
7
8
2
10
9
1
5
10
2
7
9
7
7
8
10
7
8
2
10
9
1
5
10
2
7
9
7
7
7
10
7
8
2
10
9
1
5
10
2
7
9
7
7
7
10
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
7
7
2
10
9
1
5
10
2
7
9
7
7
7
10
Fig 6.12 Serie di neuroni vincenti relative al “pattern R”
123
CAPITOLO 6
1
7
7
7
5
7
0
8
6
5
8
0
1
0
0
1
8
7
7
5
7
0
8
6
5
8
0
1
0
0
1
7
7
5
5
7
0
8
6
5
8
0
1
0
0
1
5
5
5
5
7
0
8
6
5
8
0
1
0
0
Processo di taratura della rete neurale artificiale
1
5
5
5
5
7
0
8
6
5
8
0
1
0
0
1
5
5
5
5
7
0
8
6
5
8
0
1
0
0
1
5
5
5
5
7
0
8
6
5
8
0
1
0
0
1
6
6
5
5
7
0
8
6
5
8
0
1
0
0
1
5
5
5
5
7
0
8
6
5
8
0
1
0
0
1
5
5
5
5
7
0
8
6
5
8
0
1
0
0
1
6
5
5
5
7
0
8
6
5
8
0
7
0
0
1
5
5
5
5
7
0
8
7
5
8
0
7
0
0
1
5
6
5
5
7
0
8
6
5
8
0
7
0
0
1
6
5
5
6
7
0
8
7
5
8
0
7
0
0
1
6
5
5
5
7
0
8
7
5
8
0
7
0
0
1
6
6
5
5
7
0
8
7
5
8
0
7
0
0
1
6
6
6
6
7
6
8
7
5
8
0
7
0
0
1
6
6
5
5
7
0
8
7
5
8
0
7
0
0
1
6
6
5
5
7
0
8
7
5
8
0
7
0
0
1
6
6
5
6
6
0
8
7
7
7
7
7
0
0
Fig 6.13 Serie di neuroni vincenti relative al “pattern L”
All’interno delle matrici, in nero sono indicati i neuroni che tendono sempre a
vincere qualsiasi sia il pattern fornito. In rosso sono indicate delle serie di neuroni
che sono caratteristiche dei segnali di risposta ad uno specifico pattern, mentre in blu
sono indicate serie di neuroni che compaiono in più pattern.
Dall’osservazione delle serie di neuroni vincenti si nota che i neuroni 5, 6, 7,
sono presenti in tutti e quattro i pattern anche se solamente nel caso del “pattern B”
sono in numero considerevole (soprattutto per la serie di neuroni 6 indicata per
questo motivo in rosso).
Nel “pattern F” sono caratteristiche le serie di neuroni vincenti 11 e 3 tanto da
essere perfettamente discriminato dagli altri. Questo spiega il perché la ITSOM, in
queste condizioni, lo classifica correttamente con una percentuale del 40% (vedi
tabella 6.6).
Il “pattern R” è caratterizzato dalla serie di neuroni 9. In esso compaiono
ciclicamente anche le serie di neuroni 10 e 2, ma che ritroviamo anche nel “pattern
B”.
L’ultimo pattern che rappresenta la direzione laterale sinistra è caratterizzato
dalla serie di neuroni 0 e 1.
Alla luce di queste osservazioni, possiamo spiegare il motivo per cui la
maggior parte dei pattern laterali sono classificati come “pattern B”. Questi pattern
contengono un considerevole numero di neuroni vincenti 5 e 7, tipiche di questo
124
CAPITOLO 6
Processo di taratura della rete neurale artificiale
pattern. Probabilmente è per questo motivo che i tre segnali non classificati sono
quelli provenienti da questi pattern. Si vede però chiaramente come sia spesso lo
stesso neurone a vincere, nonostante la rete “punisca” il vincitore con un valore pari
a quello del tasso di dimenticanza.
In questo caso un algoritmo di conteggio proporzionale dei neuroni vincenti
potrebbe riconoscere facilmente tutte e quattro le direzioni.
In conclusione possiamo dire che i primi 400ms del segnale registrato
sembrano essere quelli che più caratterizzano la risposta dei neuroni. Questo
conferma ulteriormente quanto detto nel capitolo precedente. Abbiamo infatti visto
nel processo di elaborazione dei segnali come a seguito della stimolazione, si generi
una risposta variabile ad opera dei neuroni connessi al MEA, in funzione dello
stimolo fornito. Questi stimoli generati dalla rete biologica non durano nel tempo, ma
il sistema biologico una volta perturbato, tende a ripristinare un equilibrio. Questo
equilibrio, in seguito alle osservazioni dei segnali rilevati, appare diverso dallo stato
iniziale, poiché gli stimoli forniti al modello di memoria ricreato in vitro durante il
processo di training (o apprendimento) determinano la modifica della dinamica della
rete di neuroni. Alcuni percorsi specifici per lo stimolo fornito vengono modificati, e
questo si ripercuote in una risposta da parte di tutta la rete di neuroni che si modifica
durante il processo di training.
In molti casi la rete biologica ha generato risposte coerenti con lo stimolo
fornito, classificabili grazie all’impiego di una specifica rete neurale appositamente
creata per classificare segnali in tempo reale. E’ importante notare che “pattern F” e
“pattern B”, ossia i più riconosciuti dalla rete neurale, sono gli ultimi forniti alla rete
biologica nella fase di addestramento, e questo potrebbe far pensare che le cellule li
abbiano memorizzati meglio, prediligendo poi la loro scelta.
Un'altra ipotesi potrebbe essere che i pattern da noi forniti per quanto riguarda
le direzioni laterali, non siano in grado di determinare una risposta da parte della rete
di neuroni, tale da essere considerata diversa dalla rete neurale artificiale. In tal caso
andrebbero testati pattern di stimolazione diversi.
125
CAPITOLO 6
Processo di taratura della rete neurale artificiale
I neuroni generati da cellule staminali neurali adulte reagiscono quindi in
modo organizzato a stimoli simulati differenziati ed inoltre esiste la possibilità di
identificare computazionalmente queste reazioni.
Il passo successivo è stato quello di utilizzare la classificazione della rete per
far muovere un attuatore robotico reale (non più virtuale), in grado di spostarsi nelle
diverse direzioni. I risultati ottenuti in questo secondo esperimento confermano i
miglioramenti riscontrati nel processo di taratura.
126
CONCLUSIONI
CONCLUSIONI
Il progetto di tesi ha riguardato lo studio della capacità di apprendimento dei
neuroni derivati da cellule staminali neuronali e la sperimentazione di una tecnica
non classica nella decodifica fine dei segnali. Per fare questo, è stata ricreata una
configurazione neurale in vitro su un apposito supporto elettronico denominato
MEA.
La prima parte del lavoro è stata rivolta alla caratterizzazione dell’attività
elettrofisiologica della popolazione di neuroni coltivata in vitro attraverso lo studio di
proprietà statistiche. Questo ha richiesto l’utilizzo di algoritmi non contemplati dai
classici strumenti software reperibili sul mercato. Per questo motivo durante il
tirocinio è stato sviluppato e utilizzato un software specifico per indagare sulle
proprietà di statistica avanzata dei segnali provenienti dai MEA.
L'idea da cui si è partiti era quella di testare il protocollo neurale artificiale
adattandolo ai neuroni naturali. Queste cellule sono state pertanto sottoposte
ripetutamente a stimoli sensoriali simulati da pattern digitali e si è andati ad indagare
sulla loro capacità di memorizzare questi stimoli e di organizzare una risposta
coerente.
Dal confronto delle proprietà ricavate dall’indagine statistica sul medesimo
stimolo, si sono evidenziate alcune analogie, facendo pensare che il modello di
memoria proposto possa effettivamente apprendere. Le analisi statistiche hanno però
mostrato come la grande varietà delle risposte ottenute dalle diverse stimolazioni non
permetta di ricavare proprietà standardizzate da questi segnali in modo da poter
veicolare informazione.
Per questo motivo si è deciso di operare attraverso l’impiego di tecniche
computazionali neurali basate sull’apprendimento. La rete neurale che è stata
utilizzata è un’ITSOM (Inductive Tracing Self Organizing Maps), tipologia di rete
adatta per input strettamente non lineari e tempovarianti, caratteristiche che
contraddistinguono i segnali che provengono dalla rete di neuroni dopo la
stimolazione.
127
CONCLUSIONI
La rete biologica è stata per questo connessa alla rete neurale artificiale, in
modo che gli ingressi di quest’ultima coincidessero alle uscite della rete di neuroni.
Essa, ricevendo questa codifica in input, ha cercato di interpretare il suo andamento
dinamico andando a leggere la successione temporale delle ampiezze dei segnali
rilevati.
Funzionando come una scatola nera, la rete artificiale è riuscita così a
decodificare l'informazione nascosta in questa sequenza utilizzando i valori in
ampiezza dei voltaggi, rinormalizzandoli in modo da cogliere l'andamento temporale
degli spike all'interno dei segnali.
A seguito della fase di apprendimento della rete di neuroni, la rete neurale
artificiale ha memorizzato i segnali in uscita e li ha correlati allo stimolo fornito.
Nella fase successiva si sono nuovamente inviati gli stimoli direzionali e si è
andati a verificare quanto la rete di neuroni avesse appreso controllando gli output
della rete neurale artificiale. Conoscendo a priori quale fosse lo stimolo inviato si è
potuta determinare la percentuale di stimoli appresi correttamente.
La rete neurale artificiale con i parametri di default (tasso di apprendimento
0,03, numero di epoche 10 e numero di neuroni dello strato competitivo 20) ha
classificato correttamente nel 32% dei casi. I risultati sono ben diversi se andiamo a
valutare i singoli stimoli. Due su quattro non sono stati riconosciuti e gli altri due
hanno raggiunto percentuali di riconoscimento dell’83,33% e 60%.
Gli errori commessi nel esperimento svolto in tempo reale sono riconducibili
principalmente a due fattori:
•
Effettivo errore di apprendimento della rete di neuroni;
•
Mancanza di una taratura su dati reali della rete di neuroni e quindi
scarse prestazioni.
Poiché l’interesse è quello di verificare quanto la rete di neuroni apprenda e di
decodificare il segnale nella maniera più corretta possibile, si è andati a tarare la rete
neurale off-line. Il processo di taratura è stato possibile grazie alla registrazione dei
segnali in uscita dalla rete di neuroni dell’esperimento in tempo reale.
128
CONCLUSIONI
La taratura ha coinvolto la modifica di alcuni parametri fondamentali come:
numero di campioni su cui lavorare, tasso d’apprendimento, numero di epoche,
numero di neuroni dello strato competitivo.
La scelta dell’intervallo temporale più informativo da inviare alla rete (quindi
del numero di campioni) coincide con un aumento della classificazione poiché i
segnali risultano più discriminati. Dai test statistici effettuati e dalle prove di
modifica della porzione di segnale inviata alla rete si è evidenziato come la risposta
della rete di neuroni agli stimoli forniti si perpetui non oltre i primi 400ms.
Nell’esperimento effettuato in tempo reale considerando 1000ms si è
“appiattita” invece l’informazione contenuta nel segnale.
La modifica dei parametri come tasso di apprendimento, numero di epoche,
numero di neuroni dello strato competitivo ha comportato un aumento delle
prestazioni del sistema. La rete con tasso di apprendimento 0,1, numero di epoche 50
e numero di neuroni dello strato competitivo 12 ha ottenuto una percentuale massima
di classificazione nelle quattro direzioni del 60%. Tuttavia, gli stimoli vengono
appresi con percentuali diverse, rispettivamente 80%, 83,33%, 42,86%, 42,86%.
La valutazione del modello proposto presenta un valore di sensitività
(accuratezza) media di astrazione del modello dell’80,11% e di specificità
(precisione) del 90,50%.
Questo miglioramento sta ad indicare come il processo di taratura e
soprattutto la scelta dell’intervallo da utilizzare per addestrare la rete neurale
artificiale, abbiano aumentato le prestazioni in classificazione e confermato che la
rete di neuroni effettivamente apprende.
Nonostante siamo ancora lontani da un riconoscimento del 100%, l’impiego
di questi nuovi parametri nell’esperimento successivo ha apportato ulteriori
miglioramenti nel riconoscimento degli stimoli. Si è visto, analizzando i parametri
della rete artificiale durante l’esperimento, che un differente algoritmo per il
conteggio dei neuroni vincenti permetterebbe di classificare correttamente tutti i
segnali.
E’ inoltre interessante rilevare come alle prestazioni dopo la taratura off-line
della rete artificiale con i segnali del primo esperimento siano corrisposte uguali
129
CONCLUSIONI
prestazioni di apprendimento nel secondo esperimento con i nuovi segnali. Ciò
dimostra che il comportamento dei neuroni si mantiene stabile rispetto al sistema di
elaborazione sviluppato; anche cambiando popolazione di neuroni la capacità di
apprendimento dei neuroni biologici è funzione delle prestazioni della rete neurale
artificiale utilizzata. I neuroni si comportano quindi in modo ripetitivo e prevedibile.
In questo secondo esperimento, il sistema è stato per la prima volta connesso
ad un attuatore robot reale che si è mosso riconoscendo gli stimoli forniti dalla rete di
neuroni. Ulteriori sviluppi e miglioramenti al sistema sono ancora possibili,
modificando l’apparecchiatura hardware e le parti software che gestiscono il sistema
(stimoli e algoritmo della rete neurale).
Possiamo concludere che la rete di neuroni ha ricevuto informazioni diverse
ed è stata in grado di memorizzarle tutte nella sua struttura complessiva e di
recuperarle poi ad una ad una quando opportunamente stimolata. Il modello neurale
artificiale che giustifica questa affermazione è formalizzato matematicamente, ma i
risultati raggiunti dagli esperimenti sembrano affermare che tale modello è corretto
anche per le reti neurali naturali.
130
BIBLIOGRAFIA
[Akin94]
Akin, T., Najafi, K., Smoke, R.H. and Bradley, R.M., 1994.
A micromachined silicon electrode for nerve regeneration applications. IEEE Trans
Biomed Eng 41, 305-313
[Bels02]
Bels, B. and Fromherz, P., 2002.
Transistor array with an organotypic brain slice: field potential records and synaptic
currents. European Journal of Neuroscience 15, 999-1005.
[Bendat71]
Bendat, J. S., Piersol, A. G., 1971.
Random Data: Analysis and Measurements Procedures, Wiley-Interscience, Nueva
York.
[Bracewell86]
Bracewell, R., 1986.
The fourier transform and its applications. Singapore: Mcgraw - Hill Book Co.
[Breckenridge95]
Breckenridge, L.J., Wilson, R.J.A., Connolly, P., Curtis, A.S.G., Dow, J.A.T.,
Blackshaw, S.E. and Wilkinson, C.D.W., 1995.
Advantages of using microfabricated extracellular electrodes for in vitro neuronal
recording. J Neuroscience Research 42 ,266- 276.
[Bonifazi02]
Bonifazi, P. and Fromherz, P., 2002.
Silicon Chip for Electronic communication between nerve cells by non-invasive
interfacing and analog-digital processing. Advanced Material 17.
131
BIBLIOGRAFIA
[Borkholder97]
Borkholder, D.A., Bao, J., Maluf, N.I., Perl, E.R. and Kovacs, G.T., 1997.
Microelectrode arrays for stimulation of neural slice preparations. J. Neuroscience
Methods 7, 61- 66.
[Bove96]
Bove, M., Martinoia, S., Grattarola, M. and Ricci, D., 1996.
The neuron-transistor junction: Linking equivalent electric circuit models to
microscopic descriptions. Thin Solid Films 285 ,772-775.
[Canepari97]
Canepari, M., Bove, M., Mueda, E., Cappello, M., Kawana, A., 1997.
Experimental analysis of neural dynamics in cultured cortical networks and
transitions between different patterns of activity. Biological Cybernetics 77 ,153-162.
[Cole49]
Cole, K. S., 1949.
Dynamic electrical characteristics of the squid axon membrane. Arch. Sci. Physiol.
3:253-258.
[Egert88]
Egert, U., Schlosshauer, B., Fennrich, S., Nisch, W., Fejtl, M., Knott, T., Müller, T.
and Hammerle H., 1988.
A novel organotypic long-term culture of the rat hippocampus on substrate
integrated microelectrode arrays. Brain Resource Protoc 2 , 229-242.
[Fromherz91]
Fromherz, P., Offenhäusser, A., Vetter, T., Weis, J., 1991.
A Neuron-Silicon-Junction: A Retzius-Cell of the Leech on an Insulated-Gate FieldEffect Transistor. Science 252, 1290-1293.
132
BIBLIOGRAFIA
[Fromherz93]
Fromherz, P., Muller, C. O., Weis, R., 1993.
Neuron-Transistor: electrical transfer function measured by the Patch-Clamp
technique. Phys. Rev. Lett. 71, 4079-4082.
[Fromherz02]
Fromherz, P., 2002.
Electrical Interfacing of Nerve Cells and Semiconductor chips. Chemphyschem, vol
3, pp. 276-284.
[Fromherz03]
Fromherz, P., 2003.
Neuroelectronic interfacing: semiconductor chip with ion channels, nerve cells, and
brain. Martinsried, Germany.
[Galli03]
Galli, R., Gritti, A., Bonfanti, L., Vescovi A.L., 2003 Apr 4.
Neural stem cells: an overview. Circ Res.;92(6):598-608. Review.
[Garcia03]
Garcia, P.S., Calabrese, R.L., DeWeerth, S.P., Ditto, W. , 2003.
Simple Arithmetic with Firing Rate Encoding in Leech Neurons: Simulation and
Experiment. Proceedings of the XXVI Australasian computer science conference 16,
Adelaide, 55 – 60.
[Gibson93]
Gibson, J.D., 1993.
Principles of Digital and Analog Communications. Macmillan, second edition.
133
BIBLIOGRAFIA
[Gritti01]
Gritti, A., Galli, R., Vescovi, A.L., 2001.
Culture of stem cell of central nervous system, Federoff ed., Humana Press III
edition pag. 173-197.
[Haken91]
Haken, H., 1991.
Synergetic computers and cognition (A top-down approach to neural nets). Springer.
[Haykin94]
Haykin, S., 1994.
Neural networks (A comprehensive foundation). MacMillan Coll. Pub.
[Hebb49]
Hebb, D.O., 1949.
The Organization of Behavior. New York, Wiley.
[Hodgkin39]
Hodgkin, A., Huxley, H.,1939.
Electrical signal of nervous activity. Philadelphia: Univ. Pennsylvania Press
[Hopfield84]
Hopfield, J.J., 1984.
Neural Networks and Physical Systems with Emergent Collective Computational
Abilities. Proc. Nat. Acad. Sci US, 81.
[Jenkner97]
Jenkner, M. and Fromherz, P., 1997.
Bistability of membrane conductance in cell adhesion observed in a neuron
transistor. Phys Rev Lett 79, 4705-4708.
134
BIBLIOGRAFIA
[Jimbo00]
Jimbo, Y. and Robinson, H.P.C., 2000.
Propagation of spontaneous synchronized activity in cortical slice cultures recorded
by planar electrode arrays. Bioelectrochemistry 5 ,107-115.
[Kandel03]
Kandel, E., Schwartz, J., Jessell, T., 2003.
Principi di Neuroscienze. CEA, Edizione 2003
[Kohonen90]
Kohonen, T., 1990.
Self-organisation and association memory. Springer Verlag.
[Kohonen97]
Kohonen, T., 1997.
Self-organizing maps. Springer, Berlin.
[Konorski48]
Konorski, J., 1948.
Conditioned reflexes and neuron organization. Cambridge: Cambridge Univ.Press.
[Lindner96]
Lindner, J.F., and Ditto, W., 1996.
Exploring the nonlinear dynamics of a physiologically viable model neuron. AIP
Conf. Proc. 1, 375-385.
[Luise99]
Luise, M., Vitetta, G. M., 1999.
Teoria dei Segnali, Mc Graw-Hill, Milano.
135
BIBLIOGRAFIA
[Maher99]
Maher, M.P., Pine, J., Wright, J. and Tai, Y.C., 1999.
The neurochip: a new multielectrode device for stimulating and recording from
cultured neurons. Neuroscience Methods 87,45-56.
[McClelland86]
McClelland, J. D., Rumelhart, D. E., 1986.
Parallel Distributed Processing. Explorations in the Microstructure of Cognition. 2
voll. Cambridge Mass., MIT Press, (eds.).
[Nicholls92]
Nicholls, J., Martin, A., Wallace, B., 1992.
From Neuron to Brain: A cellular and Molecular Approach to the Function of the
Nervous System, 3rd ed. Sunderland, MA: Sinauer.
[Pagano00]
Pagano, M., 2000.
Segnali analogici nel dominio trasformato : dalla Trasformata di Fourier all'analisi
wavelet. Pisa: ETS.
[Papoulis73]
Papoulis, A., 1973.
Probabilità, variabili aleatorie e processi stocastici, Boringheri, Torino.
[Parisi90]
Parisi, D., 1990.
Connessionismo: origine e sviluppo al centro dello studio dell’intelligenza. Sistemi
intelligenti, vol.2 pag. 364-426.
136
BIBLIOGRAFIA
[Perry96]
Perry, V., 1996.
Microglia in the developing and mature central nervous system. In KR Jessen,WD
Richardson (eds.) Glia cell development: basic principles & clinical relevance,
pp.123-140 Oxford: Bios,
[Pine99]
Pine, J., 1999.
Cultured neural networks: Multielectrode arrays for stimulating and recording
hippocampal neurons. California Institute of Technology.
[Pizzi02a]
Pizzi, R., 2002.
Sistemi dinamici e autorganizzanti. Università Statale di Milano, Polo Didattico e di
Ricerca di Crema - Note del Polo.
[Pizzi02b]
Pizzi, R., de Curtis, M., Dickson , C., 2002.
Evidence of Chaotic Attractors in Cortical Fast Oscillations Tested by an Artificial
Neural Network. In: J. Kacprzyk (Eds.), Advances in Soft Computing. Physica
Verlag.
[Potter01]
Potter, S.M., 2001.
Distributed processing in cultured neuronal networks. In: Nicolelis (Ed.), Progress in
Brain Research, M.A.L. Elsevier Science B.V .
[Ramon y Cajal37]
Ramon y Cajal, S., 1937.
1852-1937. Recollections of my life. EH Craigie (Transl.) Philadelphia: American
Philosophical society;1989.Reprint.Canbridge, MA:MIT Press.
137
BIBLIOGRAFIA
[Reger00]
Reger, B., Fleming, K.M., Sanguineti, V., Simon Alford, S., Mussa-Ivaldi, F.A.,
2000.
Connecting Brains to Robots: The Development of a Hybrid System for the Study of
Learning in Neural Tissues. Artificia Life VII, Portland, Oregon.
[Ritter86]
Ritter, H., Schulten, K., 1986.
On the Stationary State of Kohonen’s Self-Organizing Sensory Mapping. Biological
Cybernetics 54, 99-106.
[Ritter88]
Ritter, H., Schulten, K., 1988.
Convergence properties of Kohonen’s Topology Conserving Maps : Fluctuations,
Stability, and Dimension Selection. Biological Cybernetics 60, 59-71.
[Sarwate80]
Sarwate, D. V. and Pursley, M. B., 1980.
Crosscorrelation Properties of Pseudorandom and Related Secuences, Proc. IEEE,
Vol. 68.
[Schatzthauer98]
Schatzthauer, R. and Fromherz, P., 1998.
Neuron-silicon junction with voltage gated ionic currents. European Journal of
Neuroscience 10 ,1956-1962.
[Schwartz90]
Schwartz, M. , 1990
Information Transmission, Modulation, and Noise, McGraw-Hill Book Co., Nueva
York.
138
BIBLIOGRAFIA
[Shanmugan79]
Shanmugan, K. S., 1979.
Digital and Analog Communication, John Wiley and Sons, Nueva York.
[Tank89]
Tank, D.W. and Hopfield, J.J. , l989.
Neural architecture and biophysics for sequence recognition in Neural Models of
Plasticity. Academic Press.
[Vescovi99]
Vescovi, A.L., Gritti, A., Galli, R., Parati, E., 1999 Aug.
Isolation and intracerebral grafting of nontransformed multipotential embryonic
human CNS stem cells. J Neurotrauma; 16(8):689-93.
[Wilson94]
Wilson, R.J., Breckenridge, L., Blackshaw, S.E., Connolly, P., Dow, J.A.T., Curtis,
A.S.G., and Wilkinson, C.D.W., 1994.
Simultaneous multisite recordings and stimulation of single isolated leech neurons
using planar extracellular electrode arrays. Neuroscience Methods 53 ,101-110.
[Zeck01]
Zeck, G. and Fromherz, P., 2001.
Noninvasive neuroelectronic interfacing with synaptically connected snail neurons
on a semiconductor chip. Proceedings of the National Academy of Sciences 98
,10457-10462.
[Ziemer83]
Ziemer, R.E., Tranter, W. H. and Fannin, D.R., 1983.
Signals and Systems, Macmillan Publishing Company, Nueva York.
139
BIBLIOGRAFIA
[Ziemer85]
Ziemer, R.E. and Peterson, R.L., 1985.
Digital Communication and Spread Spectrum Systems, Macmillan Publishing
Company, Nueva York.
140
RINGRAZIMENTI
Siamo alla fine ed è giunto il momento di ringraziare le persone che hanno
reso possibile questo giorno...
...tutti i prof. incontrati in questi diciotto anni passati sui libri e che
regalandomi un po’ del loro sapere, mi hanno reso ciò che sono. Un particolare
ringraziamento alla prof.ssa Pizzi che con la sua pazienza, i suoi suggerimenti e le
sue correzioni ha reso possibile la stesura di questa tesi e al dott. Cino per
l’indispensabile contributo al progetto, a tutto il gruppo LIVING NETWORKS LAB:
Alberto, Andrea, Daniela, Danilo, Fabio, Roberto, Ruggero e alla prof.ssa Galli che
ci a sempre accolto nel suo ufficio e ci ha sempre ascoltato...
...tutti i compagni vecchi e nuovi, per tutti i ricordi che mi hanno regalato in
questi bellissimi anni, per gli aiuti e i momenti di non solo studio...
...ai miei genitori a cui va la mia stima e con cui voglio condividere la felicità
di questo giorno...e a mio fratello che di strada ne deve fare ancora tanta ma di
sicuro non se né pentirà...
...ai miei amici, a tutte le serate passate insieme attenuando i pensieri degli
esami e i momenti di sconforto tra una birretta e una canzone (non vi cito tutti ma ci
siete!)...in particolare tutti gli amici del Dada pub...
...ad Omar per tutto l’aiuto che mi ha fornito in questi anni senza chiedermi
una lira/euro...vi assicuro sarebbe milionario...
...a chi mi ha dato l’opportunità di lavorare e continuare a studiare in questi
anni e a tutte le persone che hanno lavorato con me: Impresa edile CORA, Pizzeria
Trevi, Pizzeria la Svolta, Tende da sole Scotti Antonio...(un po’ di pubblicità non fa
mai male)...
...a quest’anno che di cose belle me ne ha regalate tante2, forse non sarà
sempre così, ma almeno per oggi lo devo dire: “Sono felice”...
...ai tre moschettieri...che questo giorno non sia per noi un addio ma un
arrivederci. Anche se d’ora in poi non saremo più compagni spero rimarremo
sempre ciò che siamo: amici...Gigi (Patagio), Rosso (due di picco)...
...a D’Artagnan (Bolzo) e se qualcuno lo vede gli dica che lo stiamo
aspettando al bar...
Vostro fedele compagno Mit
Scarica

CAPITOLO 5 Analisi dei segnali rilevati