UNIVERSITÀ DEGLI STUDI DI MILANO Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Genomica Funzionale e Bioinformatica SVILUPPO DI UN SISTEMA ROBOTICO IBRIDO ELETTRONICO/BIOLOGICO ATTRAVERSO L’ANALISI DEI SEGNALI RILEVATI DA RETI DI NEURONI UMANI Relatore: Prof.ssa Rita PIZZI Correlatore: Dott.Giovanni CINO Tesi di Laurea di: Damiano Carne Mat. 670378 Anno Accademico 2004-2005 INDICE INDICE Pag. INTRODUZIONE………………………………………………………… 1 CAPITOLO 1: Il sistema nervoso e le sue proprietà 1.1 Le cellule gliali…………………………………………………………….. 1.2 Le cellule nervose………………………………………………………….. 1.3 L’attività elettrica del neurone……………………………………………... 1.4 Il potenziale d’azione………………………………………………………. 1.5 I principi dell’organizzazione cerebrale…………………………………… 1.6 Reti di neuroni……………………………………………………………... 1.7 Plasticità sinaptica………………………………………………………….. 4 6 9 11 13 16 18 CAPITOLO 2: I sistemi complessi: le reti neurali artificiali 2.1 Cervello e computer……………………………………………………… 2.2 Caratteristiche dei sistemi complessi………………………………………. 2.3 Le reti neurali artificiali……………………………………………………. 2.4 Architettura di una rete neurale artificiale…………………………………. 2.5 SOM e ITSOM……………………………………………………………... 22 25 27 28 34 CAPITOLO 3: Tecnologie di integrazione elettronico/biologiche 3.1 Sistemi ibridi……………………………………………………………….. 3.2 I passi salienti………………………………………………………………. 3.3 Integrazione tra neuroni e circuiti elettronici………………………………. 3.4 Voltage-clamp e Patch-clamp……………………………………………… 3.5 Micro-Electrode Array (MEA)…………………………………………….. 3.6 Voltage-clamp vs Micro-Electrode Array…………………………………. 3.7 Cellule staminali e Micro-Electrode Array……………………………........ 38 40 42 48 51 53 56 CAPITOLO 4: Materiali e metodi 4.1 Preparazione dei MEA……………………………………………………... 4.2 Sistema di acquisizione…………………………………………………….. 4.3 Protocollo di stimolazione e di registrazione dei segnali…………………... 4.4 Funzionamento della rete neurale………………………………………….. 4.5 Interfaccia grafica e applicazione robotica………………………………… 4.6 Schema generale dell’apparecchiatura……………………………………... 59 62 65 68 73 77 INDICE CAPITOLO 5: Analisi dei segnali rilevati 5.1 Segnali e sistemi…………………………………………………………… 5.2 Il campionamento dei dati………………………………………………….. 5.3 Architettura del sistema di analisi………………………………………….. 5.4 Analisi dei segnali.…………………………………………………………. 80 81 83 90 CAPITOLO 6: Processo di taratura della rete neurale artificiale 6.1 Risultati dell’esperimento in tempo reale………………………………….. 6.2 Parametri per la taratura di una rete neurale……………………………….. 6.3 Processo di taratura della rete neurale e analisi dell’informazione………… 6.4 Valutazione del modello…………………………………………………… 6.5 Analisi dei neuroni vincenti………………………………………………... 103 106 108 118 121 CONCLUSIONI…………………………………………………................ 127 BIBLIOGRAFIA…………………………………………………………... 131 INTRODUZIONE INTRODUZIONE Negli ultimi anni sono stati condotti numerosi studi sulla connessione diretta tra neuroni e circuiti elettronici. Ricerche in campi come la biologia, l’informatica e l’ingegneria, hanno trovato in questo progetto un comune denominatore. Tutto ciò trova riscontro in numerose applicazioni scientifico-tecnologiche, che vanno dallo sviluppo di protesi riabilitative di nuova generazione, sino all’evoluzione della tecnologia robotica. L’idea di connettere i neuroni al calcolatore prende origine dal fatto che entrambi i sistemi comunicano elettricamente. Proprio la comunicazione tra questi due sistemi di natura diversa è oggetto dello studio condotto durante il periodo di tesi. Il progetto ha come obiettivo lo sviluppo di un sistema in grado di guidare i neuroni alla memorizzazione ed all’apprendimento di pattern sensoriali e di decodificare i segnali provenienti dai neuroni. A riscontro di queste funzionalità, il sistema è dotato di un attuatore robotico che è comandato dalle cellule neurali. Ciò che sarà proposto nelle pagine seguenti è un protocollo innovativo per la decodifica dei segnali. L'idea di partenza è che solo sistemi con proprietà simili a quelle delle reti nervose si possano interfacciare direttamente ad una rete di neuroni. Queste proprietà sono essenzialmente: l’apprendimento, l’adattività, la flessibilità e l’auto-organizzazione dei dati. Questa struttura biologico/elettronica è resa possibile grazie all’utilizzo dei Micro-Electrode Array (MEA), array di microelettrodi su cui è possibile coltivare cellule o depositare dissezioni di tessuti e permettono la registrazione dei segnali in uscita dal sistema biologico. Su questi array sono coltivati i neuroni utilizzati negli esperimenti, che derivano da cellule staminali neurali. Per lo studio di questa comunicazione si è partiti a testare il protocollo neurale artificiale adattandolo ai neuroni naturali. Queste cellule pertanto sono sottoposte ripetutamente a stimoli sensoriali simulati da pattern digitali e si è indagato sulla loro capacità di memorizzarli proprio come si fa per le reti neurali artificiali. 1 INTRODUZIONE Tutto questo è possibile perché la rete artificiale è direttamente connessa alla rete naturale. Come conseguenza lo stimolo dato in input alla rete naturale genera una risposta nella rete biologica, questa funge da input per la rete neurale artificiale che, essendo autoorganizzante, per stimoli classificati come simili dovrebbe generare risposte uguali. Questo significa che se la rete di neuroni si comporta bene per stimoli identici in input otterremo risposte uguali in output. Per consentire un funzionamento corretto del sistema si sono studiate le proprietà statistiche del segnale in uscita dalla rete biologica, tramite apposito software implementato per tale scopo. L'ottimizzazione della rete neurale ha permesso di studiare il comportamento autoorganizzante dei segnali in output dalle rete di neuroni. Alla luce dei risultati ottenuti possiamo concludere che l’utilizzo di una rete neurale nello studio dei segnali provenienti da una rete di neuroni evidenzia come neuroni adulti generati da cellule staminali neurali reagiscano in modo organizzato a stimoli simulati differenziati. Ha inoltre permesso una decodifica fine dei segnali provenienti dalle cellule, in modo tale da poter utilizzare il sistema per muovere un attuatore robotico. 2 INTRODUZIONE Struttura: Capitolo 1: Riporta la descrizione della struttura e del comportamento del neurone biologico fino alle proprietà delle reti nervose. Capitolo 2: Sono descritti i sistemi complessi con particolare riferimento alle reti neurali. Nel capitolo è inoltre descritta la rete neurale ITSOM, tipologia di rete utilizzata e implementata nel protocollo sperimentale. Capitolo 3: L’evoluzione scientifica dell’interfacciamento tra neuroni e circuiti elettronici viene trattata facendo riferimento agli esperimenti più importanti ritrovati in letteratura. In questo capitolo sono inoltre riportate le proprietà e la tecnologia su cui si basa lo strumento utilizzato per interfacciare i neuroni alla rete neurale artificiale: i Micro-Electrode Array (MEA). Capitolo 4: Facendo riferimento alle nozioni teoriche fornite dai primi capitoli si procede nell’illustrazione dell’apparecchiatura hardware ed il protocollo di sperimentazione. Nel capitolo sono descritte nel dettaglio anche le diverse applicazioni che sono utilizzate per gestire il sistema. Capitolo 5: Contiene la descrizione in ogni sua parte del sistema informatizzato prodotto per l’analisi dei segnali. Si illustrano le analisi statistiche eseguite sui segnali prodotti dalla rete biologica tracciando delle linee guida per la loro interpretazione. Contemporaneamente, per ogni analisi sono riportate le osservazioni di carattere generale tratte dall’osservazione dei segnali. Capitolo 6: Si espone il processo di taratura della ITSOM con i relativi risultati. Nel capitolo è presentata anche una valutazione del modello descritta da parametri statistici. 3 CAPITOLO 1 Il sistema nervoso e le sue proprietà CAPITOLO 1 Il sistema nervoso e le sue proprietà Nel sistema nervoso esistono due classi principali di cellule: • cellule gliali (glia); • cellule nervose (neuroni). 1.1 Le cellule gliali Nel sistema nervoso dei vertebrati le cellule gliali sono da dieci a cinquanta volte più numerose dei neuroni e circondano gli assoni e i dendriti dei neuroni. Esse si suddividono a loro volta in due classi principali: • microglia; • macroglia. Le cellule dei microglia sono costituiti da elementi fagocitari che si mobilitano in seguito a lesioni, infezioni o altri disturbi. Esse prendono origine da macrofagi al di fuori del sistema nervoso, e non hanno alcun rapporto embriologico o funzionale con altri tipi di cellule del sistema nervoso. Tre sono i tipi di macroglia presenti nel sistema nervoso umano: • astrociti; • oligodendrociti; • cellule di Shwann. Gli astrociti che sono le cellule gliali più numerose, devono il nome alla forma irregolare e somigliante una stella dei loro corpi cellulari. Sono spesso dotati di lunghi processi, alcuni dei quali formano delle espansioni terminali che prendono 4 CAPITOLO 1 Il sistema nervoso e le sue proprietà contatto, nel cervello e nel midollo spinale, con la superficie di cellule nervose per le quali svolgono una funzione nutritiva. Altre espansioni pedicellari degli astrociti prendono contatto con i vasi sanguigni cerebrali e inducono la formazione di giunzioni strette fra le cellule endoteliali, contribuendo a formare la barriera ematoencefalica protettiva (Figura 1.1). Fig.1.1 Astrociti e barriera emato-encefalica Gli astrociti contribuiscono inoltre a mantenere normale la concentrazione di ioni potassio extracellulare negli spazi intercellulari che separano i neuroni. Essi sono anche in grado di captare i neurotrasmettitori liberati dalle terminazioni sinaptiche, contribuendo così a regolarne l’attività allontanando i neurotrasmettitori stessi. Tuttavia la funzione principale degli astrociti è quella di cellule di sostegno. Gli oligodendrociti e le cellule di Schwann sono cellule piccole, fornite di un numero limitato di processi. Entrambi questi tipi di cellule svolgono l’importante funzione di isolare gli assoni formandovi attorno, con i loro processi membranosi, una guaina di mielina che li circonda concentricamente in strette spirali. Gli oligodendrociti sono presenti nel sistema nervoso centrale e possono avvolgersi lungo numerosi tratti internodali. Le cellule di Schwann presenti nel sistema nervoso periferico, al contrario circondano un unico tratto internodale di un solo assone. Alcune cellule gliali (“glia radiale”) guidano la migrazione dei neuroni e dirigono la crescita dei loro assoni [Perry96]. 1.2 Le cellule nervose 5 CAPITOLO 1 Il sistema nervoso e le sue proprietà Da un punto di vista morfologico, in una cellula nervosa possiamo caratterizzare quattro zone ben distinte: il corpo cellulare (o soma), i dendriti, l’assone e le terminazioni presinaptiche (Figura 1.2). Il corpo cellulare o soma è il centro metabolico del neurone ed è costituito dal nucleo che contiene il patrimonio genetico della cellula e il reticolo endoplasmatico, dove vengono sintetizzate le proteine. Il corpo cellulare genera due categorie di processi: i dendriti e un lungo processo tubolare detto assone. I dendriti rappresentano il principale apparato destinato a ricevere i messaggi che arrivano dalle altre cellule nervose. L’assone, al contrario, si estende per lunghe distanze allontanandosi dal soma e rappresenta il principale elemento di conduzione capace di trasmettere i messaggi ad altri neuroni (Figura 1.2). Fig.1.2 Illustrazione delle principali parti del neurone Un assone è in grado di trasmettere segnali elettrici a distanze variabili fra 0,1 millimetri e 3 metri. Questi segnali elettrici vengono detti potenziali d’azione e sono impulsi nervosi rapidi e transitori con carattere di tutto o nulla che prendono origine a livello di una zona di innesco specializzata e localizzata all’origine dell’assone, detta cono d’emergenza. L’ampiezza del potenziale d’azione non si modifica lungo il suo decorso, ma rimane costante in quanto si rigenera ad intervalli regolari. 6 CAPITOLO 1 Il sistema nervoso e le sue proprietà I potenziali d’azione sono i segnali che il sistema nervoso impiega per ricevere, analizzare e trasmettere le informazioni. Questi segnali sono altamente stereotipati in tutto il sistema nervoso anche se prendono origine da una grande varietà di eventi come stimoli di diversa natura. Ci troviamo di fronte a uno dei principi fondamentali su cui si basa l’attività celebrale, ossia che l’informazione trasportata da un potenziale d’azione non dipende dalla morfologia del segnale ma dal cammino che quel segnale percorre nel cervello. I punti in cui due neuroni entrano in comunicazione sono chiamati sinapsi. La cellula nervosa che trasmette il segnale viene detta cellula presinaptica mentre quella che lo riceve postsinaptica. La cellula presinaptica non entra in contatto anatomicamente con la cellula postsinaptica, ma le due sono separate da uno spazio detto fessura sinaptica. La maggior parte delle terminazioni presinaptiche termina a ridosso dei dendriti del neurone postsinaptico, ma possono entrare in rapporto anche con il corpo cellulare o con il segmento iniziale dell’assone. La caratteristica che più distingue un neurone dall’altro è la forma; in particolare, il numero e il tipo dei processi nervosi che dipartono dal soma. In funzione di questa caratteristica i neuroni possono essere classificati in tre gruppi (vedi figura 1.3): • unipolari; • bipolari; • multipolari. A B C Fig.1.3 Tipologia di neuroni: A. neuroni unipolari B. neuroni bipolari C. neuroni multipolari 7 CAPITOLO 1 Il sistema nervoso e le sue proprietà I neuroni unipolari costituiscono la classe più semplice di neuroni. Hanno un solo processo primario, in generale fornito di molte ramificazioni. Una di queste è l’assone, le altre servono come strutture dendritiche di ricezione. Le cellule unipolari nei vertebrati vanno a formare i gangli del sistema nervoso autonomo. I neuroni bipolari hanno un corpo ovoidale che dà origine a due processi: un dendrite, che porta informazioni provenienti dalla periferia del corpo, e un assone, che invia informazioni al sistema nervoso centrale. Molti di questi tipi di neuroni sono di natura sensitiva. I neuroni multipolari sono la classe predominante nel sistema nervoso dei vertebrati. Queste cellule hanno un unico assone e una o più branche dendritiche che possono nascere da ogni parte del corpo cellulare. Le forme dei neuroni multipolari variano notevolmente, specialmente per ciò che riguarda la lunghezza dell’assone e il numero, la lunghezza e la complessità dell’albero dendritico. Se classifichiamo i neuroni cerebrali rispetto alla loro funzione, questi possono essere classificati in tre gruppi principali: • sensitivi; • motoneuroni; • interneuroni. I neuroni sensitivi portano dalla periferia del corpo al sistema nervoso centrale le informazioni necessarie sia per la percezione, che per la coordinazione motoria. I motoneuroni portano ordini dal cervello o dal midollo spinale, ai muscoli o all’apparato ghiandolare. Gli interneuroni costituiscono la classe di neuroni di gran lunga più numerosa e comprendono tutte le cellule del sistema nervoso che non siano specificatamente sensitive o motrici. Gli interneuroni vengono a loro volta suddivisi in due classi: gli interneuroni di ritrasmissione (o proiezione) che trasmettono informazioni a lunga distanza da una regione cerebrale all’altra, e gli interneuroni locali che hanno assoni brevi ed elaborano informazioni all’interno di circuiti locali [Kandel03]. 8 CAPITOLO 1 Il sistema nervoso e le sue proprietà 1.3 L’attività elettrica del neurone Quasi tutti i neuroni, indipendentemente dalle dimensioni e dal tipo di neurotrasmettitore impiegato, possono essere descritti da un modello generale di neurone con quattro elementi: un elemento locale d’ingresso (o recettivo), un elemento di innesco dove il segnale ha inizio (di sommazione o di integrazione), un elemento di conduzione a distanza e un elemento di uscita (o secretorio). Ogni cellula nervosa genera in successione, quattro tipi diversi di segnali che hanno origine a livello delle quattro diverse zone del neurone: un segnale d’ingresso, un segnale di innesco, un segnale di conduzione e un segnale d’uscita. I diversi segnali impiegati dal neurone sono in gran parte determinati dalle proprietà elettriche della membrana cellulare. A riposo i neuroni mantengono una differenza di potenziale elettrico ai capi della membrana plasmatica. Questo è detto potenziale di membrana a riposo e il suo valore è di circa 65mV. Poiché la carica netta presente all’esterno viene arbitrariamente definita come pari a zero, il potenziale di membrana a riposo è di -65mV. La differenza di potenziale elettrico in una cellula a riposo dipende da due fattori: l’ineguale distribuzione degli ioni elettricamente carichi sulle due facce della membrana (in particolare sodio e potassio), e la permeabilità selettiva della membrana verso uno di questi due ioni, il potassio. Le cellule nervose differiscono da tutte le altre perché il loro potenziale di membrana a riposo può subire notevoli variazioni (sono quindi eccitabili), e queste variazioni vengono utilizzate come meccanismo di segnalazione. Quando il potenziale di membrana si riduce di 10mV (da -65mV a -55mV), la membrana diviene molto più permeabile agli ioni sodio che agli ioni potassio. L’ingresso di sodio caricato positivamente determina una riduzione ancora maggiore del potenziale di membrana (da -55mV a +55mV). Questa riduzione prende il nome di potenziale d’azione (o spike). Oltre al potenziale d’azione, che è un segnale a lungo raggio, le cellule nervose producono anche segnali locali, come i segnali di recettori e i potenziali sinaptici, che non si propagano attivamente e che perciò, in generale, si riducono di 9 CAPITOLO 1 Il sistema nervoso e le sue proprietà ampiezza fino a scomparire entro pochi millimetri. Sia segnali a lungo raggio che quelli locali sono il prodotto di variazioni che determinano un aumento o una diminuzione del potenziale di membrana rispetto al suo valore di riposo. Il potenziale d’azione viene condotto lungo l’assone della cellula fino alle sue terminazioni, dove ha inizio il processo di comunicazione con altre cellule. In generale il potenziale d’azione dura circa un millisecondo, al termine del quale la membrana riacquista le sue proprietà di riposo. Il potenziale d’azione è dunque un evento tutto o nulla. Ciò significa che i segnali sotto soglia non daranno origine ad alcun segnale, mentre tutti gli stimoli sopra la soglia determineranno sempre la comparsa dello stesso segnale. Per quanto grande possa essere la variazione di intensità e di durata degli stimoli, l’ampiezza e la durata di tutti i potenziali d’azione sono all’incirca sempre le stesse. Questa caratteristica fu messa in evidenza da Edgar Adrian intorno al 1920, mediante un oscilloscopio. Pur essendo distinguibili i potenziali d’azioni rilevati degli assoni sensitivi, rispetto a quelli rilevati dagli assoni motori, sono solo due le proprietà del segnale di conduzione che contengono informazioni: il numero di potenziali d’azione e l’intervallo di tempo che intercorre fra di essi. Ciò che quindi determina l’intensità di una sensazione o la velocità di un movimento, non è l’ampiezza o la durata dei singoli potenziali, ma la loro frequenza. Quanto più l’ampiezza del potenziale di recettore (di ingresso) eccede il valore della soglia, tanto maggiore sarà la depolarizzazione, di conseguenza, tanto maggiore la frequenza dei potenziali d’azione che si generano nell’assone. Analogamente, la durata del segnale d’ingresso determina il numero dei potenziali d’azione scaricati. L’informazione contenuta nel numero e nella frequenza dei potenziali d’azione viene trasmessa fedelmente lungo tutto l’assone [Kandel03]. Va però detto che il significato di un messaggio non è determinato dalle caratteristiche del messaggio stesso, ma dalla particolare via lungo la quale esso viene condotto. Quando un potenziale d’azione raggiunge la terminazione del neurone determina la liberazione da parte della cellula del neurotrasmettitore. La 10 CAPITOLO 1 Il sistema nervoso e le sue proprietà liberazione dei neurotrasmettitori costituisce il segnale d’uscita del neurone. Questo segnale, analogamente a quello d’ingresso, è graduato. La quantità di neurotrasmettitore che viene liberata dipende dal numero e dalla frequenza dei potenziali d’azione scaricati dalle terminazioni presinaptiche. Il neurotrasmettitore liberato dalla terminazione presinaptica diffonde attraverso la fessura sinaptica verso le molecole recettrici, localizzate sulla membrana della cellula postsinaptica. Il legame con questo recettore determina l’insorgenza di un potenziale sinaptico nella cellula postsinaptica. Il fatto che il potenziale sinaptico abbia un effetto eccitatorio o inibitorio dipenderà poi dal tipo di recettori presenti nella cellula postsinaptica, e non dalla natura chimica del neurotrasmettitore. Il modello di segnalazione dei neuroni sopra descritto costituisce una semplificazione applicabile nella maggior parte dei casi, ma si possono osservare delle modificazioni importanti. In alcuni interneuroni locali privi di un elemento di conduzione o che ne hanno uno così breve da non richiedere alcun segnale condotto a distanza, i segnali di ingresso vanno incontro a sommazione e si diffondono passivamente verso la regione d’uscita dove viene liberato il neurotrasmettitore [Nicholls92]. 1.4 Il potenziale d’azione La scarica del neurone rappresenta l’informazione in uscita dal neurone stesso. Tale output è il risultato dell’elaborazione che la cellula ha fatto delle informazioni in ingresso provenienti da altre cellule (attraverso sinapsi, neurotrasmettitori, giunzioni elettriche), oppure dall’ambiente esterno (sotto forma di stimoli sensoriali). E’ la struttura della membrana plasmatica con le varie molecole connesse, i recettori, i meccanismi di modulazione, i canali ionici, a rappresentare il livello più importante nel quale si verifica il confronto tra i vari tipi di informazione e dove avviene il processo decisionale. Il potenziale d’azione è un segnale elettrico impulsivo con un’ampiezza di circa 100mV, durata di 1ms e con una velocità che varia da 1 a 100m/s. L’ampiezza del segnale d’uscita è determinata dall’ampiezza della depolarizzazione che, a sua 11 CAPITOLO 1 Il sistema nervoso e le sue proprietà volta, è determinata dal numero e dalla frequenza degli impulsi. Dopo aver generato il potenziale d’azione, il neurone entra in fase refrattaria e per 10ms non potrà più generarne. In risposta ad uno stimolo statico, il numero di potenziali d’azione emessi durante il tempo di osservazione cresce in modo proporzionale all’ampiezza dello stimolo. Il segnale si pensa quindi venga codificato nella frequenza di scarica, ovvero nella frequenza dei treni di spike. Questa è ovviamente solo una teoria in quanto ad oggi nessuno è riuscito a decifrare i segnali dei neuroni né, tanto meno, a capire il “linguaggio” che permette la codifica dell’impulso in rilascio chimico di neurotrasmettitori. Esiste una relazione lineare tra numero di potenziali d’azione e l’ampiezza dello stimolo, ma questa relazione è valida solo fino ad una determinata frequenza. La frequenza di spike non può infatti superare un certa soglia (Figura 1.4). Questa soglia dipende dal periodo refrattario e crea una sorta di saturazione al di sopra della quale non è possibile andare. Se uno stimolo viene applicato per un lungo periodo, il numero di potenziali d’azione emessi durante il tempo di osservazione inizia a decrescere a causa di un adattamento del neurone. Molti neuroni non creano potenziali d’azione in risposta a stimoli con ampiezza piccola. Questa proprietà introduce una soglia inferiore che è variabile in funzione del neurone considerato (Figura 1.4). Fig.1.4 Andamento della relazione ampiezza dello stimolonumero di potenziali d’azione 12 CAPITOLO 1 Il sistema nervoso e le sue proprietà Risulta difficile quindi stabilire quali siano i parametri rilevanti nella risposta neurale, parametri che sicuramente possono variare in base alla natura del neurone, allo stimolo e alla situazione. Il “codice di frequenza”, ossia il numero di spike durante un dato periodo che contiene informazioni circa la natura e l’ampiezza dello stimolo in questione, non è sempre valido. A volte infatti il numero di potenziali d’azione emessi durante il tempo di osservazione non varia come una funzione dell’ampiezza dello stimolo, ma il numero resta costante, mentre la frequenza aumenta in funzione dell’ampiezza; la finestra di osservazione diventa così più piccola. In altri casi, a variare in funzione dell’ampiezza, è il primo intervallo di interspike, oppure la distribuzione degli intervalli di interspike durante la risposta. Questi infatti risultano essere proporzionali all’ampiezza dello stimolo. Gli studi condotti finora sono basati sull’assunzione che lo stimolo elettrico sia definito unicamente dal potenziale d’azione, e tutte le evidenze di possibili “codici” sono state trovate analizzando la proporzionalità con l’ampiezza di stimolazione. In realtà, tutto questo flusso di stimoli elettrici sembra determinare delle modifiche morfologiche e sinaptiche a livello dei neuroni e tali modifiche, grazie alle moderne tecniche di imaging, non sono più un mistero. Il problema però rimane, poiché si conosce l’effetto ma si sa poco o nulla sui meccanismi che lo determinano. E’ quindi indispensabile capire come l’organizzazione, anatomicamente definita dei neuroni, determini un flusso di informazione. 1.5 I principi dell’organizzazione cerebrale Fu Ramòn y Cajal a fornire la maggior parte delle prove sperimentali in favore della nozione, ormai assodata, che i neuroni sono le unità elementari responsabili dei messaggi nervosi e che ogni neurone è una cellula distinta dotata di processi che prendono origine dal corpo cellulare (teoria del neurone). Egli fu anche il primo a intuire altri due principi dell’organizzazione cerebrale che si rilevarono di notevole importanza per lo studio dei sistemi di comunicazione del sistema nervoso. 13 CAPITOLO 1 Il sistema nervoso e le sue proprietà Il primo principio è ora noto come principio della polarizzazione dinamica (Figura 1.5). Esso afferma che , in ogni neurone, i messaggi nervosi viaggiano sempre in una sola direzione: dalle zone di ricezione alle zone d’innesco (cono d’emergenza) a livello dell’assone. Da qui il potenziale d’azione si propaga poi unidirezionalmente per tutta la lunghezza dell’assone fino alle terminazioni presinaptiche. Fig.1.5 Illustrazione del principio della polarizzazione dinamica Il secondo principio, o principio di specificità delle connessioni (Figura 1.6), afferma che le cellule non si connettono indifferentemente le une con le altre formando reti casuali; ciascuna cellula invece stabilisce connessioni specifiche, a livello di zone specializzate di contatto, solo con particolari cellule bersaglio postsinaptiche ma non con altre [Ramon y Cajal37]. 14 CAPITOLO 1 Il sistema nervoso e le sue proprietà Fig.1.6 Illustrazione del principio della specificità delle connessioni Il principio della polarizzazione dinamica e quello della specificità delle connessioni costituiscono nel loro insieme, i fondamenti cellulari del connessionismo moderno. Tutte le funzioni cerebrali relative al comportamento, all’analisi delle informazioni sensitive, alle risposte emozionali e alla fondamentale facoltà mentale di conservare le informazioni ricevute (apprendimento), vengono svolte da gruppi di neuroni specificatamente interconnessi [Nicholls92]. Esistono due tipi di connessioni, di cui uno noto con il nome di divergenza neuronale, particolarmente diffusa negli stadi di ingresso del sistema nervoso. Questa connessione consente a un solo neurone di far pervenire i suoi messaggi a molte cellule bersaglio, un solo neurone può quindi esercitare influenze diverse e diffuse (1 Æ molti). L’altro genere di connessione, detto convergenza, è strutturato in maniera opposta, ossia più neuroni attivano una singola cellula e questo si ritrova comunemente negli stadi di uscita del sistema nervoso (molti Æ 1). Non tutti i segnali nervosi sono eccitatori, risulta infatti che circa la metà di tutti i neuroni generano segnali inibitori. I neuroni inibitori liberano un neurotrasmettitore che riduce la probabilità che si generi un potenziale d’azione. Classifichiamo due tipi di inibizioni: l’inibizione anterograda (o feed-forward) e l’inibizione retrograda (o feed-back). Nell’inibizione anterograda, l’interneurone inibitorio può stabilire contatto con due neuroni eccitatori antagonisti, in questo modo, quando il neurone da cui 15 CAPITOLO 1 Il sistema nervoso e le sue proprietà riceve il segnale entra in attività, l’interneurone inibitorio viene eccitato e a sua volta inibisce il neurone antagonista. L’inibizione anterograda è spesso reciproca. Nell’inibizione retrograda, invece, un neurone può stabilire connessioni di tipo eccitatorio sia con una cellula bersaglio che con un interneurone inibitorio che, a sua volta, stabilisce una connessione inibitoria con il neurone di origine. In tal modo, quando il neurone di origine entra in attività, esso eccita contemporaneamente la cellula bersaglio che l’interneurone inibitorio e quest’ultimo acquista pertanto la facoltà di limitare l’efficienza con cui il neurone attivo eccita la propria cellula bersaglio. 1.6 Reti di neuroni La diversa localizzazione delle funzioni rappresenta una delle strategie fondamentali impiegate dal sistema nervoso. L’analisi che riguarda aspetti specifici dell’informazione afferente è localizzata in zone ben definite del sistema nervoso. Vengono create delle mappe specifiche nelle quali convergono le informazioni provenienti da una specifica parte dell’organismo. Queste mappe costituiscono il primo stadio del processo che porta alla creazione di una rappresentazione cerebrale del mondo in cui viviamo. I neuroni che costituiscono queste mappe, di qualsiasi tipo siano, non differiscono sostanzialmente per quanto riguarda le loro proprietà elettriche. Essi svolgono funzioni diverse perché stabiliscono connessioni diverse nel sistema nervoso. Tali connessioni si formano nel corso dello sviluppo e determinano quale sarà il ruolo di ogni cellula nervosa nella manifestazione di un certo comportamento. Risulta ormai chiaro che la logica delle operazioni che stanno alla base di una rappresentazione mentale può essere compresa solo se si conosce la sequenza con cui il flusso delle informazioni percorre le connessioni che costituiscono le diverse mappe celebrali. I meccanismi nervosi che impiegano diversi aggregati di neuroni o diverse vie nervose per convogliare informazioni similari prendono il nome di analisi in parallelo, più neuroni prendono parte contemporaneamente allo stesso tipo di analisi. 16 CAPITOLO 1 Il sistema nervoso e le sue proprietà I meccanismi di analisi in parallelo rappresentano un mezzo di fondamentale importanza nella strategia dell’evoluzione naturale, in quanto sono in grado di dare origine a strutture cerebrali sempre più efficienti, aumentando sia la velocità che la precisione delle funzioni del sistema nervoso. L’importanza delle connessioni in parallelo è oggi universalmente riconosciuta anche nella costruzione di modelli informatici che cercano di ricostruire le funzioni celebrali. I ricercatori che si occupano della cosiddetta intelligenza artificiale si sono presto resi conto che i modelli seriali erano in grado di svolgere operazioni modeste se paragonate all’attività cerebrale, proprio per la natura intrinseca del modello stesso. Di conseguenza la maggior parte degli informatici che si occupano di intelligenza artificiale, sono oggi orientati verso lo studio di sistemi costituiti da dispositivi in parallelo. I risultati ottenuti da questi modelli sono il più delle volte in accordo con le ricerche fisiologiche. I modelli connessionisti prevedono che i singoli elementi non trasmettano grandi quantità di informazioni. Non è infatti la complessità dei singoli neuroni che rende il cervello una sorprendente “macchina” d’analisi delle informazioni, quanto la molteplicità degli elementi della rete e la complessità delle loro connessioni. Il fatto che i neuroni stabiliscano reciprocamente connessioni specifiche non spiega però le modificazioni a cui è soggetto il comportamento umano, l’apprendimento e l’aumento delle capacità cognitive con il passare del tempo. La soluzione che si è dimostrata essere la più ragionevole è l’ipotesi della plasticità. La formulazione più moderna di questa ipotesi risale al 1948 ed è citata dallo psicologo polacco Jerzy Konorski nel seguente modo: “L’applicazione di uno stimolo mette capo, nel sistema nervoso, a due tipi di modificazioni… La prima proprietà, in virtù della quale la cellula nervosa reagisce allo stimolo afferente… viene detta eccitabilità e… chiameremo variazioni dovute all’eccitabilità… le variazioni che derivano da questa proprietà. Chiameremo invece plasticità la seconda proprietà in virtù della quale, in determinati sistemi neuronali, si stabiliscono talune modificazioni funzionali permanenti a seguito di particolari stimoli o di particolari loro combinazioni, e indicheremo queste modificazioni con il nome di modificazioni plastiche.” 17 CAPITOLO 1 Il sistema nervoso e le sue proprietà Esistono oggi numerose prove della plasticità delle sinapsi chimiche. Le sinapsi chimiche mostrano spesso delle modificazioni funzionali a breve termine che aumentano o diminuiscono notevolmente la loro efficacia funzionale. Si osservano poi anche delle modificazioni a lungo termine, che comportano modificazioni anatomiche, come l’eliminazione di connessioni preesistenti e perfino lo sviluppo di nuove connessioni. E’ proprio questa plasticità a conferire a ogni singolo individuo una propria singolare individualità [Konorski48]. 1.7 Plasticità sinaptica La caratteristica fondamentale che distingue i sistemi neurali dai sistemi informatici classici è la loro abilità di apprendimento. Due motivi fondamentali hanno forzato l’evoluzione di questa capacità: innanzitutto i continui cambiamenti dell’ambiente in cui viviamo e delle nostre caratteristiche fisiche (che il cervello deve controllare) fanno sì che il nostro controllore debba avere una flessibilità immensa. Secondariamente, la complessità delle funzioni che il cervello deve svolgere, e la ridondanza necessaria a garantirne l’affidabilità, richiedono un enorme numero di neuroni ed un numero ancor più grande di sinapsi; determinare a priori (cioè geneticamente) il valore di tutte le connessioni sarebbe chiaramente improponibile. L’apprendimento è mediato da due meccanismi: durante il periodo dello sviluppo si ha la creazione di connessioni tra neuroni e la morte di connessioni e neuroni non utilizzati; in seguito connessioni pre-esistenti vengono rinforzate od indebolite. Analizziamo brevemente i meccanismi che mediano questi ultimi processi. Il termine plasticità sinaptica si riferisce alla proprietà delle sinapsi di cambiare la loro efficacia, cioè l’entità dell’effetto post-sinaptico indotto da un evento pre-sinaptico. In prima approssimazione tale efficacia può essere espressa come: R=n·p·q 18 CAPITOLO 1 Il sistema nervoso e le sue proprietà dove “n” indica in numero totale di vescicole presenti nei siti pre-sinaptici di tutte le connessioni tra il neurone pre-sinaptico ed il neurone post-sinaptico, “p” indica la probabilità di rilascio di una singola vescicola di trasmettitore, e “q” è una misura dell’entità dell’effetto post-sinaptico causato dal rilascio di un quanto di neurotrasmettitore. Va notato che, nel definire “n”, abbiamo indicato come vi possano essere molteplici connessioni tra gli stessi due neuroni. Mentre in molti casi (specialmente tra neuroni corticali) vi è infatti una sola connessione tra due neuroni, spesso vi è un’elevata ridondanza di connessioni, che può essere interpretata come un metodo per garantire l’affidabilità della trasmissione. Esempi di questo tipo sono rappresentati dalle connessioni tra la retina ed il nucleo genicolato, tra le fibre rampicanti e le cellule di Purkinje nel cervelletto, e dalle giunzioni neuromuscolari. In quest’ultimo caso “n” può raggiungere valori dell’ordine del migliaio. Anche se questo non è ancora stato stabilito con certezza in tutti i casi, sembra che il meccanismo che porta alla modifica dell’efficacia di una connessione passi attraverso un cambio della probabilità di rilascio del neuro-trasmettitore. Per indicare ciò, “p” viene quindi espressa come: p(t) = p0 + ( pmax- p0 ) · e –t/τ La probabilità cambia quindi istantaneamente, per poi tornare al suo valore originale seguendo un andamento esponenziale caratterizzato da una costante di tempo “τ” . Il valore della costante di tempo può variare da qualche centinaia di millisecondi (nel qual caso si parla di facilitazione o di depressione) fino ad ore, giorni, settimane od anche più (nel qual caso si parla di long-term potentiation [LTP] (Figura 1.7) o di long-term depression [LTD]) [Tank89]. 19 CAPITOLO 1 Il sistema nervoso e le sue proprietà Fig.1.7 Illustrazione schematica di un paradigma di induzione LTP A. Un impulso debole (schematizzato a sinistra) evoca la risposta post-sinaptica abbozzata dal lato destro della figura. B. Una forte sequenza di stimoli (schematizzata a sinistra) innesca propagazione post-sinaptica (il picco del potenziale d’azione di destra). C. L’impulso della prima prova applicato in un tempo successivo evoca una più grande risposta post-sinaptica (linea continua di destra) della risposta iniziale (linea tratteggiata di destra). Gli eventi che portano all’induzione di una variazione della probabilità “p” sono molteplici; in generale, variazioni di breve durata possono venir indotte da eventi esclusivamente pre-sinaptici (per esempio nel caso in cui uno spike presinaptico sia seguito immediatamente da un altro, il secondo avrà una maggior probabilità di provocare il rilascio di trasmettitore), mentre variazioni di lunga durata solitamente richiedono una combinazione di eventi pre-sinaptici e post-sinaptici. Per esempio, è stato stabilito che per poter indurre LTP in certe sinapsi è necessario che il raggiungimento della sinapsi da parte di uno spike pre-sinaptico sia seguito, entro un tempo ben definito, da una depolarizzazione della membrana post-sinaptica (provocata, per esempio, dalla propagazione all’indietro di uno spike dalla zona di trigger del neurone post-sinaptico, attraverso l’albero dendritico e fino alla zona postsinaptica). Nel caso in cui la tempistica non venga rispettata nulla accade, mentre se l’ordine degli eventi viene invertito è possibile indurre LTD. In questa maniera, sinapsi che hanno contribuito alla generazione dello spike vengono potenziate, mentre sinapsi che non sono correlate con la generazione degli spikes vengono 20 CAPITOLO 1 Il sistema nervoso e le sue proprietà indebolite (è inoltre possibile che vi sia una generale tendenza ad indebolire tutte le sinapsi, cosicchè sinapsi che non vengono periodicamente potenziate tendono a morire). Questo tipo di apprendimento, che è stato proposto inizialmente su base teorica da Hebb (da cui il nome Hebbian learning), è quello più usato nelle reti neurali artificiali, e costituisce la base delle memorie autoassociative [Hebb49]. Siano xi e yi due nodi, allora la variazione dei pesi avverrà secondo la seguente legge ∆wij = xiyj; come conseguenza lo stimolo fornito da un neurone ad un altro attraverso l’assone rinforzerà la connessione (il peso). Il peso della sinapsi sarà quindi variato in funzione del prodotto degli stati dei due neuroni. Il peso verrà aumentato se i neuroni hanno valori concordi, diminuito in caso di valori discordi. Le reti neurali artificiali, la loro capacità di apprendimento e memorizzazione saranno argomento centrale nel seguito di questa tesi. 21 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali CAPITOLO 2 I sistemi complessi: le reti neurali artificiali 2.1 Cervello e computer Dopo l’avvento del calcolatore negli anni sessanta, nello studio delle attività mentali, accanto alla psicologia ed alle neuroscienze, si è proposta un’altra disciplina: l’intelligenza artificiale. Essa ha posto alla base della sua indagine degli assunti teorici così vicini a quelli dell’indirizzo dominante di psicologia, la psicologia cognitiva, da giungere ben presto a formare con essa il nucleo delle “scienze cognitive”. Negli anni ottanta si è proposto nell’ambito dell’intelligenza artificiale un nuovo “paradigma”, chiamato connessionismo, che si è proposto come antagonista rispetto all’intelligenza artificiale “classica”, legata al paradigma della rappresentazione simbolica della conoscenza [McClelland86]. L’idea di base di questo paradigma è che “la mente è ciò che fa il cervello”. Questo significa che il modo migliore per studiare il comportamento sia costruire modelli che riprendano le caratteristiche fondamentali del dispositivo che lo generano: il cervello. Il connessionismo afferma che la totalità dei processi cognitivi dei sistemi naturali, ed in particolare la flessibilità, la sensibilità al contesto, la robustezza al rumore, la capacità di apprendere dall’esperienza, siano producibili solo da sistemi che presentano alcune caratteristiche tipiche del cervello [Parisi90]. Per questo il connessionismo ha assunto come suo modello fondamentale le “reti neurali”. Una rete neurale cattura alcuni tratti essenziali del cervello. Essa è composta da unità (neuroni), connessioni tra unità (sinapsi), propagazione delle attivazioni da un’unità all’altra (potenziali di attivazione), attivazione delle unità sulla base delle eccitazioni ed inibizioni provenienti dalle altre unità, modificazioni della conduttività delle connessioni attraverso l’esperienza. 22 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali Le reti neurali costituiscono un’alternativa rispetto ai modelli delle scienze cognitive e dell’intelligenza artificiale classica. In particolare, le reti neurali si differenziano da questi modelli in quanto prendono in considerazione i seguenti aspetti del cervello. L’informazione, al pari di quanto avviene nel cervello, circola nelle reti neurali in forma quantitativa. In particolare la “memoria” del sistema risiede nella conduttività delle connessioni delle unità della rete, che nella simulazione è sintetizzata da un numero (peso). Anche le informazioni che sono scambiate tra le unità sono di carattere quantitativo (numeri che sintetizzano l’intensità degli impulsi scambiati). Le elaborazioni che sono realizzate dalle unità, poi, consistono in funzioni matematiche, cioè in una associazione di impulsi (numeri) in uscita ad impulsi (numeri) in entrata. Esistono però delle limitazioni tecniche nell’implementare le reti neurali sul calcolatore. Se confrontiamo il numero di neuroni presenti in un cervello umano con il numero di bit presenti in una tipica workstation di fascia alta, ci rendiamo presto conto come questi siano molti di più. Questo limite è tuttavia stato superato da alcuni supercomputer. Il cervello umano, infatti, si evolve molto lentamente, mentre le memorie del computer crescono in fretta. In ogni caso, la differenza in capacità di immagazzinamento è minima rispetto a quella in velocità e parallelismo. I chip dei computer possono eseguire un’istruzione in qualche decina di nanosecondi, mentre i neuroni richiedono millisecondi per essere attivati. Il cervello va però oltre, tanto da recuperare e superare questo svantaggio, questo perché tutti i neuroni e tutte le sinapsi possono lavorare contemporaneamente mentre la gran parte dei computer attuali ha al più qualche CPU. Una rete neurale artificiale che giri su un computer seriale richiede centinaia di cicli per decidere se una singola unità-neurone deve essere attivata, mentre nel cervello tutti i neuroni svolgono questa operazione in un singolo passo. Quindi, anche se un computer è un milione di volte più veloce in velocità di commutazione, il cervello finisce con l’essere un miliardo di volte più veloce nell’ottenere il risultato. Una delle attrattive dell’approccio basato su reti neurali artificiali è la 23 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali speranza che possa essere costruita una macchina che combini il parallelismo del cervello con la velocità di commutazione del computer [Haken91]. La caratteristica fondamentale delle reti neurali, da cui derivano diverse proprietà, è la mancanza di simbolismo. Le informazioni, diversamente da quanto accade per i sistemi di intelligenza artificiale classica, non sono codificate attraverso simboli che hanno un significato univoco e corrispondono ognuno ad una particolare entità del mondo. Il motivo di fondo è che due simboli possono essere tra loro del tutto identici o del tutto diversi. Due numeri invece, possono avere infiniti gradi di libertà. Le informazioni relative alle entità reali del mondo, proprio in quanto sono contenute nei pesi delle connessioni delle unità che sono collegate in rete e concorrono collettivamente ad esprimere le risposte date dal sistema agli stimoli provenienti dall’ambiente, sono distribuite su più punti della rete e l’informazione risulta così diffusa. Inoltre sono sovrapposte, nel senso che un peso concorre ad immagazzinare più contenuti di memoria. Questo, se da una parte può portare a produrre interferenza tra i ricordi, dall’altro consente il funzionamento della memoria associativa, cioè della memoria che recupera i ricordi sulla base di frammenti di essi o stimoli in qualche modo legati ad essi. La memoria associativa è probabilmente alla base delle abilità come la creatività, la capacità di generalizzazione, la sensibilità al contesto e la robustezza al rumore, che come detto manca ai sistemi prodotti dall’intelligenza artificiale classica. Il cervello e le reti neurali, non sono dotati di un elaboratore centrale di informazione né di particolari magazzini di memoria in cui sono contenute le informazioni come accade per i calcolatori. Sono piuttosto dotati di un grande numero di unità particolari, ciascuna in grado di svolgere delle elaborazioni molto semplici dei segnali (come la somma o l’amplificazione). Le prestazioni complessive del sistema sono l’espressione dell’operare in parallelo di queste unità. La natura di sistema complesso del cervello, accanto alla natura quantitativa e diffusa dell’informazione contenuta in esso che consente di togliere ai simboli il ruolo di unico veicolo della conoscenza, rappresenta un salto epocale nella storia dello studio del pensiero e della conoscenza. Infatti l’avere riconosciuto che alcuni 24 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali caratteri sono strettamente legati alla natura di sistema complesso del cervello, richiede dei cambiamenti drastici sia nella visione della loro essenza, sia nelle tecniche utilizzabili per la loro indagine. La ragione di questo risiede nel fatto che i sistemi complessi hanno dei caratteri così radicalmente diversi dai sistemi semplici. 2.2 Caratteristiche dei sistemi complessi Un sistema complesso è un insieme molto grande di elementi che interagiscono localmente tra di loro in modo tale che dalle loro interazioni emergono le proprietà globali del sistema. Queste proprietà globali sono emergenti nel senso che, diversamente da quanto accade nei sistemi semplici, non sono previste o deducibili dalla conoscenza degli elementi e dalle regole che governano le interazioni locali. Nel loro studio quindi, il riduzionismo incontra seri limiti. La non riducibilità del comportamento di un sistema complesso alle leggi di interazione locale delle unità di cui è composto, sebbene tale comportamento derivi da esse, dipende da una serie di proprietà dei sistemi complessi. I sistemi complessi tendono ad organizzarsi su più livelli gerarchici. Questi livelli hanno dei legami e delle interazioni che non sono univoci e deterministici: un cambiamento ad un livello può riflettersi sul livello superiore o inferiore in modo molto differente a seconda di una serie di condizioni al contorno. Le singole unità elementari dei sistemi complessi hanno poco peso nel determinare il comportamento del sistema. Ciò che determina tale comportamento è l’azione collettiva e parallela di tante unità interagenti. Questo di per sé limita la possibilità di “ridurre” la spiegazione di un fenomeno osservato a livello globale del sistema, all’azione di poche variabili sottostanti. Essa comporta che una perturbazione di entità limitata possa dar luogo a cambiamenti catastrofici nel sistema mentre una perturbazione importante possa essere riassorbita senza particolari conseguenze. Inoltre due sistemi possono partire da stati iniziali molto simili e divergere poi moltissimo tra di loro mentre in altri casi due sistemi, partendo da stati iniziali parecchio dissimili, convergono con il tempo. 25 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali Le unità e i livelli dei sistemi complessi sono caratterizzati da “legami sistemici”, cioè da relazioni circolari, da meccanismi omeostatici e da relazioni di feedback, che tendono a sostituire le relazioni lineari di causa o di effetto tipiche dei sistemi semplici. I sistemi di interesse biologico per lo studio del comportamento sono inoltre adattativi, si modificano cioè in funzione dell’ambiente in cui si trovano. I sistemi complessi adattativi hanno l’importante caratteristica di possedere dei meccanismi sofisticati che consentono dei cambiamenti a livello delle unità elementari come riflesso di eventi accaduti a livello globale. I sistemi complessi adattativi hanno una natura intrinsecamente evolutiva. Essi tendono a portare dentro, in ogni momento, delle tracce della loro storia passata, che accumula informazione a livello di struttura. I sistemi complessi sono spesso caratterizzati dalla presenza di eventi casuali. Il rumore costituisce spesso la fonte di creazione di nuove strutture ed organizzazioni che consentono al sistema di far fronte a nuove situazioni, consentendo così il processo di adattamento stesso. Essi hanno una struttura tipicamente dinamica. La dinamicità ed il cambiamento sono essenziali per consentire i processi circolari, di adattamento, di emergenza dell’organizzazione dal rumore. Il cervello è un tipico sistema complesso: i neuroni costituiscono le sue componenti elementari, le eccitazioni e le inibizioni, le funzioni di trasferimento all’interno dei neuroni, le modificazioni delle sinapsi, costituiscono le leggi di interazione locale del sistema. Il sistema complesso cervello è organizzato su più livelli gerarchici, si possono individuare in esso almeno i livelli seguenti: • livello dei singoli neuroni, sinapsi, neuro-trasmettitori, potenziali; • livello dei “circuiti” di neuroni; • livello delle aree funzionali del cervello, aventi una certa specializzazione; • livello del comportamento e dell’attività mentale dell’organismo. Il comportamento e la cognizione sono le proprietà globali emergenti del sistema complesso cervello. Questo implica che solo usando dei modelli che 26 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali incorporano le caratteristiche essenziali dei sistemi complessi, come le reti neurali, potremo sperare di comprendere a fondo le relazioni esistenti tra il livello microscopico del cervello, quello dei neuroni, ed il livello macroscopico, quello del comportamento [Haykin94]. 2.3 Le reti neurali artificiali La base teorica delle reti neurali artificiali è il connessionismo, già citato in precedenza. La teoria del connessionismo parte dal presupposto che le reti neurali artificiali sono in grado di apprendere dall’esperienza tramite semplici modulazioni della forza delle connessioni tra le unità. Questa teoria, oltre ad avvicinare questi sistemi a quelli biologici dal punto di vista teorico, offre una convincente alternativa all’apprendimento basato sulla costruzione di regole esplicite: non vi è nessun centro di costruzione di regole del sistema; semmai le regole emergono da una descrizione di livello più astratto, mentre ad un livello più basso tutta l’informazione è immagazzinata nelle connessioni delle unità. Una rete neurale è composta da un certo numero di nodi, o unità, connesse da collegamenti. Ciascun collegamento ha un peso numerico associato ad esso. I pesi sono il principale mezzo di memorizzazione a lungo termine nelle reti neurali e l’apprendimento ha luogo aggiornando i pesi. Alcune unità sono collegate con l’ambiente esterno e possono essere designate come unità di ingresso e di uscita. I pesi vengono modificati in modo tale da portare il comportamento della rete, in termini di associazione delle uscite agli ingressi, ad essere più in linea con quanto richiesto dall’ambiente che fornisce gli input [Hopfield84]. Ciascuna unità ha un insieme di collegamenti d’ingresso che proviene da altre unità, un livello di attivazione corrente, e un modo per calcolare il livello di attivazione all’istante successivo dati i suoi ingressi e i relativi pesi. L’idea è che ciascuna unità effettui un calcolo basato sugli ingressi provenienti dai suoi vicini senza bisogno di alcun controllo globale sull’insieme di unità nel suo complesso. Nella pratica la maggior parte delle reti neurali è implementata tramite software, e 27 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali usa dei controlli sincroni per aggiornare tutte le unità secondo una sequenza prefissata. Per costruire una rete neurale che svolga un qualche compito si deve dapprima decidere quante unità occorre usare, che tipo di unità sono adatte, e come tali unità devono essere connesse per formare una rete. Dopodichè si inizializzano i pesi della rete e li si addestra impiegando un algoritmo di apprendimento che si serve di un insieme di esempi di addestramento specifici per quel compito. L’uso di esempi implica anche che si debba decidere in che modo codificare gli esempi in termini di ingressi e di uscite dalla rete. 2.4 Architettura di una rete neurale artificiale Una rete neurale artificiale può essere schematizzata come segue (Figura 2.1): X1 W1 Funzione di attivazione X2 ….. Uscita W2 Σ ….. f y ….. ….. W3 X3 θ Soglia Fig 2.1 Schematizzazione di una rete neurale artificiale Esistono “n” canali d’ingresso xi..xn a ciascuno dei quali è associato un peso. I pesi wi sono numeri reali che corrispondono al segnale prodotto dalle sinapsi. Se 28 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali wi>0, il canale è detto eccitatorio, se wi<0, il canale è detto inibitorio. Il valore assoluto del peso rappresenta la forza della connessione. Il segnale con cui il neurone trasmette la sua attività all’esterno (l’uscita) è calcolato applicando la funzione di attivazione alla somma pesata degli ingressi. Indicando con: La somma pesata degli ingressi si ottiene: La funzione di attivazione f(a) è detta anche funzione di trasferimento. Nel modello di rete rappresentato in figura 2.1 è stata inclusa anche una soglia (θ) che ha l’effetto di abbassare il valore in ingresso della funzione di attivazione. Di conseguenza la somma pesata degli ingressi si ottiene nel seguente modo: Interpretando la soglia come il peso associato ad un ulteriore canale in ingresso x0 di valore sempre costante pari a -1 si può scrivere: con w0 = θ La funzione soglia definisce l’uscita di un neurone in relazione al livello di attivazione. L’uscita può essere un numero reale o un numero intero appartenente a un certo intervallo discreto (tipicamente {0,1} oppure {-1,+1}). Esistono diversi tipi di funzione di attivazione: 29 CAPITOLO 2 • I sistemi complessi: le reti neurali artificiali Funzione soglia (Figura 2.2) L’uscita di un neurone che usa una funzione di attivazione a soglia è: Fig.2.2 Funzione di attivazione a soglia • Funzione lineare (Figura 2.3) L’uscita di un neurone che usa una funzione di attivazione lineare è: Fig.2.3 Funzione di attivazione lineare • Funzione lineare a tratti (Figura 2.4) 30 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali L’uscita di un neurone che usa una funzione di attivazione lineare a tratti è: Fig. 2.4 Funzione di attivazione lineare a tratti • Funzione sigmoide (Figura 2.5) Le funzioni sigmoidi insieme alle funzioni soglia sono tra le più usate. Un esempio di funzione sigmoide è la funzione logistica definita come: Fig 2.5 Funzione di attivazione sigmoide 31 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali Si può osservare che, mentre la funzione soglia assume solo valori 0 e 1, una funzione sigmoide assume tutti i valori da 0 a 1. Notiamo inoltre che la funzione sigmoide è derivabile ovunque mentre la funzione soglia non lo è. Esistono molti tipi di reti neurali che sono differenziati sulla base di alcune caratteristiche funzionali di seguito citate: • tipo di utilizzo; • tipo di apprendimento; • architettura dei collegamenti; • algoritmo di apprendimento. Per quanto riguarda l’architettura dei collegamenti, le reti neurali si classificano in base al modo con cui i nodi (neuroni) si dispongono. Questi possono disporsi su uno o più strati, in particolare si distinguono reti a uno strato, reti a due strati e reti a più strati. In questi ultimi due tipi, gli strati esterni svolgono la funzione di strato di input e strato di output, simulando all’incirca ciò che avviene nel cervello dove ci sono neuroni a contatto diretto con gli organi di senso e neuroni che governano il movimento. Si possono identificare diversi tipi di architettura di una rete. • Reti completamente connesse o non stratificate (Figura 2.6) Fig.2.6 Scema di una rete completamente connessa 32 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali In una rete completamente connessa ogni neurone è connesso in modo bidirezionale con tutti gli altri. • Reti stratificate (Figure 2.7-2.8) Nelle reti stratificate si individuano degli strati di neuroni tali che ogni neurone è connesso con quelli dello strato successivo, ma non esistono connessioni tra i neuroni all’interno dello stesso strato, né tra neuroni di strati diversi, né tra neuroni di strati non adiacenti. Nello strato di ingresso non avviene alcuna computazione, i neuroni di ingresso devono semplicemente passare allo strato successivo i segnali ricevuti dall’ambiente esterno. Strato d’ingresso Strato d’uscita Fig.2.7 Schema di rete stratificata a due strati 33 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali Strato d’ingresso Strato nascosto Strato d’uscita Fig.2.8 Schema di rete con strato nascosto Prima di passare a una descrizione dettagliata della rete neurale utilizzata nel protocollo dell’esperimento (descritta nel capitolo 4), vediamo alcune informazioni di carattere generale sulle sue proprietà e il perché è stato scelto questo tipo di rete. 2.5 SOM e ITSOM La rete neurale da noi utilizzata è la ITSOM (Inductive Tracing Self Organizing Maps). Tale categoria di reti neurali rientra nelle reti auto-organizzanti o SOM (Self Organizing Maps). Si tratta di reti con apprendimento non supervisionato, in grado di apprendere senza nessuna indicazione esterna. Il modello più famoso e utilizzato è quello proposto da Teuvo Kohonen e noto appunto con il nome di Kohonen [Kohonen90]. L’apprendimento avviene secondo la regola di Winner Take All, vengono calcolate le distanze D (wi,xi) tra gli input xi = (x1,..,xn)T e i pesi delle connessioni wi = ( w1,..,wn)T secondo una funzione distanza D, per esempio quella euclidea. La SOM prevede a questo punto un meccanismo cosiddetto di inibizione laterale, che è presente anche in natura sotto forma di trasformazioni chimiche a livello sinaptico [Kohonen97]. Nella regione corticale del cervello, neuroni fisicamente vicini ad un neurone attivo mostrano legami più forti, mentre ad una certa distanza iniziano a mostrare 34 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali legami inibitori. In questa architettura ciascun elemento riceve sia stimoli eccitatori da parte degli elementi adiacenti (la cosiddetta neighborhood), sia stimoli inibitori da parte degli elementi più lontani, secondo la cosiddetta forma a cappello messicano (Figura 2.9). Fig.2.9 Andamento della funzione a cappello messicano L’esistenza della neighborhood è utile per non polarizzare la rete su pochi neuroni vincenti, in tal modo vengono attivati solo gli elementi con distanza inferiore a un certo valore, in casi restrittivi solo l’unità con minima distanza [Pizzi02a]. Le ITSOM sono state costruite poiché, nel caso di input strettamente non lineari e tempovarianti, le prestazioni delle SOM sono limitate. Il motivo è che se la non linearità della topologia di input è troppo accentuata lo strato di output non è in grado di dipanarsi a sufficienza su questa forma di topologia. La seconda ragione riguarda la difficoltà di pervenire ad una convergenza certa (non essendoci la possibilità di stabilire un errore della rete per ciascuna epoca), e dal numero ridotto dei neuroni dello strato competitivo. Un altro problema delle SOM è la mancanza di esplicitazione dell’output. Una volta ottenuta la classificazione dell’input, l’utente deve estrapolarne il significato con una procedura ad hoc, che in applicazioni in tempo reale può penalizzare ulteriormente il carico computazionale [Ritter86], [Ritter88]. Osservando la sequenza temporale dei neuroni vincenti di una SOM si nota che questa tende a ripetersi creando una serie temporale, costituente attrattori caotici 35 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali o precisi cicli limite, e che questi caratterizzano univocamente l’elemento di input che gli ha prodotti. La regola di apprendimento delle ITSOM fa sì che il peso vincitore rappresenti un’approssimazione del valore d’input. Ad ogni epoca il nuovo peso vincitore, insieme al peso che ha vinto nell’epoca precedente, va a costruire un’approssimazione del secondo ordine del valore di input e così via. È quindi possibile ricavare il valore dell’input confrontando le configurazioni caratteristiche di ciascun input con le configurazioni proprie dei bit del middambolo, di cui è noto il valore. Viene così effettuato un vero e proprio processo di induzione, perché una volta prodotta una quantizzazione vettoriale molti-a-pochi dall’input sullo strato dei pesi, si opera un passaggio pochi-a-molti da configurazioni di neuroni note alla totalità degli input (Figura 2.10). Fig.2.10 Schema che illustra il funzionamento di una ITSOM Va sottolineato che tale rete non necessita di essere portata a convergenza, perché le configurazioni di neuroni vincenti raggiungono la stabilità entro poche decine di epoche. Per ottenere migliori risultati, la rete non deve polarizzarsi su pochi neuroni ma nemmeno disperdersi su tutto lo strato. L’algoritmo ottimale per riconoscere le configurazioni create dalla rete si basa sul metodo degli z-score. I punteggi cumulativi relativi a ciascun input vengono normalizzati secondo la distribuzione della variabile standardizzata “z” data da: 36 CAPITOLO 2 I sistemi complessi: le reti neurali artificiali Fissata una soglia “τ” compresa tra 0 e 1, che costituisce quindi uno dei parametri di questo tipo di rete, si pone poi: In questo modo ogni configurazione dei neuroni vincenti è rappresentata da un numero composto da zeri e uni, tanti quanti sono i pesi dello strato di output. Diventa poi immediato confrontare tra loro questi numeri binari. Il meccanismo delle SOM è stato scritto tenendo conto di quanto avviene sulla neurocorteccia. Risulta infatti che input simili siano mappati su luoghi vicini della corteccia in modo ordinato conservando la topologia. Sia le SOM che le altre reti neurali artificiali apprendono grazie alla ripetizione ciclica dello stimolo di input. Anche nel cervello esiste la prova dell’esistenza di circuiti in grado di rinforzare l’impressione dell’informazione di input. Sembra però improbabile che la medesima configurazione di input possa attivare un unico bersaglio, ma è più ragionevole pensare che le mappe corticali siano costituite da un insieme di neuroni attivati, la cosiddetta traccia mnestica che servirà per il recupero successivo dell’informazione. Per questo motivo il meccanismo delle ITSOM sembra essere più vicino a quanto accade sulla neurocorteccia. Anche l’idea che l’apprendimento di nuove informazioni avvenga utilizzando la traccia mnestica di un insieme di informazioni preesistenti sembra essere confermato da esperimenti. Sembra essere confermato da diversi studi che l’apprendimento non sia un processo completamente basato su esempi, ma nemmeno completamente non supervisionato e necessiti di punti noti [Pizzi02b]. 37 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche CAPITOLO 3 Tecnologie di integrazione elettronico/biologiche 3.1 Sistemi ibridi Il passo successivo all’emulazione delle proprietà biologiche è quello di una vera e propria integrazione tra neuroni e circuiti elettronici. Il tentativo di connettere il cervello al calcolatore prende origine dal fatto che entrambi, anche se in modo diverso, comunicano elettricamente. L’idea di provare ad interfacciare direttamente i due sistemi è una sfida non solo tecnologica, ma i cui risultati potrebbero portare alla comprensione di molti misteri delle scienze cognitive. Allo stato attuale delle conoscenze teoriche e della tecnologia a disposizione non siamo in grado di stabilire che cosa ci riservi il prossimo futuro, se dovremo aspettarci tessuti cerebrali integrati nei computer oppure chip integrati direttamente nel nostro cervello. Una cosa però è certa: qualunque siano le ricerche svolte in questo campo, ci aiuteranno a capire meglio l’architettura del cervello. Tutto ciò porterà ad uno sviluppo di applicazioni scientifico-tecnologiche fino ad ora impensate. Cercare di comprendere come l’informazione si conservi in una rete di neuroni è un’operazione alquanto complessa a causa delle numerose variabili in gioco. E’ pensiero comune dire che gli impulsi scambiati tra i neuroni “codificano” informazione. Questo trova riscontro in numerosi lavori ritrovati in letteratura, dove si ricerca un linguaggio all’interno del segnale neurale. In realtà facendo questo dimentichiamo che gli impulsi scambiati “sono” informazione, e ciò che si tenta di fare è quindi decodificare qualcosa che solo apparentemente è codificato, ma in realtà sappiamo essere privo di simbolismo. Per esempio potremmo dire che una serie di stimoli scambiati all’interno di una mappa corticale determinano una traccia mnestica, che servirà per il successivo recupero dell’informazione (memoria); in realtà quella traccia “è” l’informazione. 38 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Per questo motivo ciò che verrà proposto nelle pagine seguenti è uno studio integrato tra reti nervose e reti neurali artificiali, un metodo plausibile che consente una comprensione della comunicazione neurale priva di simbolismi. L’utilizzo delle reti neurali artificiali che, come visto nel capitolo precedente, presentano in maniera semplificata le proprietà delle reti di neuroni, è un approccio diverso ai comuni metodi di integrazione tra i sistemi biologico-elettronici che si basano su algoritmi tradizionali e indagano su alcune caratteristiche del segnale. Prima di presentare il progetto svolto dal nostro gruppo di ricerca, è indispensabile citare alcuni dei lavori più significativi ritrovati in letteratura, per meglio comprendere quanto sia nuovo e innovativo l’argomento trattato. Ciò che è stato fatto in materia è frutto di studi condotti in tempi recenti a partire dai primi anni novanta. Ripercorrendo i primi lavori fino a giungere ai giorni nostri, ci si rende conto come l’introduzione di tecnologie innovative, e le teorie nate a seguito dei primi esperimenti, abbiano permesso grossi passi da gigante in un lasso di tempo piuttosto breve. L’argomento si è così ritrovato negli ultimi anni al centro di numerosi dibattiti e conferenze in diverse parti del mondo e oggetto di studio di vari gruppi di ricerca. Nell’ultimo decennio molti laboratori nel mondo hanno effettuato esperimenti sull’integrazione diretta neuro-elettronica al fine di sostenere la ricerca neurofisiologica ma anche per sperimentare dispositivi ibridi, protesi bioelettroniche e computazioni biologiche. Poiché microelettrodi inseriti nel cervello determinano forme di rigetto e infezioni, le ricerche si sono avviate verso la sperimentazione di un’adesione diretta tra il tessuto neurale e i circuiti elettronici, con importanti risultati [Egert88], [Akin94], [Wilson94], [Breckenridge95], [Bove96], [Canepari97], [Jenkner97], [Jimbo00]. Le ricerche riguardanti campi come la biologia, l’informatica, l’ingegneria, hanno trovato un comune denominatore. Gli scienziati che si occupano di queste discipline hanno scoperto un modo di unire gli sforzi, applicando le loro conoscenze in ambiti di ricerca comuni. Lo studio che unisce queste discipline apparentemente diverse tra loro, prende il nome di “Biomorphic Robotics” e lo scopo di questa 39 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche disciplina è quello di creare delle interfacce che permettano la comunicazione tra organismi animali ed apparecchiature elettroniche. 3.2 I passi salienti Già nei primi anni novanta fu stabilita per la prima volta un’interfaccia elettrica tra cellule nervose e microstrutture semiconduttrici, utilizzando i neuroni delle sanguisughe, notoriamente grandi e quindi facili da manipolare, uniti a transistor disposti su una piastra di silicio [Fromherz91]. In seguito a questi primi rudimentali esperimenti si è passati a studiare sia la natura microscopica delle giunzioni neurone-silicio, sia nuovi sistemi ibridi che combinavano neuroni a reti neurali con dispositivi microelettronici semiconduttori. Tutto questo facendo molta attenzione a rispettare la struttura e le proprietà elettriche e utilizzando contatti non invasivi, al fine di descrivere in modo corretto tali giunzioni e ottimizzare l’interfaccia tra neuroni e chip. Lo scopo di questi sistemi ibridi era quello di studiare i processi dinamici distribuiti, come l’apprendimento e la memoria [Fromherz93], [Lindner96]. Nel 1999 sono stati condotti dal professor William Ditto e dai suoi collaboratori, presso l’università di Atlanta (Georgia), alcuni esperimenti volti a creare delle semplici computazioni attraverso i neuroni di sanguisughe. L’esperimento consisteva nel collegare due neuroni tra di loro e ad un computer in grado di inviare dei segnali in modo selettivo ad ognuno di essi. Ditto è stato in grado di far compiere ai due neuroni una semplice addizione. In realtà, simulazioni al computer hanno mostrato come grandi gruppi di neuroni siano in grado di compiere moltiplicazioni e operazioni logiche. Le porte aperte da Ditto sono estremamente affascinanti perché prospettano un futuro lontano in cui i biocomputer saranno in grado di trovare soluzioni adatte a problemi che solo l’uomo oggigiorno è in grado di risolvere [Garcia03]. Nel 1999 un altro gruppo di ricercatori ha condotto degli esperimenti su delle reti neurali coltivate. Il loro scopo era quello di capire le correlazioni morfologiche dell’apprendimento e della memoria. Questo progetto, sviluppato al Pine Lab del 40 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche California Institute of Technology, ha utilizzato sistemi di neuroni coltivati su di un substrato di silicio. I neuroni prelevati dall’ippocampo di topi sono stati cresciuti su delle piastre. Questi hanno formato rapidamente delle sinapsi, e hanno sviluppato spontaneamente complessi schemi di connessione. Stimolando gruppi di neuroni con vari schemi di potenziali d’azione simulati, si è sperato di osservare dei cambiamenti nelle reti di neuroni. Questi segnali hanno indotto dei cambiamenti nel numero e nella grandezza delle sinapsi, nella crescita dendritica e nell’interazione con le cellule gliali [Pine99], [Maher99]. Nel 2000 un team di ricercatori della Northwestern University di Chicago, dell’Università dell’Illinois e dell’Università di Genova, hanno presentato il risultato delle loro ricerche: la realizzazione di una creatura ibrida costituita da un corpo meccanico controllato dal cervello di un pesce. Il robot possiede pochi neuroni prelevati dalla lampreda marina Petromyzon marinus, un vertebrato primitivo simile alle anguille. Di fronte ad alcuni stimoli luminosi il robot ha presentato diversi comportamenti: ha seguito la luce, ha evitato la luce, si è messo a “camminare” in circolo. La ricerca originariamente avrebbe dovuto studiare gli adattamenti delle cellule del cervello di fronte a stimoli che cambiano in continuazione, tuttavia l’esperimento è andato oltre permettendo di comprendere in parte come i neuroni comunichino con le macchine artificiali [Reger00]. Nel 2002, un team di ricercatori guidati da Catherine Schmidt dell’Università di Austin (Texas), è riuscito a posizionare un semiconduttore esattamente nel punto desiderato della superficie di una cellula nervosa umana, fatto di fondamentale rilevanza, visto che fino ad ora le cellule nervose utilizzate erano solo quelle di topi, sanguisughe e lumache. Nel 2002 Peter Fromherz, un neuroscienziato del Max Planck di Monaco, ha coltivato delle cellule nervose su una piastrina da cui emergevano minuscoli elettrodi di silicio, rivestiti di un polimero spugnoso: dopo qualche giorno le cellule nervose hanno stabilito rapporti tra loro, proprio come avviene nel sistema nervoso, ma soprattutto hanno formato sinapsi con gli elettrodi di silicio, formando una rete biologico-artificiale in cui i neuroni rispondevano ai segnali elettrici degli elettrodi e questi ultimi ai segnali dei neuroni [Fromherz02], [Bels02]. 41 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche L’elaborazione di reti neurali “miste” potrebbe aprire nuove strade sia nel campo dell’informatica che in quello medico. Questi esperimenti sembrano fatti apposta per indicare come le cellule nervose abbiano la proprietà di interconnettersi, di interfacciarsi con materiali non biologici, di estrarre informazioni da ambienti e realtà artificiali: in altre parole, i neuroni sono dotati della capacità di associarsi in reti intelligenti e di interfacciarsi con circuiti elettronici, purché questi siano in grado di recepire i loro segnali e ritrasmetterli alla rete di neuroni. 3.3 Integrazione tra neuroni e circuiti elettronici Una cellula nervosa ha un diametro di circa 10-100µm ed è avvolta da una membrana composta da un doppio strato lipidico elettricamente isolante. Il doppio strato lipidico separa gli ioni sodio che circondano la cellula dagli ioni potassio presenti nell’ambiente intracellulare. Le correnti attraverso la membrana, in entrambi i sensi, sono mediate da specifici canali proteici per il sodio e per il potassio con una conduttanza di circa 10-100pS. I chip di silicio sono rivestiti da un sottile strato di biossido di silicio, che rende i chip perfettamente inerti alle coltivazione di neuroni, impedendo il danneggiamento delle proprietà elettrofisiologiche. Questo sottile strato evita la corrosione del silicio e il conseguente danneggiamento delle cellule, in quanto blocca il trasferimento di elettroni. I neuroni sono conduttori di ioni, mentre il silicio è un conduttore di elettroni. Una volta soppressa la corrente di Faraday all’interno dell’interfaccia del biossido di silicio, l’accoppiamento tra cellule e chip può essere raggiunto solo attraverso la polarizzazione elettrica. Se il doppio strato lipidico della cellula è direttamente in contatto con lo strato di biossido di silicio colpito si forma un compatto dielettrico che non permette il flusso di elettroni (Figura 3.1). Il campo elettrico che attraversa la membrana cellulare, causato dall’attività neuronale, polarizza il biossido di silicio così che la struttura elettronica del silicio risulta alterata. Al contrario, il campo elettrico causato dal voltaggio applicato al chip, polarizza la membrana in modo da alterare le conformazioni dei canali ionici e delle proteine di trasporto di membrana. 42 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Fig.3.1 Compatto dielettrico tra neurone e chip Questo accade se la membrana del neurone e lo strato di biossido di silicio sono a stretto contatto tra loro. Se facciamo crescere un neurone su un chip, il compatto dielettrico non viene a crearsi, perché le proteine che sporgono dalla membrana cellulare fanno si che tra il doppio strato lipidico e lo strato di biossido di silicio si crei una pellicola elettrolitica (Figura 3.2). La pellicola non è altro che uno spazio conduttore che scherma il campo elettrico e annulla la polarizzazione dello strato di biossido di silicio e della membrana cellulare. Tra la giunzione cellula-semiconduttore si forma così uno strato centrale che funge da conduttore planare. Gli strati di biossido di silicio e della membrana isolano lo spazio conduttore interno dall’ambiente conduttore del silicio e del citosol. Questo fenomeno disaccoppia elettricamente il chip dalla cellula. Fig.3.2 Pellicola elettrolitica e conduzione tra cellule e chip Le correnti elettriche e la diffusione degli ioni in questa struttura governano la stimolazione e la registrazione dell’attività dei neuroni sul chip. Il primo passo per una interfaccia neurone-chip è determinato dal flusso di corrente nello strato conduttore interno. L’attività del neurone porta correnti ioniche e di spostamento attraverso la membrana cellulare, e la concomitante corrente lungo lo strato interno crea un potenziale extracellulare transdotto (TEP) tra la cellula e il 43 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche chip. Un voltaggio transiente applicato al silicio porta le correnti di spostamento attraverso lo strato di biossido di silicio. Nell’interfacciamento neurone-chip, il TEP nello strato conduttore viene registrato da strumenti voltaggio-sensibili nel chip o nella cellula: • il TEP indotto dal neurone genera un campo elettrico nel biossido di silicio; • il TEP indotto dal chip crea un campo elettrico attraverso la membrana cellulare. Per descrivere la giunzione silicio-neuroni può essere usato il modello 2D area-contatto di seguito mostrato (Figura 3.3): Fig.3.3 Modello 2D area contatto La corrente lungo lo spazio tra cellula e silicio è bilanciata dalla corrente di spostamento attraverso il silicio e dalla corrente ionica e di spostamento attraverso la membrana. La conservazione della carica elettrica per unità di area della giunzione è espressa dalla seguente formula (1): La parte sinistra dell’equazione si riferisce al bilancio di corrente per unità di lunghezza nello spazio tra il silicio e la membrana, mentre la parte destra si riferisce 44 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche alla corrente per unità di area attraverso la membrana e l’ossido. Nella parte di sinistra compare il TEP della giunzione (VJ), e la resistenza dello spazio tra cellula e silicio (rJ). “ ” è l’operatore di derivata bidimensionale. Nella parte di destra compare il potenziale elettrico della cellula (VM), e il potenziale elettrico del substrato (VS) con le rispettive capacità specifiche di area della membrana (cM) e del substrato (cS), e la conduttanza della membrana attaccata allo spazio conduttore interno (gJM). Un altro modello che può essere usato è il modello che segue (Figura 3.4): Fig.3.4 Modello a “punto di contatto” Questo modello è detto a “punto di contatto”. Per molte applicazioni è conveniente descrivere lo spazio conduttore interno con il circuito sopra mostrato. Qui il bilancio di voltaggio è espresso dalla seguente formula: Lo spazio conduttore interno è rappresentato da una conduttanza ohmica (gJ). La membrana del neurone e il biossido di silicio, a contatto con lo spazio conduttore, sono rappresentate rispettivamente dalle capacità globali (cM, cS). I voltaggi inversi (ViO), generati dalle differenze di concentrazione ionica tra cellula e ambiente, sono considerati uguali anche per la condizione di membrana libera. Nella formula compare anche la conduttanza inversa della membrana attaccata allo spazio conduttore interno (giJM). 45 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Un potenziale d’azione conduce una corrente elettrica attraverso la membrana della cellula e attraverso il gap che separa cellula e chip. Il voltaggio extracellulare VJ(t), che modula la struttura a banda del semiconduttore, nasce da una sovrapposizione di tutte le correnti ioniche e capacitive, presenti nel contatto. La forma e l’ampiezza del segnale è controllata dall’accumulo e dal rilascio delle conduttanze di ioni (nella membrana), e dalla specifica conduttanza della giunzione. Monitorando l’attività dei neuroni si può osservare una certa varietà di segnali che possono in qualche modo essere compattati in tre classi (Figura 3.5): A. Il voltaggio extracellulare è proporzionale alla derivata prima del potenziale d’azione. Questa risposta di tipo A-type avviene quando tutte le conduttanze di ioni sono rilasciate nella giunzione e le correnti capacitive sono controllate. B. Il voltaggio extracellulare è proporzionale al potenziale d’azione stesso. Questa risposta di tipo B-type è stata osservata quando una non specificata conduttanza prevale nel contatto in modo che una corrente ohmica attraverso la membrana e il gap controlli il voltaggio extracellulare. C. Il voltaggio extracellulare assomiglia all’inversa della derivata prima del potenziale d’azione (C-type). Il segnale si presenta quando tutte le conduttanze di ioni pertinenti sono accumulate nella giunzione. 46 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Fig.3.5 Rappresentazione delle tre classi di segnali Possiamo quindi concludere che l’interfacciamento neuroni-chip è mediato dal potenziale extracellulare transdotto (TEP). Un grande TEP risulta da grandi correnti attraverso la membrana e il biossido di silicio, e da una bassa conduttanza della giunzione. La registrazione e la stimolazione dell’attività dei neuroni sono promosse da una piccola distanza tra membrana e silicio, da un’alta resistenza specifica e da un grande raggio della giunzione cellula-silicio. Una registrazione efficiente richiede un’alta conduttanza ionica (gJM) nella membrana attaccata allo strato conduttore, mentre un’efficiente stimolazione richiede un’alta capacità area specifica del chip [Fromherz03]. La distanza tra cellula e chip (~ 40-100nm) può essere misurata con un metodo detto FLIC (FLuorescence Interference Contrast), che utilizzando la microscopia, tiene conto dei diversi modi in cui una luce si comporta di fronte alla superficie riflettente del silicio. Lo spazio tra neurone e silicio ha una resistenza elettrica che corrisponde ad un sottile film di elettroliti. La resistenza del film (rJ) è dell’ordine di 10 Mohm, con una resistenza globale (gJ-1) intorno a 1 Mohm. Si può osservare che la larghezza dello spazio è più grande dello spessore del doppio strato, elettricamente diffuso nel 47 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche biossido di silicio e nella membrana. Potrebbe essere un obiettivo rendere maggiore la resistenza del film diminuendo la larghezza o aumentando la resistenza specifica dello spazio. La stimolazione del neurone attraverso l’interfaccia elettrica senza la presenza di correnti di Faraday richiede un’alta capacità per area unitaria del chip, per far in modo di iniettare corrente sufficiente nella giunzione. Sono stati costruiti punti di stimolazione molto efficienti utilizzando silicio fortemente drogato con un sottile strato di biossido di silicio [Bonifazi02]. 3.4 Voltage-clamp e Patch-clamp La tecnica del blocco di voltaggio o voltage-clamp è stata sviluppata alla fine degli anni quaranta da Cole ed è stata ampiamente sfruttata in quegli anni per studiare le caratteristiche elettrofisiologiche della membrana dell’assone gigante di calamaro, permettendo a Hodgkin e Huxley di caratterizzare le conduttanze all’origine del potenziale d’azione (o spike). Questo sistema consente di misurare l’intensità e la direzione delle correnti ioniche che fluiscono attraverso la membrana, in funzione del potenziale di membrana che viene imposto, e del tempo. Gli esperimenti vengono condotti in condizioni ioniche intracellulari ed extracellulari controllate. L’andamento delle correnti nel tempo è legato alla conduttanza di membrana (G) dalla relazione di Ohm: I = G • (Em - Eioni) In blocco di voltaggio si studia quindi come varia la conduttanza di membrana in seguito a variazioni di potenziale [Cole49], [Hodgkin39]. Il blocco di voltaggio viene ottenuto con un meccanismo a feedback negativo: il segnale del voltaggio misurato a cavallo della membrana è inviato a un circuito di controllo, un amplificatore operazionale, che provvede a confrontarlo con il segnale di comando, ovvero con il valore che si desidera imporre alla membrana (Figura 3.6). 48 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Fig.3.6 Schema circuitale del blocco del voltaggio Ogni differenza tra il potenziale di membrana effettivo e il potenziale che si desidera imporre viene pressoché istantaneamente corretta, fornendo alla membrana corrente di intensità e carica opportuna. Il sistema è così in grado di mantenere costante il potenziale della membrana, nonostante vari nel tempo la sua conduttanza totale (per l’apertura o la chiusura di canali ionici). Ciò che si registra sono l’intensità e la direzione della corrente che è necessario pompare per portare e mantenere la membrana ai potenziali desiderati, cioè la corrente che si deve fornire per caricare la componente capacitiva della membrana e per controbilanciare la corrente che fluisce attraverso i canali, quella che altrimenti determinerebbe la variazione di potenziale. Per realizzare una registrazione con la tecnica del blocco di voltaggio sono necessari due microelettrodi in contatto con il citoplasma della cellula e un elettrodo di riferimento immerso nel bagno di registrazione. Dei primi due citati, uno misura il potenziale di membrana, l’altro serve a pompare corrente all’interno della cellula. Prendiamo ora in considerazione un esperimento di registrazione, in voltageclamp, delle correnti che fluiscono attraverso la membrana. In seguito a depolarizzazioni crescenti queste correnti presentano un andamento prima verso il basso (per convenzione questo rappresenta un flusso di cariche positive entranti) e poi nel tempo la deflessione diventa positiva (flusso di cariche positive uscenti). Questo andamento delle correnti, anche se a potenziali bloccati, è già indicativo di quanto avviene nel potenziale d’azione. La corrente entrante è depolarizzante in condizioni fisiologiche e genererà la fase ascendente del potenziale d’azione. In un tempo successivo si attiva una corrente di cariche positive uscente, che ci può spiegare la ripolarizzazione della membrana durante lo spike. 49 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Il patch-clamp inventato da E. Neher e B. Sakmann misura il potenziale a cavallo della membrana cellulare utilizzando una micropipetta di vetro opportunamente forgiata, con un diametro della punta di circa 1µm. La micropipetta di vetro è riempita da una soluzione elettrolitica. Un filo di argento clorurato è immerso in questa soluzione e assicura il collegamento con lo strumento di registrazione. All’atto della registrazione, la micropipetta viene appoggiata sulla membrana cellulare, quindi viene applicata una leggera depressione al suo interno migliorando l’adesione della cellula. Il vetro dell’elettrodo e la membrana cellulare stabiliscono così un contatto ad elevatissima resistenza elettrica. Se nella membrana sottesa dalla punta della pipetta di vetro è presente anche un solo canale, è possibile registrare la corrente che lo attraversa. Questa configurazione si chiama cell-attached. Da questa configurazione una ulteriore depressione all’interno della pipetta provoca la perforazione della membrana sottesa alla punta dell’elettrodo, mettendo quindi in continuità la soluzione della micropipetta con l’interno della cellula. In queste condizioni è possibile registrare le correnti che fluiscono attraverso tutti i canali presenti nella membrana della cellula. La configurazione di questo tipo è detta di whole-cell. Esistono altri due tipi di configurazioni che consentono registrazioni di singolo canale. Dalla configurazione di whole-cell, se la pipetta viene leggermente allontanata dalla cellula, si stacca un piccolo frammento di membrana. In questo caso si registra l’attività dei canali rimasti nel pezzettino di membrana e la configurazione è detta di outside-out, perché la superficie esterna del pezzettino di membrana (outside) rimane rivolta verso la soluzione extracellulare (out). Un altro tipo di configurazione viene raggiunto partendo ancora una volta dalla configurazione di cell-atteched. Allontanando la pipetta dalla cellula si stacca una vescicola di membrana. La vescicola esposta all’aria si apre. Una volta riimmersa nel bagno la superficie interna del pezzetto di membrana (inside) rimarrà rivolta verso la soluzione extracellulare (out), questa configurazione è detta di inside-out. Tutte queste configurazioni causano dei danni alla cellula, indispensabili per rilevare il segnale. 50 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Lo schema circuitale per il patch-clamp è concettualmente simile a quello già spiegato per il blocco di voltaggio (Figura 3.6). 3.5 Micro-Electrode Array (MEA) Un Micro-Electrode Array (MEA) è un array di microelettrodi su cui è possibile coltivare diversi tipi di cellule o depositare dissezioni di tessuti per poter effettuare studi di elettrofisiologia in modo veloce e innovativo (Figura 3.7). Fig.3.7 Schema di registrazione elettrofisiologica effettuata con Micro-Electrode Array Esso è costituito da un disco di vetro o plastica, dove sono riportati dei piccoli elettrodi. Ogni singolo elettrodo è connesso tramite una sottile pista isolata ad una piazzola adibita al collegamento esterno del sistema. Questa può essere connessa al calcolatore tramite appositi connettori che isolano l’intero sistema dall’ambiente esterno. Esistono diversi tipi di MEA che, pur essendo utilizzati per il medesimo scopo, presentano caratteristiche strutturali e proprietà fisiche diverse. La distinzione deriva dal tipo di materiale impiegato nella costruzione, dalle proprietà strutturali, e dal numero di alloggiamenti per singolo MEA. Esistono MEA in grado di ospitare un solo campione, altri invece permettono di registrare contemporaneamente da più campioni. Se per esempio consideriamo i MEA utilizzati nel protocollo che vedremo nel capitolo successivo, prodotti dalla Panasonic (Figura 3.8), hanno un numero di 51 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche microelettrodi pari a sessantaquattro. Gli strati conduttori che portano il segnale all’ambiente esterno hanno uno spessore di 0,15µm e lo strato isolante in poliacrilammide che li separa è di 1,5µm. Fig.3.8 Micro-Electrode Array (MEA) I sessantaquattro microelettrodi sono arrangiati in una griglia 8x8 fissati al centro di una piastra di vetro o plastica 50x50mm con uno spessore di 1,1mm. Ogni elettrodo è 50x50µm e determina un bassissima impedenza (< di 22 KΩ) critica per avere un buon rapporto segnale rumore. Ne esistono quattro modelli, con distanza interpolare di 100, 150, 300, 450µm, per permettere misurazioni di piccole regioni con interazioni a larga scala. Il cilindro entro il quale viene depositato il campione ha un diametro interno di 20mm ed esterno di 25mm. Di seguito (Figura 3.9) è mostrato uno schema che illustra come sono disposti i microelettrodi e come vengono misurate le proprietà sopra citate. Fig.3.9 Schema rappresentante la disposizione dei microelettrodi 52 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche I MEA utilizzati nei primi esperimenti erano costruiti con materiale diversi e avevano altre proprietà strutturali. Il disco comprendeva quattro parti, ognuna delle quali a sua volta suddivisa in cinque piccole aree contenenti circa tredici elettrodi ciascuna. Approssimativamente il numero totale degli elettrodi presenti sull’intero disco ammonta a circa 300 connessioni. La distanza tra gli elettrodi, in tungsteno, variava in funzione del layout presente in ogni singola area, mediamente tale distanza si aggira tra i 70 e i 100µm. 3.6 Voltage-clamp vs Micro-Electrode Array La tecnologia dei MEA ha introdotto un nuovo modo per effettuare studi di elettrofisiologia, eseguiti solitamente con le tecniche del voltage-clamp e patchclamp. Le principali caratteristiche che rendono i MEA un valido strumento per l’elettrofisiologia sono la non invasività e la possibilità di registrare contemporaneamente su diversi canali l’attività di materiale biologico vivente. La prima caratteristica permette di poter registrare l’attività cellulare per lunghi periodi di tempo senza determinare danni al tessuto oggetto di studio. La seconda permette di poter registrare simultaneamente diversi canali e di poter analizzare i cambiamenti indotti dalle stimolazioni elettriche [Borkholder97]. L’attività elettrica delle cellule, pur essendo la stessa, viene registrata diversamente a causa delle proprietà strutturali e della tipologia di collegamento tra elettrodi e materiale biologico che caratterizzano i MEA. I segnali elettrici misurati nello spazio extracellulare sono dovuti al verificarsi dei seguenti eventi tra lo spazio che separa le cellule dai microelettrodi: • l’attività della cellula che corrisponde alla variazione della conduttanza di membrana (dovuta hai canali ionici) produce un flusso di corrente attraverso il fluido circostante; • il flusso di corrente attraverso lo spazio conduttore instaura un campo elettrico; 53 CAPITOLO 3 • Tecnologie di integrazione elettronico /biologiche il campo elettrico genera gradienti spaziali di potenziale. Come si può osservare dai grafici sotto mostrati (Figura 3.10), l’andamento del potenziale extracellulare registrato tramite MEA, che corrisponde all’incirca alle correnti transmembrana, è approssimativamente equivalente alla derivata prima del potenziale trasmembrana registrato in voltage-clamp. Vi è inoltre una stretta relazione tra la frequenza contenuta nel segnale e l’andamento del segnale registrato [Schatzthauer98]. Fig.3.10 Confronto tra segnali registrati tramite voltage-clamp e segnali registrati tramite Micro-Electrode Array Come si osserva dall’immagini sotto riportate (Figura 3.11) l’andamento del segnale registrato con i MEA per correnti in bassa frequenza è equivalente all’andamento della derivata prima del potenziale, mentre per correnti ad alta frequenza varia avvicinandosi all’andamento del potenziale. 54 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche Fig.3.11 Dipendenza tra la frequenza e andamento del segnale registrato con i MEA (a sinistra bassa frequenza a destra alta frequenza) In ascissa, nei due casi sopra mostrati, il tempo è indicato con due scale diverse; rappresentando con la stessa scala le due correnti avremmo ottenuto, nel secondo caso, un picco rappresentato da un'unica riga (ciò che accade quando registriamo da soluzioni elettrolitiche). Particolare interesse suscita lo studio dei tessuti neurali tramite questi strumenti di nuova generazione. Poiché sappiamo abbastanza sull’elettrofisiologia del singolo neurone, ma poco sulla dinamica di una rete di neuroni, avere a disposizione uno strumento come i MEA, che consente di correlare le attività tra i differenti canali e definire la dinamica della rete, è un passo tecnologico importante [Zeck01]. I segnali raccolti dalle reti di neuroni tramite MEA mostrano un’ampiezza tipica nel range di 0.1-0.4mV (100-400µV), e sono circondati da un rumore biologico e termico. L’estrazione del segnale reale, espresso come ampiezza in funzione del tempo è fatta grazie all’impiego di particolari filtri che eliminano il rumore di fondo e rendono il segnale nitido e analizzabile. Per estrarre le caratteristiche degli spike e burst è indispensabile processare i dati con un algoritmo ad hoc, in modo da rilevare i potenziali d’azione. 55 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche 3.7 Cellule staminali e Micro-Electrode Array Gli esperimenti che vedremo nel capitolo successivo utilizzano i MEA per registrare l’attività elettrica di una rete di neuroni. La differenza sostanziale tra quanto ritrovato in letteratura e quanto verrà presentato riguarda la tipologia di cellule utilizzate e di conseguenza la modalità con cui queste cellule si connettono tra loro. Oggetto di studio, in entrambi i casi, sono le cellule del sistema nervoso (gliali e neurali), ma, mentre nei lavori citati in precedenza il tessuto neurale veniva portato dal vivo ai MEA, per effettuare studi di elettrofisiologia (Figura 3.12); nel caso dell’esperimento che troverete nelle prossime pagine le cellule vengono coltivate direttamente in vitro a partire dalle cellule staminali. Fig. 3.12 Rappresentazione schematica di un tessuto adeso al Micro-Electrode Array Le cellule staminali utilizzate nel protocollo di preparazione delle cellule neurali provengono da tessuti di cervelli ottenuti da feti umani abortiti naturalmente dopo dieci settimane di gestazione. Le cellule staminali sono state prelevate dal telencefalo e dal diencefalo e differenziate con apposito protocollo in vitro [Gritti01]. Prima di vedere nel dettaglio l’esperimento, riportiamo alcune proprietà generali di queste cellule, in modo da comprendere meglio il perché sono state utilizzate. Il primo carattere distintivo delle cellule staminali è il loro stato altamente indifferenziato. Questo significa che non possiedono le caratteristiche morfologiche, 56 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche strutturali, molecolari o antigeniche che si ritrovano nelle cellule differenziate del tessuto cui appartengono. Le cellule staminali sono inoltre dotate di capacità proliferativa. La proliferazione è quel processo che ha come risultato finale la divisione della cellula. Il processo avviene attraverso l’espressione ordinata e ciclica di pattern di geni caratteristici, i cui prodotti possono variare in modo graduale o brusco. Se vengono generate due cellule con lo stesso fenotipo (entrambe uguali alla cellula di origine o entrambe progenitori), la divisione é detta “simmetrica”. Se invece si ottengono due cellule con fenotipo diverso (una staminale e una progenitrice) si parla di divisione “asimmetrica”. Caratteristica fondamentale delle cellule staminali è la multipotenzialità, in altre parole, la capacità di dare luogo a una progenie differenziata comprendente tutti i tipi cellulari del tessuto di appartenenza o, nel caso delle embrionali, a tutte le cellule dell’organismo adulto. La formazione di cellule differenziate a partire da cellule staminali avviene dando origine a cellule intermedie, che costituiscono il cosiddetto “compartimento dei progenitori di transito”, cellule più differenziate rispetto alle staminali ma che mantengono la capacità di proliferare per un numero limitato e predeterminato di cicli mitotici, generando alla fine un elevato numero di cellule differenziate. Così, da una singola divisione di una cellula staminale, grazie al compartimento di transito, vengono generate numerosissime cellule differenziate. Un'altra proprietà che caratterizza questo tipo di cellule è l’automantenimento. L'automantenimento è la capacità di una singola cellula, o di una popolazione cellulare, di perpetuare se stessa; in molti casi il periodo di automantenimento si estende su tutta la vita dell’organismo, ed in vitro può permanere in maniera illimitata nelle opportune condizioni sperimentali. La proprietà delle cellule staminali di mantenere la funzionalità dei tessuti nell’organismo adulto è la diretta conseguenza della loro capacità proliferativa e della multipotenzialità. Per mantenere l’omeostasi del tessuto, l’organismo utilizza una strategia che prevede l’esistenza di una popolazione di cellule posta a metà strada fra le cellule staminali e le cellule terminalmente differenziate dal punto di vista della capacità proliferativa e differenziativa e che abbiamo già definito in 57 CAPITOLO 3 Tecnologie di integrazione elettronico /biologiche precedenza come progenitori. La loro esistenza è dovuta al fatto che la via che porta da una cellula staminale ad una funzionalmente competente può essere vista come una transizione da un estremo, ovvero cellule staminali, in cui si ha capacità proliferativa, all’estremo opposto, ovvero cellule terminalmente differenziate non più in grado di dividersi. Poiché il passaggio avviene per stadi, fra questi due estremi si colloca una popolazione di cellule eterogenea che possiede entrambe le potenzialità, anche se in modo più limitato: queste ad esempio possono proliferare solo per un numero limitato di cicli, poi la loro capacità proliferativa si arresta e si differenziano in modo terminale [Galli03]. Negli ultimi anni il cervello umano e quello dei roditori hanno dimostrato di possedere cellule precursori indifferenziate, mitoticamente attive e multipotenti, in grado di rigenerare neuroni e cellule gliali. Mentre molti esperimenti hanno individuato la presenza di cellule staminali nel cervello adulto in vivo, testato la proliferazione e la capacità di rigenerarsi, molti altri hanno portato avanti metodologie che hanno fatto sì che queste stesse cellule staminali potessero espandersi e maturare in vitro [Vescovi99]. Grazie ad opportune condizioni chimico-fisiche è possibile generare in vitro un tessuto neurale che presenta, per quanto sappiamo da diversi studi, caratteristiche simili a quelle riscontrabili in vivo. Il vantaggio è quello di poter coltivare cellule direttamente sui MEA, ottenendo così una rete di neuroni che formi delle connessioni migliori con i microelettrodi, e che quindi sia il più possibile integrata al circuito artificiale. 58 CAPITOLO 4 Materiali e metodi CAPITOLO 4 Materiali e metodi 4.1 Preparazione dei MEA Prima di entrare in merito all’esperimento di apprendimento, è bene fornire alcune informazioni sulla preparazione dei MEA. Come accennato nel capitolo precedente, le cellule staminali si prestano molto bene ad essere utilizzate in questo tipo di esperimenti, per le proprietà di adattamento e proliferazione che le caratterizzano. Queste cellule, sotto apposite condizioni, sono in grado di differenziarsi e maturare sui MEA senza richiedere dissezioni multiple. Prima di essere utilizzati i MEA, assemblati mediante silicone, devono essere lavati accuratamente. Esiste un preciso protocollo di lavaggio che è indispensabile seguire al fine di renderli idonei ad ospitare le cellule. Questo protocollo che riportiamo di seguito consiste in: • lavare in alcool 70% la piastra servendosi di un bastoncino di cotone; • lasciare la piastra per 6 ore sotto l’acqua corrente, possibilmente distillata; • lasciare la piastra per 6 ore in alcool 70%; • lavare con 4 brevi risciacqui la piastra con detergente non saponato e acido; • sciacquare con alcool 70%; • lavare con acqua distillata; • lasciare in acqua distillata sotto raggi UV ventiquattrore; • aspirare l’acqua e lasciare asciugare sotto cappa sterile. Al termine del processo di lavaggio è possibile fare aderire il matrigel ai MEA. Il matrigel è composto essenzialmente da laminina, collagene IV, proteoglicani, entactina e nidogeno. Esso è una molecola di adesione ricavata dal sarcoma di verme, che si trova allo stato liquido a 4° C e gelifica a 37° C su plastica o vetro in soli venti minuti. Il matrigel deve gelificare sui MEA formando lo strato 59 CAPITOLO 4 Materiali e metodi necessario ad ospitare le cellule. Per impedire il distaccamento del matrigel e quindi delle cellule adese dopo soli 2 o 3 giorni, il processo di gelificazione è prolungato a ventiquattro ore. In questo modo il matrigel si stabilizza perfettamente permettendo la maturazione cellulare nei venticinque giorni successivi. Le staminali neurali, che si trovano sotto forma di neurosfere, sono dissociate meccanicamente e piastrate sul matrigel come singole cellule. Per ogni MEA si piastrano circa 50000 cellule staminali singole in presenza di fattori di crescita come FGF2 (basic fibroblast growth factor), GDNF (glial cell line-derived neurotrophic factor), BDNF (brain-derived nurotrophic factor), CTNF (ciliary neurotrophic factor). Questi fattori di crescita servono rispettivamente per: • FGF2 Æ fondamentale per la neurogenesi e viene rilasciato dalle neurosfere; • GDNF Æ previene l’apoptosi dei neuroni e migliora la crescita di assoni e dendriti; • BDNF Æ permette la sopravvivenza e il differenziamento dei neuroni in vitro ed è coinvolto nelle sinapsi; • CTNF Æ aumenta la proliferazione, aumentando l’attività metabolica e riducendo lo stress da differenziamento. Dopo l’esposizione delle cellule staminali ai fattori di crescita per circa dieci giorni e la loro rimozione, l’aggiunta di un medium di controllo arricchito con FCS 2% (fetal calf serum 2%) permette la generazione dei neuroni seguiti da astroglia e oligodendrociti. Un’interessante considerazione deriva dall’osservazione al microscopio del MEA al quindicesimo giorno, quando sono ben visibili delle zone senza più matrigel dove le cellule poggiano direttamente sugli elettrodi che formano il circuito del MEA (Figura 4.1). 60 CAPITOLO 4 Materiali e metodi Fig.4.1 Immagine al microscopio dei neuroni connessi agli elettrodi del MEA Osservando il MEA si può vedere come ogni elettrodo è connesso attraverso un sottile percorso isolato ad un collegamento esterno. Di tutti i collegamenti situati nel supporto, alcuni fungono da input, altri da output, ed altri ancora mettono a massa il sistema. Il MEA viene collegato all’apposita morsettiera di collegamento (Figura 4.2) per facilitarne la connessione al sistema di acquisizione. Fig 4.2 Micro-Electrode Array connesso alla morsettiera di registrazione I MEA vengono posti dentro ad un box termoregolato. La temperatura viene mantenuta costante grazie una sonda termometrica, posta all’interno del suddetto 61 CAPITOLO 4 Materiali e metodi box, connessa ad un circuito elettronico di controllo che provvede ad alimentare alcune resistenze. Queste sono situate all’interno dell’alloggiamento delle vaschette delle cellule, al fine di mantenere la temperatura costante a 37° C. Le resistenze sono realizzate in carbone e alimentate in corrente continua. Per ottenere una buona schermatura da disturbi di natura elettromagnetica, l’intero contenitore, realizzato in plexiglass, è rivestito con una rete d’ottone con maglia da 1mm. Il box termoregolato non risolve il problema dell’ossigeno e dell’anidride carbonica che dovrebbero essere mantenuti ai livelli ottimali (ossigeno 20%, anidride carbonica 5%), per permettere alle cellule una migliore sopravvivenza. Per ovviare a questo problema, poiché non è possibile effettuare le registrazioni mantenendo le cellule in un incubatore insieme al box termoregolato, viene utilizzato un buffer Tyrode che permette di mantenere il PH e i livelli di glucosio necessari alle cellule. Questo particolare buffer è costituito da 250ml di soluzione madre contenente NaCl e KCl, 0,5ml di CaCl2 1M, 0,5ml di MgCl2 1M e 1,5gr di glucosio, per un PH finale di 7.4. Il buffer viene aggiunto al medium di coltura poco prima delle registrazioni. L’aggiunta del Tyrode mantiene le cellule stabili, ovvero senza scatenare la formazioni di vescicole apoptotiche per un tempo sufficiente a terminare le registrazioni (circa due ore). A causa delle limitazioni imposte dagli strumenti a disposizione, non è possibile collocare le cellule esattamente nei punti desiderati. Le architetture elettriche realizzate hanno costituito una sorta di letto sul quale sono state depositate le cellule che hanno creato collegamenti tra loro al di là di quelli elettrici. 4.2 Sistema di acquisizione Dagli elettrodi posti a contatto con le cellule viene prelevato, tramite un cavo schermato, il segnale elettrico da misurare. Il segnale entra in un amplificatore ad alta impedenza d’ingresso per una prima amplificazione e successivamente passa attraverso due filtri Notch, accordati sulla frequenza di 50Hz, al fine di eliminare eventuali disturbi generati dalla rete elettrica. Dopo i filtri il segnale subisce un’ulteriore amplificazione e tramite 62 CAPITOLO 4 Materiali e metodi accoppiamenti isolati viene trasferito alla scheda d’acquisizione istallata a bordo del computer di gestione e di registrazione. Il segnale della stimolazione, proveniente da un generatore interno, transita attraverso dei relé allo stato solido per essere inviato alle cellule. I relé sono comandati esternamente tramite l’uscita digitale della scheda di acquisizione in sintonia con il relativo software di gestione. Tutto il circuito elettronico (Figura 4.3) è completamente isolato e racchiuso in uno spesso contenitore metallico il cui corpo viene connesso ad un conduttore di terra. Al fine di evitare che eventuali segnali spuri possano influenzare il sistema di amplificazione, si è provveduto ad isolare completamente tutto il circuito elettronico della sezione di preamplificazione. I segnali analogici entranti (acquisizione) e uscenti (dopo amplificazione) sono completamente isolati dal mondo esterno tramite circuiti elettronici realizzati dalla Texas Instruments; questi circuiti impediscono di fatto qualsiasi accoppiamento tra i circuiti esterni e quelli interni. Anche i segnali digitali di controllo sono completamente disaccoppiati dal circuito interno tramite fotoaccoppiatori. In questa maniera gli elettrodi connessi alle cellule non vengono a contatto in nessun modo con il mondo esterno di misura/controllo. Quattro batterie ricaricabili a ioni di litio provvedono ad alimentare tutti i circuiti elettronici: in questo modo viene garantita una tensione pulita. Tutto il sistema, alloggiamento vaschette e circuito di preamplificazione, è connesso a terra. La scheda di acquisizione, modello NI6052E DAQ, utilizzata negli esperimenti è costruita dalla Soc. National Instruments ed ha le seguenti caratteristiche: • velocità 333 kS/s a 16bit; • frequenza di acquisizione 10 kHz; • 16 input analogici; • 2 output analogici; • 8 linee I/O digitali. 63 CAPITOLO 4 Materiali e metodi Fig.4.3 Schema del circuito preamplificatore 64 CAPITOLO 4 Materiali e metodi 4.3 Protocollo di stimolazione e di registrazione dei segnali L’esperimento riportato nelle pagine seguenti è stato applicato a tre tipi di culture: • Neuroni ottenuti dalla coltivazione di cellule staminali neurali umane; • Cellule staminali neurali indifferenziate; • Neuroni ottenuti dalla coltivazione di cellule staminali neurali umane sottoposte a trattamento con tetratossina (TTX). La TTX è un’alcaloide che appartiene al gruppo delle neurotossine. Il trattamento con TTX determina il blocco del trasporto degli ioni sodio attraverso la membrana plasmatica, ciò si traduce in una profonda modificazione dell’eccitabilità e nel blocco della conduzione dell’ impulso nervoso. Il protocollo dell’esperimento che sotto riportiamo si basa sul presupposto che una rete di neuroni umani può essere trattata come una rete neurale artificiale. L’esperimento necessita quindi di una fase di training e di una fase di testing. Nella fase di training le cellule sono state sottoposte per diverse volte a stimoli sensoriali simulati da pattern digitali. Alle cellule sono stati forniti quattro pattern, che per comodità sono stati indicati con le quattro direzioni canoniche (avanti, indietro, destra, sinistra). Questa in realtà è una convenzione, determinata dal fatto che il fine ultimo di questa applicazione è far muovere un robot. Non vi è infatti alcun tipo di correlazione tra gli stimoli forniti e la reale informazione che si riflette a livello biologico. Ciò che interessa è guidare i neuroni alla memorizzazione ed all’apprendimento di pattern sensoriali verificando che vi sia una risposta coerente da parte della rete di neuroni riprodotta in vitro. Nella vaschetta contenente le cellule sono stati attivati otto canali utili per riprodurre la stimolazione sensoriale. Questi canali sono stati selezionati dai sessantaquattro elettrodi a disposizione imitando il processo pochi-a-molti molti-apochi che caratterizza il sistema nervoso. 65 CAPITOLO 4 Materiali e metodi Ogni pattern è costituito da una matrice di otto bit per otto bit. Ogni bit ha la durata di 300ms a 300mV ognuno. Le cellule sono state quindi stimolate per 2.4 secondi. La stimolazione è stata seguita da un secondo di pausa ed è stata ripetuta per dieci volte. Ognuno dei quattro pattern è stato somministrato dieci volte per permettere alla rete di neuroni collocata sui MEA di rafforzare alcune iterazioni e non altre, in modo tale da apprendere la configurazione dei pattern e ricordarla successivamente. Al termine della decima stimolazione è stata attivata la registrazione della risposta delle cellule nervose. Tale risposta è servita a fare apprendere alla rete neurale artificiale le quattro direzioni. I pattern forniti sono schematizzati di seguito (Figura 4.4). Le ordinate rappresentano gli otto canali attivati contemporaneamente, mentre in ascissa è riportato il tempo. Ogni casella mi rappresenta un bit, se la casella è annerita significa che è stato fornito lo stimolo, altrimenti lo stimolo è nullo. Fig.4.4 Pattern inviati alla rete di neuroni 66 CAPITOLO 4 Materiali e metodi Terminata la fase di training si è passati a testare l’apprendimento della rete di neuroni (fase di testing). Nella fase di testing si è inviata alla rete di neuroni una stimolazione corrispondente ad uno dei quattro pattern. Tale stimolazione, della durata di 2.4 secondi è stata seguita da una registrazione della risposta delle cellule nervose. I pattern sono stati forniti in maniera casuale. Lo stimolo generato è stato acquisito dalla rete neurale, la quale ha classificato tale risposta, sulla base di quanto ricevuto nella fase di training, individuando una specifica direzione. Il segnale di stimolazione è un segnale alternato a bassa tensione che può essere preimpostato nel circuito di preamplificazione come un segnale in onda quadra. La scelta di un segnale alternato è per evitare fenomeni di elettrolisi all’interno delle colture delle cellule. Nella figura sottostante (Figura 4.5) è mostrato un esempio di segnali inviati ai MEA durante l’esperimento: come si può vedere vengono inviati contemporaneamente otto stimoli in zone differenti dei MEA. Fig 4.5 Esempio di segnali di stimolazione inviati alle cellule 67 CAPITOLO 4 Materiali e metodi 4.4 Funzionamento della rete neurale Il fine ultimo dell’esperimento, come detto, è quello di far apprendere a un circuito di neuroni creato in vitro, dei pattern di segnali. Poiché a priori non conosciamo nulla dei segnali in uscita dai MEA, per capire se vi sia stato o meno l’apprendimento dei pattern potremmo ricorrere a strumenti informatici classici, andando ad estrarre particolari proprietà dal segnale e utilizzando degli algoritmi per decifrare l’informazione. Questo però non garantirebbe la riuscita dell’esperimento, perché la decodifica del contenuto informativo di una rete di neuroni non è possibile con i metodi classici, che si applicano con evidenti limitazioni, allo studio dell’andamento di singoli segnali. Nel sistema presentato, invece di effettuare questo tipo di processazione ai dati, si ricorre all’utilizzo di sistemi complessi, come le reti neurali. Le reti neurali, grazie a proprietà come la flessibilità, la gradualità del cambiamento, l’adattamento progressivo e la capacità di operare per analogia, riescono a classificare i segnali uscenti dati, dai segnali in input. Tutto questo senza limitare l’informazione a particolari proprietà del segnale, sapendo che il segnale stesso è informazione. L’utilizzo delle reti neurali risolve questo problema andando a considerare l’insieme dei segnali in parallelo. La rete neurale utilizzata è una ITSOM, le cui caratteristiche generali sono state ampiamente trattate nel capitolo 2. L’obiettivo della rete, generata in linguaggio C, è la classificazione dei segnali provenienti dai neuroni in una delle quattro direzioni: avanti, indietro, destra e sinistra. Sappiamo che una rete neurale artificiale necessita di due fasi: una fase di addestramento (o training) e una fase di validazione (o testing). Nel caso di una rete neurale ITSOM, la prima fase serve per generare gli zscore di riferimento utilizzati, poi per la classificazione, mentre la seconda fase è la vera e propria classificazione dei segnali direzionali grazie agli z-score acquisiti nella fase precedente. 68 CAPITOLO 4 Materiali e metodi Prima però di poter utilizzare la rete neurale, è indispensabile definire alcuni parametri di fondamentale importanza che incidono profondamente sul suo comportamento, che sono: • il numero di neuroni dello strato di input; • il numero di neuroni dello strato competitivo (o di Kohonem); • il numero di epoche per campionamento; • il tasso di apprendimento (ε) e il tasso di dimenticanza (α); • il valore soglia utilizzato nel calcolo degli z-score (τ); • la dimensione totale del file contenente i campioni da analizzare intesa come numero di campioni presenti. Dei valori assunti da questi parametri avremo modo di parlare nello specifico nel capitolo 6, dove verrà presentato il lavoro sperimentale di taratura della rete. Per poter classificare, la rete deve innanzitutto memorizzare i quattro stati indicanti lo spostamento, acquisendo i segnali di risposta delle cellule nella fase di training. La ITSOM acquisisce tali informazioni attraverso una matrice di valori decimali in virgola mobile (double per il linguaggio C). Questa matrice ha le dimensioni di 10000 x 8, dove diecimila è il numero di campionamenti e otto sono i canali da cui vengono prelevati i segnali. Una volta iniziata la fase di training la rete scarta tutti i file di addestramento precedenti al decimo. Arrivato il decimo file di training indicante lo spostamento, la rete inizia a generare gli z-score che serviranno per il confronto nella fase successiva all’esperimento: il testing. La rete acquisisce quindi 80.000 dati racchiusi in una matrice bidimensionale composta da otto colonne e diecimila righe. Essa non viene analizzata in un'unica volta, ma si divide il numero totale di dati (rappresentati da valori di potenziale) per il numero di z-score di riferimento da generare per ogni direzione in ogni campionamento. Tale nuovo valore viene diviso per il numero di neuroni di input ottenendo il numero di campionamenti necessari per processare tutti i dati (Vedi diagramma mostrato in figura 4.6). Tramite test empirici si è scelto di generare otto 69 CAPITOLO 4 Materiali e metodi z-score di riferimento per ogni direzione. In pratica, ogni neurone ha in ogni campionamento otto valori di 0 e 1, che indicano il suo stato vincente o perdente risultante dall’elaborazione di quella parte di dati in input. 80.000 dati Suddivisi in una matrice da 8x10.000 : 1. Numero di z-score per ogni direzione Stabilito da test empirici assume valore 8 per ogni direzione. 80.000:8 =10.000 : 2. Numero di neuroni in input Il numero di neuroni in input è 500. 10.000:500=20 = Numero di campionamenti necessari per processare tutti i dati Il numero di campionamenti per ogni direzione è 20. Da cui deriva la matrice mostrata in Figura 4.7 Fig.4.6 Diagramma che illustra il calcolo della matrice tridimensionale degli z-score di riferimento 70 CAPITOLO 4 Materiali e metodi Prendendo i valori di tutti i venti neuroni per campionamento si ha uno zscore di riferimento. Esiste una matrice tridimensionale per ogni direzione e in essa si memorizzano tutti gli z-score di riferimento (Figura 4.7). Fig.4.7 Matrice tridimensionale in cui si memorizzano gli z-score di riferimento (esiste una matrice per ogni direzione) Per ogni campionamento si determina il neurone vincente in base alla distanza minima, quindi si provvede a punire o premiare tale neurone mediante la modifica dei pesi. La premiazione del vincente si compie spostando il valore del peso verso il valore della media degli input di una percentuale di tale distanza, determinata dal tasso di apprendimento (ε). Si tiene conto delle vittorie di ogni neurone e si definisce un numero oltre al quale è meglio scoraggiarne ulteriori. In questo caso e in caso di neuroni perdenti, si attua una punizione mediante un lieve allontanamento del peso dal valore medio degli input, questa volta grazie ad una percentuale indicata dal tasso di dimenticanza (α). Più precisamente in questa fase si applicano le seguenti regole: • Se il neurone viene selezionato per la prima volta come vincente viene premiato: 71 CAPITOLO 4 • Materiali e metodi Se il neurone raggiunge una determinata soglia di vittorie e viene riselezionato come vincente, viene punito e il contatore che tiene traccia delle volte che ha vinto viene azzerato: • Se il neurone non è fra quelli vincenti allora viene punito: Nelle formule Winew rappresenta il nuovo valore di peso che viene assegnato al neurone, mentre Wiold il valore del peso prima del nuovo assegnamento. Il tasso di apprendimento (ε) indica quanto vengono premiati i neuroni vincenti, il tasso di dimenticanza (α) indica invece quanto vengono puniti i neuroni. Tasso di apprendimento e di dimenticanza (ε,α) sono delle costanti comprese tra 0 e 1. Questa fase viene ripetuta per un dato numero di epoche al fine di generare la serie temporale di vittorie e approssimazioni necessarie alla creazione degli z-score significativi. Questi ultimi vengono poi calcolati mediante l’algoritmo descritto nel capitolo due e si arriva a rappresentare con sequenze di 1 e 0 le configurazioni dei neuroni vincenti per ogni campionamento. La differenza tra le fasi di training e di testing è data dal fatto che nella prima fase non si procede a classificare gli z-score generati, ma li si memorizza in un’apposita matrice. Si hanno così i riferimenti rappresentanti le configurazioni dei neuroni vincenti in relazione ai diversi pattern di training ricevuti in input. Tutto questo non avviene nella fase di testing, dove si procede invece alla classificazione. Una volta generati gli z-score si procede al confronto con quelli memorizzati nella matrice e non appena si riscontra una corrispondenza nella configurazione degli z-score si classifica quel segnale di test come indicante quella direzione. Si memorizza la classificazione e la si invia all’applicazione grafica. 72 CAPITOLO 4 Materiali e metodi 4.5 Interfaccia grafica e applicazione robotica L’intero sistema è interfacciato graficamente per renderlo più gestibile da parte dell’utente. La rete è una parte dell’intera applicazione creata tramite LabView. LabView è un ambiente grafico con funzionalità incorporate per l’acquisizione, l’analisi delle misure e la presentazione dei dati, che garantisce la flessibilità di un potente linguaggio senza la complessità dei tradizionali tool di sviluppo. Esso offre avanzate capacità di acquisizione, analisi e presentazione in un unico ambiente. Sul video sono presenti quattro tasti (Figura 4.8) che indicano le quattro direzioni. Premendo uno di questi tasti, si invia alla rete di neuroni posta sui MEA, una stimolazione corrispondente a uno dei quattro pattern citati in precedenza. Fig.4.8 Interfaccia LabView per l’invio dei segnali I segnali direzionali vengono generati da un’applicazione server. Essa li invia alla scheda che li converte in segnali elettrici atti a stimolare i neuroni, quindi, mediante la medesima scheda, riceve i segnali di ritorno dalle cellule e li memorizza in file binari. La scheda di acquisizione istallata nel pc trasmette i segnali ad un controller (Figura 4.9) e alle cellule mediante otto canali di trasmissione. 73 CAPITOLO 4 Materiali e metodi Fig 4.9 Dettagli del controller Una volta che il file binario è pronto, viene inviata una notifica che attiva l’applicazione in cui è inclusa la DLL (Dinamic Link library) e nella quale si provvede a visualizzare la direzione derivante dalla classificazione effettuata dalla rete. Entrambe le operazioni di training e di testing sono sufficientemente veloci e quindi non si corre il rischio di rimanere indietro rispetto all’invio di segnali, fase critica nell’applicazione di algoritmi di intelligenza artificiale al tempo reale. Una volta terminata l’elaborazione dei dati, questa restituisce, sotto forma di numero intero, la direzione in cui dovrà muoversi il robot virtuale o reale. Nel caso della fase di training viene restituito un valore 0 detto di default, mentre nel caso in cui un valore non venga classificato, non rientrando in nessuno degli z-score di riferimento precedentemente generati, viene restituito il valore 5, anch’esso trattato come caso di default. Si è deciso di differenziare i due valori nonostante in LabView si abbia lo stesso comportamento dal punto di vista della generazione dell’immagine e il robot in entrambi i casi non si muoverà: ma le due situazioni hanno concettualmente significati molto diversi. In base al numero ricevuto LabView posiziona l’immagine sullo schermo nel seguente modo e il robot si muove nelle seguenti direzioni: 1 Æ verso il basso (direzione del robot Æ indietro); 2 Æ verso l’alto (direzione del robot Æ avanti); 3 Æ verso destra (direzione del robot Æ destra); 74 CAPITOLO 4 Materiali e metodi 4 Æ verso sinistra (direzione del robot Æ sinistra). Avviando l’applicazione si visualizza uno spazio bianco nel quale si muoverà l’immagine rappresentante il robot (Figura 4.10) oppure se è attivo il sistema di connessione al telecomando ad infrarossi si avrà il movimento del robot stesso (Figura 4.12). Fig.4.10 Interfaccia LabView per la visualizzazione dei movimenti del robot e dei segnali in tempo reale Il tempo di acquisizione dei segnali uscenti dalla coltura dei neuroni deve essere inferiore a cinque secondi. Tale tempo comunque può essere variato anche durante la fase sperimentale, per trovare il migliore valore per una corretta elaborazione dei segnali ricevuti. L’applicazione effettuata con attuatore robot (Figura 4.12) richiede l’invio dei segnali non solo all’applicazione server ma anche al robot. I segnali in uscita che comandano il robot devono essere come nell’esempio riportato nella figura sottostante (Figura 4.11). 75 CAPITOLO 4 Materiali e metodi Fig.4.11 Esempio di come devono essere i segnali in uscita che comandano il robot Un’apposita scheda gestisce l’invio dei segnali infrarossi che consentono al robot di muoversi. Per quanto riguarda il robot reale, la durata minima del comando è di un secondo, la massima non ha limiti ma dipende dallo spazio disponibile per i movimenti. La distanza tra un comando e l’altro deve essere uguale o maggiore di 5 ms. La velocità media di spostamento in avanti/dietro del robot è di circa 80 cm/s mentre per lo spostamento a destra e a sinistra sono necessari comandi con tempo maggiore per far ruotare il robot su se stesso. Anche i tempi di attivazione di ogni singolo comando dovrebbero essere variabili in modo da trovare sperimentalmente la migliore performance. I segnali di pilotaggio del trasmettitore a infrarossi che comanda il robot provengono dalla porta parallela del computer. Fig.4.12 Robot comandato a infrarossi 76 CAPITOLO 4 Materiali e metodi 4.6 Schema generale dell’apparecchiatura Dopo aver visto tutte le componenti hardware e software prodotte per eseguire il protocollo dell’esperimento, vediamo di capire, osservando lo schema riportato di seguito (Figura 4.13), come tutte queste parti siano interconnesse tra loro. Fig 4.13 Schema che mostra la connessione tra tutte le apparecchiature sopra illustrate Le parti software, indicate per convenzione nel computer, sono costituite dal programma per la generazione dei pattern e dalla rete neurale. Questa accoglie gli stimoli in uscita dai MEA (indicati con il riquadro blu) grazie alla scheda d’acquisizione e rielabora gli input inviando un segnale direzionale al robot. Come si osserva dallo schema, le diverse componenti sono tutte isolate tra loro e dall’ambiente esterno, questo per evitare fenomeni di disturbo del segnale. Possiamo riassumere la fase di training con lo schema riportato in figura 4.14: 77 CAPITOLO 4 Materiali e metodi FASE DI TRAINING Generazione ed invio dei segnali, tramite controller, ai neuroni I neuroni ricevono le stimolazioni e producono un output che viene accolto dalla scheda di acquisizione L’applicazione server registra le risposte dei neuroni in appositi file Viene segnalata la presenza di un file alla ITSOM La rete genera gli z-score di riferimento x4 Fig.4.14 Schema riassuntivo della fase di training Nella fase di testing la rete neurale artificiale non ha più movimenti da memorizzare, ma solo segnali che devono essere classificati, quindi devono essere confrontati con le quattro configurazioni binarie memorizzate in training. Prima del confronto, i valori devono essere trasformati in z-score con una procedura analoga a quanto descritto sopra. L’intera procedura relativa allo schema sopra mostrato può essere riassunto per la fase di testing come riportato di seguito (Figura 4.15). L’esecuzione della fase di testing, come si vede, comporta il movimento del robot virtuale o, se connesso, di quello reale. 78 CAPITOLO 4 Materiali e metodi FASE DI TESTING Nell’applicazione server sono presenti i tasti delle quattro direzioni, premendone uno si genera il segnale che viene inviato ai neuroni I neuroni ricevono lo stimolo e producono una risposta che viene accolta dalla scheda di acquisizione Viene segnalata la presenza di un file pronto all’applicazione dedicata, la quale ne estrae i contenuti e lo passa alla rete neurale La rete neurale artificiale elabora i dati ricevuti e cerca di classificare il segnale Il segnale classificato viene inviato all’applicazione grafica che visualizza il movimento / al robot che genera il movimento Fig.4.15 Schema riassuntivo della fase di testing Al fine di migliorare le prestazioni della rete neurale e al tempo stesso d’indagare sulle proprietà dei segnali neurali in uscita dai MEA, nei capitoli seguenti verrà presentato un software per l’analisi del segnale. Questo software, generato ad hoc per l’apparecchiatura presentata e adattato nello specifico per l’esperimento di robotica, consente di indagare su proprietà di statistica avanzata del segnale. La potenzialità dell’intero sistema presentato in questo capitolo permette di memorizzare in appositi file i segnali in uscita, e quindi di ripetere virtualmente l’esperimento. Questo consente di agire off-line sui parametri della rete neurale con il fine di migliorarne le prestazioni, come si vedrà nel capitolo 6. 79 CAPITOLO 5 Analisi dei segnali rilevati CAPITOLO 5 Analisi dei segnali rilevati 5.1 Segnali e sistemi I concetti di segnale e sistema sono presenti in un’ampia gamma di discipline e campi applicativi, e le idee tecniche associate a questi concetti giocano un ruolo importante in diverse aree scientifiche e tecnologiche. Le tensioni e le correnti (funzioni del tempo) in ingresso o in uscita da una rete di neuroni sono esempi di segnali , mentre la rete di neuroni è un esempio di sistema. Sebbene la natura fisica dei segnali e dei sistemi possa essere differente, essi sono dipendenti l’uno dall’altro. I segnali, che sono funzioni di una o più variabili indipendenti, contengono informazioni riguardo lo stato di un sistema o di qualche fenomeno, mentre i sistemi rispondono a sollecitazioni prodotte dai segnali producendo a loro volta segnali o qualche comportamento desiderato. La principale problematica che si affronta nello studio di un sistema è l’analisi, ossia lo studio delle caratteristiche del comportamento di un dato sistema. Il comportamento di un sistema viene descritto attraverso la relazione ingresso-uscita mostrata in figura 5.1 [Ziemer83]. Fig.5.1 Schema della relazione ingresso-uscita Come accennato nel protocollo di sperimentazione, le cellule sono state sottoposte per diverse volte a stimoli sensoriali simulati da pattern digitali (rappresentati dalla figura 4.4), e hanno generato un segnale. Questo segnale descrive il comportamento del sistema biologico poiché può essere visto come un mezzo per veicolare informazione sul suo stato o sul suo comportamento. L’informazione 80 CAPITOLO 5 Analisi dei segnali rilevati veicolata da questo segnale può essere a sua volta utilizzata per comunicare, prevedere, controllare, prendere decisioni. Nel modello di memoria a disposizione sulla piastra dei MEA, l’elaborazione dei segnali avviene in modo parallelo. In tale architettura, l’attività di un neurone dipende sia da proprietà intrinseche, che dai segnali che gli inviano le altre cellule nervose, pertanto una modifica nella dinamica delle sue connessioni può causare un cambiamento nell’attività di tutto il sistema [Potter01]. Analizzando il segnale in uscita, pur non comprendendo fisicamente come la dinamica delle rete possa modificarsi, è possibile verificare se vi sia una variazione dell’intero sistema coerente con lo stimolo fornito. Possiamo inoltre verificare per quanto tempo questa variazione si propaghi nel tempo. Queste analisi sono importanti perché ci danno informazioni di carattere biologico e ci permettono di modellare sistemi informatici. 5.2 Il campionamento dei dati Dal momento della conversione A/D del segnale analogico di partenza proveniente dalla rete di neuroni, questo si trasforma in una serie di valori digitali discreti: non abbiamo quindi più a disposizione il segnale originale, ma solo la serie di punti campionati, che dovrebbero esserne una rappresentazione corretta. Questa rappresentazione non sarà corretta nel caso in cui la cadenza del campionamento effettuato sia inferiore alla frequenza del segnale campionato. Il segnale acquisito riprodurrà anzi in questo caso una forma d’onda inesistente o fantasma chiamata alias. Questo fenomeno è definito aliasing, e l’errore connesso “errore di aliasing”. Nell’analisi in frequenza, l’antitrasformata della trasformata di Fourier non coincide più con il segnale acquisito, e questo fenomeno è definito “ripiegamento nel dominio della frequenza”. Per questo motivo grosso interesse riveste la frequenza di campionamento del segnale analogico emesso dalla rete di neuroni [Shanmugan79]. Il teorema di Nyquist afferma che, per non incorrere in questo tipo di errore, occorre campionare il segnale da acquistare ad una cadenza almeno due volte 81 CAPITOLO 5 Analisi dei segnali rilevati superiore alla componente di massima frequenza contenuta nel segnale analogico. Quindi nel caso per esempio di un segnale in ingresso di frequenza 1000Hz, la velocità di campionamento dovrà essere superiore a 2000 campioni al secondo. Nella pratica corrente si usa campionare a valori almeno tre o cinque volte superiori la frequenza massima attesa del segnale analogico, cercando così di porsi in condizioni di relativa sicurezza rispetto all’errore di aliasing. Nei casi in cui si desideri ottenere, oltre ad una corretta informazione del contenuto in frequenza del segnale analogico di partenza, anche una sua riproduzione temporale abbastanza fedele, occorre campionare ad almeno dieci volte la frequenza massima del segnale. Con l’apparecchiatura a disposizione riusciamo a campionare a 10 KHz, frequenza considerevole che ci permette di riprodurre il segnale piuttosto fedelmente. In molte applicazioni, inoltre, è preferibile registrare sequenze di dati di lunghezza finita, per migliorare alcune caratteristiche dell’analisi spettrale (analisi nel dominio delle frequenze). Il processo di terminazione di una sequenza, dopo un numero finito di periodi, può essere pensato come la moltiplicazione di un segnale di lunghezza infinita per una funzione finestra di lunghezza finita. In altre parole, la funzione finestra determina quanto della sequenza impulsiva originale debba essere osservata attraverso questa finestra. Un altro parametro molto importante è la risoluzione, che definisce la più piccola variazione nel segnale di ingresso misurabile dal sistema di acquisizione dati. Nel nostro caso la scheda di acquisizione è dotata di un convertitore A/D a 16 bit e la risoluzione vale 1/216 , che corrisponde a 1/65536, ovvero lo 0.0015% del fondoscala selezionato. Quindi, per un fondoscala da 0 a 100mV, la risoluzione è 1,5µV. Variazioni inferiori a questo valore non sono rilevate dal convertitore A/D [Gibson93]. In questa trattazione è indispensabile considerare un'altra componente che ritroviamo in fase di registrazione: il rumore. Il rumore è il peggior nemico delle misure di segnali analogici. Si può presentare in varie forme ed è caratterizzato da un andamento random. Le fonti di rumore sono varie e numerose e il livello di rumore acquisito è generalmente maggiore per le schede con alta velocità di campionamento 82 CAPITOLO 5 Analisi dei segnali rilevati (la scheda utilizzata ha una velocità di velocità 333kS/s), che acquisiscono rumore ad alta frequenza. Quando il livello picco-picco del rumore è superiore alla risoluzione della scheda, allora non sarà possibile usufruire di tutta la risoluzione del convertitore A/D. Per migliorare questa situazione difficile, l’apparecchiatura è stata dotata di un sistema esterno di condizionamento del segnale per filtrare a monte il rumore. Anche la stessa scheda A/D è sorgente di rumore, e le schede più veloci ne emettono usualmente di più. Purtroppo non è possibile eliminare questa fonte di rumore [Schwartz90]. 5.3 Architettura del sistema di analisi La caratterizzazione dell’attività elettrofisiologica di popolazioni di neuroni coltivate in vitro richiede l’utilizzo di algoritmi, non contemplati dai classici strumenti software reperibili sul mercato. Questi algoritmi permetto di estrapolare dal segnale registrato parametri statistici inerenti ai neuroni collocati sui MEA. Di seguito verrà presentato il software sviluppato e utilizzato durante il periodo di tirocinio presso il gruppo di ricerca Living Networks Lab. Negli esperimenti effettuati con il sistema hardware descritto nel capitolo precedente, vengono registrati un numero considerevole di segnali, e questi devono essere gestiti al meglio e soprattutto analizzati per estrarre delle osservazioni. Analizzare i dati in uscita dai MEA con i comuni software commerciali richiede un tempo considerevole e, talvolta, i risultati che si ottengono non sono quelli desiderati. Per poter effettuare queste analisi statistiche ed evitare la conversione in diversi formati dei dati in uscita dalla rete rischiando di perdere delle informazioni importanti, è stato quindi sviluppato un software specifico per l’apparecchiatura hardware presentata. Esso ha una base comune anche per altre applicazioni del gruppo di ricerca ed è stato adattato ad hoc per il protocollo di robotica. L’intero sistema, chiamato DSP system (Digital Signal Processing System), è stato implementato in ambiente Windows XP, mediante linguaggio di 83 CAPITOLO 5 Analisi dei segnali rilevati programmazione interpretato dall’ambiente Matlab, e permette di gestire le matrici dati memorizzate in uscita dai MEA, rendendo l’analisi più sbrigativa e allo stesso tempo completa. A queste matrici viene associato un nome corrispondente alla fase dell’esperimento, e successivamente vengono salvate in un apposita cartella. In questo modo i dati sono sempre reperibili e soprattutto è possibile ripetere gli esperimenti virtualmente anche in un secondo momento. Questi file dati in formato csv sono molto grandi a causa del considerevole numero di dati che viene fornito dalla scheda di acquisizione che permette di registrare 10000 campionamenti al secondo su tutti gli otto canali a disposizione, per un totale di 80000 valori decimali in virgola mobile al secondo. Le matrici che otteniamo riportano nella prima colonna il tempo espresso in secondi mentre nelle altre colonne le uscite dei diversi canali espresse in millivolt. Riportiamo di seguito un diagramma a blocchi (Figura 5.2) che mostra schematicamente l’organizzazione del sistema sviluppato; esso è interfacciato graficamente, poiché reso più gradevole e funzionale all’utente. DSP system Selezione del file di riferimento Visualizzazione finestre temporali del segnale Analisi sul singolo canale Analisi comparative tra i canali Analisi comparative tra i file Fig.5.2 Diagramma a blocchi dell’architettura del sistema Il software per poter funzionare necessita dell’istallazione di Matlab e funziona come se fosse un Toolbox di questo programma. Quindi è sufficiente 84 CAPITOLO 5 Analisi dei segnali rilevati copiare il sistema nella cartella lavoro e lanciare il file “start.m”, per aprire l’applicazione e far comparire il primo menù a scelta multipla (Figura 5.3). Fig.5.3 Interfaccia utente DSP system Da questo menù principale si passa, dopo avere caricato il file, ad altri sottomenù in base al tipo di analisi che intendiamo effettuare. Selezionando “CARICA IL FILE” compare nella finestra di lavoro di Matlab un elenco dei file che possiamo analizzare che sono stati salvati in precedenza nell’apposita cartella (“cartella_segnali”). Per facilitare la scelta è sufficiente digitare il numero corrispondente al file che intendiamo analizzare e, immediatamente, ci vengono forniti dei grafici relativi al segnale. A seguito di questa selezione vengono visualizzati due tipi di grafici: il primo mostra separatamente l’andamento degli otto canali in uscita dalla rete di neuroni coltivata sui MEA, il secondo li sovrappone mettendo in evidenza come varia il loro andamento. Di seguito riportiamo un esempio dei segnali rilevati dalla piastra in una registrazione (Figure 5.4 e 5.5). Come si osserva dall’immagine, ogni canale è indicato con un colore diverso e, nella legenda, abbiamo l’indicazione del canale che stiamo visualizzando. Può essere che in alcune registrazioni non tutti i canali siano attivi (per esempio nella registrazione con cellule sottoposte a trattamento con TTX): 85 CAPITOLO 5 Analisi dei segnali rilevati il sistema mostra allora solamente quelli attivi. I grafici, in ascissa, riportano il tempo espresso in secondi di registrazione e, in ordinata, il potenziale espresso in mV. Plot dei segnali uscenti dai MEA(mV/s) 0 1 Channel -0.5 -1 00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 2 Channel -0.5 -1 0 0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 3 Channel 0 -0.5 -0.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 4 Channel -1 -0.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 -1.5 0.5 0 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 6 Channel 0 -0.5 00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 7 Channel -0.5 -1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 8 Channel -1 -2 0.9 5 Channel -1 0 0.1 0.2 0.3 0.4 0.5 Time(s) 0.6 0.7 0.8 0.9 1 Fig.5.4 Plot relativo a una fase dell’esperimento che mostra gli otto canali separati 0.6 0.4 0.2 0 Potential(mV) -0.2 -0.4 -0.6 -0.8 -1 -1.2 -1.4 0 0.1 0.2 0.3 0.4 0.5 Time(s) 0.6 0.7 0.8 0.9 1 Fig.5.5 Plot relativo a una fase dell’esperimento che mostra gli otto canali a confronto 86 CAPITOLO 5 Analisi dei segnali rilevati La prima azione che possiamo selezionare dal menù principale è “VISUALIZZZAZIONE PARZIALE”: questa ci consente di spezzare il segnale degli otto canali in finestre temporali dalle dimensioni desiderate, in modo da poter effettuare una prima analisi incrociata sui diversi canali in specifiche zone di interesse. Una volta osservato l’intero segnale possiamo procedere in tre direzioni: analizzare le proprietà di un singolo canale, comparare i segnali in uscita dai diversi canali, comparare due file diversi (quindi nel caso specifico due pattern). Nel primo caso si sceglie dal menù principale “ANALISI SINGOLO CANALE” e si apre così un sottomenù (Figura 5.6), che riporta le principali analisi che possiamo eseguire sul singolo canale. Fig.5.6 Interfaccia utente DSP system Selezionando “SELEZIONA CANALE” dal menù a scelta multipla ci viene fornito il numero di canali su cui è possibile effettuare l’analisi, e ci viene chiesto su quale canale vogliamo effettuare le analisi elencate nel menù. A questo punto è possibile procedere effettuando l’analisi su tutta la registrazione del canale oppure andare a selezionare una frazione di tempo (per esempio i primi 400ms). Per fare questo è sufficiente selezionare l’opzione “SELEZIONA INTERVALLO” e nella 87 CAPITOLO 5 Analisi dei segnali rilevati finestra di lavoro di Matlab verranno richiesti gli estremi dell’intervallo che intendiamo analizzare. Una volta forniti gli estremi, viene visualizzata in dettaglio la frazione del segnale che intendiamo analizzare. Per esempio se selezioniamo l’intervallo 0-150ms di un canale otteniamo il grafico riportato in figura 5.7. Plot del segnale -0.6 Segnale -0.7 -0.8 Potential -0.9 -1 -1.1 -1.2 -1.3 0 0.05 0.1 0.15 0.2 Time(s) 0.25 0.3 0.35 0.4 Fig.5.7 Plot relativo a una fase dell’esperimento che mostra una finestra temporale di 150ms Una volta selezionato il canale e la frazione di tempo che vogliamo analizzare possiamo procedere con l’analisi vera e propria delle proprietà statistiche del segnale. Il primo tasto ci permette di identificare i potenziali d’azione e ci dà una stima della loro frequenza mediante l’istogramma ISI. Selezionando dal sottomenù l’opzione “AUTOCORRELAZIONE” si ottengono a confronto il plot del segnale che stiamo analizzando, e l’autocorrelazione del segnale stesso. Nei grafici relativi all’autocorrelazione del segnale, le unità di misura sono il tempo di ritardo in funzione del coefficiente di correlazione. Il tasto “PERIODOGRAMMA“ permette il calcolo del periodogramma nell’intervallo selezionato, questo ci dà una stima della densità spettrale. L’ultimo tasto permette di eseguire la trasformata di Fourier (“TRASFORMATA DI FOURIER”) del segnale, fornendoci un’indicazione delle frequenze contenute all’interno del segnale. Ritornando al menù principale (opzione “ESCI”) e scegliendo “ANALISI COMPARATIVE”, si apre un secondo sottomenù (Figura 5.8 di sinistra), che riporta le 88 CAPITOLO 5 Analisi dei segnali rilevati principali analisi che possiamo eseguire, comparando i segnali provenienti da due canali, che sono le medesime effettuabili selezionando “ANALISI MULTI FILE” dal menù principale (Figura 5.8 di destra). Fig.5.8 Interfaccia utente DSP system Selezionando “SELEZIONA CANALI” dal menù a scelta multipla ci viene fornito il numero di canali su cui è possibile effettuare l’analisi e ci viene chiesto, nella finestra di lavoro di Matlab, di indicare i due canali che intendiamo comparare con le analisi sotto riportate. A questo punto come nel caso precedente è possibile procedere effettuando l’analisi su tutta la registrazione del canale, oppure selezionando una frazione di tempo ben definita. Per fare questo è sufficiente selezionare l’opzione “SELEZIONA INTERVALLO”, e inserire gli estremi dell’intervallo che intendiamo analizzare, in questo modo viene visualizzata la medesima porzione di segnale per entrambi i canali. La stessa cosa avviene per l’analisi in multi file, in questo caso però, prima di selezionare canale e intervallo, viene chiesto di caricare il file (definito di test) che si vuole comparare con il file precedentemente caricato (definito di riferimento). Una volta selezionato file, canale e la frazione di tempo che vogliamo analizzare, possiamo procedere con l’analisi indicate nel sottomenù che sono coerenza e cross-correlazione. 89 CAPITOLO 5 Analisi dei segnali rilevati Selezionando dal sottomenù l’opzione “COERENZA” si ottiene il confronto delle frequenze dei due segnali che stiamo analizzando. Il grafico relativo alla coerenza, in ascissa riporta le frequenze, mentre in ordinata, un coefficiente che assume valori compresi tra 0 e 1. La seconda analisi che possiamo eseguire sui due segnali (selezionando “CROSSCORRELAZIONE”) è la crosscorrelazione; anche in questo caso in ordinata è presente il coefficiente di crosscorrelazione compreso tra 0 e 1. 5.4 Analisi dei segnali • Le funzioni di correlazione: Autocorrelazione e Crosscorrelazione: I segnali rilevati dal sistema biologico riprodotto in vitro sono aleatori e sono caratterizzati da proprietà statistiche. E’ quindi possibile analizzarli con tecniche statistiche [Bendat71]. Le funzioni di correlazione sono molto importanti nell’elaborazione dei segnali. Una funzione è detta di correlazione quando fornisce la misura di quanto due segnali hanno proprietà comuni, si assomigliano in funzione di un loro ritardo reciproco nel tempo. La funzione è detta d’autocorrelazione quando fornisce una misura di quanto un segnale assomigli, si correli, abbia proprietà comuni con se stesso ritardato di un tempo tau (senza ritardo il segnale è sempre lo stesso). L’autocorrelazione per i segnali aleatori è molto importante, poiché ci fornisce una misura della regolarità del processo. Ritardando un segnale, possiamo verificare se esistono delle periodicità. Riportiamo di seguito due grafici relativi all’autocorrelazione di segnali in uscita da un canale dei MEA (Figure 5.9 e 5.10). Le registrazioni si riferiscono alla rete di neuroni maturi, nel secondo caso però sono trattati con TTX. Il segnale estrapolato si riferisce in entrambi i casi ai primi 150ms che otteniamo al termine della registrazione. 90 CAPITOLO 5 Analisi dei segnali rilevati 0.35 Waveform 0.3 Amplitude (mV) 0.25 0.2 0.15 0.1 0.05 0 -0.05 0.04 0.06 0.08 0.1 0.12 Time (s) 0.14 0.16 0.18 0.2 1 Autocorrelation Correlation coeff. 0.8 0.6 0.4 0.2 0 -0.2 -0.4 0 100 200 300 400 Delay 500 600 700 800 Fig.5.9 Esempio di autocorrelazione dei primi 150ms di registrazione provenienti dalla rete di neuroni 0.15 Waveform Amplitude (mV) 0.1 0.05 0 -0.05 -0.1 0.04 0.06 0.08 0.1 0.12 Time (s) 0.14 0.16 0.18 0.2 1.2 Autocorrelation 1 Correlation coeff. 0.8 0.6 0.4 0.2 0 -0.2 -0.4 0 100 200 300 400 Delay 500 600 700 800 Fig.5.10 Esempio di autocorrelazione dei primi 150ms di registrazione provenienti dalla rete di neuroni trattati con TTX L’autocorrelazione contiene l’informazione relativa alle variazioni sull’asse dei tempi. Dato un segnale in un determinato intervallo di tempo 0-T, di una funzione x(t), valutandone l’autocorrelazione, è possibile scoprirne eventuali periodicità. Se la funzione di correlazione diminuisce rapidamente all’allontanarsi dallo 0, non è possibile fare stime attendibili sulla futura evoluzione del segnale. Se ciò non accade, 91 CAPITOLO 5 Analisi dei segnali rilevati è possibile predire per il futuro in modo inperfetto, ma con grande precisione, l’evolversi del segnale [Papoulis73], [Luise99]. Osservando i grafici sopra riportati si vede come l’andamento del segnale nei primi 150ms presenti delle periodicità, che sono caratteristiche per ogni canale e sono differenti per ogni stimolo che forniamo in input alla rete di neuroni. La caratteristica che più sorprende è come nella parte iniziale, successiva la stimolazione, queste periodicità sono molto accentuate (ciò non accade sempre per tutti i canali), facendo intendere che probabilmente siano conseguenza dell’eccitazione delle cellule poste sui MEA, mentre successivamente al passare del tempo questo andamento pur essendo presente si appiattisca notevolmente. Questo è verosimilmente legato alla normale attività ritmica delle cellule in stato di eccitazione. Dal grafico della rete di neuroni trattata con TTX si osserva come la funzione di correlazione diminuisca rapidamente allontanandosi da 0: questo non permette di prevedere la possibile evoluzione del segnale, facendo presupporre che il trattamento con TTX abbia causato un danno ai neuroni. Nel nostro caso il differente comportamento con e senza TTX sta ad indicare che abbiamo prelevato effettivamente da una cellula vitale, che cessa di funzionare correttamente in presenza di TTX. La crosscorrelazione compara, invece, l’output di due diversi canali. Quando si esaminano due serie temporali di parametri diversi, come possono essere i segnali provenienti da due canali differenti del medesimo pattern di stimolazione, o due identici canali per due pattern di stimolazione diversi, è utile capire quanto i valori delle due serie siano fra loro correlati. Ciò significa capire se le due serie sono rappresentative della stessa fenomenologia. Quanto sopra detto, porta a definire la funzione di crosscorrelazione fra due serie temporali: Dove: 92 CAPITOLO 5 Analisi dei segnali rilevati xi = i-esimo valore della serie X yi = i-esimo valore della serie Y µx = media della serie X µy = media della serie Y Si definisce coefficiente di crosscorrelazione fra i valori delle serie la quantità: Il cui valore assoluto varia tra 0 (nessuna correlazione) e 1 (le due serie sono totalmente rappresentative dello stesso fenomeno) [Sarwate80]. Nell’analizzare il segnale sono stati calcolati i coefficienti di correlazione tra le serie temporali provenienti da canali differenti per il medesimo pattern. Un’ulteriore analisi è stata fatta sul medesimo canale per pattern (uguali o diversi), dati in un secondo momento. Inoltre si sono crosscorrelati intervalli diversi di questi segnali. Di seguito riportiamo alcuni esempi. Il primo è generato dal confronto di due canali differenti con il medesimo pattern (Figura 5.11), il secondo, lo stesso, selezionando i primi 150ms (Figura 5.12) di registrazione e l’ultimo gli ultimi 850ms (Figura 5.13). 93 CAPITOLO 5 Analisi dei segnali rilevati Cross-Correlazione dei segnali selezionati 0.4 0.3 Correlation Coeff. 0.2 0.1 0 -0.1 -0.2 -0.3 0 0.2 0.4 0.6 0.8 1 Sample 1.2 1.4 1.6 1.8 2 4 x 10 Fig.5.11 Esempio di correlazione tra due canali differenti del medesimo pattern Cross-Correlazione dei segnali selezionati 0.8 0.7 0.6 Correlation Coeff. 0.5 0.4 0.3 0.2 0.1 0 -0.1 0 500 1000 1500 2000 2500 3000 3500 Sample Fig..5.12 Correlazione dei primi 150ms 94 CAPITOLO 5 Analisi dei segnali rilevati Cross-Correlazione dei segnali selezionati 0.5 0.4 Correlation Coeff. 0.3 0.2 0.1 0 -0.1 -0.2 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 Sample Fig.5.13 Correlazione degli ultimi 850ms Dall’osservazione dei risultati ottenuti dalle diverse analisi di crosscorrelazione, possiamo trarre alcune informazioni generali sul segnale derivato dallo stimolo della rete di neuroni. Guardando nell’insieme i grafici dei coefficienti di crosscorrelazione si nota come lo stimolo fornito tramite pattern abbia generato in alcuni canali segnali molto crosscorrelati per un tempo non superiore ai 400ms (per la maggior parte compreso nei primi 150ms). Il valore assoluto di crosscorrelazione, pur non portandosi a parametro 0 (totalmente non crosscorrelato), si attenua con il procedere del segnale. Per altre combinazioni di canali la crosscorrelazione è molto bassa, indicando che la rete di neuroni ha generato una risposta differente in diversi punti della piastra, dove è connessa con gli elettrodi. Altre osservazioni si possono estrarre dal confronto del medesimo canale con il medesimo pattern dato in un secondo momento o con pattern differenti. Nel primo caso si ottengono segnali piuttosto crosscorrelati, mentre nel secondo caso non è possibile trarre un'unica conclusione a causa della varietà dei comportamenti. 95 CAPITOLO 5 • Analisi dei segnali rilevati Analisi spettrali: Trasformata di Fourier, Periodogramma, Coerenza: Nelle analisi che riportiamo di seguito si parlerà di spettri. Lo spettro è una relazione, tipicamente rappresentata dal valore relativo di un qualche parametro, in funzione della frequenza. I fenomeni descritti come detto sono trattati in termini di segnali, rappresentati da grandezze elettriche variabili (voltaggi). Queste quantità sono tipicamente descritte nel dominio del tempo. Sappiamo però che, per ogni funzione del tempo x(t) può essere trovata una equivalente funzione nel dominio delle frequenze X(w), che descrive specificatamente il contenuto componente-frequenza richiesto per generare x(t). Uno studio delle relazioni fra il dominio tempo e la sua corrispondente rappresentazione nel dominio frequenza è il soggetto dell’analisi di Fourier e delle trasformate di Fourier. La trasformata di Fourier è un algoritmo che permette di esprimere qualsiasi funzione, periodica e non, attraverso funzioni sinusoidali. Poiché un calcolatore digitale opera solo con dati discreti, la computazione numerica della trasformata di Fourier di x(t) richiede valori di campionamento discreti di x(t). Inoltre un computer può calcolare la trasformata X(w) solo per valori discreti di w, cioè può fornire in output solo valori discreti della trasformata [Bracewell86]. Ricordando il teorema di Nyquist, possiamo dire che la massima frequenza contenuta nella trasformata di Fourier risulta uguale alla metà della frequenza di campionamento. Ciò significa che nei grafici che riportiamo di seguito il massimo valore di frequenza rilevabile è pari a 5000Hz. Il troncamento ad un tempo T (1000ms) fa sì che la trasformata di Fourier venga calcolata solamente sulle frequenze fk = k/T. Per migliorare la risoluzione in frequenza bisognerebbe aumentare il tempo di misura. Questo però limita la praticità: allungare il tempo di misura porta infatti all’elaborazione di una grossa mole di dati, con problemi di spazio e di velocità di elaborazione. Di seguito, in figura 5.14, riportiamo un grafico relativo alla trasformata di Fourier, ovviamente, per non ridurre ulteriormente il tempo T, non effettuiamo nessun sottocampionamento, ma prendiamo tutti e 10000 dati a disposizione. 96 CAPITOLO 5 Analisi dei segnali rilevati FFT SEGNALE 0.35 0.3 0.25 Amplitude 0.2 0.15 0.1 0.05 0 0 500 1000 1500 2000 2500 Frequency [Hz] 3000 3500 4000 4500 5000 Fig.5.14 Esempio di trasformata di Fourier del segnale registrato con i MEA Dall’analisi delle trasformate di Fourier dei segnali registrati possiamo stimare le frequenze contenute nel segnale rilevato. La trasformata di Fourier di un set di dati, di per sé, non fornisce però informazioni sulle caratteristiche del fenomeno fisico che quei dati rappresentano. Interessante è invece la stima dello spettro di potenza. In letteratura s'incontrano molte definizioni di spettro di potenza, spesso indicato come PSD (Power Spectral Density). In alcuni testi come PSD viene semplicemente riportato il modulo quadro della trasformata di Fourier. Un'altra definizione molto usata di PSD è quella di periodogramma [Pagano00]. Il grafico riporta la variazione del PSD al variare della frequenza. Se la funzione fosse continua nel dominio delle frequenze (ovvero se il set di dati fosse una funzione continua di t), i picchi individuabili nel PSD rappresenterebbero con esattezza le frequenze caratteristiche del sistema e le eventuali armoniche. Nell'ipotesi cioè che ogni funzione continua possa essere approssimata da una serie di funzioni seno e coseno, si otterrebbero le frequenze caratteristiche di ognuna di queste funzioni periodiche e, dall'intensità del picco, si potrebbe ricavare il 97 CAPITOLO 5 Analisi dei segnali rilevati contributo allo sviluppo in serie. Chiaramente un grafico privo di picchi ben marcati corrisponderebbe ad un andamento aperiodico. Purtroppo non è possibile disporre di un set infinito di valori, quindi anche il periodogramma non è una funzione continua della frequenza, e non si può avere la certezza di individuare tutti i picchi, anche perchè, tranne che in pochi e rari casi, lo sviluppo di una funzione necessita di un numero infinito di funzioni seno e coseno. Il periodogramma consente però di mettere in rilievo quali sono le frequenze più importanti individuate misurando l’intensità della frequenza K-esima all’interno della serie di valori e quindi di determinare l’importanza che assume ogni periodo della serie. I picchi che emergono nel periodogramma corrispondono alle sinusoidi che spiegano la varianza della serie. Raw Periodogram -10 -20 Power Spectral Density (dB/ rad/sample) -30 -40 -50 -60 -70 -80 -90 -100 -110 0 500 1000 Normalized Frequency (×π rad/sample) 1500 Fig.5.15 Esempio di periodogramma del segnale registrato da MEA I dati ottenuti (vedi esempio riportato in figura 5.15) confermano quanto ritrovato in letteratura sulle frequenze di neuroni corticali depositati su MEA, ossia la presenza di una zona lineare che va dai 50Hz (per piccoli interneuroni anche 20Hz) fino a 300Hz, mentre la massima frequenza di scarica è attorno ai 1000Hz (valore variabile in funzione del tipo di neuroni). Interessante è osservare come, effettuando 98 CAPITOLO 5 Analisi dei segnali rilevati il periodogramma sui primi 150ms (Figura 5.16), eliminiamo dallo spettro di potenza tutte quelle frequenze che non determinano picchi importanti. Nel caso specifico il grafico presenta un picco emergente a 640Hz. Raw Periodogram -10 -20 Power Spectral Density (dB/ rad/sample) -30 -40 -50 -60 -70 -80 -90 0 500 1000 Normalized Frequency (×π rad/sample) 1500 Fig.5.16 Esempio di periodogramma del segnale registrato da MEA ( intervallo dei primi 150ms) I grafici relativi al periodogramma hanno in ascissa la frequenza (espressa come Hz x π rad) e in ordinata il PSD [Ziemer85]. Le analisi spettrali viste fino ad ora si riferiscono al singolo segnale. La relazione che mostriamo di seguito coinvolge invece l’ampiezza del cross-spettro fra due segnali: Questa relazione da luogo alla definizione di funzione di coerenza: 99 CAPITOLO 5 Analisi dei segnali rilevati La funzione di coerenza è importante nell’analisi di due segnali raccolti da due canali differenti, perché ci dà un’indicazione di come questi siano separati di una certa quantità. Lo scostamento dal valore 1 della funzione di coerenza ci dice con quale bontà possiamo supporre che una determinata frequenza misurata da un canale corrisponda allo stesso fenomeno misurato alla medesima frequenza dall’altro canale. Se la funzione di coerenza si avvicina a 1 significa che la causa che genera i due segnali è la medesima [Ziemer85]. Questo si ripercuote sull’analisi del sistema, permettendo di stabilire se è l’impulso inviato a tale sistema (rete di neuroni) a determinare la risposta rilevabile nei primi 400ms del segnale. Cosa interessante da notare dai grafici a nostra disposizione è come vi sia una forte coerenza alle basse frequenze in tutti i segnali rilevati (Figura 5.17). Coerenza tra segnali Vaschetta A e Vascheta B 1 0.9 0.8 0.7 Correlation Coeff 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.05 0.1 0.15 0.2 0.25 0.3 Frequenza (x 10000Hz) 0.35 0.4 0.45 0.5 Fig.5.17 Esempio di grafico coerenza tra due segnali registrati da MEA Nel DSP è stato inoltre sviluppato un algoritmo particolare, che consente di individuare gli spike presenti nel segnale. L’algoritmo fa uso di una soglia piccopicco, che permette di seguire le eventuali oscillazioni del segnale. 100 CAPITOLO 5 Analisi dei segnali rilevati L’algoritmo “cammina” sul segnale e identifica i punti di massimo e di minimo. Una volta identificati, questo effettua una differenza tra valore massimo e valore minimo e se questa differenza è superiore a una soglia stabilita viene segnalato uno spike. In aggiunta l’algoritmo calcola l’istogramma ISI, ossia (l’Inter Spike Interval). Questo è definito come l’intervallo temporale che intercorre tra due spike successivi, e l’istogramma si costruisce raggruppando gli ISI. Questo metodo è sperimentale e presenta delle limitazioni. Prima fra tutte è la determinazione corretta della soglia che si dovrebbe attestare tra i 100 e 400µV per segnali rilevati tramite MEA. In figura 5.18 mostriamo l’output ottenuto processando un segnale campione. Fig.5.18 Esempio di individuazione degli spike e istogramma ISI Il confronto delle proprietà ricavate dall’indagine statistica con la letteratura a disposizione ha dimostrato effettivamente che i neuroni ottenuti da cellule staminali neurali hanno un comportamento elettrofisiologico compatibile con i neuroni asportati da tessuti celebrali e posti su MEA. 101 CAPITOLO 5 Analisi dei segnali rilevati Un'altra conclusione cui si è giunti attraverso l’analisi è che i segnali provenienti da stimolazioni effettuate con il medesimo pattern hanno evidenziato alcune analogie, facendo pensare che il modello di memoria proposto possa effettivamente apprendere. Queste analogie sono state verificate in termini di output del medesimo canale. Le analisi statistiche hanno però mostrato come la grande varietà delle risposte ottenute dalle diverse stimolazioni, non permetta di ricavare con metodi di analisi statistica proprietà standardizzate da questi segnali per veicolare informazione e controllare un attuatore robot. Per questo motivo si è deciso di abbandonare l’utilizzo di algoritmi tradizionali nella comunicazione elettronica/biologica, e si è pensato di operare attraverso l’impiego di tecniche computazionali neurali basate sull’apprendimento. Per decodificare lo stimolo di risposta è stata utilizzata una rete neurale artificiale che, ricevendo questa codifica in input ha cercato di interpretare il suo andamento dinamico, andando a leggere la successione temporale delle ampiezze dei segnali rilevati. Funzionando come una scatola nera, la rete artificiale è riuscita così a decodificare l'informazione nascosta in questa sequenza utilizzando i valori in ampiezza dei voltaggi , rinormalizzandoli in modo da cogliere l'andamento temporale degli spike all'interno dei segnali. L’analisi statistica effettuata sui segnali rilevati ha permesso però di ricavare alcune osservazioni utili a questo scopo. Queste informazioni risiedono soprattutto nell’intervallo di tempo successivo alla stimolazione che la rete neurale deve apprendere per discriminare un pattern fornito come diverso. Nel capitolo successivo si è operato andando a verificare quanto ricavato dalle analisi sopra mostrate, ossia che vi è una risposta specifica per ogni canale a seguito della stimolazione e che, tale risposta è concentrata nei primi 400ms. 102 CAPITOLO 6 Processo di taratura della rete neurale artificiale CAPITOLO 6 Processo di taratura della rete neurale artificiale 6.1 Risultati dell’esperimento in tempo reale Per verificare se la rete di neuroni fosse in grado di apprendere dei pattern digitali simulati, come descritto nei capitoli precedenti, si è utilizzato una rete neurale artificiale. La ITSOM ha utilizzato in input i segnali generati dalla rete biologica e, grazie alle sue caratteristiche, è riuscita nella fase di training a discriminarli e, nella fase di testing, a classificarli verificando l’apprendimento. Questa verifica si è ripercossa sulla classificazione corretta dei pattern simulati forniti alla rete biologica, di cui in questo capitolo riportiamo i risultati. Il protocollo di robotica descritto nel capitolo 4 è stato eseguito inizialmente su cellule immature. Dalle registrazioni si è osservato come cellule indifferenziate generano un segnale non compatibile con i segnali derivati normalmente da una rete di neuroni, presentando cioè un comportamento atipico. Questo comportamento è dovuto alla mancanza delle caratteristiche morfologiche e molecolari che contraddistinguono il neurone. Dalle osservazioni effettuate al microscopio si vede come queste cellule non siano interconnesse tra loro, né tanto meno ai microelettrodi, mancando di assoni e dendriti. Non essendosi quindi sviluppate connessioni tra le diverse unità, il modello in vitro di memoria non è in grado di autoorganizzarsi e non è pertanto possibile guidare queste cellule ad apprendere pattern digitali simulati. Questo si traduce in una non classificazione o in una classificazione casuale dei segnali in input della rete neurale artificiale. Un’ulteriore osservazione deriva dalle registrazioni dei segnali derivati dalla rete di neuroni trattati con TTX: si nota infatti come vi sia un abbattimento dell’attività elettrica della rete di neuroni. Bloccare selettivamente il trasporto degli ioni sodio attraverso la membrana plasmatica si traduce in una profonda modificazione dell’eccitabilità e nel blocco della conduzione dell’ impulso nervoso, e anche in questo caso ripercussioni sulla rete biologica osservabili dall’output della 103 CAPITOLO 6 Processo di taratura della rete neurale artificiale rete neurale artificiale. Il controllo operato con cellule immature e trattate con TTX permette di affermare che i risultati ottenuti con cellule mature sono dovuti alla loro struttura morfologica ed alle proprietà funzionali che ne derivano. Durante il primo esperimento robotico si sono forniti alla ITSOM i quattro stimoli provenienti dal training della rete biologica (il decimo segnale per ogni direzione). Questo ha permesso la costruzione delle matrici tridimensionale in cui si sono memorizzati gli z-score di riferimento (una matrice per ogni direzione). Nella fase di validazione (o testing) alla rete biologica sono stati forniti venticinque pattern che hanno generato a loro volta segnali che sono stati classificati dalla rete neurale artificiale in una delle quattro direzioni. Questi rappresentano il 100% della classificazione e sono distribuiti secondo quanto riportato in tabella 6.1. Tabella 6.1 Distribuzione dei pattern utilizzati nell’esperimento PATTERN F PATTERN B PATTERN L PATTERN R 5 6 7 7 Nella tabella che viene mostrata di seguito (Tabella 6.2) sono riassunte le caratteristiche della rete neurale artificiale utilizzata nel primo esperimento, che impiega i parametri stimati tramite appositi test. Tabella 6.2 Parametri della rete neurale utilizzata nell’esperimento in tempo reale Intervallo temporale analizzato Numero di campioni esaminati Tasso di apprendimento Numero di neuroni dello strato di input Numero di neuroni nello strato di output Numero di epoche 1-1000ms 80.000 0,03 500 20 10 La ITSOM ha classificato in tempo reale i segnali in uscita dalla rete di neuroni secondo i dati riportati in tabella 6.3. I segnali che vengono classificati sono determinati dalla somministrazione di stimoli corrispondenti ai pattern sopra mostrati. 104 CAPITOLO 6 Processo di taratura della rete neurale artificiale Tabella 6.3 Classificazione dei pattern in funzione della direzione input 1-1000ms Classificati correttamente Non classificati correttamente Non classificati Totale dei pattern forniti % Classificati % Classificati correttamente Direzioni Pattern F Pattern B Pattern L Pattern R 3 5 0 0 1 1 6 6 1 0 1 1 5 6 7 7 80% 100% 85,71% 85,71% 60% 83,33% 0% 0% Totale 8 14 3 25 88% 32% Percentuale di classificazione nelle quattro direzioni 100% 80% 60% Non classificati 40% Non classificati correttamente 20% Classificati correttamente 0% Pattern F Pattern B Pattern L Pattern R Totale Direzioni Fig.6.1 Istogramma relativo alla classificazione in funzione della direzione I risultati sopra mostrati (Tabella 6.3 e Figura 6.1) indicano un non perfetto funzionamento del sistema sulla totalità dei pattern forniti. Il numero di pattern che la rete è riuscita ad associare ad una delle quattro direzioni è pari all’88% del totale degli stimoli forniti, mentre per quanto riguarda la percentuale di classificazioni corrette, questa raggiunge in media il 32% delle direzioni fornite. In realtà, se andiamo a valutare direzione per direzione, il numero di classificazioni corrette ci accorgiamo come il sistema sia riuscito a riconoscere quasi perfettamente due delle quattro direzioni. Le direzioni che la rete è riuscita a classificare con un margine di errore limitato corrispondono ai “pattern F” e “pattern B” dove le rispettive percentuali di classificazione sono 60% e 83,33%. 105 CAPITOLO 6 Processo di taratura della rete neurale artificiale 6.2 Parametri per la taratura di una rete neurale Come detto la ITSOM, creata per classificare gli stimoli in uscita dalla rete di neuroni non era mai stata testata su dei campioni reali. I dati mostrati nel paragrafo precedente corrispondono al primo esperimento di robotica e sono stati pertanto ottenuti senza tarare la rete neurale artificiale, utilizzando i parametri di default. Sappiamo che con il sistema a disposizione abbiamo la possibilità di registrare i segnali in uscita dalla rete di neuroni e quindi di ripetere l’esperimento virtualmente tutte le volte che vogliamo. Grazie a queste registrazioni, è stato pertanto possibile implementare il processo di taratura della rete neurale, al fine di migliorarne le prestazioni. Il processo di taratura consiste nella variazione dei parametri che caratterizzano le reti neurali ed in particolare la ITSOM utilizzata. Questi parametri sono: • campioni da fornire in input; • tasso di apprendimento (ε); • numero di epoche; • numero di neuroni dello strato competitivo. Prima di presentare i risultati del processo di taratura vediamo in dettaglio questi parametri per avere un’idea di cosa comporta la modifica di ognuno di essi. Sappiamo che prima di utilizzare una rete neurale artificiale è indispensabile selezionare dei dati in input che siano i più significativi possibili al fine della classificazione. Nel caso specifico i dati sono rappresentati dai segnali in uscita dagli otto canali dalla rete di neuroni. Questi segnali sono espressi come variazione di potenziale (mV) in funzione del tempo (s). La registrazione totale dopo il termine della stimolazione dura un secondo. Poiché l’acquisizione di un segnale continuo avviene a tempo discreto con una scheda di acquisizione in grado di rilevare 10000 campioni al secondo su otto canali, il numero totale di campioni registrati è 80000 al secondo. 106 CAPITOLO 6 Processo di taratura della rete neurale artificiale Nel primo esperimento sono stati forniti alla rete neurale artificiale tutti gli 80000 dati. Successivamente si è andati a testare diversi intervalli temporali in modo da capire, in funzione del comportamento della rete neurale, quale era la parte più informativa del segnale. Questo significa stabilire per quanto tempo lo stimolo generi una perturbazione (stato eccitatorio) nel sistema prima di ritornare allo stato di normalità. Includendo infatti nell’input della rete neurale artificiale i dati del sistema in condizioni di normalità attenuiamo l’informazione di quella parte di dati che permette di discriminare i diversi pattern. Il tasso di apprendimento (ε) rappresenta la percentuale di avvicinamento del valore del peso della connessione del neurone premiato al valore medio degli input. Questo significa che, se agisco modificando questa percentuale, modifico il valore con cui premio il neurone vincente. Se aumento troppo il valore del tasso di apprendimento rischio invece di convergere immediatamente verso un neurone vincente e questo si ripercuote in termini di output con la non classificazione del segnale; viceversa, se il tasso di apprendimento assume valori troppo bassi, non riesco a selezionare i neuroni vincenti quindi rischio di classificare casualmente. Il numero di epoche indica quante volte viene ripetuto il calcolo dei neuroni vincenti: in tal modo si raffinano sempre di più i pesi delle connessioni, migliorando quelli dei neuroni vincenti. Il numero di epoche nelle reti neurali ITSOM non assume grandi valori come nelle altre tipologie di reti. La caratteristica di questa rete è che non necessita di essere portata a convergenza, perché le configurazioni di neuroni vincenti raggiungono la stabilità necessaria entro poche decine di epoche. Per questo motivo, come vedremo di seguito, questa variabile è stata modificata rimanendo nell’ordine delle decine. Il numero di neuroni dello strato competitivo (output) determina il numero di z-score di riferimento per ogni campionamento in uscita dalla rete di neuroni. Diminuendo il numero di neuroni che competono, ogni neurone avrà più peso. In questo senso, se riduciamo troppo il numero di neuroni, la rete convergerà più volte sullo stesso neurone, determinando una scarsa separazione delle classi (le quattro direzioni). In opposizione, aumentando troppo il numero dei neuroni, il rischio è che 107 CAPITOLO 6 Processo di taratura della rete neurale artificiale si associno agli stessi pattern configurazioni troppo varie e quindi la classificazione sia casuale. Un’ultima considerazione riguarda la matrice tridimensionale in cui si memorizzano gli z-score di riferimento (vedi capitolo 4) nella fase di training. Modificando i campioni forniti in input e il numero di neuroni dello strato competitivo, determiniamo una variazione nelle sue dimensioni, come verrà specificato di seguito. Dato l’alto numero di combinazioni possibili risultanti dalla variazione dei parametri sopra indicati, il processo di taratura è stato guidato dai risultati. I test di seguito riportati sono stati distinti in funzione di quali e quanti campioni fornire alla rete neurale artificiale nel tempo reale, per ottenere la migliore classificazione dei segnali provenienti dalla rete biologica. Per ognuno di questi intervalli si è andati con l’ordine riportato di seguito a ricercare la configurazione migliore: 1. modifica del tasso di apprendimento (ε); 2. modifica del numero delle epoche; 3. modifica del numero di neuroni dello strato competitivo. Durante il processo sopra indicato si è andati anche ad analizzare gli z-score ottenuti. 6.3 Processo di taratura della rete neurale e analisi dell’informazione Prima di andare a selezionare dal segnale un intervallo di registrazione specifico, si è deciso di procedere utilizzando tutti i dati iniziali dell’esperimento (1000ms), variando il tasso di apprendimento e verificando eventuali miglioramenti nella classificazione. In questa prova i parametri della rete sono settati con i parametri riportati in tabella 6.4. 108 CAPITOLO 6 Processo di taratura della rete neurale artificiale Tabella 6.4 Parametri della rete neurale utilizzata nel primo test 1-1000ms 80.000 500 20 10 Intervallo temporale analizzato Numero di campioni esaminati Numero di neuroni dello strato di input Numero di neuroni nello strato di output Numero di epoche I valori del tasso di apprendimento testati sono indicati nella tabella successiva (Tabella 6.5) e nel relativo grafico (Figura 6.2). Ad ogni valore sono associate le percentuali di classificazione e le percentuali di classificazione corrette della rete neurale artificiale. Tabella 6.5 Classificazione dei pattern in funzione del tasso di apprendimento Input 1-1000ms Classificati correttamente Non classificati correttamente Non classificati Totale dei pattern forniti % Classificati % Classificati correttamente 0,03 8 0,3 4 14 3 25 88% 32% 0 21 25 16% 16% Tasso di apprendimento 0,003 0,01 0,02 5 4 7 20 0 25 100% 20% 21 0 25 100% 16% 15 3 25 88% 28% 0,04 9 0,05 4 11 5 25 80% 36% 3 18 25 28% 16% Percentuale di classificazioni in funzione del tasso di apprendimento 100% 80% 60% Non classificati 40% Non classificati correttamente 20% Classificati correttamente 0% 0,03 0,3 0,003 0,01 0,02 0,04 0,05 Tasso di apprendimento Fig.6.2 Istogramma relativo alla classificazione in funzione del tasso di apprendimento La rete neurale raggiunge una percentuale massima di classificazioni corrette del 36% con un tasso di apprendimento pari a 0,04. Questa percentuale va però a scapito del numero di segnali che la rete non riconosce (non classificati), che 109 CAPITOLO 6 Processo di taratura della rete neurale artificiale aumenta passando da 3 a 5. Ad essere riconosciuti però, in questo caso, non sono solo “pattern F” e ”pattern B”: in alcune circostanze anche il “pattern R”; questo può essere considerato un risultato importante. Una volta selezionato il miglior tasso di apprendimento per i campioni a disposizione, si è passati alla modifica del numero delle epoche. Come detto, la variazione delle epoche nel caso delle ITSOM rientra nell’ordine delle decine, in quanto, non è necessario arrivare alla convergenza. Le variazioni apportate alle epoche non hanno portato ad alcun miglioramento nell’efficienza di classificazione, per questo motivo si sono mantenute le dieci epoche iniziali (dati non riportati). L’ultimo parametro da modificare è il numero di neuroni dello strato competitivo: variando questo parametro modifichiamo anche la matrice tridimensionale degli z-score di riferimento per ogni direzione, nella fase di training. Utilizzando come tasso di apprendimento il valore 0,04 e mantenendo le epoche invariate, si è andato a diminuire il numero di neuroni dello strato competitivo. Con un numero di neuroni pari a dodici, per la prima volta si è riusciti a classificare tutte e quattro le direzioni. La percentuale di classificazione totale non è però la migliore ottenuta tra le prove descritte. Di seguito, in tabella 6.6, è riportata la classificazione nelle diverse direzioni, utilizzando tasso di apprendimento 0,04 e numero di neuroni dello strato competitivo 12 (vedi anche grafico relativo in figura 6.3). Tabella 6.6 Classificazione dei pattern in funzione della direzione Direzioni Totale Pattern F Pattern B Pattern L Pattern R 2 2 2 2 8 Classificati correttamente 3 3 4 4 14 Non classificati correttamente 0 1 1 1 3 Non classificati 5 6 7 7 25 Totale dei pattern forniti 100% 83,33% 85,71% 85,71% 88% % Classificati 40% 33,33% 28,57% 28,57% 32% % Classificati correttamente Input 1-1000ms 110 CAPITOLO 6 Processo di taratura della rete neurale artificiale Percentuale di classificazione nelle quattro direzioni 100% 80% 60% Non classificati 40% Non classificati correttamente Classificati correttamente 20% 0% Pattern F Pattern B Pattern L Pattern R Totale Direzioni Fig.6.3 Istogramma relativo alla classificazione in funzione della direzione La rete neurale così tarata è in grado di riconoscere tutti i pattern, e questa sembra essere la configurazione ottimale utilizzando l’intero set di dati a disposizione (intervallo del segnale da 1-1000ms). Dai segnali registrati, abbiamo osservato che la risposta della rete biologica avviene nei primi millisecondi successivi alla stimolazione. Il passo successivo è stato quello di estrarre dall’intero segnale (1000ms) i primi 400ms. Se in un secondo otteniamo la registrazione di 10000 dati per ognuno degli otto canali, per un totale di 80000 dati, avremo che i primi 400ms corrisponderanno ai primi 4000 dati per ogni canale per un totale di 32000 dati da processare. Fig.6.4 Matrice tridimensionale in cui sono memorizzati gli z-score di riferimento 111 CAPITOLO 6 Processo di taratura della rete neurale artificiale In questo caso la matrice tridimensionale in cui sono memorizzati gli z-score di riferimento subirà delle modificazioni, ossia mantenendo gli otto z-score di riferimento per ogni direzione avremo (32000 : 8) 4000 dati da distribuire sui 500 neuroni (4000:500) in 8 campionamenti, e non più 20 come nella fase precedente. Il training verrà effettuato sui primi 400ms generando una nuova matrice si riferimento riportata in figura 6.4. Anche in questo caso si è partiti dalla configurazione della rete neurale utilizzata nel protocollo e si è andati a modificare il tasso di apprendimento. La rete neurale artificiale si è comportata come riportato nella tabella (Tabella 6.7) e nell’istogramma di seguito (Figura 6.5). Tabella 6.7 Classificazione dei pattern in funzione del tasso di apprendimento Input 1-400ms Classificati correttamente Non classificati correttamente Non classificati Totale dei dati analizzati % Classificati % Classificati correttamente 0,03 5 18 2 25 92% 20% Tasso di apprendimento 0,001 0,003 0,107 0,09 0,1 5 5 2 6 7 19 18 20 19 18 1 2 3 0 0 25 25 25 25 25 96% 92% 88% 100% 100% 20% 20% 8% 24% 28% 0,2 4 7 14 25 44% 16% Percentuale di classificazioni in funzione del tasso di apprendimento 100% 80% 60% Non classificati 40% Non classificati correttamente 20% Classificati correttamente 0% 0,03 0,001 0,003 0,107 0,09 0,1 0,2 Tasso di apprendimento Fig.6.5 Istogramma relativo alla classificazione in funzione del tasso di apprendimento 112 CAPITOLO 6 Processo di taratura della rete neurale artificiale In questo caso i risultati che si ottengono sono inferiori a quelli ottenuti utilizzando l’intero segnale, ma rispetto a quanto ottenuto nel precedente test, variando solamente il tasso di apprendimento, riusciamo a classificare tre delle quattro direzioni, e inoltre tutti i segnali vengono classificati. Più precisamente con tasso di apprendimento pari a 0,1 classifichiamo correttamente “pattern F”, “pattern B”, “pattern L”. Le relative percentuali sono mostrate a seguire nella tabella 6.8 e nel grafico relativo in figura 6.6. Tabella 6.8 Classificazione dei pattern in funzione della direzione Direzioni Totale Pattern F Pattern B Pattern L Pattern R Classificati correttamente 4 1 2 0 7 Non classificati correttamente 1 5 5 7 18 Non classificati 0 0 0 0 0 Totale dei pattern forniti 5 6 7 7 25 100% 100% 100% 100% 100% % Classificati 80% 16,67% 28,57% 0% 28% % Classificati correttamente Input 1-400ms Percentuale di classificazione nelle quattro direzioni 100% 80% 60% Non classificati 40% Non classificati correttamente 20% Classificati correttamente 0% Pattern F Pattern B Pattern L Pattern R Totale Direzioni Fig.6.6 Istogramma relativo alla classificazione in funzione della direzione Mantenendo il valore del tasso di apprendimento pari 0,1 si è andati a modificare il numero di epoche. Da questa variazione otteniamo che il numero di epoche che consente di aumentare il numero di classificazioni corrette è pari a 50. Con questo numero di epoche classifichiamo correttamente nel 36% dei casi (vedi tabella 6.9 e figura 6.7). 113 CAPITOLO 6 Processo di taratura della rete neurale artificiale Tabella 6.9 Classificazione dei pattern in funzione del numero di epoche Input 1-400ms Classificati correttamente Non classificati correttamente Non classificati Totale dei dati analizzati % Classificati % Classificati correttamente 10 7 18 0 25 100% 28% 20 3 22 0 25 100% 12% Numero di epoche 30 50 55 5 9 4 20 16 21 0 0 0 25 25 25 100% 100% 100% 20% 36% 16% 70 8 17 0 25 100% 32% Percentuale di classificazione in funzione del numero di epoche 100% 80% Non classificati 60% Non classificati correttamente 40% 20% Classificati correttamente 0% 10 20 30 50 55 70 Numero delle epoche Fig.6.7 Istogramma relativo alla classificazione in funzione del numero di epoche Variando il numero di neuroni dello strato competitivo, utilizzando tasso di apprendimento 0,1 e numero di epoche pari a 50, si è raggiunta una percentuale di classificazione del 60%. Questa percentuale è ottenuta utilizzando 12 neuroni nello strato competitivo. Sotto questo numero di neuroni la rete non classifica più correttamente. Questo risultato è confermato, sia considerando l’intero intervallo, che per i primi 400ms. Si può concludere che 12 neuroni dello strato competitivo sono sufficienti a discriminare i segnali in uscita dalla rete biologica in seguito allo stimolo proveniente dai quattro pattern. La configurazione migliore utilizzando i primi 400ms è di seguito riportata e, a seguire, sono riportate anche le percentuali di classificazione relative ai diversi pattern. Questa configurazione sarà poi utilizzata 114 CAPITOLO 6 Processo di taratura della rete neurale artificiale nell’esperimento successivo perché ritenuta la configurazione migliore (Tabella 6.10). Tabella 6.10 Parametri della rete neurale dopo il processo di taratura 1-400ms 32000 0,1 500 12 50 Intervallo temporale analizzato Numero di campioni esaminati Tasso di apprendimento Numero di neuroni dello strato di input Numero di neuroni nello strato di output Numero di epoche Osservando i dati ottenuti da questa ultima prova, riportati nella tabella 6.11 e nel relativo grafico (Figura 6.8), possiamo trarre diverse considerazioni. Tabella 6.11 Classificazione dei pattern in funzione della direzione Direzioni Totale Pattern F Pattern B Pattern L Pattern R Classificati correttamente 4 5 3 3 15 Non classificati correttamente 1 0 3 3 7 Non classificati 0 1 1 1 3 Totale dei pattern forniti 5 6 7 7 25 100% 83,33% 85,71% 85,71% 88% % Classificati 80% 83,33% 42,86% 42,86% 60% % Classificati correttamente Input 1-400ms Percentuale di classificazione nelle quattro direzioni 100% 80% 60% Non classificati 40% Non classificati correttamente 20% Classificati correttamente 0% Pattern F Pattern B Pattern L Pattern R Totale Direzioni Fig.6.8 Istogramma relativo alla classificazione in funzione della direzione 115 CAPITOLO 6 Processo di taratura della rete neurale artificiale Le percentuali di classificazione dei “pattern F” e “pattern B” raggiungono valori considerevoli di classificazione, 80% e 83,33%, mentre per quanto riguarda i “pattern R” e “pattern L”, che rappresentano le direzioni laterali, la percentuale è del 42,86%. Un’ulteriore osservazione deriva dal confronto delle percentuali dei segnali classificati (riconosciuti come appartenenti ad una direzione) con quelli classificati correttamente. Se eliminiamo i segnali non riconosciuti le percentuali di classificazione corrette si innalzano notevolmente e nel caso dei pattern B si raggiunge una classificazione del 100%. Proseguendo nella taratura della rete neurale si è passati ad utilizzare altri intervalli temporali, e più precisamente gli intervalli compresi tra 400-800ms e tra 400-1000ms i cui dati sono riportati in tabella 6.12-6.13 e nei rispettivi istogrammi (Figura 6.9-6.10). I risultati ottenuti operando in questi intervalli temporali secondo la procedura sopra mostrata, lasciano pensare che, oltre i 400ms, la rete di neuroni ripristini il suo stato di normalità, non consentendo alla ITSOM di estrarre dal segnale delle informazioni tali da determinare la classificazione tramite z-score. Il numero di dati processati per l’intervallo compreso tra 400-800ms è pari a 32000 e la matrice tridimensionale in cui si memorizzano gli z-score di riferimento presenta le medesime dimensioni della prova precedente. Per quanto riguarda invece l’intervallo temporale compreso tra 400-1000ms, il numero di dati processato è 48000 (6000 dati ogni canale di registrazione); in questo caso il numero di campionamenti è 12 (48000dati : 8 : 500neuroni) con conseguente modifica della matrice tridimensionale. Con i parametri iniziali della rete si è ottenuto per entrambi gli intervalli una classificazione massima del 12%, modificando il tasso di apprendimento. Tabella 6.12 Classificazione dei pattern in funzione del tasso di apprendimento Input 400-800ms Classificati correttamente Non classificati correttamente Non classificati % Classificati % Classificati correttamente Tasso di apprendimento 0,03 0,3 0,003 0,001 0 0 1 3 5 14 12 17 20 11 12 5 20% 56% 52% 80% 0% 0% 4% 12% 116 CAPITOLO 6 Processo di taratura della rete neurale artificiale Percentuale di classificazione in funzione del tasso di apprendimento 100% 80% Non classificati 60% Non classificati correttamente 40% 20% Classificati correttamente 0% 0,03 0,3 0,003 0,001 Tasso di apprendimento Fig.6.9 Istogramma relativo alla classificazione in funzione del tasso di apprendimento Tabella 6.13 Classificazione dei pattern in funzione del tasso di apprendimento Tasso di apprendimento 0,03 0,01 0,1 0,001 0 1 0 3 5 8 1 18 20 16 24 4 20% 36% 4% 84% 0% 4% 0% 12% Input 400-1000ms Classificati correttamente Non classificati correttamente Non classificati % Classificati % Classificati correttamente Percentuale di classificazione in funzione del tasso di apprendimento 100% 80% Non classificati 60% Non classificati correttamente 40% 20% Classificati correttamente 0% 0,03 0,01 0,1 0,001 Tasso di apprendimento Fig.6.10 Istogramma relativo alla classificazione in funzione del tasso di apprendimento 117 CAPITOLO 6 Processo di taratura della rete neurale artificiale Procedendo nel processo di taratura si sono ottenuti dei risultati poco significativi, pertanto non si è ritenuto di riportarli. Negli esperimenti successivi la rete sarà configurata con i parametri migliori del processo di taratura riportati nella tabella 6.10. 6.4 Valutazione del modello Quando si costruisce un modello che intende spiegare un fenomeno a partire dai dati bisogna valutarlo. Costruito il modello si possono associare degli indici che misurino l’accuratezza del modello nel descrivere i dati. Questo è stato fatto durante l’esperimento svolto in tempo reale e durante la taratura della rete neurale artificiale, dove si è andati a verificare la percentuale di apprendimento al variare dei parameri della rete. Questi risultati ci hanno fornito una stima di quanto il classificatore (la ITSOM) sia in grado di generalizzare un problema con i parametri fornitegli. Con i dati a disposizione nella tabelle possiamo calcolarci la percentuale d’errore in validazione del modello che ci fornisce una valutazione interna al modello (equivale a: 100% - percentuale di classificazioni corrette). Errore% _ val. = N _ class. _ corrette ∗ 100 TOT _ campioni _ val. Secondo questa formula, l’errore compiuto in validazione dalla rete neurale utilizzando i parametri migliori è del 40%. Nel caso di problemi di classificazione, uno strumento noto in letteratura come “matrice di confusione” può essere utile per misurare le potenzialità del modello, permettendo una validazione esterna. La valutazione esterna è in grado di fornire il valore netto del modello. Infatti, il tasso di accuratezza trovato utilizzando le tecniche viste precedentemente è valido solo per il set di dati con il quale è stato costruito il modello. Nella tabella 6.14 è mostrata la matrice di confusione relativa al modello presentato. 118 CAPITOLO 6 Processo di taratura della rete neurale artificiale Tabella 6.14 Matrice di confusione relativa alla classificazione delle direzioni Direzione fornita (REALE) Matrice di confusione Direzione classificata (PREVISTA) F B L R F 4 0 0 0 B 1 5 3 2 L 0 0 3 1 R 0 0 0 3 N.C. 0 1 1 1 La matrice sopra mostrata ci fornisce indicazioni su come sono state sbagliate le classificazioni. Come si vede sulla diagonale sono indicate le direzioni che sono state apprese correttamente, mentre al di fuori della diagonale dove è avvenuto l’errore in classificazione. Con questa matrice di confusione non è tuttavia possibile identificare il tipo di errore commesso in classificazione; ovvero, non è possibile stabilire se ci si trova in presenza di un falso positivo o di un falso negativo. Per indagare ulteriormente è stato fatto per, ogni pattern, una matrice di confusione a due classi come riportato di seguito nelle tabelle 6.15. Per fare questo si sono eliminati i pattern non classificati. Tabella 6.15a Matrice di confusione pattern F Matrice di confusione pattern F F Non F 4 0 F 1 17 Non F Tabella 6.15b Matrice di confusione pattern B Matrice di confusione pattern B B Non B 5 6 B 0 11 Non B Tabella 6.15c Matrice di confusione pattern L Matrice di confusione pattern L L Non L 3 1 L 3 15 Non L 119 CAPITOLO 6 Processo di taratura della rete neurale artificiale Tabella 6.15d Matrice di confusione pattern R Matrice di confusione pattern R R Non R 3 0 R 3 16 Non R Per ogni matrice di confusione si possono definire quattro importanti parametri: • False Positive (FP): è la probabilità che un pattern sia stato erroneamente classificato come appartenente ad un altro pattern. • False Negative (FN): è la probabilità che uno specifico pattern sia stato erroneamente classificato non nel suo specifico pattern. • True Positive (TP): è la probabilità che un pattern sia stato correttamente classificato come appartenente ad uno specifico pattern. • True Negative (TN): è la probabilità che un pattern sia stato correttamente classificato come non appartenente ad uno specifico pattern. Considerando una tabella di confusione come ad esempio quella del pattern F (Tabella 6.16); possiamo quindi collocare questi quattro parametri nel modo seguente: Tabella 6.16 Esempio di matrice di confusione Matrice di confusione pattern F F Non F TP FN F FP TN Non F Ora è possibile definire altri due importanti indici che indicano la bontà del classificatore: • Sensitività: è la probabilità che il test sia positivo dato che un determinato pattern possiede le caratteristiche di quella classe di appartenenza. 120 CAPITOLO 6 Processo di taratura della rete neurale artificiale Sensitivity = (TP / ( TP + FN))*100 • Specificità: è la probabilità che il test sia negativo dato che un determinato pattern non possiede le caratteristiche di quella classe di appartenenza. Specificity = (TN / (TN + FP))*100 Alla luce di queste considerazioni riportiamo, nella seguente tabella (Tabella 6.17), i valori di sensitività e specificità di tutti e quattro i pattern: Tabella 6.17 Sensitività e specificità Pattern F Pattern B Pattern L Pattern R Totale Sensitività 100% 45,45% 75% 100% 80,11% Specificità 94,44% 100% 83,33% 84,21% 90,50% Dall’osservazione dei dati ottenuti possiamo considerare il modello di classificatore efficiente e dire che è rappresentativo del comportamento della rete neurale biologica. Evidenziamo quindi come il modello appare corretto. La sensitività (accuratezza) media di astrazione del modello è dell’80,11%, mentre la specificità (precisione) è del 90,50%. L’unico pattern che presenta una percentuale di sensitività bassa è il “pattern B”, di seguito vedremo di spiegarne il motivo. 6.5 Analisi dei neuroni vincenti Analizzando i file generati dalla ITSOM è possibile andare a vedere quali sono i neuroni vincenti e stimare se vengano generate delle serie di neuroni vincenti tali da far presupporre che vi sia una correlazione logica dei pattern. Possiamo analizzare la serie dei neuroni vincenti in due modi: • orizzontalmente; 121 CAPITOLO 6 • Processo di taratura della rete neurale artificiale verticalmente. Orizzontalmente la sequenza indica i neuroni vincenti in quell’epoca, uno per campionamento. In questo modo si può osservare che alcuni neuroni, pur venendo puniti continuano a vincere. Verticalmente si osserva la serie temporale vera e propria, ed essa permette di capire se, nelle varie epoche, si crea una sequenza di neuroni vincenti che si ripete nel tempo. Controllando tali dati per ogni pattern inviato, si nota che i neuroni vincenti assumono effettivamente delle sequenze che si ripetono periodicamente e che caratterizzano l’informazione di quel determinato pattern. Abbiamo considerato sia l’intero secondo di registrazione (1000ms), sia i primi 400ms. Nelle prove relative agli intervalli da 400-800ms e 400-1000ms ciò non avviene, ad ulteriore conferma che il metodo degli z-score rileva ottimamente i dati presenti nella prima parte di segnale, ma risulta essere insufficiente nell’analizzare quella parte di segnale giudicata povera di informazione. L’analisi effettuata sui neuroni vincenti (Figura 6.10-6.11-6.12-6.13) mostra la presenza di una differenza funzionale nei segnali: deve per questo esistere una procedura in grado di individuare queste specificità; che sia uno z-score ben tarato, oppure un qualsiasi altro algoritmo. Un possibile algoritmo appare essere quello che ricerca la maggioranza dei neuroni vincenti in una serie di epoche. Infatti, spesso nelle configurazioni dei neuroni vincenti è sempre un medesimo neurone a vincere. Ad esempio, nella configurazione di rete che analizza l’intero segnale con i seguenti parametri: 12 neuroni sullo strato competitivo, un tasso di apprendimento dello 0,04 ed un numero di epoche pari a 10, compaiono particolari serie di neuroni vincenti. Riportiamo di seguito degli esempi di serie di neuroni relative agli specifici pattern. Queste serie di neuroni sono molto simili per ogni specifica direzione, ciò avvalora ulteriormente i risultati riportati nelle pagine precedenti e ci permette di trarre alcune considerazioni sul perché alcune direzioni non sono state classificate correttamente. 122 CAPITOLO 6 10 5 2 10 6 10 6 5 7 6 10 2 5 7 6 5 5 2 7 6 10 6 6 7 6 10 2 5 7 6 5 5 7 7 6 10 6 5 7 6 10 2 5 7 6 5 7 7 7 6 10 6 5 7 6 10 2 5 7 6 Processo di taratura della rete neurale artificiale 7 7 7 7 6 10 6 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 7 7 7 7 6 10 5 5 7 6 10 2 5 7 6 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 11 3 3 3 5 3 11 7 11 5 11 11 11 11 11 11 3 3 3 5 3 11 7 11 5 11 11 11 11 11 11 3 3 3 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 Fig 6.10 Serie di neuroni vincenti relative al “pattern B” 5 7 7 7 11 11 6 6 6 7 7 7 7 7 8 5 7 7 7 11 11 7 7 7 7 7 7 7 7 7 5 7 7 7 11 11 7 7 7 7 7 7 7 7 7 5 7 7 7 11 11 11 11 3 3 3 3 3 3 3 5 7 7 7 11 11 11 11 11 3 3 3 3 3 3 5 7 7 7 11 11 11 11 11 3 3 3 3 3 3 5 7 7 7 11 11 11 11 11 11 3 3 3 3 3 5 3 11 7 11 11 11 11 11 11 3 3 3 3 3 5 7 7 7 11 5 11 11 11 11 3 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 5 3 11 7 11 5 11 11 11 11 11 3 3 3 3 Fig 6.11 Serie di neuroni vincenti relative al “pattern F” 5 8 2 10 9 1 5 10 2 5 9 5 9 8 10 6 8 2 10 9 1 5 10 2 5 9 5 9 8 10 6 8 2 10 9 1 5 10 2 5 9 5 9 8 10 6 8 2 10 9 1 5 10 2 7 9 5 9 8 10 7 8 2 10 9 1 5 10 2 7 9 7 9 8 10 6 8 2 10 9 1 5 10 2 7 9 7 9 8 10 7 8 2 10 9 1 5 10 2 7 9 7 9 8 10 7 8 2 10 9 1 5 10 2 7 9 7 7 8 10 7 8 2 10 9 1 5 10 2 7 9 7 7 8 10 7 8 2 10 9 1 5 10 2 7 9 7 7 8 10 7 8 2 10 9 1 5 10 2 7 9 7 7 7 10 7 8 2 10 9 1 5 10 2 7 9 7 7 7 10 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 7 7 2 10 9 1 5 10 2 7 9 7 7 7 10 Fig 6.12 Serie di neuroni vincenti relative al “pattern R” 123 CAPITOLO 6 1 7 7 7 5 7 0 8 6 5 8 0 1 0 0 1 8 7 7 5 7 0 8 6 5 8 0 1 0 0 1 7 7 5 5 7 0 8 6 5 8 0 1 0 0 1 5 5 5 5 7 0 8 6 5 8 0 1 0 0 Processo di taratura della rete neurale artificiale 1 5 5 5 5 7 0 8 6 5 8 0 1 0 0 1 5 5 5 5 7 0 8 6 5 8 0 1 0 0 1 5 5 5 5 7 0 8 6 5 8 0 1 0 0 1 6 6 5 5 7 0 8 6 5 8 0 1 0 0 1 5 5 5 5 7 0 8 6 5 8 0 1 0 0 1 5 5 5 5 7 0 8 6 5 8 0 1 0 0 1 6 5 5 5 7 0 8 6 5 8 0 7 0 0 1 5 5 5 5 7 0 8 7 5 8 0 7 0 0 1 5 6 5 5 7 0 8 6 5 8 0 7 0 0 1 6 5 5 6 7 0 8 7 5 8 0 7 0 0 1 6 5 5 5 7 0 8 7 5 8 0 7 0 0 1 6 6 5 5 7 0 8 7 5 8 0 7 0 0 1 6 6 6 6 7 6 8 7 5 8 0 7 0 0 1 6 6 5 5 7 0 8 7 5 8 0 7 0 0 1 6 6 5 5 7 0 8 7 5 8 0 7 0 0 1 6 6 5 6 6 0 8 7 7 7 7 7 0 0 Fig 6.13 Serie di neuroni vincenti relative al “pattern L” All’interno delle matrici, in nero sono indicati i neuroni che tendono sempre a vincere qualsiasi sia il pattern fornito. In rosso sono indicate delle serie di neuroni che sono caratteristiche dei segnali di risposta ad uno specifico pattern, mentre in blu sono indicate serie di neuroni che compaiono in più pattern. Dall’osservazione delle serie di neuroni vincenti si nota che i neuroni 5, 6, 7, sono presenti in tutti e quattro i pattern anche se solamente nel caso del “pattern B” sono in numero considerevole (soprattutto per la serie di neuroni 6 indicata per questo motivo in rosso). Nel “pattern F” sono caratteristiche le serie di neuroni vincenti 11 e 3 tanto da essere perfettamente discriminato dagli altri. Questo spiega il perché la ITSOM, in queste condizioni, lo classifica correttamente con una percentuale del 40% (vedi tabella 6.6). Il “pattern R” è caratterizzato dalla serie di neuroni 9. In esso compaiono ciclicamente anche le serie di neuroni 10 e 2, ma che ritroviamo anche nel “pattern B”. L’ultimo pattern che rappresenta la direzione laterale sinistra è caratterizzato dalla serie di neuroni 0 e 1. Alla luce di queste osservazioni, possiamo spiegare il motivo per cui la maggior parte dei pattern laterali sono classificati come “pattern B”. Questi pattern contengono un considerevole numero di neuroni vincenti 5 e 7, tipiche di questo 124 CAPITOLO 6 Processo di taratura della rete neurale artificiale pattern. Probabilmente è per questo motivo che i tre segnali non classificati sono quelli provenienti da questi pattern. Si vede però chiaramente come sia spesso lo stesso neurone a vincere, nonostante la rete “punisca” il vincitore con un valore pari a quello del tasso di dimenticanza. In questo caso un algoritmo di conteggio proporzionale dei neuroni vincenti potrebbe riconoscere facilmente tutte e quattro le direzioni. In conclusione possiamo dire che i primi 400ms del segnale registrato sembrano essere quelli che più caratterizzano la risposta dei neuroni. Questo conferma ulteriormente quanto detto nel capitolo precedente. Abbiamo infatti visto nel processo di elaborazione dei segnali come a seguito della stimolazione, si generi una risposta variabile ad opera dei neuroni connessi al MEA, in funzione dello stimolo fornito. Questi stimoli generati dalla rete biologica non durano nel tempo, ma il sistema biologico una volta perturbato, tende a ripristinare un equilibrio. Questo equilibrio, in seguito alle osservazioni dei segnali rilevati, appare diverso dallo stato iniziale, poiché gli stimoli forniti al modello di memoria ricreato in vitro durante il processo di training (o apprendimento) determinano la modifica della dinamica della rete di neuroni. Alcuni percorsi specifici per lo stimolo fornito vengono modificati, e questo si ripercuote in una risposta da parte di tutta la rete di neuroni che si modifica durante il processo di training. In molti casi la rete biologica ha generato risposte coerenti con lo stimolo fornito, classificabili grazie all’impiego di una specifica rete neurale appositamente creata per classificare segnali in tempo reale. E’ importante notare che “pattern F” e “pattern B”, ossia i più riconosciuti dalla rete neurale, sono gli ultimi forniti alla rete biologica nella fase di addestramento, e questo potrebbe far pensare che le cellule li abbiano memorizzati meglio, prediligendo poi la loro scelta. Un'altra ipotesi potrebbe essere che i pattern da noi forniti per quanto riguarda le direzioni laterali, non siano in grado di determinare una risposta da parte della rete di neuroni, tale da essere considerata diversa dalla rete neurale artificiale. In tal caso andrebbero testati pattern di stimolazione diversi. 125 CAPITOLO 6 Processo di taratura della rete neurale artificiale I neuroni generati da cellule staminali neurali adulte reagiscono quindi in modo organizzato a stimoli simulati differenziati ed inoltre esiste la possibilità di identificare computazionalmente queste reazioni. Il passo successivo è stato quello di utilizzare la classificazione della rete per far muovere un attuatore robotico reale (non più virtuale), in grado di spostarsi nelle diverse direzioni. I risultati ottenuti in questo secondo esperimento confermano i miglioramenti riscontrati nel processo di taratura. 126 CONCLUSIONI CONCLUSIONI Il progetto di tesi ha riguardato lo studio della capacità di apprendimento dei neuroni derivati da cellule staminali neuronali e la sperimentazione di una tecnica non classica nella decodifica fine dei segnali. Per fare questo, è stata ricreata una configurazione neurale in vitro su un apposito supporto elettronico denominato MEA. La prima parte del lavoro è stata rivolta alla caratterizzazione dell’attività elettrofisiologica della popolazione di neuroni coltivata in vitro attraverso lo studio di proprietà statistiche. Questo ha richiesto l’utilizzo di algoritmi non contemplati dai classici strumenti software reperibili sul mercato. Per questo motivo durante il tirocinio è stato sviluppato e utilizzato un software specifico per indagare sulle proprietà di statistica avanzata dei segnali provenienti dai MEA. L'idea da cui si è partiti era quella di testare il protocollo neurale artificiale adattandolo ai neuroni naturali. Queste cellule sono state pertanto sottoposte ripetutamente a stimoli sensoriali simulati da pattern digitali e si è andati ad indagare sulla loro capacità di memorizzare questi stimoli e di organizzare una risposta coerente. Dal confronto delle proprietà ricavate dall’indagine statistica sul medesimo stimolo, si sono evidenziate alcune analogie, facendo pensare che il modello di memoria proposto possa effettivamente apprendere. Le analisi statistiche hanno però mostrato come la grande varietà delle risposte ottenute dalle diverse stimolazioni non permetta di ricavare proprietà standardizzate da questi segnali in modo da poter veicolare informazione. Per questo motivo si è deciso di operare attraverso l’impiego di tecniche computazionali neurali basate sull’apprendimento. La rete neurale che è stata utilizzata è un’ITSOM (Inductive Tracing Self Organizing Maps), tipologia di rete adatta per input strettamente non lineari e tempovarianti, caratteristiche che contraddistinguono i segnali che provengono dalla rete di neuroni dopo la stimolazione. 127 CONCLUSIONI La rete biologica è stata per questo connessa alla rete neurale artificiale, in modo che gli ingressi di quest’ultima coincidessero alle uscite della rete di neuroni. Essa, ricevendo questa codifica in input, ha cercato di interpretare il suo andamento dinamico andando a leggere la successione temporale delle ampiezze dei segnali rilevati. Funzionando come una scatola nera, la rete artificiale è riuscita così a decodificare l'informazione nascosta in questa sequenza utilizzando i valori in ampiezza dei voltaggi, rinormalizzandoli in modo da cogliere l'andamento temporale degli spike all'interno dei segnali. A seguito della fase di apprendimento della rete di neuroni, la rete neurale artificiale ha memorizzato i segnali in uscita e li ha correlati allo stimolo fornito. Nella fase successiva si sono nuovamente inviati gli stimoli direzionali e si è andati a verificare quanto la rete di neuroni avesse appreso controllando gli output della rete neurale artificiale. Conoscendo a priori quale fosse lo stimolo inviato si è potuta determinare la percentuale di stimoli appresi correttamente. La rete neurale artificiale con i parametri di default (tasso di apprendimento 0,03, numero di epoche 10 e numero di neuroni dello strato competitivo 20) ha classificato correttamente nel 32% dei casi. I risultati sono ben diversi se andiamo a valutare i singoli stimoli. Due su quattro non sono stati riconosciuti e gli altri due hanno raggiunto percentuali di riconoscimento dell’83,33% e 60%. Gli errori commessi nel esperimento svolto in tempo reale sono riconducibili principalmente a due fattori: • Effettivo errore di apprendimento della rete di neuroni; • Mancanza di una taratura su dati reali della rete di neuroni e quindi scarse prestazioni. Poiché l’interesse è quello di verificare quanto la rete di neuroni apprenda e di decodificare il segnale nella maniera più corretta possibile, si è andati a tarare la rete neurale off-line. Il processo di taratura è stato possibile grazie alla registrazione dei segnali in uscita dalla rete di neuroni dell’esperimento in tempo reale. 128 CONCLUSIONI La taratura ha coinvolto la modifica di alcuni parametri fondamentali come: numero di campioni su cui lavorare, tasso d’apprendimento, numero di epoche, numero di neuroni dello strato competitivo. La scelta dell’intervallo temporale più informativo da inviare alla rete (quindi del numero di campioni) coincide con un aumento della classificazione poiché i segnali risultano più discriminati. Dai test statistici effettuati e dalle prove di modifica della porzione di segnale inviata alla rete si è evidenziato come la risposta della rete di neuroni agli stimoli forniti si perpetui non oltre i primi 400ms. Nell’esperimento effettuato in tempo reale considerando 1000ms si è “appiattita” invece l’informazione contenuta nel segnale. La modifica dei parametri come tasso di apprendimento, numero di epoche, numero di neuroni dello strato competitivo ha comportato un aumento delle prestazioni del sistema. La rete con tasso di apprendimento 0,1, numero di epoche 50 e numero di neuroni dello strato competitivo 12 ha ottenuto una percentuale massima di classificazione nelle quattro direzioni del 60%. Tuttavia, gli stimoli vengono appresi con percentuali diverse, rispettivamente 80%, 83,33%, 42,86%, 42,86%. La valutazione del modello proposto presenta un valore di sensitività (accuratezza) media di astrazione del modello dell’80,11% e di specificità (precisione) del 90,50%. Questo miglioramento sta ad indicare come il processo di taratura e soprattutto la scelta dell’intervallo da utilizzare per addestrare la rete neurale artificiale, abbiano aumentato le prestazioni in classificazione e confermato che la rete di neuroni effettivamente apprende. Nonostante siamo ancora lontani da un riconoscimento del 100%, l’impiego di questi nuovi parametri nell’esperimento successivo ha apportato ulteriori miglioramenti nel riconoscimento degli stimoli. Si è visto, analizzando i parametri della rete artificiale durante l’esperimento, che un differente algoritmo per il conteggio dei neuroni vincenti permetterebbe di classificare correttamente tutti i segnali. E’ inoltre interessante rilevare come alle prestazioni dopo la taratura off-line della rete artificiale con i segnali del primo esperimento siano corrisposte uguali 129 CONCLUSIONI prestazioni di apprendimento nel secondo esperimento con i nuovi segnali. Ciò dimostra che il comportamento dei neuroni si mantiene stabile rispetto al sistema di elaborazione sviluppato; anche cambiando popolazione di neuroni la capacità di apprendimento dei neuroni biologici è funzione delle prestazioni della rete neurale artificiale utilizzata. I neuroni si comportano quindi in modo ripetitivo e prevedibile. In questo secondo esperimento, il sistema è stato per la prima volta connesso ad un attuatore robot reale che si è mosso riconoscendo gli stimoli forniti dalla rete di neuroni. Ulteriori sviluppi e miglioramenti al sistema sono ancora possibili, modificando l’apparecchiatura hardware e le parti software che gestiscono il sistema (stimoli e algoritmo della rete neurale). Possiamo concludere che la rete di neuroni ha ricevuto informazioni diverse ed è stata in grado di memorizzarle tutte nella sua struttura complessiva e di recuperarle poi ad una ad una quando opportunamente stimolata. Il modello neurale artificiale che giustifica questa affermazione è formalizzato matematicamente, ma i risultati raggiunti dagli esperimenti sembrano affermare che tale modello è corretto anche per le reti neurali naturali. 130 BIBLIOGRAFIA [Akin94] Akin, T., Najafi, K., Smoke, R.H. and Bradley, R.M., 1994. A micromachined silicon electrode for nerve regeneration applications. IEEE Trans Biomed Eng 41, 305-313 [Bels02] Bels, B. and Fromherz, P., 2002. Transistor array with an organotypic brain slice: field potential records and synaptic currents. European Journal of Neuroscience 15, 999-1005. [Bendat71] Bendat, J. S., Piersol, A. G., 1971. Random Data: Analysis and Measurements Procedures, Wiley-Interscience, Nueva York. [Bracewell86] Bracewell, R., 1986. The fourier transform and its applications. Singapore: Mcgraw - Hill Book Co. [Breckenridge95] Breckenridge, L.J., Wilson, R.J.A., Connolly, P., Curtis, A.S.G., Dow, J.A.T., Blackshaw, S.E. and Wilkinson, C.D.W., 1995. Advantages of using microfabricated extracellular electrodes for in vitro neuronal recording. J Neuroscience Research 42 ,266- 276. [Bonifazi02] Bonifazi, P. and Fromherz, P., 2002. Silicon Chip for Electronic communication between nerve cells by non-invasive interfacing and analog-digital processing. Advanced Material 17. 131 BIBLIOGRAFIA [Borkholder97] Borkholder, D.A., Bao, J., Maluf, N.I., Perl, E.R. and Kovacs, G.T., 1997. Microelectrode arrays for stimulation of neural slice preparations. J. Neuroscience Methods 7, 61- 66. [Bove96] Bove, M., Martinoia, S., Grattarola, M. and Ricci, D., 1996. The neuron-transistor junction: Linking equivalent electric circuit models to microscopic descriptions. Thin Solid Films 285 ,772-775. [Canepari97] Canepari, M., Bove, M., Mueda, E., Cappello, M., Kawana, A., 1997. Experimental analysis of neural dynamics in cultured cortical networks and transitions between different patterns of activity. Biological Cybernetics 77 ,153-162. [Cole49] Cole, K. S., 1949. Dynamic electrical characteristics of the squid axon membrane. Arch. Sci. Physiol. 3:253-258. [Egert88] Egert, U., Schlosshauer, B., Fennrich, S., Nisch, W., Fejtl, M., Knott, T., Müller, T. and Hammerle H., 1988. A novel organotypic long-term culture of the rat hippocampus on substrate integrated microelectrode arrays. Brain Resource Protoc 2 , 229-242. [Fromherz91] Fromherz, P., Offenhäusser, A., Vetter, T., Weis, J., 1991. A Neuron-Silicon-Junction: A Retzius-Cell of the Leech on an Insulated-Gate FieldEffect Transistor. Science 252, 1290-1293. 132 BIBLIOGRAFIA [Fromherz93] Fromherz, P., Muller, C. O., Weis, R., 1993. Neuron-Transistor: electrical transfer function measured by the Patch-Clamp technique. Phys. Rev. Lett. 71, 4079-4082. [Fromherz02] Fromherz, P., 2002. Electrical Interfacing of Nerve Cells and Semiconductor chips. Chemphyschem, vol 3, pp. 276-284. [Fromherz03] Fromherz, P., 2003. Neuroelectronic interfacing: semiconductor chip with ion channels, nerve cells, and brain. Martinsried, Germany. [Galli03] Galli, R., Gritti, A., Bonfanti, L., Vescovi A.L., 2003 Apr 4. Neural stem cells: an overview. Circ Res.;92(6):598-608. Review. [Garcia03] Garcia, P.S., Calabrese, R.L., DeWeerth, S.P., Ditto, W. , 2003. Simple Arithmetic with Firing Rate Encoding in Leech Neurons: Simulation and Experiment. Proceedings of the XXVI Australasian computer science conference 16, Adelaide, 55 – 60. [Gibson93] Gibson, J.D., 1993. Principles of Digital and Analog Communications. Macmillan, second edition. 133 BIBLIOGRAFIA [Gritti01] Gritti, A., Galli, R., Vescovi, A.L., 2001. Culture of stem cell of central nervous system, Federoff ed., Humana Press III edition pag. 173-197. [Haken91] Haken, H., 1991. Synergetic computers and cognition (A top-down approach to neural nets). Springer. [Haykin94] Haykin, S., 1994. Neural networks (A comprehensive foundation). MacMillan Coll. Pub. [Hebb49] Hebb, D.O., 1949. The Organization of Behavior. New York, Wiley. [Hodgkin39] Hodgkin, A., Huxley, H.,1939. Electrical signal of nervous activity. Philadelphia: Univ. Pennsylvania Press [Hopfield84] Hopfield, J.J., 1984. Neural Networks and Physical Systems with Emergent Collective Computational Abilities. Proc. Nat. Acad. Sci US, 81. [Jenkner97] Jenkner, M. and Fromherz, P., 1997. Bistability of membrane conductance in cell adhesion observed in a neuron transistor. Phys Rev Lett 79, 4705-4708. 134 BIBLIOGRAFIA [Jimbo00] Jimbo, Y. and Robinson, H.P.C., 2000. Propagation of spontaneous synchronized activity in cortical slice cultures recorded by planar electrode arrays. Bioelectrochemistry 5 ,107-115. [Kandel03] Kandel, E., Schwartz, J., Jessell, T., 2003. Principi di Neuroscienze. CEA, Edizione 2003 [Kohonen90] Kohonen, T., 1990. Self-organisation and association memory. Springer Verlag. [Kohonen97] Kohonen, T., 1997. Self-organizing maps. Springer, Berlin. [Konorski48] Konorski, J., 1948. Conditioned reflexes and neuron organization. Cambridge: Cambridge Univ.Press. [Lindner96] Lindner, J.F., and Ditto, W., 1996. Exploring the nonlinear dynamics of a physiologically viable model neuron. AIP Conf. Proc. 1, 375-385. [Luise99] Luise, M., Vitetta, G. M., 1999. Teoria dei Segnali, Mc Graw-Hill, Milano. 135 BIBLIOGRAFIA [Maher99] Maher, M.P., Pine, J., Wright, J. and Tai, Y.C., 1999. The neurochip: a new multielectrode device for stimulating and recording from cultured neurons. Neuroscience Methods 87,45-56. [McClelland86] McClelland, J. D., Rumelhart, D. E., 1986. Parallel Distributed Processing. Explorations in the Microstructure of Cognition. 2 voll. Cambridge Mass., MIT Press, (eds.). [Nicholls92] Nicholls, J., Martin, A., Wallace, B., 1992. From Neuron to Brain: A cellular and Molecular Approach to the Function of the Nervous System, 3rd ed. Sunderland, MA: Sinauer. [Pagano00] Pagano, M., 2000. Segnali analogici nel dominio trasformato : dalla Trasformata di Fourier all'analisi wavelet. Pisa: ETS. [Papoulis73] Papoulis, A., 1973. Probabilità, variabili aleatorie e processi stocastici, Boringheri, Torino. [Parisi90] Parisi, D., 1990. Connessionismo: origine e sviluppo al centro dello studio dell’intelligenza. Sistemi intelligenti, vol.2 pag. 364-426. 136 BIBLIOGRAFIA [Perry96] Perry, V., 1996. Microglia in the developing and mature central nervous system. In KR Jessen,WD Richardson (eds.) Glia cell development: basic principles & clinical relevance, pp.123-140 Oxford: Bios, [Pine99] Pine, J., 1999. Cultured neural networks: Multielectrode arrays for stimulating and recording hippocampal neurons. California Institute of Technology. [Pizzi02a] Pizzi, R., 2002. Sistemi dinamici e autorganizzanti. Università Statale di Milano, Polo Didattico e di Ricerca di Crema - Note del Polo. [Pizzi02b] Pizzi, R., de Curtis, M., Dickson , C., 2002. Evidence of Chaotic Attractors in Cortical Fast Oscillations Tested by an Artificial Neural Network. In: J. Kacprzyk (Eds.), Advances in Soft Computing. Physica Verlag. [Potter01] Potter, S.M., 2001. Distributed processing in cultured neuronal networks. In: Nicolelis (Ed.), Progress in Brain Research, M.A.L. Elsevier Science B.V . [Ramon y Cajal37] Ramon y Cajal, S., 1937. 1852-1937. Recollections of my life. EH Craigie (Transl.) Philadelphia: American Philosophical society;1989.Reprint.Canbridge, MA:MIT Press. 137 BIBLIOGRAFIA [Reger00] Reger, B., Fleming, K.M., Sanguineti, V., Simon Alford, S., Mussa-Ivaldi, F.A., 2000. Connecting Brains to Robots: The Development of a Hybrid System for the Study of Learning in Neural Tissues. Artificia Life VII, Portland, Oregon. [Ritter86] Ritter, H., Schulten, K., 1986. On the Stationary State of Kohonen’s Self-Organizing Sensory Mapping. Biological Cybernetics 54, 99-106. [Ritter88] Ritter, H., Schulten, K., 1988. Convergence properties of Kohonen’s Topology Conserving Maps : Fluctuations, Stability, and Dimension Selection. Biological Cybernetics 60, 59-71. [Sarwate80] Sarwate, D. V. and Pursley, M. B., 1980. Crosscorrelation Properties of Pseudorandom and Related Secuences, Proc. IEEE, Vol. 68. [Schatzthauer98] Schatzthauer, R. and Fromherz, P., 1998. Neuron-silicon junction with voltage gated ionic currents. European Journal of Neuroscience 10 ,1956-1962. [Schwartz90] Schwartz, M. , 1990 Information Transmission, Modulation, and Noise, McGraw-Hill Book Co., Nueva York. 138 BIBLIOGRAFIA [Shanmugan79] Shanmugan, K. S., 1979. Digital and Analog Communication, John Wiley and Sons, Nueva York. [Tank89] Tank, D.W. and Hopfield, J.J. , l989. Neural architecture and biophysics for sequence recognition in Neural Models of Plasticity. Academic Press. [Vescovi99] Vescovi, A.L., Gritti, A., Galli, R., Parati, E., 1999 Aug. Isolation and intracerebral grafting of nontransformed multipotential embryonic human CNS stem cells. J Neurotrauma; 16(8):689-93. [Wilson94] Wilson, R.J., Breckenridge, L., Blackshaw, S.E., Connolly, P., Dow, J.A.T., Curtis, A.S.G., and Wilkinson, C.D.W., 1994. Simultaneous multisite recordings and stimulation of single isolated leech neurons using planar extracellular electrode arrays. Neuroscience Methods 53 ,101-110. [Zeck01] Zeck, G. and Fromherz, P., 2001. Noninvasive neuroelectronic interfacing with synaptically connected snail neurons on a semiconductor chip. Proceedings of the National Academy of Sciences 98 ,10457-10462. [Ziemer83] Ziemer, R.E., Tranter, W. H. and Fannin, D.R., 1983. Signals and Systems, Macmillan Publishing Company, Nueva York. 139 BIBLIOGRAFIA [Ziemer85] Ziemer, R.E. and Peterson, R.L., 1985. Digital Communication and Spread Spectrum Systems, Macmillan Publishing Company, Nueva York. 140 RINGRAZIMENTI Siamo alla fine ed è giunto il momento di ringraziare le persone che hanno reso possibile questo giorno... ...tutti i prof. incontrati in questi diciotto anni passati sui libri e che regalandomi un po’ del loro sapere, mi hanno reso ciò che sono. Un particolare ringraziamento alla prof.ssa Pizzi che con la sua pazienza, i suoi suggerimenti e le sue correzioni ha reso possibile la stesura di questa tesi e al dott. Cino per l’indispensabile contributo al progetto, a tutto il gruppo LIVING NETWORKS LAB: Alberto, Andrea, Daniela, Danilo, Fabio, Roberto, Ruggero e alla prof.ssa Galli che ci a sempre accolto nel suo ufficio e ci ha sempre ascoltato... ...tutti i compagni vecchi e nuovi, per tutti i ricordi che mi hanno regalato in questi bellissimi anni, per gli aiuti e i momenti di non solo studio... ...ai miei genitori a cui va la mia stima e con cui voglio condividere la felicità di questo giorno...e a mio fratello che di strada ne deve fare ancora tanta ma di sicuro non se né pentirà... ...ai miei amici, a tutte le serate passate insieme attenuando i pensieri degli esami e i momenti di sconforto tra una birretta e una canzone (non vi cito tutti ma ci siete!)...in particolare tutti gli amici del Dada pub... ...ad Omar per tutto l’aiuto che mi ha fornito in questi anni senza chiedermi una lira/euro...vi assicuro sarebbe milionario... ...a chi mi ha dato l’opportunità di lavorare e continuare a studiare in questi anni e a tutte le persone che hanno lavorato con me: Impresa edile CORA, Pizzeria Trevi, Pizzeria la Svolta, Tende da sole Scotti Antonio...(un po’ di pubblicità non fa mai male)... ...a quest’anno che di cose belle me ne ha regalate tante2, forse non sarà sempre così, ma almeno per oggi lo devo dire: “Sono felice”... ...ai tre moschettieri...che questo giorno non sia per noi un addio ma un arrivederci. Anche se d’ora in poi non saremo più compagni spero rimarremo sempre ciò che siamo: amici...Gigi (Patagio), Rosso (due di picco)... ...a D’Artagnan (Bolzo) e se qualcuno lo vede gli dica che lo stiamo aspettando al bar... Vostro fedele compagno Mit