- GRID L'evoluzione della Rete Soluzioni alternative del prossimo futuro. Il Grid Computing come proposta di applicazione di Utility Computing. 12 – apr – 2006 Matteo Mangini email: [email protected] Sommario • Network Integration & Solutions – L’azienda • La tecnologia GRID • Il progetto di rete GRID pilota • Gli applicativi pilota • Conclusioni 12 – apr – 2006 Network Integrations and Solutions 12 – apr – 2006 Network Integration & Solutions 12 – apr – 2006 Network Integration & Solutions NIS è nata nel 1993 da un gruppo di professionisti dell’IT con esperienza in diversi campi dell’industria e della ricerca accademica. Durante gli anni abbiamo prestato particolare attenzione a formare un team di professionisti che avessero capacità di unire le proprie competenze in diversi settori. E’ grazie a questo alto livello di esperienza raggiunto dal nostro staff che oggi possiamo offrire ai nostri clienti organizzati ed autonomi team di lavoro capaci di integrarsi nelle realtà lavorative dei clienti e caratterizzati da un bilanciato compromesso fra innovazione e affidabilità e fra creatività e soluzioni realistiche. 12 – apr – 2006 Network Integration & Solutions 12 – apr – 2006 Network Integration & Solutions NIS fornisce soluzioni competitive for il design, lo sviluppo e la fornitura di servizi di rete e applicazioni per il businness, la pubblica amministrazione e gli utenti finali nelle seguenti aree: Telecomunicazioni Industria Finance Servizi Come system integrator abbiamo sviluppato specifiche esperienze nei seguenti settori dell’industria: Network Design System Integration and Administration Installation, Designing and Administration of Databases Programming Technologies 12 – apr – 2006 Network Integration & Solutions Sempre aggiornati per mantenere competitività 12 – apr – 2006 Network Integration & Solutions NIS è partner di: 12 – apr – 2006 Sommario • Network Integration & Solutions – L’azienda • La tecnologia GRID • Il progetto di rete GRID pilota • Gli applicativi pilota • Conclusioni 12 – apr – 2006 La tecnologia GRID 12 – apr – 2006 L’importanza della tecnologia GRID In un ambiente industriale e scientifico in fase di profonda evoluzione tecnologica, le aziende devono reagire per non restare escluse dal processo di innovazione ma diventare più competitive sul mercato. Come? Utilizzando una tecnologia d’avanguardia che sfrutti le risorse a disposizione e limiti al tempo stesso gli investimenti Grid Grid Grid Grid Grid Grid Grid 12 – apr – 2006 Grid Grid L’importanza della tecnologia GRID Perché? Per esplorare le particelle fondamentali e le interazioni fra di esse, i Fisici produrranno presto circa 10 Petabytes di dati all’anno (circa 20 milioni di CD). Questi dati preserveranno il risultato di collisioni fra praticelle fondamentali ad alta energia. Migliaia di fisici in dozzine di università sparse per il mondo vorranno analizzare questi dati. Gli studiosi della Terra tengono traccia del livello di ozono nell’atmosfera attraverso osservazioni da satellite. Unicamente per questo scopo essi scaricano dallo spazio verso la Terra circa 100 Gigabytes di immagini al giorno (l’equivalente di 150 CD). Scoprire i segreti del genoma umano sarebbe impossibile senza l’analisi computerizzata di massive quantità di dati, incluse le sequenze di 3 miliardi di unità chimiche che compongono il nostro DNA. 12 – apr – 2006 L’importanza della tecnologia GRID Forti investimenti da parte di: 1. Comunità europea: • • 50 milioni di Euro stanziati per 20 progetti grid nell’ambito del V Programma Quadro 300 milioni di Euro stanziati per il progetto europeo EGEE nell’ambito del VI Programma Quadro 2. Produttori di tecnologie IT (IBM, HP, Sun Microsystem, Oracle…): • • attivazione specifici programmi sulle GRID sviluppo prodotti commerciali GRID compatibili (ex: Oracle 10g, IBM WebSphere, etc…) 3. Aziende private: • 12 – apr – 2006 realizzazione di GRID interne all’azienda per ottimizzare le risorse disponibili e attivare politiche di co-progettazione Tecnologia GRID – Le origini Distributed computing Al giorno d’oggi, ogni volta che si presenta un problema dovuto ad una carenza di potenza di calcolo, la soluzione è unire insieme le risorse sia che si tratti di un’azienda o di un’istituzione accademica. La rete di computer è quindi usata come una singola, unificata risorsa. Questa soluzione è chiamata “calcolo distribuito", e questo termine si riferisce ad ogni sistema in cui molti computer risolvo un problema lavorando insieme. Il Grid computing è, in un certo senso, una specie di calcolo distribuito. 12 – apr – 2006 Tecnologia GRID – Le origini Metacomputing Metacomputing è un termine che fu coniato per un particolare tipo di calcolo distribuito, molto popolare nei primi anni novanta, che implicava l’unione di centri di supercomputer attraverso quelle che erano, ai tempi, reti ad alta velocità. 12 – apr – 2006 Tecnologia GRID – Le origini Cluster Computing Molti anni fa, alla fine del secolo scorso, gli scienziati misero insieme alcuni PC e li fecero comunicare: nacque Beowulf. Questi scienziati stavano cercando di affrontare il problema della crescita di costosi mainframe o supercomputer. Il successo andò ben al di là dei loro sogni: molte società oggi offrono cluster di PC come soluzioni standard per far fronte alla complesse problematiche di HA. I cluster possono avere dimensioni differenti. Uno dei maggiori vantaggi di questo approccio è la scalabilità: un cluster può crescere semplicemente aggiungendo PC ad esso, nonostante esistano dei limiti “fisiologici”. 12 – apr – 2006 Tecnologia GRID – Le origini Peer to Peer computing 12 – apr – 2006 Probabilmente avrete sentito parlare di "Napster', il sito web che consentiva ai fans di condividere e scambiare files musicali attraverso la rete da un punto all’altro del mondo. Scaricando un pezzo di software sul proprio PC, era possibile connettersi ad una rete di altri utenti che avevano a disposizione lo stesso software. Gli utenti non dovevano fare altro che specificare quale porzione del proprio disco condividere pubblicamente e potevano accedere alle risorse messe a disposizione dagli altri utenti. In questo modo i computer possono condividere files ed altre generiche risorse direttamente, senza passare attraverso un server centrale. Tecnologia GRID – Le origini Internet computing Avrete sentito parlare di SETI@home. Sviluppato dalla University of California - Berkeley, SETI@home è un "supercomputer" virtuale che analizza i dati del radio telescopio di Arecibo in Porto Rico, alla ricerca di segnali vi vita extraterrestre. Utilizzando Internet, SETI unisce insieme la potenza di calcolo di oltre 3 milioni di personal computer in tutto il mondo ed ha già utilizzato l’equivalente di oltre 600.000 anni di “PC processing power”! 12 – apr – 2006 Tecnologia GRID – Le origini Internet computing – The SETI@home project SETI@home è un programma screen-saver che ogni utente può scaricare dal Web e funziona senza impattare il normale utilizzo del computer. I vari PC (i nodi di questa “Grid”) lavorano contemporaneamente su diverse parti del problema, recuperando “pezzi” di dati da Internet, elaborandoli e restiruendo quindi i risultati ad un sistema centrale per il post-processing. Il successo di SETI ha ispirato molte altre “@home applications”. 12 – apr – 2006 SETI@home è anche un esempio del concetto di "cycle scavenging". Il termine significa che è possibile sfruttare il tempo libero su computer che non sono direttamente controllati. Tecnologia GRID – L’evoluzione La realtà, per il momento, è che non esiste una singola “GRID” (così come invece esiste una singola "Internet" ed un singolo "Web"). Esistono molte GRID in evoluzione continua, alcune private, alcune pubbliche, alcune dentro un’azienda, dentro una regione, altre di dimensioni globali. Alcune dedicate a particolari problemi scientifici, alcune orientate al business, altre a carattere più generale. 12 – apr – 2006 Tecnologia GRID – L’evoluzione National Grids L’idea dietro una Grid “nazionale” è accoppiare risorse fra nazioni Private Grids Le Grid privatePrivate Grids possono essere utili in molte istituzioni (ospedali, corporazioni, etc). Sono caratterizzate da una scala relativamente piccola e obiettivi comuni, spesso allo scopo di integrare tecnologie a basso costo.Soluzioni commerciali in tal senso sono già disponibili Project Grids Le GRID di progetto sono create per incontrare le esigenze di istituti, gruppi di ricerca, team virtuali con scopi prevalentemente scientifici 12 – apr – 2006 Tecnologia GRID – L’evoluzione Goodwill Grids Queste GRID sono per chiunque possiede un computer a casa e vuole “donare” parte delle proprie risorse per una buona causa Peer-to-peer Grids La tecnologia peer-to-peer consente agli utenti di condividere dati fra di loro, senza il necessario appoggio di un server centrale (anche se…) Consumer Grids In questo caso le risorse sono condivise su base commerciale, a differenza delle Goodwill Grid. Compagnie ed organizzazioni varie affittano risorse e vengono pagate per questo servizio 12 – apr – 2006 Tecnologia GRID – L’evoluzione In confronto al “sogno GRID”, queste GRID hanno capacità molto ristrette, per il momento, ma stanno via via crescendo verso soluzioni più sofisticate. A lungo termine si prefigura uno scenario in cui le capacità di calcolo e di storage di milioni di sistemi, attraverso la rete globale, funzioneranno come un unico team, utilizzabile pressochè da chiunque ne avrà bisogno. 12 – apr – 2006 Tecnologia GRID – Cos’è? Così come il Web è uno strumento per condividere informazioni attraverso Internet, GRID è uno strumento per condividere risorse di calcolo e risorse di storage attraverso Internet. Simulare un enorme computer virtuale che, in maniera intelligente, metta a disposizione le proprie risorse partendo da sistemi eterogenei connessi tra loro. Businness On Demand Le imprese hanno a disposizione ON DEMAND tutta la potenza necessaria ad un costo precedentemente inaccessibile. 12 – apr – 2006 Tecnologia GRID – Cos’è? Esistono due principali filoni della tecnologia GRID su cui il mondo scientifico sta focalizzando i propri sforzi: Computational GRID Data GRID 12 – apr – 2006 Tecnologia GRID – Computational GRID Siamo nel campo di applicazioni di calcolo ad elevate prestazioni, l’utente necessita di più “teraflops“ possibili: progettazione e testing, processi batch, computer grafica, modelli statistici, previsioni meteo, etc… Spesso questo tipo di applicazioni può trarre beneficio dalla tecnologia GRID combinando ampie e differenti tipologie di risorse computazionali per affrontare problemi che non potrebbero essere risolti su di un singolo sistema, o almeno per farlo nella maniera più veloce possibile. 12 – apr – 2006 Tecnologia GRID – Data GRID Linux file system Windows file system Unix file system Other file system Siamo nel campo di applicazioni “dataintensive”. Nei prossimi anni enormi quantità di dati scientifici e non giungeranno da differenti siti del pianeta: non solo esperimenti astrofisici, ma anche dati provenienti dalle più svariate applicazioni in ambito scientifico ed industriale. La tecnologia Grid consente di memorizzare, organizzare ed analizzare dati mantenendoli in repository, librerie digitali, database geograficamente distribuiti. 12 – apr – 2006 Tecnologia GRID – Elementi innovativi (1) 1. Gestione delle risorse di rete sotto utilizzate: • macchine desktop sfruttate meno del 5% • macchine server con picchi di inattività Miglior bilanciamento delle risorse disponibili 12 – apr – 2006 Tecnologia GRID – Elementi innovativi (2) 2. Risorse virtuali: condivisione di risorse (cpu, file system, sw, servizi, licenze, dispositivi remoti, larghezza di banda,…) tra sistemi eterogenei attraverso standard precisi 3. Calcolo parallelo e distribuito: • possibilità di eseguire sotto-processi su risorse differenti • gestione di applicazioni e servizi distribuiti Migliore gestione delle risorse 12 – apr – 2006 Tecnologia GRID – Elementi innovativi (3) 4. Affidabilità: per aumentare l’affidabilità è spesso necessaria una duplicazione dei componenti: l’hardware risulta molto costoso. in un sistema Grid ben organizzato questo problema non sussiste: se un componente della rete fallisce, le altre parti sono in grado di sopperire. 5. Sicurezza: autenticazione a chiave pubblica e chiave privata, certificati digitali e single sign-on consentono uno scambio sicuro di informazioni sensibili tra gli utenti dell’Organizzazione Virtuale (VO). Ogni applicazione gestita dalla Grid ha a disposizione questi strumenti 12 – apr – 2006 Architetture GRID e architetture esistenti Elemento critico Stato dell’arte Innovazione Utilizzo CPU remote Solo su reti aziendali e mediante assegnazione puntuale di una risorsa. Richiesta identificativi sistema ospitante. Accesso garantito ad ogni nodo della rete GRID. L’utente ignora quale processore sia messo a disposizione per l’esecuzione di un determinato job Data sharing Possibile su architetture dedicate (SAN - Storage Area Network) o su dispositivi di rete (NAS – Network Attached Storage) Accesso trasparente a sistemi di storage della GRID. L’utente non deve comperare uno spazio prefissato ma lo richiede a seconda della necessità. Larghezza di banda La larghezza di banda utilizzata è determinata in modo statico con l’ISP. Non viene modificata in modo dinamico. L’infrastruttura GRID è in grado di utilizzare l’instradamento più efficace per un determinato job, in maniera trasparente all’utente. Co-progettazione interaziendale Possibile solo su architetture dedicate e condivise tra una o più aziende. Scarsa flessibilità. Elevati costi e rischi di errori progettuali. La GRID consente di lavorare in maniera trasparente sulle stesse risorse e condividere licenze SW. Clusterizzazione tra nodi non omogenei E’ possibile una clusterizzazione tra nodi non omogenei, ma al solo fine di condividere dati e non per coprocessing. Le reti GRID, per definizione, sono cluster composti da nodi non omogenei, che possono cooperare tra di loro. Virtualizzazione di risorse non omogenee Possibile parzialmente solo per dispositivi di storage. Le GRID rendono virtuali CPU e storage anche se composte da elementi tra loro eterogenei. 12 – apr – 2006 Tecnologia GRID – Stato dell’arte Le infrastrutture Grid sono ottenibili attraverso la progettazione, l’installazione e la configurazione di appositi strati software (middleware) o specifici applicativi messi a disposizione dai principali leader dell’IT a livello mondiale. 12 – apr – 2006 Tecnologia GRID – Stato dell’arte Prodotti commerciali Computational Grid: LSF, PBS, Datasynapse DataGrid: Avaki Prodotti freeware: Computational Grid: Globus, Condor, openPBS DataGrid: SRB, Alien 12 – apr – 2006 Tecnologia GRID – Accesso ai servzi Soluzione 1 (Grid client) Un’azienda può accedere ai servizi forniti da un Grid Service Provider senza implementare una soluzione in casa. User http Browser 12 – apr – 2006 Portale Grid Service Provider Tecnologia GRID – Accesso ai servzi Soluzione 2 (Grid node) Implementazione di un proprio nodo Grid A seconda della tipologia di servizio richiesta: •Computational grid •Data grid 12 – apr – 2006 Architettura di un nodo 12 – apr – 2006 Sommario • Network Integration & Solutions – L’azienda • La tecnologia GRID • Il progetto di rete GRID pilota • Gli applicativi pilota • Conclusioni 12 – apr – 2006 Il progetto di rete GRID pilota 12 – apr – 2006 Architetture GRID Sono state implementate tre differenti architetture: Grid Globus Ambiente destinato a diventare lo standard de facto della tecnologia Grid. Un’architettura in grado di contenere differenti tipologie di servizio in un’unica soluzione completamente integrata. Soluzione opensource. Grid LSF Architettura per il calcolo distribuito e parallelo orientata all’erogazione di servizi verso soggetti che necessitano di aumentare la potenza di calcolo aziendale. Soluzione commerciale. 12 – apr – 2006 Grid SRB Architettura per la virtualizzazione dello storage. Consente un accesso uniforme e indipendente dalla piattaforma alle risorse presenti su differenti supporti fisici. Orientata in particolar modo a realtà aziendali che necessitano di una gestione complessa e geografica dei dati. Soluzione open-source. GRID - Globus 12 – apr – 2006 Middleware Grid - Globus Globus – Lo standard Perchè Globus? Software open source Standard de facto per la costruzione di una infrastruttura Grid Ideato dai “padri” del concetto di Grid: Foster e Kesselman Basato interamente su tecnologie standard: Java, XML, WSDL, SOAP, HTTP, X509 GT4 è un middleware multipiattaforma e portabile. 12 – apr – 2006 Middleware Grid - Globus Globus – Lo standard Infrastruttura del middleware Globus ha una struttura a “pillard” Resource Management Information Service Data Management Da Web Service a Grid Service. Grid Security Infrastructure 12 – apr – 2006 Middleware Grid - Globus Globus – Lo standard Sicurezza GSI (Grid Security Infrastructure) offre: autenticazione a chiave pubblica (PKI) certificati digitali (X.509 certificate) autenticazione singola (una volta all’inizio delle operazioni sulla Grid) delega delle credenziali (Proxy delegation) GSI è basato su tecnologia standard 12 – apr – 2006 Middleware Grid - Globus Globus – Lo standard GT 4.0 Linux RH9 Linux RH9 Linux RH9 SITE 1 100 Mbit LAN WAN SITE 2 GT 4.0 LAN 12 – apr – 2006 Linux RH9 Linux RH9 Linux RH7.3 100 Mbit Il GRID portal Gridsphere 12 – apr – 2006 Middleware Grid - Gridsphere Framework open-source che offre funzionalità ampie e un ambiente predisposto a colloquiare con un’infrastruttura Globus. 12 – apr – 2006 Open-source Sviluppato in accordo alle specifiche JSR168 e con l’ambiente di sviluppo IBM WebSphere Supporto e facile integrazione di portlet prodotte da “terze parti” Layout basato su una presentazione XML flessibile e facilmente customizzabile Supporto per il controllo e gestione dei ruoli di accesso al portale basato su RBAC (Role Based Access Control) Modello dei servizi portlet sofisticato che consente la creazione di servizi utente, dove i differenti servizi possono essere limitati a seconda dei diritti degli utenti Persistenza dei dati fornita utilizzando Hibernate per il supporto di database relazionali Core portlet includono funzionalità di base quali login, logout, controllo di accessi e gestione utenti Middleware Grid - Gridsphere Gridsphere – Il portale – GRID GridSphere screenshot (1) 12 – apr – 2006 Middleware Grid - Gridsphere Gridsphere – Il portale GRID 12 – apr – 2006 Computational GRID LSF 12 – apr – 2006 Computational Grid - LSF LSF (Load Sharing Facility) - prodotto di Platform • Si adatta a realtà aziendali con necessità di calcoli massivi e ripetuti • Consente di sfruttare al meglio le risorse di CPU preesistenti in azienda, anche in realtà eterogenee: AIX, IRIX, Tru64, HP-UX, Solaris, Linux e Windows – 32-bit/64-bit • Orientato al calcolo distribuito e parallelo • Architettura scalabile ed altamente performante: OGSI-compliant (interoperabilità con Globus) - Fino a 100 cluster, 200K CPU e 500K job attivi per cluster • Gestione avanzata del ciclo di vita dei job e schedulazione dei processi di calcolo Massima libertà di configurazione delle policy aziendali • Sicurezza 12 – apr – 2006 Accesso sicuro alle risorse: standard 56-bit encryption (optional 128-bit) Computational Grid - LSF LSF (Load Sharing Facility) - prodotto di Platform Solaris EnginFrame Portal LSF 6.0 - Master SITE 1 Windows Linux LSF 6.0 LSF 6.0 LSF 6.0 100 Mbit LAN 10 Mbit VPN 10 Mbit LAN 100 Mbit LSF 6.0 Windows 12 – apr – 2006 SITE 2 Il GRID portal EnginFrame 12 – apr – 2006 Computational Grid - EnginFrame Accesso al nodo Grid LSF tramite portale EF EnginFrame LSF Internet Web Access EF agent EnginFrame Portal 12 – apr – 2006 LSF Node Computational Grid Computational Grid - EnginFrame EnginFrame Sistema distribuito costituito da un processo Server, basato su un Web Server, e uno o più processi Agent in grado di interagire con il Server tramite messaggi XML. •Approccio webcentric Permette agli utenti di accedere alle applicazioni da ogni posto, in qualunque momento e da qualunque piattaforma •Meccanismo di autenticazione Accesso efficace e consistente alle applicazioni, ai dati e alle informazioni specifiche per l’utente •Sviluppato per una specifico gruppo di utenti Focalizzato all’oggetto dell’attività dell’impresa e finalizzato a migliorarne la produttività 12 – apr – 2006 Computational Grid - EnginFrame Visualizzazione risorse 12 – apr – 2006 Computational Grid - EnginFrame Gestione dei processi 12 – apr – 2006 Computational Grid - EnginFrame Gestione dei processi 12 – apr – 2006 Storage Resource Broker 12 – apr – 2006 Data Grid - SRB Storage Resource Broker Obiettivo: implementazione di un ambiente datagrid per condivisione di risorse di storage Datagrid permette: • Condivisione data storage File system condivisi Database federati • Trasferimento più veloce e sicuro dei dati • Replicazione dati - backup 12 – apr – 2006 Data Grid - SRB Storage Resource Broker I principali middleware che rispondono a queste esigenze sono: 1. 2. 3. EDG (European Data Grid) Alien (Alice Environment) SRB (Storage Resource Broker) implementazione nodo SRB 12 – apr – 2006 Data Grid - SRB Middleware di tipo client-server che fornisce un’interfaccia di accesso uniforme a dati e metadati geograficamente distribuiti su sistemi eterogenei . Caratteristiche: uno spazio dei nomi logico interfacce verso una vasta quantità di sistemi di memorizzazione sistemi di trasferimento dati ad alte prestazioni sistemi per il fault-tolerance ed il fail-over gestione degli account e dei meccanismi di autenticazione – autorizzazione insieme di tool grafici per la configurazione e la gestione via web 12 – apr – 2006 ampio insieme di API (C, C++, Java) Data Grid - SRB • • • • • 12 – apr – 2006 Middleware con architettura client-server Condivisione di risorse dati eterogenee Gestione logica dei dati Replicazione dei dati Garanzia di sicurezza Data Grid - SRB SRB - Virtual layer Linux file system Windows file system Unix file system 12 – apr – 2006 Unix file system Linux file system Windows file system Data Grid - SRB Storage Resource Broker Architettura nodo SRB SITE 1 MySRB portal SRB server SRB client Linux SRB server SRB server SRB client SRB client MCAT server Windows Solaris SRB server SRB client SRB server SRB client WAN SITE 2 SRB server SRB client 12 – apr – 2006 Linux SRB client SITE 3 Linux Il GRID portal MySRB 12 – apr – 2006 Data Grid - MySRB MySRB – Il portale DataGRID • fornisce un unico punto di accesso allo storage virtuale • consente di gestire i dati condivisi ed i rispettivi metadata indipendentemente dalla loro locazione fisica 12 – apr – 2006 Data Grid - MySRB SRB server SRB user MCAT server MySRB Portal Storage Resource Broker 12 – apr – 2006 n SRB clients Nodo SRB Data Grid - MySRB MySRB – Gestione risorse 12 – apr – 2006 GRID Portal Accesso ai servizi Grid tramite portale SRB Node Internet Servizi Web Access Globus Node Grid Portal Grid Globus Grid LSF Grid SRB 12 – apr – 2006 LSF Node GRID Portal Accesso ai servizi Grid tramite portale 12 – apr – 2006 Sommario • Network Integration & Solutions – L’azienda • La tecnologia GRID • Il progetto di rete GRID pilota • Gli applicativi pilota • Conclusioni 12 – apr – 2006 Gli applicativi pilota 12 – apr – 2006 Applicazioni Pilota Il costante confronto con le PMI da un lato e la consapevolezza della continua evoluzione tecnologica dall’altro hanno portato a focalizzare l’attenzione su alcune tipologie di applicativi: Calcolo distribuito Diagnosi precoce del morbo di Alzheimer Modellatore statistico 12 – apr – 2006 Applicazioni Pilota RGM – Post-elaborazione del Burn-in L’obiettivo: distribuire la post-elaborazione dell’output prodotto dal software di gestione del burn-in mediante fieldpoint su più nodi e controllare il ciclo di vita dei job attraverso una gestione centralizzata dei processi di calcolo. Contesto applicativo: azienda produttrice di alimentatori ad alta tecnologia, trasformatori, circuiti ibridi di controllo e di potenza. Vantaggi: • Possibilità di distribuire il calcolo sulla Grid • Gestione centralizzata del ciclo di vita dei job via web • Architettura scalabile 12 – apr – 2006 Applicazioni Pilota RGM – Post-elaborazione del Burn-in Elaborazione su Grid Element #Files Proc. Time (3 nodes) Proc. Time (6 nodes) Elaborazione su singolo host Element # Files Processing time Single/GRID host1 5 415 sec +40.7% GRID 5 295 sec 295 sec host2 5 486 sec +65.1% GRID 10 352 sec 352 sec host3 5 491 sec +66.4% GRID 15 407 sec 407 sec host1 10 451 sec +28.1% GRID 20 437 sec 437 sec host2 10 561 sec +59.4% GRID 30 495 sec 495 sec host3 10 578 sec +64.2% GRID 60 998 sec 495 sec host1 20 556 sec +27.2% host2 20 789 sec +80.5% host3 20 858 sec +96.3% host1 30 650 sec +31.3% host2 30 992 sec +85.4% Caratteristiche macchine Element CPU RAM O.S. host3 30 1104 sec +123.1% host1 1.6Ghz 512Mb RH9 host1 60 1189 sec +140.2(19.1)% host2 600Mhz 384Mb Y2K host2 60 1843 sec +272.3(84.7)% host3 600Mhz 384Mb RH9 host3 60 2015 sec +307.1(101.9)% 12 – apr – 2006 Applicazioni Pilota RGM – Post-elaborazione del Burn-in Processing time Single/GRID comparation Single/GRID comparation 2500 Processing time 2000 2500 1500 2000 1000 1500 1000 500 500 0 5 10 15 20 30 GRID 6 GRID 3 host1 host2 host3 12 – apr – 2006 60 # files 0 5 10 Element 15 20 30 60 # files CPU RAM O.S. host1 1.6Ghz 512Mb RH9 host2 600Mhz 384Mb Y2K host3 600Mhz 384Mb RH9 Applicazioni Pilota Elaborazione di immagini: Demo Pov-Ray L’obiettivo: dimostrare le potenzialità dell’architettura GRID per il calcolo distribuito attraverso un algoritmo di elaborazione di immagini basato su una tecnica di rendering chiamata ray-tracing (Pov-Ray). Contesto applicativo: qualsiasi azienda che necessiti potenza di calcolo (progettazione, testing, compilazione, elaborazione numerica) Vantaggi: • Possibilità di distribuire il calcolo sulla Grid • Gestione centralizzata del ciclo di vita dei job via web • Architettura scalabile 12 – apr – 2006 Applicazioni Pilota Elaborazione di immagini 12 – apr – 2006 Elaborazione su singola macchina Elaborazione su GRID Applicazioni Pilota Il modellatore statistico L’obiettivo: mettere a disposizione delle PMI un servizio di “DATA MINING” per classificazione, previsione o analisi di correlazioni relativamente a dati provenienti da processi industriali e aziendali Contesto applicativo: diagnosi e controllo di qualità. GPS (Green Power Solutions Srl) ha fornito dati su cui è stata condotta una sperimentazione. Vantaggi: • Distribuire un algoritmo computazionalmente pesante per fornire una risposta più veloce all’utente, garantendo affidabilità • Trasferire dati di natura “sensibile” in un ambiente 12 – apr – 2006 sicuro Applicazioni Pilota Diagnosi precoce del morbo di Alzheimer L’obiettivo: fornire accesso uniforme a dati e metadati geograficamente distribuiti su piattaforme eterogenee ed al tempo stesso ottimizzare l’esecuzione degli algoritmi SPM (Statistical Parameter Mapping) di elaborazione su tali dati. Contesto applicativo: condivisione di informazioni residenti all’interno di diverse organizzazioni (sanitarie e non) in maniera sicura, scalabile e performante. 12 – apr – 2006 Vantaggi: • Virtualizzazione dello storage • Accesso geograficamente distribuito • Trasferimento dei dati più sicuro e veloce • Elaborazione sui dati distribuita Applicazioni Pilota Diagnosi precoce del morbo di Alzheimer PET images PET images PET images Hospital A Site 1 Hospital B Site 2 Hospital C Site 3 Data Grid Processing Site A SPM Processing Processing Site B 12 – apr – 2006 Applicazioni Pilota Diagnosi precoce del morbo di Alzheimer Sperimentazione: • sono state utilizzate immagini SPECT autentiche fornite dall’ospedale San Raffaele di Milano; • selezione dell’immagine “campione”; • estrazione dei parametri significativi da altre immagini geograficamente distribuite in diversi siti; • elaborazione matematica con individuazione delle “aree patologicamente anomale” nell’immagine “campione” 12 – apr – 2006 Risultati: • i dati non vengono spostati dai diversi siti geografici perchè sono condivisi nella Grid • riduzione dei costi • tempi di analisi ridotti perchè viene sfruttata la potenza di calcolo della Grid Sommario • Network Integration & Solutions – L’azienda • La tecnologia GRID • Il progetto di rete GRID pilota • Gli applicativi pilota • Conclusioni 12 – apr – 2006 Conclusioni 12 – apr – 2006 Conclusioni La tecnologia GRID rappresenta un potenziale enorme per le imprese, nonostante esistano ancora barriere che si frappongono, al momento attuale, ad una loro rapida diffusione. Due sono i principali aspetti “critici”: 1) le tecnologie GRID, sviluppate in ambito scientifico, sono ancora relativamente immature per un diffuso uso a livello industriale, soprattutto nel segmento delle imprese mediopiccole; 2) la cultura informatica delle imprese di medio-piccole dimensioni è spesso modesta e ciò rende difficile la comprensione e l’introduzione di sistemi IT avanzati nei cicli produttivi aziendali; A fronte di queste difficoltà, potenzialmente, le tecnologie GRID rappresentano una significativa opportunità per le imprese. 12 – apr – 2006 Conclusioni – Immaturità della tecnologia Per quanto riguarda l’immaturità della tecnologia per un diffuso uso industriale, si possono elencare i seguenti aspetti: l’architettura per ottenere una soluzione completa è complessa l’offerta non è omogenea per alcuni moduli software esistono soluzioni sia commerciali che open source per altri moduli le soluzioni disponibili sono più rare, quando addirittura inesistenti anche quando le soluzioni sono disponibili, esse spesso sono finalizzate ad utilizzi specifici (es. ambito finanziario o progettuale) una volta individuati tutti i moduli software necessari a comporre l’architettura, l’integrazione degli stessi è complessa le operazioni di configurazione e di manutenzione sono relativamente complesse e possono essere svolte solamente da personale qualificato che abbia effettuato training specifico sulle tecnologie impiegate 12 – apr – 2006 Conclusioni – Capacità di penetrazione Relativamente alla capacità di penetrazione di sistemi IT avanzati nei cicli produttivi aziendali: le conoscenze in ambito IT possedute dalle imprese, mediamente, non sono di livello avanzato allo stato attuale, nessuna azienda (non informatica) sarebbe in grado di selezionare ed utilizzare tecnologie GRID per realizzare una propria infrastruttura l’offerta di competenze specialistiche professionali esterne è assolutamente carente Questo fatto unito alle difficoltà insite nella tecnologia ed elencate al punto precedente fa sì che esista un grande gap di tipo “culturale” tra le potenzialità offerte dalle reti GRID e le aspettative, spesso più modeste, delle imprese. 12 – apr – 2006 Probabilmente, come successo nel caso della diffusione di Internet, saranno i grandi gruppi industriali a fare da “driver” nell’uso della tecnologia e successivamente traineranno le aziende più dinamiche ed innovative. Conclusioni – Potenzialità della tecnologia Al di là degli aspetti “critici” precedentemente evidenziati: una volta che l’infrastruttura GRID è stata realizzata ed è funzionante correttamente, essa presenta caratteristiche di sicuro interesse in particolare la possibilità di avere a disposizione importanti risorse di calcolo ed immagazzinamento dati, modulabili a seconda delle esigenze temporanee dell’azienda E’ ipotizzabile in un prossimo futuro, quando saranno disponibili Grid Service Provider (Server Farm basate su tecnologie GRID e gestite da aziende terze), uno scenario in cui le aziende potranno riprogettare tutto o parte del loro IT interno aumentando notevolmente l’efficienza aziendale ed abbattendo contemporaneamente i costi di gestione. 12 – apr – 2006 Relativamente invece alla possibilità di allestire infrastrutture GRID interne, si ritiene che esse necessiteranno ancora per lungo tempo dell’intervento sia in fase di progettazione che di realizzazione e manutenzione di aziende specializzate esterne. Il nostro futuro GRID Service Provider Il progetto ha come fine l’apprendimento ed il consolidamento delle competenze riguardanti la tecnologia GRID all’interno dell’azienda NIS. Questa iniziativa è finalizzata alla creazione di un nuova “business unit” con lo scopo di offrire un servizio di “Grid Service Provider” – (G.S.P.) rivolto prevalentemente al mondo produttivo ed industriale. Questa scelta è motivata dalla constatazione che la tecnologia GRID è attualmente in rapida espansione all’interno delle grandi imprese ed è previsto che possa nel futuro diventare di interesse anche per attori medio-piccoli. Il progetto di ricerca e sviluppo si orienta all’acquisizione della tecnologia corrente nel campo ed al suo adattamento allo scenario della offerta di servizi alle piccole e medie imprese del territorio. 12 – apr – 2006 Il nostro futuro GRID Service Provider Il progetto verrà sviluppato attraverso i seguenti obiettivi realizzativi: Studio di fattibilità Progettazione infrastruttura hardware Progettazione Middleware Sviluppo Applicativi 12 – apr – 2006 Il GRID nella vita quotidiana Può risultare difficile immaginare come la tecnologia GRID influenzerà la vita di tutti i giorni ma è utile ricordare alcune famose predizioni sul futuro dei computer: "The world will only need five computers" attribuita a Thomas J. Watson, IBM "640 kilobytes is all the memory you will ever need" attribuita a Bill Gates, Microsoft "There is absolutely no need for a computer in the home" attribuita a Ken Olsen, DEC 12 – apr – 2006 Una cosa analoga accadde con lo sviluppo del Web, quando fu inventato al CERN ad uso degli scienziati per condividere informazioni nessuno poteva immaginare la miriade di applicazioni pratiche e commerciali: oggi il mondo dell'IT (e non solo) non potrebbe vivere senza il Web.