STORAGE (Memorie di Massa) Luglio 2004 1 DA UNA RICERCA DELL’UNIVERSITA’ DI BERKELEY Il mondo produce tra 1 e 2 Exabyte di nuova informazione ogni anno, equivalenti a circa 250 MB per ogni uomo, donna e bambino sulla faccia della Terra. Un Exabyte è un miliardo di GB, ovvero 1018 byte. L’informazione stampata di ogni tipo rappresenta solo lo 0,003% del totale. Le memorie magnetiche sono di gran lunga il mezzo più utilizzato per la memorizzazione delle informazioni e rappresentano anche quello a più rapido tasso di crescita, con la capacità degli hard disk commerciali che raddoppia ogni anno. Le memorie magnetiche stanno rapidamente diventando il mezzo universale per il salvataggio delle informazioni. 2 GENERALITA’ “Critical assets” o “family jewel” Su supporto magnetico vengono conservati archivi del personale, documenti pubblici e confidenziali, siti Web, Intranet e Internet, specifiche di progetto e quant’altro possa essere rappresentato in formato digitale. Si tratta in altri termini della gran parte del valore dell’azienda stessa e quasi sempre dell’intera proprietà intellettuale. Caratteristiche • Sono organizzate sequenzialmente o per permettere l’accesso diretto • Possono essere on line (se sono sempre connesse al sistema) o off line (se è richiesto l’intervento umano prima di poter interagire con il sistema) 3 I sistemi tradizionali di memorizzazione sono adeguati e sufficienti per l’impresa di oggi? 4 Ieri: L’Impresa Automatizzare e Ottimizzare i Processi Interni Enterprise 5 Oggi: L’Impresa Rete Automatizzare ed Ottimizzare i Processi Esterni Suppliers Inbound Logistics eMarketplaces Enterprise Partners Outbound Logistics Channel Customers • Linear • Discrete • Reactive 6 Domani: La eImpresa Rete Estendere L’Automatizzazione e L’Ottimizzazione Plan Design/ Develop Channel Service Enterprise Source Procure Fulfill Suppliers Logistics Enterprise eMarketplace Channel Move Sell • Collaborative Partners Channel • Integrated Store Make • Dynamic Customers 7 .....l’impresa diventa il centro di una rete di relazioni complesse.... 24x365 unlimited access from anyware Plan Design/ Develop Channel Service Esplode la quantità di dati da gestire Enterprise Source Procure Fulfill Suppliers Logistics Enterprise eMarketplace Channel Move Sell • Collaborative Partners Store Channel • Integrated Make • Dynamic Customers 8 Fonte IDC 2001 ...l’accesso via WEB mi genera quantità enormi di dati.... eCRM eTraffic • • • • Core ClickStream Web-Based Portal Dashboard Reports OLAP eMarketing • Campaign Analysis • Visitors/Customer Analysis • Predictive Analysis eCommerce • Order/Sales Analysis • Shopping Cart Abandonment 9 Il driver del cambiamento: il dato Ristrutturare le industrie Utenti IT (M) Ridefinire i processi 1,000 100 10 Guadagnare efficienza Automatizzare il Back-Office Supportare gli Utenti IT con un Sistema Management Informativo Centralizzato Architetture tecnologiche Centralized Proprietary Systems Automatizzare Front-Office & Field Automatizzare Customers Supportare gli Utenti con un Sistema Supportare gli Utenti Informativo “sconosciuti” Distribuito C/S Internet Computing 10 Italian Disk Storage Systems Terabytes, 1999–2003 45.000 40.680 40.000 35.000 30.000 25.000 23.425 20.000 15.000 13.566 10.000 7.698 4.847 5.000 - 1999 2000 2001 2002 2003 In termini di “new terabytes” i Disk Storage Systems crescono mediamente dell’65% all’anno nel periodo 1999/2003 11 NETWORKED STORAGE L’importanza e il ruolo strategico dello storage sono in costante crescita, tanto che attualmente sono sempre più numerose le aziende che richiedono una gestione sofisticata degli strumenti e delle attività di storage a tutti i livelli – dal mainframe agli ambienti desktop. Al tempo stesso si sta verificando una vera e propria “rivoluzione” in questo ambito determinata dall’interconnessione dei dispositivi di storage. IDC 12 SITUAZIONE DI PARTENZA • La gestione della sicurezza (disaster recovery, backup, sistemi duplicati, ecc.) richiede grandissima quantità di storage. • Le applicazioni talvolta devono essere bloccate per aggiungere storage e le operazioni di backup sono talmente onerose da non poter essere completate. • Lo storage è sempre stato caratterizzato dall’approccio DAS (Direct Attached Storage) cioè integrato nel server. 13 EVOLUZIONE DELL’ARCHIVIO DEI DATI AZIENDALI • Lo storage non deve essere considerato necessariamente un componente del server o del mainframe • La resistenza a separare lo storage del server è forte, ma quando si richiede una unità di storage (o dischi) di capacità superiore bisogna spegnere il server. Inoltre in sistemi multiserver può essere arduo condividere le porzioni di storage. • Una strada interessante si è rivelata quella di installare SCSI array, cioè dispositivi separati contenenti le unità a disco (alta scalabilità, presenza di un computer che gestisce le configurazioni, server eterogenei, ecc.) Ma hanno pure limiti di espansione e possono richiedere il fermo del sistema. • La soluzione oggi più chiara e definitiva è quella di spostare lo storage in rete. 14 LO STORAGE IN RETE: NAS • I NAS (Network Attache Storage) possono essere considerati come computer specializzati per “servire” file ai server applicativi. • I vantaggi consistono nelle prestazioni, nella semplicità della gestione e soprattutto nel fatto che sia i server Windows che quelli Unix possono interfacciarsi a una NAS eliminando la necessità di “isole” di gestione. • Ci sono talvolta problemi di prestazione a causa dei protocolli utilizzati per spostare i dati da un NAS a un server applicativo. 15 LO STORAGE IN RETE: SAN • Le SAN (Storage Area Network) sono reti che trasferiscono dati tra l’host e gli elementi dello storage. • Si compongono di una infrastruttura di comunicazione e un software che “organizza” le connessioni e il layout degli elementi di storage. • Di norma, la SAN fornisce accesso diretto ai blocchi di dati e utilizza come supporto fisico per le connessioni il cavo a fibra ottica. 16 LO STORAGE IN RETE: SAN (Cont. 1) • Questa tecnologia consente i livelli superiori di scalabilità e prestazioni. • Inserendo i sistemi di networking ad alta velocità tra i server applicativi e lo storage, i primi comunicano con lo storage come se fossero direttamente connessi: questo evita i problemi di latenza delle soluzioni NAS. • Anche le SAN hanno i loro limiti: soprattutto il costo. 17 IL PERCORSO DELLE ARCHITETTURE DI STORAGE – server centrica DAS – storage centrica NAS – network centrica SAN 18 LO STORAGE IN RETE: NAS e SAN • NAS costa meno, è più semplice da installare e da manutenere, e consente espansioni facili e quasi illimitate. Per applicazioni critiche, o notevoli livelli di complessità o richiesta di banda molto elevata conviene considerare da subito una soluzione SAN che ha tutti gli aspetti positivi della NAS ma è anche indipendente dai supporti e dalle piattaforme utilizzate. • Stanno nascendo i primi SSP (Storage Service Provider) che analizzano le richieste delle aziende e forniscono la capacità di storage richiesta tramite una “presa nel muro”. 19 Lo sviluppo delle Storage Architecture (Valore) 100% 14,5% 90% 20,3% 2,4% 80% 30,0% 37,0% 4,7% 70% 43,0% 7,9% 60% SAN:42% 11,8% 15,8% 50% NAS:70% CAGR 00-04 : totale 11% 83,2% 40% 75,0% Direct Attach:-8% 62,1% 30% 51,2% 41,2% 20% 10% 0% 1999 2000 2001 2002 2003 20 STORAGE RESOURCE MANAGEMENT Consiste in un insieme di componenti software che controllano e producono dati utili su questioni che riguardano il buon funzionamento, la configurazione, la disponibilità, le prestazioni e il livello di utilizzo di specifiche risorse di memorizzazione dei dati condivise in rete. 21