STORAGE
(Memorie di Massa)
Luglio 2004
1
DA UNA RICERCA DELL’UNIVERSITA’ DI
BERKELEY
Il mondo produce tra 1 e 2 Exabyte di nuova informazione ogni anno,
equivalenti a circa 250 MB per ogni uomo, donna e bambino sulla
faccia della Terra.
Un Exabyte è un miliardo di GB, ovvero 1018 byte.
L’informazione stampata di ogni tipo rappresenta solo lo 0,003% del
totale.
Le memorie magnetiche sono di gran lunga il mezzo più utilizzato per
la memorizzazione delle informazioni e rappresentano anche quello a
più rapido tasso di crescita, con la capacità degli hard disk
commerciali che raddoppia ogni anno.
Le memorie magnetiche stanno rapidamente diventando il mezzo
universale per il salvataggio delle informazioni.
2
GENERALITA’
“Critical assets” o “family jewel”
Su supporto magnetico vengono conservati archivi del personale,
documenti pubblici e confidenziali, siti Web, Intranet e Internet,
specifiche di progetto e quant’altro possa essere rappresentato in
formato digitale. Si tratta in altri termini della gran parte del valore
dell’azienda stessa e quasi sempre dell’intera proprietà intellettuale.
Caratteristiche
• Sono organizzate sequenzialmente o per permettere l’accesso diretto
• Possono essere on line (se sono sempre connesse al sistema) o off line
(se è richiesto l’intervento umano prima di poter interagire con il
sistema)
3
I sistemi tradizionali di memorizzazione
sono adeguati e sufficienti per l’impresa di
oggi?
4
Ieri: L’Impresa
Automatizzare e Ottimizzare i Processi Interni
Enterprise
5
Oggi: L’Impresa Rete
Automatizzare ed Ottimizzare i Processi Esterni
Suppliers
Inbound
Logistics
eMarketplaces
Enterprise
Partners
Outbound
Logistics
Channel
Customers
• Linear
• Discrete
• Reactive
6
Domani: La eImpresa Rete
Estendere L’Automatizzazione e L’Ottimizzazione
Plan
Design/
Develop
Channel
Service
Enterprise
Source
Procure
Fulfill
Suppliers
Logistics
Enterprise
eMarketplace
Channel
Move
Sell
• Collaborative
Partners
Channel
• Integrated
Store
Make
• Dynamic
Customers
7
.....l’impresa diventa il centro di
una rete di relazioni complesse....
24x365 unlimited
access from
anyware
Plan
Design/
Develop
Channel
Service
Esplode
la quantità di
dati da gestire
Enterprise
Source
Procure
Fulfill
Suppliers
Logistics
Enterprise
eMarketplace
Channel
Move
Sell
• Collaborative
Partners
Store
Channel
• Integrated
Make
• Dynamic
Customers
8
Fonte IDC 2001
...l’accesso via WEB mi genera
quantità enormi di dati....
eCRM
eTraffic
•
•
•
•
Core ClickStream
Web-Based Portal
Dashboard Reports
OLAP
eMarketing
• Campaign Analysis
• Visitors/Customer
Analysis
• Predictive Analysis
eCommerce
• Order/Sales
Analysis
• Shopping Cart
Abandonment
9
Il driver del cambiamento: il dato
Ristrutturare
le industrie
Utenti IT (M)
Ridefinire i
processi
1,000
100
10
Guadagnare
efficienza
Automatizzare
il Back-Office
Supportare gli Utenti
IT
con un Sistema
Management
Informativo
Centralizzato
Architetture
tecnologiche
Centralized
Proprietary Systems
Automatizzare
Front-Office
& Field
Automatizzare
Customers
Supportare gli Utenti
con un Sistema
Supportare gli Utenti
Informativo
“sconosciuti”
Distribuito
C/S
Internet
Computing
10
Italian Disk Storage Systems
Terabytes, 1999–2003
45.000
40.680
40.000
35.000
30.000
25.000
23.425
20.000
15.000
13.566
10.000
7.698
4.847
5.000
-
1999
2000
2001
2002
2003
In termini di “new terabytes” i Disk Storage Systems
crescono mediamente dell’65% all’anno
nel periodo 1999/2003
11
NETWORKED STORAGE
L’importanza e il ruolo strategico dello storage sono in costante
crescita, tanto che attualmente sono sempre più numerose le aziende
che richiedono una gestione sofisticata degli strumenti e delle attività
di storage a tutti i livelli – dal mainframe agli ambienti desktop. Al
tempo stesso si sta verificando una vera e propria “rivoluzione” in
questo ambito determinata dall’interconnessione dei dispositivi di
storage.
IDC
12
SITUAZIONE DI PARTENZA
• La gestione della sicurezza (disaster recovery, backup,
sistemi duplicati, ecc.) richiede grandissima quantità di
storage.
• Le applicazioni talvolta devono essere bloccate per
aggiungere storage e le operazioni di backup sono talmente
onerose da non poter essere completate.
• Lo storage è sempre stato caratterizzato dall’approccio
DAS (Direct Attached Storage) cioè integrato nel server.
13
EVOLUZIONE DELL’ARCHIVIO DEI DATI
AZIENDALI
• Lo storage non deve essere considerato necessariamente un
componente del server o del mainframe
• La resistenza a separare lo storage del server è forte, ma quando si
richiede una unità di storage (o dischi) di capacità superiore bisogna
spegnere il server. Inoltre in sistemi multiserver può essere arduo
condividere le porzioni di storage.
• Una strada interessante si è rivelata quella di installare SCSI array, cioè
dispositivi separati contenenti le unità a disco (alta scalabilità, presenza
di un computer che gestisce le configurazioni, server eterogenei, ecc.)
Ma hanno pure limiti di espansione e possono richiedere il fermo del
sistema.
• La soluzione oggi più chiara e definitiva è quella di spostare lo storage
in rete.
14
LO STORAGE IN RETE: NAS
• I NAS (Network Attache Storage) possono essere
considerati come computer specializzati per “servire” file
ai server applicativi.
• I vantaggi consistono nelle prestazioni, nella semplicità
della gestione e soprattutto nel fatto che sia i server
Windows che quelli Unix possono interfacciarsi a una
NAS eliminando la necessità di “isole” di gestione.
• Ci sono talvolta problemi di prestazione a causa dei
protocolli utilizzati per spostare i dati da un NAS a un
server applicativo.
15
LO STORAGE IN RETE: SAN
• Le SAN (Storage Area Network) sono reti che
trasferiscono dati tra l’host e gli elementi dello storage.
• Si compongono di una infrastruttura di comunicazione e un
software che “organizza” le connessioni e il layout degli
elementi di storage.
• Di norma, la SAN fornisce accesso diretto ai blocchi di
dati e utilizza come supporto fisico per le connessioni il
cavo a fibra ottica.
16
LO STORAGE IN RETE: SAN (Cont. 1)
• Questa tecnologia consente i livelli superiori di scalabilità
e prestazioni.
• Inserendo i sistemi di networking ad alta velocità tra i
server applicativi e lo storage, i primi comunicano con lo
storage come se fossero direttamente connessi: questo evita
i problemi di latenza delle soluzioni NAS.
• Anche le SAN hanno i loro limiti: soprattutto il costo.
17
IL PERCORSO DELLE ARCHITETTURE DI
STORAGE
– server centrica
DAS
– storage centrica NAS
– network centrica SAN
18
LO STORAGE IN RETE: NAS e SAN
• NAS costa meno, è più semplice da installare e da manutenere, e
consente espansioni facili e quasi illimitate.
Per applicazioni critiche, o notevoli livelli di complessità o richiesta di
banda molto elevata conviene considerare da subito una soluzione
SAN che ha tutti gli aspetti positivi della NAS ma è anche
indipendente dai supporti e dalle piattaforme utilizzate.
• Stanno nascendo i primi SSP (Storage Service Provider) che
analizzano le richieste delle aziende e forniscono la capacità di storage
richiesta tramite una “presa nel muro”.
19
Lo sviluppo delle
Storage Architecture (Valore)
100%
14,5%
90%
20,3%
2,4%
80%
30,0%
37,0%
4,7%
70%
43,0%
7,9%
60%
SAN:42%
11,8%
15,8%
50%
NAS:70%
CAGR 00-04 :
totale 11%
83,2%
40%
75,0%
Direct Attach:-8%
62,1%
30%
51,2%
41,2%
20%
10%
0%
1999
2000
2001
2002
2003
20
STORAGE RESOURCE MANAGEMENT
Consiste in un insieme di componenti software che
controllano e producono dati utili su questioni che
riguardano il buon funzionamento, la configurazione, la
disponibilità, le prestazioni e il livello di utilizzo di
specifiche risorse di memorizzazione dei dati condivise in
rete.
21
Scarica

LO STORAGE IN RETE