Preparare un Piano di Disaster Recovery
Antonio Tonani, Clever Consulting srl.
Preparare un piano di Disaster Recovery
A.Tonani – Clever Consulting Srl
I processi decisionali in situazioni di
emergenza
Sessione 8
2
Sommario
Le diverse fasi del piano.
La gestione dell’emergenza
I processi del piano
I team coinvolti
La fase di recovery
Gli step dopo la dichiarazione di disastro
I team coinvolti
Esempi di flowchart
La fase di emergenza
La fase di invocazione del DR
Data Flow Diagram
Lo sviluppo del piano di DR
3
Le diverse fasi del piano
Procedure e policy strutturate per la gestione della
situazione di crisi.
Indispensabile per la gestione ordinata dei processi di recovery.
Gestione della fase di reazione.
Gestione della fase di recovery
Gestione del rientro alla situazione di normalità.
Il coordinatore deve :
Definire i team di recovery e assegnare a ciascuno le responsabilità
Lavorare con L’IT e team di business per sviluppare le procedure di
notifica e invocazione del piano.
• Albero di notifica
Sviluppare le tempistiche atraverso flowchart identificando la
sequenza temporale e il reporting di attività per ciascun team.
4
La gestione dell’emergenza
I processi del piano
Il piano deve contenere
1.
I processi di reazione alla situazione di emergenza
Procedura di evacuazione, estinzioni incendi
2.
Le procedure di notifica e riunione di un comitato di crisi
Rendevous point
Notification tree
Il Command Center.
3.
I processi di dichiarazione del disastro
Istruzioni relative alla valutazione dei danni
Criteri di determinazione della situazione di disastro.
4.
Processi di recovery dei sistemi e dei dati
Sia per quelli centralizzati che quelli distribuiti
A secondo di RTO e RPO stabiliti dall’analisi.
5.
Processi di recovery delle reti
Dati e Fonia secondo RTO stabiliti
6.
7.
Processi di recovery degli utenti
Processi di recupero e salvataggio
All’interno dell’edificio o dell’area impattata.
Fattibilità di rientro all’interno dell’edificio.
Richieste di rimborso alle assicurazioni.
8.
Processi di ripristino alla normalità.
Ritorno a livelli di servizio normali.
Rollback dei sistemi, reti ed utenti nel sito di produzione.
5
La gestione dell’emergenza
I team coinvolti
Team per le operazioni di emergenza
Sono coinvolti nell’immediatamente dopo la notifica dell o stato di
emergenza.
Sono in genere azioni svolte da singole persone su attività
specifiche.
Team preposto alla valutazione dei danni
Personale qualificato incaricato alla verifica dei danni.
• Deve valutare attentamente i danni, le cause e il downtime stimato.
• Hardware e software / Facilities
Team preposto alla gestione delle emergenze
E’ il team composto da componenti del senior management
preposto al coordinamento delle attività di recovery
Il coordinatore di DR è membro del team.
6
La fase del recovery
Gli step dopo la dichiarazione di disastro
Gli step successivi alla dichiarazione di disastro.
Recupero dei media archiviati off-site
Installazione e test dei sistemi operativi su sistemi centralizzati e
quelli distribuiti.
Restore e test delle applicazioni.
Ripristino delle attività di produzione dal sito di recovery.
• Amministrazione e gestione dei sistemi
• Ripristino dei servizi help desk
• Trasferimento dei dati
Re-routing del traffico di rete
• LAN aree utenti e data center.
• WAN sulle reti esterne (clienti, Branch office, sedi remote)
Trasporto degli utenti al sito di Recovery
Richiesta ai fornitori di materiale di supporto per il sito di DR
Coordinamento degli utenti sull’uso dei sistemi.
7
La fase del recovery
I team di lavoro
I Team coinvolti:
1. Off site storage team
2. Team software
3. Team applicativo
4. Team di amministrazione e gestione
5. Team di network recovery
6. Tem di recovery la comunicazione.
7. Team di supporto alla rilocazione degli utenti
8. Team di infrastruttura
9. Team di supporto logistico / servizi generali
10. Team per l’approvvigionamento del materiale di consumo e per la
richiesta di nuovo hardware in DR.
8
La fase del recovery
I team di lavoro
E’ possibile aggregare più team.
Per ciascun team è necessario nominare un
responsabile (team leader)
Ha il compito di mantenere aggiornato il comitato di crisi attraverso
una linea di reporting.
Elementi per la valutazione dei membri del team:
Skill e preparazione (senior).
Predisposizione alla comunicazione e a lavorare sotto stress
Situazione personale.
Luogo di residenza.
9
Esempi di flowchart
La fase di gestione dell’emergenza
,QYRFD]LRQHGHO
SLDQR
1RW
ILLFDDW
LHDP
GLUHFRYHU\
6,
$WWLYD] LRQHGHL
J UXSSL
GLYHULILFDGHL
GDQQL
$ WWLYD] LRQH
GHO
FHQW
URGL
FULVL
5HSRUW
GHOODVLW
XD] LRQH
,QL]LRGHO
O
HDW
W
LYLW
j
GLUHFRYHU\
1RWLILFD
DOODFRPSDJ QLDGL
DVVLFXUD]LRQH
1R
9DL
DO
SHUFRUVR
GLUHFRYHU\
VLVWHPL
6LVWHPL
$UHDRSHUDW
LYD
LPSDW
W
DW
D
5HW
L
9DLDO
SHUFRUVRGL
UHFRYHU\
UHWL
10
8W
HQW
L
9DLDO
SHUFRUVRGL
UHFRYHU\
XWHQWH
Esempi di flowchart
La fase di invocazione del disastro
11
Data Flow Diagram – lo sviluppo del piano
di DR
12
Fine della sessione
Domande ?
13
Preparare un piano di Disaster Recovery
A.Tonani – Clever Consulting Srl
La conoscenza del piano all’interno
dell’azienda e i test di recovery.
Sessione 9
14
Sommario
La conoscenza del piano all’interno dell’azienda
Il mantenimento del piano
I test di Disaster Recovery
Gli obiettivi
L’organizzazione dei test
Tipologie dei test
I 7 punti importanti di un piano di DR
15
La conoscenza del piano di DR all’interno
dell’azienda
Un piano di DR è efficace solo se è conosciuto e
pubblicato all’interno dell’azienda.
Formare un comitato permanente di DR all’interno del senior
management.
Change management per l’IT
• Nuove applicazioni o sistemi
Workshop con i business manager sullo stato del progetto
Informazioni su siti intranet
BIA Ciclici con i business manager
Procedure di change management del piano
Policy all’interno dei contratti del personale
Training ai team di recovery per le attività di propria competenza
16
Il mantenimento del piano
Deve essere mantenuto attraverso attraverso
rigorose procedure di change management.
Adattamento ai cambiamenti organizzativi
Adattamento ai nuovi processi critici
Adattamento alle nuove necessità aziendali.
Deve essere validato da auditor interni ed esterni
all’azienda.
Deve essere validato e verificato all’anno attraverso i
test di recovery.
17
I test di recovery
Gli obiettivi
Rappresentano uno strumento di audit.
Valutano l’efficenza del piano e rivelano i limiti e le inefficenze.
Forniscono un benchmark
Forniscono informazioni sulle performance e le possibilità di
recovery
I test live rappresentano un utile strumento per la rinegoziazione dei
premi assicurativi.
Forniscono in forma chiara i service level agreement che sono
forniti dai sistemi e dalle reti in caso di contingenza.
Forniscono il massimo livello di confidenza ed
esperienza a tutti i team e agli utenti.
Familiarità dei team con i siti e le infrastrutture di DR.
Verifica l’interdipendenza dei team di lavoro in forma reale.
18
I test di recovery
L’organizzazione dei test
Definire lo scenario del test
Scenario di distruzione e tipologia di failure
Assunzioni
Limitazioni ed eccezioni del test di esclusione dal test.
Durata prevista dell’interruzione
Identificare gli Obiettivi
Determinazione dei tempi di ripristino dei sistemi e reti
Determinazione dei tempi di trasporto degli utenti
Determinazione delle funzionalità previste dei sistemi.
Valutazione del recovery in determinati orari di lavoro.
Valutazione e test delle procedure da parte degli utenti
19
I test di recovery
L’organizzazione dei test
Identificazione dei partecipanti e degli osservatori.
Lista completa dei partecipanti
Identificazione delle attività di ogni partecipante..
Documentazione dei risultati
Sulla base degli obiettivi compilare un report con i risultati dei test
Feedback dei partecipanti al termine del test
20
I test di recovery
Tipologie dei test
Test live in produzione
Sconsigliato per il primo test
Alto rischio
Fornisce la massima confidenza sul piano.
Da effettuare in giornate di minimo volume di lavoro
Test in produzione durante week end o giorni festivi.
Rischio minimo.
Pone alcune limitazione per le limitazioni esterni
21
I 7 punti più importanti in un piano di DR
Pensare sempre al peggior scenario possibile
Focus esclusivo agli asset critici
Non considerare solo i sistemi più importanti.
Valutare sempre le dipendenze esterne all’azienda.
Prevedere sempre la soluzione di recovery per gli
utenti
Mantenere alta la visibilità del piano all’interno
dell’azienda
Gestire il DR all’interno del normale ciclo produttivo.
22
Fine della sessione
Domande ?
23
Scarica

DR Training - Day 2 - Pomeriggio