Preparare un Piano di Disaster Recovery Antonio Tonani, Clever Consulting srl. Preparare un piano di Disaster Recovery A.Tonani – Clever Consulting Srl I processi decisionali in situazioni di emergenza Sessione 8 2 Sommario Le diverse fasi del piano. La gestione dell’emergenza I processi del piano I team coinvolti La fase di recovery Gli step dopo la dichiarazione di disastro I team coinvolti Esempi di flowchart La fase di emergenza La fase di invocazione del DR Data Flow Diagram Lo sviluppo del piano di DR 3 Le diverse fasi del piano Procedure e policy strutturate per la gestione della situazione di crisi. Indispensabile per la gestione ordinata dei processi di recovery. Gestione della fase di reazione. Gestione della fase di recovery Gestione del rientro alla situazione di normalità. Il coordinatore deve : Definire i team di recovery e assegnare a ciascuno le responsabilità Lavorare con L’IT e team di business per sviluppare le procedure di notifica e invocazione del piano. • Albero di notifica Sviluppare le tempistiche atraverso flowchart identificando la sequenza temporale e il reporting di attività per ciascun team. 4 La gestione dell’emergenza I processi del piano Il piano deve contenere 1. I processi di reazione alla situazione di emergenza Procedura di evacuazione, estinzioni incendi 2. Le procedure di notifica e riunione di un comitato di crisi Rendevous point Notification tree Il Command Center. 3. I processi di dichiarazione del disastro Istruzioni relative alla valutazione dei danni Criteri di determinazione della situazione di disastro. 4. Processi di recovery dei sistemi e dei dati Sia per quelli centralizzati che quelli distribuiti A secondo di RTO e RPO stabiliti dall’analisi. 5. Processi di recovery delle reti Dati e Fonia secondo RTO stabiliti 6. 7. Processi di recovery degli utenti Processi di recupero e salvataggio All’interno dell’edificio o dell’area impattata. Fattibilità di rientro all’interno dell’edificio. Richieste di rimborso alle assicurazioni. 8. Processi di ripristino alla normalità. Ritorno a livelli di servizio normali. Rollback dei sistemi, reti ed utenti nel sito di produzione. 5 La gestione dell’emergenza I team coinvolti Team per le operazioni di emergenza Sono coinvolti nell’immediatamente dopo la notifica dell o stato di emergenza. Sono in genere azioni svolte da singole persone su attività specifiche. Team preposto alla valutazione dei danni Personale qualificato incaricato alla verifica dei danni. • Deve valutare attentamente i danni, le cause e il downtime stimato. • Hardware e software / Facilities Team preposto alla gestione delle emergenze E’ il team composto da componenti del senior management preposto al coordinamento delle attività di recovery Il coordinatore di DR è membro del team. 6 La fase del recovery Gli step dopo la dichiarazione di disastro Gli step successivi alla dichiarazione di disastro. Recupero dei media archiviati off-site Installazione e test dei sistemi operativi su sistemi centralizzati e quelli distribuiti. Restore e test delle applicazioni. Ripristino delle attività di produzione dal sito di recovery. • Amministrazione e gestione dei sistemi • Ripristino dei servizi help desk • Trasferimento dei dati Re-routing del traffico di rete • LAN aree utenti e data center. • WAN sulle reti esterne (clienti, Branch office, sedi remote) Trasporto degli utenti al sito di Recovery Richiesta ai fornitori di materiale di supporto per il sito di DR Coordinamento degli utenti sull’uso dei sistemi. 7 La fase del recovery I team di lavoro I Team coinvolti: 1. Off site storage team 2. Team software 3. Team applicativo 4. Team di amministrazione e gestione 5. Team di network recovery 6. Tem di recovery la comunicazione. 7. Team di supporto alla rilocazione degli utenti 8. Team di infrastruttura 9. Team di supporto logistico / servizi generali 10. Team per l’approvvigionamento del materiale di consumo e per la richiesta di nuovo hardware in DR. 8 La fase del recovery I team di lavoro E’ possibile aggregare più team. Per ciascun team è necessario nominare un responsabile (team leader) Ha il compito di mantenere aggiornato il comitato di crisi attraverso una linea di reporting. Elementi per la valutazione dei membri del team: Skill e preparazione (senior). Predisposizione alla comunicazione e a lavorare sotto stress Situazione personale. Luogo di residenza. 9 Esempi di flowchart La fase di gestione dell’emergenza ,QYRFD]LRQHGHO SLDQR 1RW ILLFDDW LHDP GLUHFRYHU\ 6, $WWLYD] LRQHGHL J UXSSL GLYHULILFDGHL GDQQL $ WWLYD] LRQH GHO FHQW URGL FULVL 5HSRUW GHOODVLW XD] LRQH ,QL]LRGHO O HDW W LYLW j GLUHFRYHU\ 1RWLILFD DOODFRPSDJ QLDGL DVVLFXUD]LRQH 1R 9DL DO SHUFRUVR GLUHFRYHU\ VLVWHPL 6LVWHPL $UHDRSHUDW LYD LPSDW W DW D 5HW L 9DLDO SHUFRUVRGL UHFRYHU\ UHWL 10 8W HQW L 9DLDO SHUFRUVRGL UHFRYHU\ XWHQWH Esempi di flowchart La fase di invocazione del disastro 11 Data Flow Diagram – lo sviluppo del piano di DR 12 Fine della sessione Domande ? 13 Preparare un piano di Disaster Recovery A.Tonani – Clever Consulting Srl La conoscenza del piano all’interno dell’azienda e i test di recovery. Sessione 9 14 Sommario La conoscenza del piano all’interno dell’azienda Il mantenimento del piano I test di Disaster Recovery Gli obiettivi L’organizzazione dei test Tipologie dei test I 7 punti importanti di un piano di DR 15 La conoscenza del piano di DR all’interno dell’azienda Un piano di DR è efficace solo se è conosciuto e pubblicato all’interno dell’azienda. Formare un comitato permanente di DR all’interno del senior management. Change management per l’IT • Nuove applicazioni o sistemi Workshop con i business manager sullo stato del progetto Informazioni su siti intranet BIA Ciclici con i business manager Procedure di change management del piano Policy all’interno dei contratti del personale Training ai team di recovery per le attività di propria competenza 16 Il mantenimento del piano Deve essere mantenuto attraverso attraverso rigorose procedure di change management. Adattamento ai cambiamenti organizzativi Adattamento ai nuovi processi critici Adattamento alle nuove necessità aziendali. Deve essere validato da auditor interni ed esterni all’azienda. Deve essere validato e verificato all’anno attraverso i test di recovery. 17 I test di recovery Gli obiettivi Rappresentano uno strumento di audit. Valutano l’efficenza del piano e rivelano i limiti e le inefficenze. Forniscono un benchmark Forniscono informazioni sulle performance e le possibilità di recovery I test live rappresentano un utile strumento per la rinegoziazione dei premi assicurativi. Forniscono in forma chiara i service level agreement che sono forniti dai sistemi e dalle reti in caso di contingenza. Forniscono il massimo livello di confidenza ed esperienza a tutti i team e agli utenti. Familiarità dei team con i siti e le infrastrutture di DR. Verifica l’interdipendenza dei team di lavoro in forma reale. 18 I test di recovery L’organizzazione dei test Definire lo scenario del test Scenario di distruzione e tipologia di failure Assunzioni Limitazioni ed eccezioni del test di esclusione dal test. Durata prevista dell’interruzione Identificare gli Obiettivi Determinazione dei tempi di ripristino dei sistemi e reti Determinazione dei tempi di trasporto degli utenti Determinazione delle funzionalità previste dei sistemi. Valutazione del recovery in determinati orari di lavoro. Valutazione e test delle procedure da parte degli utenti 19 I test di recovery L’organizzazione dei test Identificazione dei partecipanti e degli osservatori. Lista completa dei partecipanti Identificazione delle attività di ogni partecipante.. Documentazione dei risultati Sulla base degli obiettivi compilare un report con i risultati dei test Feedback dei partecipanti al termine del test 20 I test di recovery Tipologie dei test Test live in produzione Sconsigliato per il primo test Alto rischio Fornisce la massima confidenza sul piano. Da effettuare in giornate di minimo volume di lavoro Test in produzione durante week end o giorni festivi. Rischio minimo. Pone alcune limitazione per le limitazioni esterni 21 I 7 punti più importanti in un piano di DR Pensare sempre al peggior scenario possibile Focus esclusivo agli asset critici Non considerare solo i sistemi più importanti. Valutare sempre le dipendenze esterne all’azienda. Prevedere sempre la soluzione di recovery per gli utenti Mantenere alta la visibilità del piano all’interno dell’azienda Gestire il DR all’interno del normale ciclo produttivo. 22 Fine della sessione Domande ? 23