Disaster Recovery: czyli jak zabezpieczyć ciągłość działania firmy

Za koncepcją Disaster Recovery kryją się procesy, polityki i procedury związane z wznowieniem lub utrzymywaniem krytycznej infrastruktury teleinformatycznej. O procedurze tej mówi się w kontekście awarii spowodowanych np. klęskami żywiołowymi, ale także problemami z zasilaniem (blackout). W celu zapobieżenia ich skutkom najczęściej wykorzystuje się zapasowe centrum danych.

Poniżej – krok po kroku – pokazujemy w jaki sposób opracować strategię zapewnienia ciągłości działania. Trzeba pamiętać, że planowanie procesu odtwarzania systemów IT po awarii angażuje cały dział IT. Zacząć należy od przeprowadzenia analizy ryzyka – Risk Assessment i zbadania wpływu awarii na działanie firmy – Business Impact Analysis. Analizy te pozwolą zidentyfikować systemy IT, które wspierają kluczowe dla działalności naszej firmy procesy. Następnie należy ustalić czas, w jakim należy przywrócić procesy po wystąpieniu awarii RTO (Recovery Time Objective) oraz akceptowalny poziom utraty danych wyrażony w czasie RPO (Recovery Point Objective).

Przykładowo dla systemów sterowana produkcją RTO może wynosić 8 godzin, a RPO 4 godziny. W tym przypadku zagrożeniem jest zaprzestanie jego działania. Zastosowane zabezpieczenia mogą dotyczyć np. wprowadzenia systemu monitoringu, który regularnie informuje o nietypowym funkcjonowaniu systemu sterowania produkcją, budowa systemu podtrzymywania zasilania czy regularne kontrole. Odpowiedzią na awarie może być zaś automatyczne uruchomienie systemu w zapasowym centrum danych, który może tam pracować do czasu odtworzenia go w ośrodku podstawowym.

Opracowując plan Disaster Recovery należy brać pod uwagę kilka czynników:

1. Ludzie

Aspekt ten dotyczy dostępności odpowiednich pracowników lub kontraktorów; konieczność ich przeszkolenia; zapewnienia zastępstwa dla pracowników posiadających wiedzę w zakresie kluczowych technologii (co najmniej jedna osoba w „zapasie”); przygotowanie dokumentacji, z której skorzystać mogą pracownicy poszukujący informacji pomocnych przy przywracaniu systemów IT; opracowanie procedur przekazywania sobie tej informacji wśród pracowników i kontraktorów. Większość tych problemów może rozwiązać umowa z dostawcą usług centrum danych, który zapewni odpowiednie wsparcie.

2. Miejsce pracy

W przypadku awarii należy zapewnić pracownikom alternatywne miejsce do pracy, czy to w innym biurze w tej samej lokalizacji, we własnym domu, czy też w firmie zewnętrznej, np. takiej, która zarządza zapasowym centrum danych przygotowanym na przejęcie funkcjonowania systemów IT w razie awarii. W przypadku zapasowej lokalizacji trzeba oczywiście wcześniej opracować wiele procedur, np. dostępu do ośrodka zapasowego. Karty dostępu do biura podstawowego powinny np. działać także w lokalizacji zapasowej.

3. Wymogi technologiczne

W przypadku zapasowej lokalizacji konieczne jest przygotowanie takiego miejsca, które jest dostosowane do wymogów infrastruktury IT, posiada odpowiednie systemy chłodzenia, wentylacji, zasilania, dostępu do łączy o wysokiej przepustowości itp. Oczywiście wymagane są także systemy do archiwizacji i tworzenia kopii zapasowych oraz rozwiązania wspierające proces powrotu systemów IT do normalnej pracy po awarii. Dzięki temu przyspieszymy proces Disaster Recovery. Odpowiednie zasoby ponownie mogą zapewnić firmy zarządzające komercyjnymi centrami danych.

4. Przechowywanie informacji

Aspekt ten dotyczy zasad przechowywania kluczowych dla przedsiębiorstwa danych, ich archiwizacji oraz tworzenia kopii zapasowych. Dotyczy to również zastosowania odpowiednich technologii, w zależności od tego, jak często wykorzystywane są dane. Są to dyski twardy, ale także napędy taśmowe i optyczne dla danych rzadziej wykorzystywanych. Za tym kryją się wymogi związane z zapewnieniem łączy o odpowiedniej przepustowości. Ważne są także możliwości dotyczące ochrony danych w zapasowym centrum danych oraz dostępności w nim wsparcia technicznego ze strony wykwalifikowanych specjalistów IT.

5. Umowy z kluczowymi dostawcami

W ramach planów Disaster Recovery konieczne jest określenie zasad współpracy z dostawcami wszystkich, stosowanych przez nas, krytycznych systemów IT. Dotyczy to również dostępności odpowiednich specjalistów po stronie partnera. Główne obszary, w których konieczne są umowy określające zasady współpracy przy odtwarzaniu systemów po awarii dotyczą dostawców sprzętu (np. serwery, pamięci masowe), systemów zasilania, usług sieciowych (telefonia i transmisja danych), firm zajmujących się usługami wsparcia technicznego, a nawet firm transportowych i logistycznych.

6. Polityki i procedury

Po opracowaniu polityk Disaster Recovery konieczne jest zatwierdzeniu ich przez kierownictwo wyższego szczebla. Należy być przygotowanym to tego, aby móc wykazać przed wyższym kierownictwem, że strategie Disaster Recovery mają pozytywny wpływ na realizację celów biznesowych organizacji. Następnie określa się – krok po kroku – procedury związane z odtwarzaniem poszczególnych zasobów IT. W ten sposób przekłada się strategię Disaster Recovery na konkretne plany działania.

Zastanów się

Ile Twoja firma może stracić przychodów jeśli – wspierająca ją podstawowa infrastruktura IT – nie będzie działać przez godzinę, dzień, tydzień? Idea Disaster Recovery opiera się bowiem na przeprowadzeniu chłodnej kalkulacji ryzyka związanego z utratą danych zanim jeszcze do niej dojdzie. Należy założyć, że w każdej chwili może dojść do nieoczekiwanej i niemożliwej do przewidzenia awarii, o trudnym do oszacowania zasięgu, która może sparaliżować działanie infrastruktury IT i – w konsekwencji – działanie całości lub części przedsiębiorstwa.