Jak połączyć dwie serwerownie, aby móc replikować dane

Jednym ze sposobów ochrony danych przed poważnymi zdarzeniami jest wykorzystanie zapasowego ośrodka i uruchomienie replikacji danych poza głównym data center. Replikacja do zapasowego ośrodka umożliwia firmie przetrwanie danych bez ich utraty nawet w przypadku dużych awarii. Oprócz budowy lub wynajęcia zapasowego ośrodka, ten sposób wymaga także niezawodnych łączy do obsługi takiej transmisji danych.

Replikacja synchroniczna

Najsprawniejsza pod względem ochrony jest replikacja synchroniczna, w której transakcje są synchronicznie zatwierdzane w obu ośrodkach przetwarzania danych i awaria (lub brak dostępności) jednego z nich nie powoduje utraty informacji. Technologia ta stawia również najwyższe wymagania pod względem połączeń, gdyż wszystkie zmienione porcje informacji muszą zostać przesłane w możliwie najkrótszym czasie pomiędzy ośrodkami. Przy replikacji synchronicznej – za pomocą mechanizmów na poziomie macierzy dyskowych – każdy blok po wejściu do pamięci cache systemu pamięci masowej jest przesłany przez łącze do zdalnej lokalizacji. Trafia tam do pamięci cache macierzy w rezerwowym data center. Potwierdzenie tej operacji zostaje przekazane do ośrodka głównego, a następnie informacja o udanym zapisie jest przekazywana do hosta.

W praktyce taką replikację wykonuje się przy wykorzystaniu dedykowanych sieci transmisji danych. Musi mieć ona znaczną przepustowość. Wszystkie informacje zapisywane do macierzy muszą być bowiem w tym samym czasie przesłane do zapasowego ośrodka. Wysycenie tego łącza spowoduje radykalną utratę wydajności całego serwisu chronionego za pomocą replikacji danych. Proces ten powoduje również wzrost opóźnień, co nie pozostaje bez wpływu na jakość działania serwisu. Do replikacji synchronicznej najlepiej nadają się dzierżawione łącza punkt-punkt lub wirtualne sieci prywatne korzystające z przełączania etykiet (MPLS) z racji na najniższe opóźnienia i możliwość zapewnienia pasma dla danej usługi.

Replikacja asynchroniczna

Jeśli w danej usłudze można zastosować asynchroniczną replikację, warto z niej skorzystać. Porcje danych są wtedy w czasie rzeczywistym zapisywane lokalnie, a potem trafiają do kolejki i podlegają przesłaniu do ośrodka zapasowego. Można do tego wykorzystać np.szyfrowany publiczny VPN. Jest to rozwiązanie niewątpliwie cechujące się niskim kosztem.

Replikację asynchroniczną w bazach danych można zrealizować także w sposób hybrydowy. Wówczas replikacja synchroniczna odbywa się lokalnie, w obrębie jednego data center. Z kolei zamknięte już transakcje są wysyłane do zdalnego ośrodka asynchronicznie. Archiwalne logi transakcji posłużą wtedy do utworzenia rezerwowej kopii na potrzeby Disaster Recovery. W dobie wirtualizacji powszechnie stosuje się replikację z użyciem kopii migawkowych lub śledzenia zmienionych bloków. Uruchamiane okresowo kopie migawkowe są replikowane do zdalnego ośrodka przez WAN.

Asynchroniczna replikacja nie zapewnia przeniesienia kompletu informacji w dowolnej chwili do zapasowego ośrodka przetwarzania danych, ale za to jest bardzo ekonomiczna. Nie wymaga bowiem łączy wyskalowanych do maksymalnego pasma wykorzystywanego przez bazę danych. Zastosowanie pasma zależy więc od ilości informacji przetwarzanych w czasie. Przy mniej istotnych – i mało obciążonych serwerach – replikację asynchroniczną można zrealizować nawet w popularnych sieciach VPN wykonanych za pomocą IPSec na typowych łączach klasy biznes.

Ciekawą alternatywą dla asynchronicznej replikacji są narzędzia do ciągłej ochrony danych (Contitnuous Data Protection), które tworzą dziennik zmian i kopiują go do zdalnej lokalizacji. W razie awarii można będzie przywrócić system do dowolnego stanu w przeszłości. Metoda ta może z powodzeniem działać przez sieć WAN. Zazwyczaj można przy tym ustawić ograniczenia na wykorzystywane pasmo. Dzięki temu administrator może uniknąć wysycenia łączy WAN, kosztem dłuższego czasu przenoszenia zmian do ośrodka zapasowego.

Pamiętajmy, replikacja niejedno ma imię!

Pojęcie replikacji obejmuje trzy najważniejsze modele: replikację transakcji, stanu maszyny i wirtualną synchronizację. Przy replikacji transakcji, informacje zapisywane w bazie danych są kopiowane do drugiej bazy, zlokalizowanej np. w zapasowym centrum danych, zapewniając przy tym spójność danych. Z replikacją stanu maszyny mamy do czynienia wtedy, gdy absolutnie każde działanie podlega automatycznemu przenoszeniu do drugiej maszyny lub wielu maszyn. Do tego modelu zbliża się mechanizm kopii migawkowych maszyn wirtualnych w klastrach wirtualizacyjnych przy replikacji do zdalnego ośrodka. Z kolei wirtualna synchronizacja odbywa się wówczas, gdy grupa procesów replikuje dane w pamięci operacyjnej lub wzajemnie koordynuje swoje działania. W praktyce spotyka się głównie replikację transakcji bazodanowych albo asynchroniczną replikację stanu maszyny wirtualnej między klastrami wirtualizacyjnymi.