Gesucht wird eine schnelle und bezahlbare Disaster Recovery Lösung
Die neue Lösung arbeitet absolut transparent und benötigt keine Agenten oder Konfigurationsänderungen an unseren Systemen. Trotzdem werden sogar unsere Oracle Datenbanken und SAP Anwendungen problemlos und nahezu in Echtzeit repliziert.
Martin Kächelein, Leiter IT der IFA GmbH
Auf dem deutschen Arzneimittelmarkt werden Tausende Medikamente und andere Medizinprodukte gehandelt. Apotheken, Ärzte, Krankenkassen und andere Stellen sind auf aktuelle Produktinformationen angewiesen. Diese Informationen bekommen sie von der IFA GmbH. Hersteller und Importeure melden jede Änderung und jeden neuen Artikel an die IFA. Dort werden die Informationen in die Datenbank integriert und an die Kunden weitergegeben. Eine Unterbrechung dieses Informationsflusses hätte fatale Folgen für alle Beteiligten. Deshalb achtet die IFA nicht nur auf einen hochverfügbaren Betrieb ihrer Informationssysteme, sondern legt auch viel Wert auf einen funktionierenden Plan B für den Notfall, wenn das eigene Rechenzentrum einmal ausfallen sollte. Die bislang eingesetzte Disaster Recovery Lösung konnte zwar sowohl virtuelle als auch physische Systeme sichern und wiederherstellen, aber angesichts der wachsenden Datenmengen sprengten die Kosten jedes Budget. Gesucht wurde eine kosteneffiziente Alternative, die zum Virtualisierungsgrad der IT-Systeme passte und mit möglichst wenig Aufwand implementiert werden konnte.
Die wichtigsten Anforderungen an die neue Lösung waren:
- Replikation nahe Echtzeit, damit so gut wie keine Daten verloren gehen
- Gute Skalierbarkeit und Kosteneffizienz auch bei großen Datenmengen
- Problemlose Replikation und Wiederherstellung von komplexen Anwendungen wie SAP, Oracle Datenbanken und Exchange Server
Disaster Recovery als Service mit Backup-Rechenzentrum in der Cloud
Da die IFA GmbH inzwischen nahezu alle IT-Systeme virtualisiert hat, lag es nahe, nach einer Hypervisor-basierten Lösung zu suchen. Der Disaster Recovery Service auf der Basis von Zerto Virtual Replication konnte problemlos in die bestehende VMware-Infrastruktur integriert werden. Ausschlaggebend für die Wahl war die Forderung nach minimalen RPOs (Recovery Point Objective), um auch im Notfall synchrone Datenbestände garantieren zu können. Im Gegensatz zu anderen Produkten kommt die Replikationslösung von Zerto ohne Snapshots aus und beeinträchtigt nicht die Performance der Anwendungen. Die replizierten Daten werden komprimiert in die Cloud übertragen. Obwohl die IFA einen Datenbestand von ca. 5 Terabyte synchron halten muss, erreichen alle 25 replizierten virtuellen Maschinen im Durchschnitt einen RPO zwischen 3 und 10 Sekunden. In einem Notfall würden somit maximal die Daten der letzten Sekunden vor dem Ausfall verlorengehen.
Robuste Replikation ohne Agenten
Dank der direkten Hypervisor-Anbindung musste die IFA keine Agenten auf ihren Systemen installieren oder Konfigurationen ändern. Trotzdem werden selbst die Oracle Datenbanken und der Exchange Server problemlos repliziert. Wie robust und flexibel die Replikation funktioniert, hat selbst den erfahrenen IT-Leiter der IFA, Martin Kächelein, überrascht: “Noch während der Erstreplikation sind wir mit unseren Systemen in ein neues Rechenzentrum gezogen. Nach dem Umzug setzte die Software die Replikation nahtlos dort fort, wo sie unterbrochen hatte.“
Einfaches Management
Die neue Lösung lässt sich bequem über den gewohnten vSphere Client administrieren. Sollte dieser gerade nicht geöffnet sein, können die Administratoren auch über ein Web Interface auf das Management zugreifen. Obwohl Replikation und Disaster Recovery von Dunkel als Service bereitgestellt werden, hat die IFA dennoch jederzeit die volle Kontrolle über den Replikationsprozess. Sie kann selbst auswählen, welche Maschinen repliziert werden sollen und die Service Level überprüfen.
Failover-Tests und „Point-in-time“ Wiederherstellung
Im Notfall kommt es nicht nur darauf an, dass alle Daten gesichert wurden, sondern auch, dass die Anwendungen innerhalb der maximal tolerierbaren Ausfallzeit funktionsfähig wiederhergestellt werden können. Um das zu testen, kann die IFA beliebig oft ein Test-Failover durchführen. Dafür werden die replizierten Maschinen in einer Sandbox-Umgebung wiederhergestellt, damit die Produktivsysteme am primären Standort nicht beeinträchtigt werden. Alle bisherigen Tests ergaben Wiederherstellungszeiten (RTO) von wenigen Minuten.
Für Martin Kächelein hat der neue Service auch noch einen weiteren Vorteil für die IFA: „Wenn in der Vergangenheit ein Softwarefehler zu Betriebsstörungen führte, mussten wir das System erst umständlich aus dem Backup rekonstruieren. Heute können wir die betroffenen virtuellen Maschinen mit einem früheren, noch intakten Stand in der Cloud aktivieren und weiterarbeiten“. Die neue Lösung speichert nicht nur den jeweils zuletzt replizierten Stand, sondern auch frühere Wiederherstellungspunkte. Bei Bedarf kann der Replikationsprozess umgekehrt werden, um die Maschine mit einem früheren Systemzustand im primären Rechenzentrum wiederherzustellen.