Eine der wichtigsten Basistechnologien für
zukunftsweisende Speicherstrategien findet den Weg in die Unternehmen
Wohin mit all den Daten?
In den letzten Jahren ist die Verfügbarkeit von Speicherplatz
so selbstverständlich geworden wie der Strom aus der Steckdose. Anwender nutzen
Storage-Ressourcen, ohne an Kapazitäten oder Zugriffsbeschränkungen zu denken.
Was für die Nutzer wie ein ständig verfügbares Gebrauchsgut daherkommt, impliziert eine komplexe Infrastruktur
im Hintergrund.
Das rasante Datenwachstum und unterschiedlichste
Anforderungen an die vorgehaltenen Informationen verlangen von den IT-Systemen
viel Flexibilität. Ohne Speichervirtualisierung ist der kontinuierlich
steigende Verwaltungsaufwand für diese Umgebung nicht zu meistern. Praktisch alle
zukunftsweisenden Konzepte und Strategien im Speicherumfeld wie Information
Lifecycle Management (ILM) oder Utility Computing sind letztlich auf
Virtualisierungstechnologien angewiesen.
Virtualisierung ist in den letzten Monaten zu einem der
bedeutendsten Schlagworte der Speicherbranche geworden. Als der Begriff um die
Jahrtausendwende erstmals im Zusammenhang mit Storage auftauchte, sahen
zahlreiche Beobachter in ihm einen Hype, der so schnell verfliegen würde, wie
er gekommen war. Tatsächlich ist es um den Begriff nach 2001 wieder still
geworden. Wie so häufig war eine Idee auf den Markt gekommen, in der noch
niemand so recht den Nutzen für die Anwender sah. Viele meinten dann auch, in
der Technologie eher einen Selbstzweck denn einen Lösungsweg für konkrete
Anforderungen zu erkennen. Daher hielten sich die großen Speicherhersteller
zurück und verfolgten die weitere Entwicklung mit Interesse, doch ohne größeres
Engagement. Nun hat sich im vergangenen Jahr durch die technologischen und
konzeptionellen Entwicklungen in der Speicherindustrie einiges geändert.
Steigende Verfügbarkeitsanforderungen und die Automatisierung von
Verwaltungsprozessen haben zu einer Renaissance der Virtualisierung geführt.
Unternehmen reagieren auf die wachsenden und vielfältigen
Anforderungen an die Datenhaltung mit dem Aufbau dedizierter Speichernetzwerke
in Form von Storage Area Networks (SAN) oder Network Attached Storage (NAS).
Dabei setzen sie oftmals im Sinne eines ILM-Konzepts auf eine mehrstufige
Infrastruktur, in der sie unterschiedliche Service-Levels abbilden können. Ziel
ist es dabei, die Daten über den gesamten Lebenszyklus hinweg ihrem jeweils
aktuellen Wert entsprechend vorzuhalten – zu den niedrigsten Kosten. Dazu
müssen die Daten flexibel zwischen den verschiedenen Speicherebenen und
-systemen verschoben werden, ohne die Verknüpfung zu den Anwendungen zu
unterbrechen. Der Schlüssel hierzu ist Virtualisierung: Die Technologie trennt
die logische Sicht auf Daten und Datenträger von der physischen Einheit. Sie
erlaubt dem Anwender einen Blick auf seine Speicherressourcen unabhängig von
deren tatsächlichen Standorten und Eigenschaften. Virtualisierung steht somit
für eine in die Infrastruktur eingeschobene Abstraktionsschicht. Die
installierten Systeme erscheinen dem Administrator wie ein einheitlicher
Speicherpool, den er flexibel und bedarfsgerecht aufteilen kann (siehe Grafik
1).
Virtualisierung ist kein Selbstzweck. Sie ermöglicht eine
einfachere Verwaltung großer Speichernetzwerke und kann die damit verbundenen Kosten
deutlich reduzieren. Die Trennung der logischen Kapazitätsverwaltung von der
physischen Speicher-Hardware versetzt die Unternehmen in die Lage, die Vorteile
von Speichernetzen voll auszuschöpfen. Sie löst die Verbindung zwischen den
Storage-Systemen und den Anwendungen auf. So können Administratoren über eine
zentrale Konsole Speicherplatz im laufenden Betrieb flexibel den jeweiligen
Applikationen und Dateisystemen zuweisen, ohne den Datenzugriff zu unterbrechen
oder gar die Server neu zu booten. So können mittels der virtualisierten
Speicher die vorhandenen Ressourcen auch in heterogenen Speichernetzen besser
genutzt werden. Administratoren müssen ihre Ressourcenprobleme somit nicht mehr
nur durch den Kauf neuer Platten lösen. Darüber hinaus ermöglicht es die
Virtualisierung, durch flexiblen Lastenausgleich Engpässe im Datenfluss
frühzeitig zu vermeiden und so die Performance im Speichernetz zu erhöhen.
Administratoren können komplexere Attribute wie beispielsweise spezifische
Verfügbarkeitsanforderungen oder die Zugriffshäufigkeit für das
Daten-Management verwenden. Viele Verwaltungsprozesse werden dann über ein
Regelwerk automatisiert, um die IT-Abteilungen zu entlasten und potenzielle
Fehlerquellen zu reduzieren. Dies eröffnet ganz neue Perspektiven für die
verteilte Nutzung von Informationen und deren Sicherung.
Eine Vielfalt von Methoden, Begriffen und Ansätzen macht es
den Anwendern schwer, sich aus den unterschiedlichen Möglichkeiten die optimale
Lösung herauszusuchen. Es beginnt schon bei der Frage, auf welcher Ebene die
Virtualisierung ansetzen soll. Für strukturierte Daten empfiehlt sich die schon
länger bekannte Methode der Blockvirtualisierung. Mittlerweile kommen jedoch
auch Ansätze für die Virtualisierung von Dateisystemen und ganzen Informationsobjekten
auf, die vor allem für unstrukturierte Daten im NAS interessant sind.
Block-Virtualisierung
Durch den Einsatz von Volume-Management-Software werden auf
der Block-Ebene einzelne Platten, RAID-Gruppen (Re-dundant Array of Independent
Disks) oder Logical Units Numbers (LUN) in einem virtuellen Speicher-Pool
zusammengefasst. Die Virtualisierungsinstanz kann dabei an verschiedenen Orten
in der Infrastruktur angesiedelt sein: als Logical Volume Man-ager auf dem
Host, direkt im Speichersystem oder aber als jüngste Entwicklung im Netzwerk
(siehe Grafik 2).
Host-basiertes Volume Management
Die Virtualisierung auf Host-Ebene ist die derzeit am
weitesten verbreitete Methode und existiert schon seit mehreren Jahren. Die
Software – der Logical Volume Manager (LVM) – ist meist eng mit dem
Dateisystem verknüpft und liegt direkt auf dem Server, entweder als
integrierter Bestandteil im Betriebssystem oder als zusätzliche Applikation.
Diese Technologie kommt unter anderem auch in Microsoft Windows und SUN Solaris
zum Einsatz. Diese Variante erlaubt es, Volumes über mehrere Speichersysteme
innerhalb eines SANs einzurichten. Administratoren können beispielsweise den
Speicherort für bestimmte Daten definieren. Auch Wiederherstellungsprozesse
nach einem Ausfall lassen sich so deutlich beschleunigen. Allerdings benötigt
diese Technologie viele Host-Ressourcen. Außerdem muss für jeden Server ein
eigener LVM installiert werden, ein zentrales Management ist nicht möglich.
Darüber hinaus müssen Migrationsprozesse nach wie vor über die Arrays oder
Switches laufen. Es können also nur Teile der Verwaltungsaufgaben
zusammengefasst werden.
Array-basiertes Volume Management
Im Speichersystem selbst wird schon seit Jahren RAID
Virtualisierung betrieben. Hinter RAID verbirgt sich eine große Zahl
unabhängiger Plattensysteme, wodurch sich die Performance und Ausfallsicherheit
des Gesamtsystems erheblich verbessert. Innerhalb der einzelnen Arrays bieten
die meisten Hersteller mittlerweile weitreichende Virtualisierungsmöglichkeiten
auf Blockebene, wodurch die Kapazitäten flexibel auf verschiedene Applikationen
und sogar Hosts aufgeteilt werden können. Damit ist die Technologie Basis für
viele Funktionen wie Replikation, Datenmigration, Disk Striping oder
Spiegelung. Doch auch bei diesem Array-basierten Ansatz ist es sehr
umständlich, die Virtualisierungsfunktionen mehrerer Systeme zu verknüpfen und
zentral zu verwalten – insbesondere in heterogenen Netzwerken. Daher
halten viele Marktexperten diesen Ansatz mittelfristig für eine Sackgasse.
Netzwerk-basiertes Volume Management
Seit etwa fünf Jahren existieren Lösungen, bei denen die
Virtualisierungsinstanz im Netzwerk angesiedelt ist. Experten sehen in dieser
Methode das größte Potenzial, gerade für heterogene Netzwerke. Das wichtigste
Argument lautet, dass mit einer solchen Instanz ein virtueller Storage-Pool
unabhängig vom Host oder den physischen Speichersystemen geschaffen wird. Dies
ebnet den Weg, um sämtliche Möglichkeiten der Virtualisierungstechnologie mit
zentralem Management, fortschrittlichen Speicherfunktionalitäten und noch
effizienteren Datendurchsatzraten auszuschöpfen. Dabei zeichnen sich drei
Ansätze ab, wo die Virtualisierungsinstanz liegt: auf einem eigenen Server
eingebunden in das SAN (In-Band), auf einem Host, der abgekoppelt vom
eigentlichen Speicherdatenstrom im Local Area Network angesiedelt ist
(Out-of-Band), oder in der Fabric auf einem Switch.
Bei der In-Band-Methode sitzt die Kontrollinstanz im
Datenstrom zwischen Applikations-Server und Speicher. Die Zuordnung von
Speichersegmenten zu jedem einzelnen Server erfolgt hier. Auch der Zugriff auf
Daten läuft über diese Instanz. Damit bildet sie einen Engpass, der die
Performance im SAN maßgeblich beeinflusst. Außerdem besteht immer die Gefahr,
dass durch den Ausfall der Appliance der komplette Speicherzugriff unterbrochen
wird. „Das In-Band-Konzept ist einfach zu implementieren, da es sich
unkompliziert in das bestehende Speichernetz integrieren lässt“, begründet
Forrester-Analyst Anders Lofgren, warum dies derzeit eine weit genutzte Methode
ist.
Im Fall der Out-of-Band-Virtualisierung befindet sich die
Kontrollinstanz außerhalb des Datenstroms. Sie kommuniziert über das LAN mit
dem Host Bus Adapter (HBA) im Server, auf dem ein spezieller Agent eingerichtet
ist. Hier werden die Verwaltungs- und Steuerungsinformationen bereits am Server
vom Datenstrom getrennt und über das LAN an das Gerät gesendet. Die
eigentlichen Datenblöcke wiederum fließen direkt vom Server auf die
Speichergeräte, sodass der Zugriff selbst beim Ausfall der Kontrollinstanz
weiterhin bestehen bleibt. Diese Methode ist aufgrund der Wechselwirkungen
zwischen den zusätzlichen Agenten auf den Applikations-Servern und der
SAN-Appliance zwar komplexer, gleichzeitig aber auch unabhängiger. Im Gegensatz
zur In-Band-Virtualisierung belegt sie zudem nur wenige Ports und hat weniger
Einfluss auf die Performance. So ist bei großen, redundant ausgelegten SANs
eine höhere Skalierbarkeit möglich. Ein Vorreiter der Out-of-Band-Theorie ist
EMC. Unter einer einheitlichen Management-Oberfläche bündelt EMC sowohl
Storage- als auch Server-Ressourcen und schafft auf diesem Wege eine
durchgängige Informationsinfrastruktur. Heute geht der Trend hin zu
Virtualisierungsfunktionalitäten in einem oder mehreren Switches. „Die
Intelligenz wandert immer mehr in die Netzwerkinfrastruktur“, stellt Norbert
Deuschle, Senior Consultant bei der Meta Group, fest. „Dort erfüllen Switches
dann Spezialaufgaben wie Virtualisierung oder das Erstellen von Snapshots.“
John Web-ster, Senior Analyst und Gründer der Data Mobility Group, prophezeit:
„The future is in the fabric.“ Die Idee hinter diesem Ansatz lautet, dass bei
der Virtualisierung ein vielschichtiger Ansatz die größte Flexibilität und
Leistungsfähigkeit erzielt. Im günstigsten Fall sitzt die Intelligenz
unmittelbar in der Schicht der Informationsinfrastruktur, die sie kontrollieren
soll: Anwendungen lassen sich am besten direkt auf dem Server,
Speicherfunktionalitäten auf dem Storage-Array und Zugriffsfunktionen im
Netzwerk virtualisieren. Nach dieser Logik ist klar, dass Prozesse rund um die
dynamische und unterbrechungsfreie Migration von Produktivdaten im
Speichernetzwerk abgebildet werden. Switch-Hersteller wie McData, Brocade und
Cisco haben entsprechende Plattformen präsentiert, die das Netzwerk
leistungsfähiger und intelligenter machen. Auf diesen neuen Switches setzt der
neue Storage Router von EMC auf und integriert eine Reihe neuartiger Funktionen
in das Speichernetzwerk. So haben Anwender die Möglichkeit, dynamische Volume-Migration
und netzwerkbasiertes Volume-Management zu betreiben sowie in heterogenen
Infrastrukturen Point-in-Time-Kopien zu erstellen. Der Vorteil dieser Lösung
ist, dass sie mit bestehenden Komponenten in der Informationsinfrastruktur
zusammenarbeitet, bestehende Investitionen also weiter gesichert sind. Die
Fabric-Virtualisierung ist somit ein weiterer Schritt hin zu dem Ziel, die
gesamte Netzwerkinfrastruktur von einer Ansammlung von Speichersystemen,
Switches, Servern, Kabeln und Software in einen einzigen, transparenten Service
für den Endbenutzer und Administrator zu verwandeln.
File-Virtualisierung
Neben der ausführlich diskutierten Virtualisierung auf
Blockebene sind in den letzten Jahren auch verstärkt Ansätze für Dateisysteme
entwickelt worden. Sie kommen vor allem im Bereich der unstrukturierten Daten
– also im NAS-Umfeld – zum Einsatz. Dabei lösen sie eines der
drängendsten Probleme, mit denen die Unternehmen derzeit konfrontiert sind:
Aufgrund des rasanten Datenwachstums stoßen NAS-Infrastrukturen langsam an die
Grenzen ihrer Skalierbarkeit und Performance. Hier setzt die File-basierte
Virtualisierung an. Allerdings handelt es sich dabei nicht mehr um eine
Abstraktionsschicht zwischen dem logischen und physischen Speicher. Vielmehr
operiert diese Technologie insgesamt auf der logischen Ebene der
Speicherinfrastruktur. Auch hier können die Instanzen auf unterschiedlichsten
Ebenen angesiedelt werden – vom Speichersystem über den Host bis hinein
ins LAN. Schon heute gibt es erste
Tendenzen dahingehend, dass mit der Konvergenz von SAN und NAS auch File- und
Block-basierte Virtualisierung zusammenwachsen. Ein erster Ansatz sind
NAS-Gateways. Diese greifen auf Blockspeicher im SAN zu und virtualisieren
diesen auf der File-Ebene. So lassen sich Daten innerhalb einer NAS-Umgebung
zwischen verschiedenen Speichersystemen verschieben und erlauben die
Implementierung von ILM-Konzepten
in komplexen Informationsinfrastrukturen.
Virtuell in die Zukunft
Für Unternehmen sind dabei Fragen wie Implementierungsaufwand,
Interoperabilität, Funktionsvielfalt und einfache Bedienung von entscheidender
Bedeutung. Für den Anwender zählt ein schneller, unkomplizierter Zugriff auf
die benötigten Daten ohne Ausfall- und Verlustrisiken. Da Speichernetzwerke
immer mehr die Infrastrukturen in Unternehmen dominieren, werden sie kaum um
eine virtuelle Lösung zur effizienten Nutzung der Speicherumgebung herumkommen.
Darüber hinaus zeichnet sich ab, dass die bislang
unabhängigen Virtualisierungstechnologien für Speicher, Server und Netzwerke
konvergieren. Das visionäre Ziel der unterschiedlichen Ansätze der
verschiedenen Hersteller ist letztlich die Schaffung eines komplett
virtualisierten Rechenzentrums. Die Übernahme von VMware durch EMC hat dieser
Tendenz Anfang 2004 einen neuen Schub gegeben und war ein Schritt in die
richtige Richtung im Sinne der Anwender.