zurück Meldungen Artikel Bilder Viten Mappen Termine Kontakte Service Suche Start


Sie sehen den Artikel: Wohin mit all den Daten?. Veröffentlicht am: 11.08.2005
 
Web-Vorlage

Eine der wichtigsten Basistechnologien für zukunftsweisende Speicherstrategien findet den Weg in die Unternehmen

 

Wohin mit all den Daten?

 

In den letzten Jahren ist die Verfügbarkeit von Speicherplatz so selbstverständlich geworden wie der Strom aus der Steckdose. Anwender nutzen Storage-Ressourcen, ohne an Kapazitäten oder Zugriffsbeschränkungen zu denken. Was für die Nutzer wie ein ständig verfügbares  Gebrauchsgut daherkommt, impliziert eine komplexe Infrastruktur im Hintergrund.

 

Das rasante Datenwachstum und unterschiedlichste Anforderungen an die vorgehaltenen Informationen verlangen von den IT-Systemen viel Flexibilität. Ohne Speichervirtualisierung ist der kontinuierlich steigende Verwaltungsaufwand für diese Umgebung nicht zu meistern. Praktisch alle zukunftsweisenden Konzepte und Strategien im Speicherumfeld wie Information Lifecycle Management (ILM) oder Utility Computing sind letztlich auf Virtualisierungstechnologien angewiesen.

 

Virtualisierung ist in den letzten Monaten zu einem der bedeutendsten Schlagworte der Speicherbranche geworden. Als der Begriff um die Jahrtausendwende erstmals im Zusammenhang mit Storage auftauchte, sahen zahlreiche Beobachter in ihm einen Hype, der so schnell verfliegen würde, wie er gekommen war. Tatsächlich ist es um den Begriff nach 2001 wieder still geworden. Wie so häufig war eine Idee auf den Markt gekommen, in der noch niemand so recht den Nutzen für die Anwender sah. Viele meinten dann auch, in der Technologie eher einen Selbstzweck denn einen Lösungsweg für konkrete Anforderungen zu erkennen. Daher hielten sich die großen Speicherhersteller zurück und verfolgten die weitere Entwicklung mit Interesse, doch ohne größeres Engagement. Nun hat sich im vergangenen Jahr durch die technologischen und konzeptionellen Entwicklungen in der Speicherindustrie einiges geändert. Steigende Verfügbarkeitsanforderungen und die Automatisierung von Verwaltungsprozessen haben zu einer Renaissance der Virtualisierung geführt.

 

Unternehmen reagieren auf die wachsenden und vielfältigen Anforderungen an die Datenhaltung mit dem Aufbau dedizierter Speichernetzwerke in Form von Storage Area Networks (SAN) oder Network Attached Storage (NAS). Dabei setzen sie oftmals im Sinne eines ILM-Konzepts auf eine mehrstufige Infrastruktur, in der sie unterschiedliche Service-Levels abbilden können. Ziel ist es dabei, die Daten über den gesamten Lebenszyklus hinweg ihrem jeweils aktuellen Wert entsprechend vorzuhalten – zu den niedrigsten Kosten. Dazu müssen die Daten flexibel zwischen den verschiedenen Speicherebenen und -systemen verschoben werden, ohne die Verknüpfung zu den Anwendungen zu unterbrechen. Der Schlüssel hierzu ist Virtualisierung: Die Technologie trennt die logische Sicht auf Daten und Datenträger von der physischen Einheit. Sie erlaubt dem Anwender einen Blick auf seine Speicherressourcen unabhängig von deren tatsächlichen Standorten und Eigenschaften. Virtualisierung steht somit für eine in die Infrastruktur eingeschobene Abstraktionsschicht. Die installierten Systeme erscheinen dem Administrator wie ein einheitlicher Speicherpool, den er flexibel und bedarfsgerecht aufteilen kann (siehe Grafik 1).

 

Virtualisierung ist kein Selbstzweck. Sie ermöglicht eine einfachere Verwaltung großer Speichernetzwerke und kann die damit verbundenen Kosten deutlich reduzieren. Die Trennung der logischen Kapazitätsverwaltung von der physischen Speicher-Hardware versetzt die Unternehmen in die Lage, die Vorteile von Speichernetzen voll auszuschöpfen. Sie löst die Verbindung zwischen den Storage-Systemen und den Anwendungen auf. So können Administratoren über eine zentrale Konsole Speicherplatz im laufenden Betrieb flexibel den jeweiligen Applikationen und Dateisystemen zuweisen, ohne den Datenzugriff zu unterbrechen oder gar die Server neu zu booten. So können mittels der virtualisierten Speicher die vorhandenen Ressourcen auch in heterogenen Speichernetzen besser genutzt werden. Administratoren müssen ihre Ressourcenprobleme somit nicht mehr nur durch den Kauf neuer Platten lösen. Darüber hinaus ermöglicht es die Virtualisierung, durch flexiblen Lastenausgleich Engpässe im Datenfluss frühzeitig zu vermeiden und so die Performance im Speichernetz zu erhöhen. Administratoren können komplexere Attribute wie beispielsweise spezifische Verfügbarkeitsanforderungen oder die Zugriffshäufigkeit für das Daten-Management verwenden. Viele Verwaltungsprozesse werden dann über ein Regelwerk automatisiert, um die IT-Abteilungen zu entlasten und potenzielle Fehlerquellen zu reduzieren. Dies eröffnet ganz neue Perspektiven für die verteilte Nutzung von Informationen und deren Sicherung.

 

Eine Vielfalt von Methoden, Begriffen und Ansätzen macht es den Anwendern schwer, sich aus den unterschiedlichen Möglichkeiten die optimale Lösung herauszusuchen. Es beginnt schon bei der Frage, auf welcher Ebene die Virtualisierung ansetzen soll. Für strukturierte Daten empfiehlt sich die schon länger bekannte Methode der Blockvirtualisierung. Mittlerweile kommen jedoch auch Ansätze für die Virtualisierung von Dateisystemen und ganzen Informationsobjekten auf, die vor allem für unstrukturierte Daten im NAS interessant sind.

 

Block-Virtualisierung

 

Durch den Einsatz von Volume-Management-Software werden auf der Block-Ebene einzelne Platten, RAID-Gruppen (Re-dundant Array of Independent Disks) oder Logical Units Numbers (LUN) in einem virtuellen Speicher-Pool zusammengefasst. Die Virtualisierungsinstanz kann dabei an verschiedenen Orten in der Infrastruktur angesiedelt sein: als Logical Volume Man-ager auf dem Host, direkt im Speichersystem oder aber als jüngste Entwicklung im Netzwerk (siehe Grafik 2).

 

Host-basiertes Volume Management

 

Die Virtualisierung auf Host-Ebene ist die derzeit am weitesten verbreitete Methode und existiert schon seit mehreren Jahren. Die Software – der Logical Volume Manager (LVM) – ist meist eng mit dem Dateisystem verknüpft und liegt direkt auf dem Server, entweder als integrierter Bestandteil im Betriebssystem oder als zusätzliche Applikation. Diese Technologie kommt unter anderem auch in Microsoft Windows und SUN Solaris zum Einsatz. Diese Variante erlaubt es, Volumes über mehrere Speichersysteme innerhalb eines SANs einzurichten. Administratoren können beispielsweise den Speicherort für bestimmte Daten definieren. Auch Wiederherstellungsprozesse nach einem Ausfall lassen sich so deutlich beschleunigen. Allerdings benötigt diese Technologie viele Host-Ressourcen. Außerdem muss für jeden Server ein eigener LVM installiert werden, ein zentrales Management ist nicht möglich. Darüber hinaus müssen Migrationsprozesse nach wie vor über die Arrays oder Switches laufen. Es können also nur Teile der Verwaltungsaufgaben zusammengefasst werden.

 

Array-basiertes Volume Management

 

Im Speichersystem selbst wird schon seit Jahren RAID Virtualisierung betrieben. Hinter RAID verbirgt sich eine große Zahl unabhängiger Plattensysteme, wodurch sich die Performance und Ausfallsicherheit des Gesamtsystems erheblich verbessert. Innerhalb der einzelnen Arrays bieten die meisten Hersteller mittlerweile weitreichende Virtualisierungsmöglichkeiten auf Blockebene, wodurch die Kapazitäten flexibel auf verschiedene Applikationen und sogar Hosts aufgeteilt werden können. Damit ist die Technologie Basis für viele Funktionen wie Replikation, Datenmigration, Disk Striping oder Spiegelung. Doch auch bei diesem Array-basierten Ansatz ist es sehr umständlich, die Virtualisierungsfunktionen mehrerer Systeme zu verknüpfen und zentral zu verwalten – insbesondere in heterogenen Netzwerken. Daher halten viele Marktexperten diesen Ansatz mittelfristig für eine Sackgasse.

 

Netzwerk-basiertes Volume Management

 

Seit etwa fünf Jahren existieren Lösungen, bei denen die Virtualisierungsinstanz im Netzwerk angesiedelt ist. Experten sehen in dieser Methode das größte Potenzial, gerade für heterogene Netzwerke. Das wichtigste Argument lautet, dass mit einer solchen Instanz ein virtueller Storage-Pool unabhängig vom Host oder den physischen Speichersystemen geschaffen wird. Dies ebnet den Weg, um sämtliche Möglichkeiten der Virtualisierungstechnologie mit zentralem Management, fortschrittlichen Speicherfunktionalitäten und noch effizienteren Datendurchsatzraten auszuschöpfen. Dabei zeichnen sich drei Ansätze ab, wo die Virtualisierungsinstanz liegt: auf einem eigenen Server eingebunden in das SAN (In-Band), auf einem Host, der abgekoppelt vom eigentlichen Speicherdatenstrom im Local Area Network angesiedelt ist (Out-of-Band), oder in der Fabric auf einem Switch.

 

Bei der In-Band-Methode sitzt die Kontrollinstanz im Datenstrom zwischen Applikations-Server und Speicher. Die Zuordnung von Speichersegmenten zu jedem einzelnen Server erfolgt hier. Auch der Zugriff auf Daten läuft über diese Instanz. Damit bildet sie einen Engpass, der die Performance im SAN maßgeblich beeinflusst. Außerdem besteht immer die Gefahr, dass durch den Ausfall der Appliance der komplette Speicherzugriff unterbrochen wird. „Das In-Band-Konzept ist einfach zu implementieren, da es sich unkompliziert in das bestehende Speichernetz integrieren lässt“, begründet Forrester-Analyst Anders Lofgren, warum dies derzeit eine weit genutzte Methode ist.

 

Im Fall der Out-of-Band-Virtualisierung befindet sich die Kontrollinstanz außerhalb des Datenstroms. Sie kommuniziert über das LAN mit dem Host Bus Adapter (HBA) im Server, auf dem ein spezieller Agent eingerichtet ist. Hier werden die Verwaltungs- und Steuerungsinformationen bereits am Server vom Datenstrom getrennt und über das LAN an das Gerät gesendet. Die eigentlichen Datenblöcke wiederum fließen direkt vom Server auf die Speichergeräte, sodass der Zugriff selbst beim Ausfall der Kontrollinstanz weiterhin bestehen bleibt. Diese Methode ist aufgrund der Wechselwirkungen zwischen den zusätzlichen Agenten auf den Applikations-Servern und der SAN-Appliance zwar komplexer, gleichzeitig aber auch unabhängiger. Im Gegensatz zur In-Band-Virtualisierung belegt sie zudem nur wenige Ports und hat weniger Einfluss auf die Performance. So ist bei großen, redundant ausgelegten SANs eine höhere Skalierbarkeit möglich. Ein Vorreiter der Out-of-Band-Theorie ist EMC. Unter einer einheitlichen Management-Oberfläche bündelt EMC sowohl Storage- als auch Server-Ressourcen und schafft auf diesem Wege eine durchgängige Informationsinfrastruktur. Heute geht der Trend hin zu Virtualisierungsfunktionalitäten in einem oder mehreren Switches. „Die Intelligenz wandert immer mehr in die Netzwerkinfrastruktur“, stellt Norbert Deuschle, Senior Consultant bei der Meta Group, fest. „Dort erfüllen Switches dann Spezialaufgaben wie Virtualisierung oder das Erstellen von Snapshots.“ John Web-ster, Senior Analyst und Gründer der Data Mobility Group, prophezeit: „The future is in the fabric.“ Die Idee hinter diesem Ansatz lautet, dass bei der Virtualisierung ein vielschichtiger Ansatz die größte Flexibilität und Leistungsfähigkeit erzielt. Im günstigsten Fall sitzt die Intelligenz unmittelbar in der Schicht der Informationsinfrastruktur, die sie kontrollieren soll: Anwendungen lassen sich am besten direkt auf dem Server, Speicherfunktionalitäten auf dem Storage-Array und Zugriffsfunktionen im Netzwerk virtualisieren. Nach dieser Logik ist klar, dass Prozesse rund um die dynamische und unterbrechungsfreie Migration von Produktivdaten im Speichernetzwerk abgebildet werden. Switch-Hersteller wie McData, Brocade und Cisco haben entsprechende Plattformen präsentiert, die das Netzwerk leistungsfähiger und intelligenter machen. Auf diesen neuen Switches setzt der neue Storage Router von EMC auf und integriert eine Reihe neuartiger Funktionen in das Speichernetzwerk. So haben Anwender die Möglichkeit, dynamische Volume-Migration und netzwerkbasiertes Volume-Management zu betreiben sowie in heterogenen Infrastrukturen Point-in-Time-Kopien zu erstellen. Der Vorteil dieser Lösung ist, dass sie mit bestehenden Komponenten in der Informationsinfrastruktur zusammenarbeitet, bestehende Investitionen also weiter gesichert sind. Die Fabric-Virtualisierung ist somit ein weiterer Schritt hin zu dem Ziel, die gesamte Netzwerkinfrastruktur von einer Ansammlung von Speichersystemen, Switches, Servern, Kabeln und Software in einen einzigen, transparenten Service für den Endbenutzer und Administrator zu verwandeln.

 

File-Virtualisierung

 

Neben der ausführlich diskutierten Virtualisierung auf Blockebene sind in den letzten Jahren auch verstärkt Ansätze für Dateisysteme entwickelt worden. Sie kommen vor allem im Bereich der unstrukturierten Daten – also im NAS-Umfeld – zum Einsatz. Dabei lösen sie eines der drängendsten Probleme, mit denen die Unternehmen derzeit konfrontiert sind: Aufgrund des rasanten Datenwachstums stoßen NAS-Infrastrukturen langsam an die Grenzen ihrer Skalierbarkeit und Performance. Hier setzt die File-basierte Virtualisierung an. Allerdings handelt es sich dabei nicht mehr um eine Abstraktionsschicht zwischen dem logischen und physischen Speicher. Vielmehr operiert diese Technologie insgesamt auf der logischen Ebene der Speicherinfrastruktur. Auch hier können die Instanzen auf unterschiedlichsten Ebenen angesiedelt werden – vom Speichersystem über den Host bis hinein ins LAN.  Schon heute gibt es erste Tendenzen dahingehend, dass mit der Konvergenz von SAN und NAS auch File- und Block-basierte Virtualisierung zusammenwachsen. Ein erster Ansatz sind NAS-Gateways. Diese greifen auf Blockspeicher im SAN zu und virtualisieren diesen auf der File-Ebene. So lassen sich Daten innerhalb einer NAS-Umgebung zwischen verschiedenen Speichersystemen verschieben und erlauben die Implementierung  von ILM-Konzepten in komplexen Informationsinfrastrukturen.

 

Virtuell in die Zukunft

 

Für Unternehmen sind dabei Fragen wie Implementierungsaufwand, Interoperabilität, Funktionsvielfalt und einfache Bedienung von entscheidender Bedeutung. Für den Anwender zählt ein schneller, unkomplizierter Zugriff auf die benötigten Daten ohne Ausfall- und Verlustrisiken. Da Speichernetzwerke immer mehr die Infrastrukturen in Unternehmen dominieren, werden sie kaum um eine virtuelle Lösung zur effizienten Nutzung der Speicherumgebung herumkommen.

 

Darüber hinaus zeichnet sich ab, dass die bislang unabhängigen Virtualisierungstechnologien für Speicher, Server und Netzwerke konvergieren. Das visionäre Ziel der unterschiedlichen Ansätze der verschiedenen Hersteller ist letztlich die Schaffung eines komplett virtualisierten Rechenzentrums. Die Übernahme von VMware durch EMC hat dieser Tendenz Anfang 2004 einen neuen Schub gegeben und war ein Schritt in die richtige Richtung im Sinne der Anwender.

 

 

 

ml>
 

Diesen Artikel als PDF-Datei downloaden  

 

 

 
11.08.2005
EMC Virtualisierung (Grafik 1)
Virtualisierung ist der Schlüssel
11.08.2005
EMC Virtualisierung (Grafik 2)
Virtualisierungsinstanz kann an verschiedenen Orten angesiedelt sein
 
Zu diesem Artikel ist derzeit keine Vita vorhanden