Informationen dauerhaft gesichert
Von der Felsplatte zu ILM
„In Stein
gemeißelt“ – anschaulicher kann das Thema Langzeitspeicherung
kaum in Worte gepackt werden. Doch seitdem die ersten Menschen ihre Botschaften
auf Felswänden hinterließen, haben sich Bedürfnisse wie auch
Speichermedien gewandelt und multipliziert. Mit der zunehmenden
Informationsfülle waren erste Verwaltungssysteme gefragt, um die Menge der
Dokumente zu verwalten, zu klassifizieren und für den späteren
Gebrauch wieder auffindbar zu machen. In der Antike wurden so die ersten
Bibliotheken gegründet. Die Entwicklung und Verbreitung des Computers,
beginnend mit Konrad Zuses erster Maschine für elektronische
Datenverarbeitung, führte zur zunehmenden Digitalisierung von Prozessen
und einem ungebremsten Datenwachstum. Heute müssen riesige Speichersysteme
die Flut elektronischer Informationen bewältigen. Daher arbeiten die
großen Speicherhersteller wie EMC, StorageTek oder HP intensiv an
sogenannten Information Lifecycle Management (ILM)-Konzepten. Die Vision der
Hersteller klingt viel versprechend: Die Informationen über ihren gesamten
Lebenszyklus hinweg immer auf den optimalen Speichermedien vorzuhalten, um die
geforderten Service Levels zu erzielen und die Kosten zu senken. Doch der Weg dorthin
ist weit. Welche Stationen sind schon absolviert? Welche Abschnitte stehen noch
an?*
1. Schritt – Vernetzung der Speicherinfrastrukturen
In den achtziger Jahren kamen
die ersten Mainframes mit direkt angeschlossenen Speichereinheiten (Direct
Attached Storage - DAS) in die Unternehmen. Jeder Großrechner hatte
seinen dediziert zugewiesenen Speicherplatz, wer Daten von einem System zum
anderen bewegen wollte, dem standen umständliche und zeitintensive
Prozesse ins Haus. Abhilfe versprechen seit 1995 vernetzte
Speicherinfrastrukturen in Form von Storage Area Networks (SAN) und Network
Attached Storage (NAS). Alle Speichersysteme sind in einem Netzwerk
zusammengeschlossen und bilden einen einheitlichen Pool für sämtliche
Server. So lassen sich die vorhandenen Ressourcen effektiver nutzen und Daten
sind flexibler einsetzbar. Ein erster entscheidender Schritt auf dem Weg zu ILM
war somit geschafft.
2. Schritt – Hierarchisches Speicher-Management
(HSM)
Als nach dem Platzen der
Internet-Blase im Jahr 2000 die IT-Budgets schrumpften, versuchten Hersteller
und Unternehmen durch die Einrichtung mehrerer Storage-Levels die Kosten
für Speicherplatz zu senken. Auf Basis von zeitlichen Faktoren wurden
Regeln entwickelt, um die Daten schrittweise von den kostenintensiven
Produktivsystemen auf günstigere Archivierungsmedien auszulagern. In
diesem Zusammenhang entstanden auch erste Management-Tools, mit denen gewisse
regelmäßig wiederkehrende Prozesse wie Backup & Recovery
automatisiert werden konnten.
3. Schritt – Data Lifecycle Management (DLM)
Aufgrund der steigenden
Datenmengen und den komplexer werdenden Anforderungen an die verschiedenen
Kategorien von Daten entwickeln die Hersteller seit 2002/2003 zunehmend
spezialisierte Speichersysteme. Unterschiedlichste interne und externe
Kräfte wie Service Levels, Compliance, Datensicherheit und
Kostentransparenz treiben die Entwicklung voran. Eines der wichtigsten Themen
ist die 2003 eingeführte verschärfte Finanzgesetzgebung in diversen
Ländern, mit denen Behörden auf die Skandale um Enron und WorldCom
reagierten. Ein Reihe von Anbietern stellte daraufhin Lösungen für
revisionssichere Archivierung vor, die auch den strikten Regelungen der
Gesetzgeber genügen. Weitere spezialisierte Archivsysteme wurden für
unveränderliche Daten sowie für E-Mails entwickelt. Ein Aspekt, dem
Unternehmen ebenfalls vermehrt Aufmerksamkeit zollen, ist das Thema Backup und
Business Continuance. So präsentierte EMC beispielsweise Anfang 2004 die
erste Disk-basierte Library für schnellere Backup-Prozesse. Anwender
erhalten damit eine breite Auswahl an Speichersystemen, mit denen sie ihre
individuellen Service-Level-Anforderungen abbilden können. Im Gegensatz zu
früheren HSM-Lösungen stehen nun auch erste Klassifizierungsverfahren
bereit, mit denen Inhalte bewertet werden können. Dies erlaubt eine
deutlich genauere Analyse der eigenen Datenbestände. So ist eine
Informationsverwaltung realisierbar, die sich am tatsächlichen Wert und
den tatsächlichen Anforderungen der Informationen orientiert, nicht mehr nur
an rein technischen Faktoren wie dem Alter oder dem Datum des letzten Zugriffs.
4. Schritt – Manuelles ILM
Im Laufe des Jahres 2004
beginnen die ersten Unternehmen, ihre Klassifizierungsmethoden weiter zu
verfeinern und die Intelligenz ihrer Netzwerkinfrastruktur auszubauen. Dank
solcher Netzwerk-zentrischen Ansätze erhalten sie detailliertes Wissen um
die gespeicherten Inhalte und können dieses in ein umfassendes Regelwerk
umsetzen. Diese Regeln definieren, wie mit den jeweiligen Daten zu verfahren ist,
welche Service Level gelten und wo sie abgespeichert werden sollen. Dabei
helfen im Speichernetz angesiedelte Technologien für Backup, Replikation
und Datenmigration. Mit Virtualisierungstechnologien entstehen Speicher- und
Server-Pools, die automatisch auf die aktuellen Bedürfnisse der
Kernapplikationen zugeschnitten werden. Solange aber keine einheitlichen
Management-Lösungen existieren, wird ILM auf Teilbereiche beschränkt
bleiben.
5. Schritt – Automatisiertes ILM
Entscheidend für den
Übergang von manuellem zu automatisiertem ILM wird die Entwicklung von
Standards sein, mit der auch heterogene Infrastrukturen über ein
einheitliches System verwaltet werden können. Im April 2004
präsentierte der Branchenverband SNIA mit den Storage Management Initiative
Specifications (SMI-S) die ersten Standards. Einige Hersteller wie Dell, EMC,
Hewlett Packard, Hitachi Data Systems, IBM und SUN haben ihre Produkte
daraufhin zertifizieren lassen. Andere werden sicher nachziehen. Doch bis das
gesamte Feld von der Speicher-Hardware bis zum Content Management eine
gemeinsame Sprache spricht, werden sicher noch einige Jahre ins Land gehen. Vor
2006 ist kaum mit einheitlichen Management-Tools zu rechnen. Entscheidend wird
auch die Entwicklung von Technologien sein, mit denen tatsächlich Inhalte
verwaltet werden können. Denn künftige Ansprüche werden sich
nicht damit zufrieden geben, nur den Speicherort und die Betreffzeile einer
E-Mail zu kennen. Anwender brauchen dann eine komplette Zusammenfassung des
Inhalts, um sie in einer automatisierten ILM-Umgebung richtig behandeln zu
können.
Schaut man noch weiter in die
Zukunft, wird es sicherlich eine weitere Annäherung von ILM und anderen
Bereichen der IT geben. So zeichnet sich heute schon ab, dass wesentliche
Aspekte von ILM auch für Utility Computing oder On-demand Computing
gelten, also Konzepte, nach denen Nutzer jederzeit und überall die
Ressourcen abrufen kann, die er gerade benötigt. Die großen
Generalisten der IT-Branche wie IBM und HP, aber auch Speicherspezialisten wie
EMC werden langfristig auf eine Konvergenz dieser Bereiche zusteuern.
*Die folgende historische
Gliederung stützt sich in Teilen auf die Studie „ILM: A Strategic
Opportunity for Storage Vendors“ der 451 Group, erschienen im Mai 2004.