Hintergrundartikel
Beständiger Stein, flüchtiges Byte
Langzeitarchivierung war schon für die Ägypter ein Thema.
Ihre Strategie war so gut, dass die Informationen auch nach zwei Jahrtausenden
noch verstanden werden. Heute vernichtet der digitale Alzheimer schon nach
wenigen Jahren gespeicherte Daten.
Als Napoleon 1799 in Ägypten einmarschierte, fanden die
Franzosen in der Hafenstadt Rosette im Nildelta einen Stein, der Geschichte
machte. Die halbrunde Stele, die heute allgemein unter dem Namen Stein von
Rosette bekannt ist, wurde zum Schlüssel für die moderne Ägyptologie. In drei
verschiedenen Schriften hatte der Rat der ägyptischen Priester 196 vor Christi ein
Dekret einmeißeln lassen: in Hieroglyphen, in Demotisch und in Griechisch. Gut
2.000 Jahre später gelang es dem französischen Forscher Jean-François
Champollion, durch den Vergleich der verschiedenen Sprachen und Schriftzeichen
den Inhalt der Inschrift zu erschließen. Gleichzeitig entschlüsselte er die
Hieroglyphen-Schrift und schuf damit die Grundlage, weitere
Hinterlassenschaften der alten Ägypter zu verstehen – zwei Jahrtausende
nach ihrer Entstehung. Natürlich denkt heute beim Thema digitale
Langzeitarchivierung keiner an eine solche Zeitspanne. Doch wenn man sich vor
Augen hält, dass durch den technischen Fortschritt oft schon nach einem Jahr
Hardware- und Software-Lösungen durch neue Versionen abgelöst werden, wird das
Problem deutlich: Unternehmen wie auch die Gesellschaft stehen vor einer Flut
digitaler Daten, die sie aus rechtlichen, kulturellen oder auch historischen
Gründen für die Zukunft aufbewahren müssen – doch wie?
Der Vergleich mit dem Stein von Rosette weist nicht nur auf
die mangelnde Beständigkeit moderner Informationstechnologien hin. Die
Geschichte der Inschrift zeigt, dass es grundlegende Probleme bei der
dauerhaften und unveränderlichen Speicherung von Informationen gibt, für die
schon die alten Ägypter Lösungen gesucht und gefunden haben. Das
augenscheinlichste Problem ist der Datenträger. Die Ägypter kannten und nutzten
Papyrus – und wussten offensichtlich um seine Vergänglichkeit. Denn nur
so ist nachvollziehbar, warum sie das erheblich schwieriger zu bearbeitende
Medium Stein für ihre Inschrift wählten. Das zweite Problem ist nicht so
offensichtlich. Es betrifft die Darstellung der Information und ihre
Verständlichkeit in der Zukunft. Denn auch wenn die einzelnen Zeichen auch nach
zwei Jahrtausenden noch eindeutig erkennbar waren, das Wissen um ihre Bedeutung
war längst verschwunden. Die Ägypter haben dafür eine elegante Lösung gefunden,
indem sie den Text in den damals bekanntesten drei Sprachen in Stein meißelten.
Sie entwickelten damit einen Interpretationsrahmen, der auch 2.000 Jahre später
noch zu rekonstruieren war.
Beide Probleme, die Haltbarkeit des Datenträgers sowie die
Lesbarkeit des Inhalts sind heute noch dieselben wie vor 2.000 Jahren.
Allerdings hat die digitale Technologie das Problem um eine dritte Facette
erschwert: digital gespeicherte Informationen können ohne ein geeignetes
Lesegerät überhaupt nicht dargestellt werden. Das fängt bei der Hardware an. So
waren beispielsweise bis vor wenigen Jahren 3,5-Zoll-Disketten weit verbreit.
Heute besitzen viele Computer kein passendes Laufwerk mehr. Ganz zu schweigen
davon, dass Disketten häufig schon
nach fünf Jahren nicht mehr lesbar sind. Doch selbst wer noch ein geeignetes
Laufwerk besitzt, kann mit den gespeicherten Daten vermutlich kaum etwas
anfangen. Da viele Betriebssysteme und Anwendungen ein proprietäres Verfahren
für die Codierung der Daten einsetzen, benötigt man zum Auslesen Systeme, die
kompatibel sind zu dem System, mit dem die Daten ursprünglich erstellt wurden. Doch
meist sind nicht einmal diese Informationen bekannt, so dass es praktisch
unmöglich ist, die Daten originalgetreu zu rekonstruieren.
Mittlerweile gibt es verschiedene Initiativen, die sich in
Europa und den USA mit dem Thema Langzeitarchivierung digitaler Informationen
beschäftigen. In Deutschland sind hier vor allem das „Kompetenznetzwerk
Langzeitarchivierung und Langzeitverfügbarkeit digitaler Ressourcen für
Deutschland“ – kurz: nestor – sowie das Projekt kopal
(„Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen“) zu
nennen. nestor versteht sich in erster Linie als Austauschplattform für
nationale und internationale Projekte, Initiativen und Unternehmen, die sich
mit der dauerhaften Archivierung von digitalen Inhalten beschäftigen. kopal
leistet Pionierarbeit, indem im Rahmen dieses Projekts ein Langzeitarchiv für
die zersplitterte deutsche Verlags- und Bibliothekslandschaft aufgebaut wird.
Um eine einheitliche Archivierungsplattform für die verschiedenen von den
Verlagen eingesetzten Dokumententypen zur Verfügung zu stellen, hat kopal eine
offene Plattform entwickelt, die alle gängigen Formate einschließt. Dabei wird
gemeinsam mit den Objekten eine standardisierte Beschreibung für
Dokumententypen und Formate als Metadaten gespeichert. Darin sind sowohl
bibliographische Angaben wie auch technische Daten enthalten. Die technischen
Metadaten umfassen Angaben zu dem System und den Anwendungen, mit denen die
Daten erstellt wurden. Über diese Angaben können beispielsweise alle Objekte
ausfindig gemacht werden, die mit einer bestimmten Version eines Programms
erstellt wurden. Sollte diese Version nicht mehr am Markt erhältlich sein,
könnten so alle betroffenen Daten auf eine neuere migriert werden. Dabei werden
bevorzugt offene Formate gewählt, um eine möglichst große Unabhängigkeit von
der Produktpolitik der Hersteller zu wahren.
Auch für Unternehmen ist es entscheidend, sich Gedanken über eine
Strategie zur langfristigen Archivierung relevanter Daten zu machen. Betroffen
sind auf jeden Fall jene Daten, die im Falle einer Steuerprüfung oder eines
Rechtsstreits benötigt werden können. Aber auch Entwicklungsdaten oder
Forschungsergebnisse können unter Umständen in einigen Jahrzehnten wieder
relevant werden, so dass diese ebenfalls in eine Archivierungsstrategie
eingebunden werden sollten. In der Vergangenheit wurde das Problem zu häufig
unterschätzt. So hat die NASA wissenschaftlichen Untersuchungsdaten von den
Mondmissionen verloren, weil die Magnetbänder nicht rechtzeitig migriert wurden
und nicht mehr lesbar waren. Das Bonmot vom „digitalen Alzheimer“ macht seitdem
die Runde.
Vor 2.000 Jahren reichte es aus, einige vorausschauende
Überlegungen anzustellen und das Ergebnis in einer Steinmetzarbeit
niederzulegen. Seitdem wurde der Stein von Rosette nicht mehr verändert. Auch
später, als man längst auf Pergament und Papier umgestiegen war, waren
Migrationszyklen eher eine Frage von Jahrhunderten denn von Jahrzehnten. Heute,
wo durch die zunehmende Digitalisierung aller Lebens- und Arbeitswelten immer
mehr Informationen erfasst und gespeichert werden, sind die notwendigen
Migrationszyklen teilweise bis auf ein Jahr geschrumpft. Langzeitarchivierung
ist ein aufwändiger Prozess geworden, der die stete Aufmerksamkeit der
Verantwortlichen erfordert. Eine intelligente Archivierungsstrategie kann
jedoch vieles vereinfachen.