Auf dem Weg zur erinnerungslosen Gesellschaft?
Langzeitarchivierung war schon für die alten Ägypter ein
Thema. Ihre Strategie war so gut, dass die Informationen auch nach zwei
Jahrtausenden noch verstanden werden. Heute laufen wir Gefahr, gespeicherte Daten
schon nach wenigen Jahren nicht mehr lesen geschweige denn nutzen zu können. In
Zeiten, in denen durch die zunehmende Digitalisierung aller Lebens- und
Arbeitswelten immer mehr Informationen erfasst und gespeichert werden, ist eine
vernünftige Archivierungsstrategie wichtiger denn je. Archivierung muss sein.
Das sieht nicht nur der Gesetzgeber so, sondern auch alle Beteiligten in
Unternehmen und Behörden. Gesetzliche Archivierungsvorschriften sind nicht der
einzige Antrieb für Unternehmen, ihre geschäftskritischen Informationen in
digitaler Form für die Zukunft zu sichern. Die Firmen haben auch ein
erhebliches Eigeninteresse an erfolgreichen Archivierungsstrategien.
Schließlich wollen sie sicherstellen, dass ihre Unterlagen auch in 10, 15 oder
50 Jahren noch verfügbar und lesbar sind.
Um es vorweg zu nehmen: die langfristige Aufbewahrung
digitaler Inhalte ist ein äußerst dynamischer Prozess, der schon mit der
richtigen Erfassung der Bits und Bytes beginnt und sich über deren
Strukturierung, Speicherung, Verteilung bis hin zur Archivierung zieht. Ohne
geeignete Dokumenten-Management-Systeme, sprich Enterprise Content Management
(ECM) geht es deshalb nicht. Heute
gilt es den Medienmix im Unternehmen zu konsolidieren und mit zukunftsweisenden
Technologien skalierbar zu halten. Offene Systeme und Standardformate sind eine
Voraussetzung für die langfristige Lesbarkeit wichtiger Informationen. Doch
wollen diese Daten in komplexen Umgebungen auch wiedergefunden werden.
Zusätzlich müssen Generationen von Software-Versionen und Betriebssystemen
verwaltet werden.
So wie Unternehmen und Behörden Geschäftskritisches speichern
und archivieren, haben auch Bibliotheken und Museen damit begonnen,
elektronische Abbildungen ihrer kulturellen Schätze dauerhaft zu speichern, um
wenigstens diese vor Katastrophen wie dem Brand der Herzogin Anna Amalia
Bibliothek (HAAB) zu schützen. In einem solchen Kontext wird Unternehmen wie
auch wissenschaftlichen Einrichtungen und Behörden bewusst, wie flüchtig
digitale Daten sind und wie groß die Gefahr ist, zu einer „erinnerungslosen
Gesellschaft“ zu werden. Erstere haben dabei die Archivierungsfristen für die
Bilanzbuchhaltung im Blick, während letztere schon aufgrund ihres Auftrags ein
deutlich langfristigeres Interesse an dem Thema digitale Langzeitarchivierung
haben. Bibliotheken wie die Weimarer Herzogin Anna Amalia Bibliothek (HAAB)
scannen ihre Kulturschätze ein und stellen Sie in verschiedenen Qualitätsstufen
für interessierte Laien, Forschungszwecke und als Druckvorlage für Nachdrucke
vorhalten. Ziel des Projektes ist, die wichtigsten Werke im Internet verfügbar
zu machen und gleichzeitig die kostbaren Originale vor übermäßiger Benutzung zu
schützen.
Das digitale Dilemma
Die dauerhafte Archivierung von digitalen Inhalten bringt erhebliche
Herausforderungen mit sich. Elektronisch gespeicherte Informationen können ohne
ein geeignetes Lesegerät nicht dargestellt werden. Im Gegensatz zu gedrucktem
Material, dass lediglich dem zeitlich bedingten Materialverfall unterliegt,
muss bei digitalen Inhalten immer auch der technologische Fortschritt
berücksichtigt werden. Neue Anwendungen oder auch nur Software-Versionen sowie
Innovationen bei Speichermedien erfordern kontinuierliche Aufmerksamkeit. Es braucht eine Strategie zur Migration
oder Emulation sowie offene Formate.
Hier sind die Hersteller von Anwendungen und Speicherinfrastrukturen
aufgefordert, an der Entwicklung von einheitlichen technischen Mitteln,
Schnittstellen, Lieferverfahren und Methoden mitzuarbeiten, die den
Bedürfnissen der langfristigen Archivierung von digitalen Inhalten gerecht
werden.
Fehlende Standards und Verfahren
Gerade die Hardware stellt Bibliotheken vor besondere
Herausforderungen. Die begrenzte Haltbarkeit heute gängiger Medien zwingt die
Verantwortlichen zu teils umständlichen Verfahren, deren Ergebnis sie selbst
mit Skepsis betrachten. So beschreibt Dr. Michael Knoche, Direktor der HAAB,
als Beispiel ein Verfahren, das in seiner Einrichtung zum Einsatz kommt: „Wir
belichten die Digitalisate inklusive Metadaten auf dauerhaftem Mikrofilm aus,
so dass in Zukunft unabhängig von der heutigen Hardware diese Daten wieder
ausgelesen und nachgebaut werden können.“ Diese Mikrofilme werden im Rahmen des
Zivilschutzgesetzes im zentralen Bergungsort der Bundesrepublik im Schwarzwald
archiviert. Ein solches Verfahren funktioniert jedoch nur bei statischen
Dokumenten wie Büchern. Bei interaktiven Anwendungen wie Webseiten mit
angeschlossenen Datenbanken stößt es an seine Grenzen. Die Hersteller sind
daher gefordert, Speicherplattformen zu entwickeln, die einerseits die
Konsistenz der Daten dauerhaft sichern, gleichzeitig jedoch auch einen
einfachen Migrationsprozess auf neue Speichertechnologien erlauben. Hier hat
sich das Archivsystem EMC Centera bewährt, dass ebenfalls von der Herzogin Anna
Amalia Bibliothek eingesetzt wird.
Mindestens ebenso gravierend ist jedoch die Frage des
Datenformats, in dem digitale Inhalte archiviert werden sollen. Hier ist
Herstellerunabhängigkeit ganz entscheidend. Nur so lässt sich vermeiden, dass
Dokumente irgendwann nicht mehr gelesen werden können, weil der Hersteller die
Unterstützung für ein Format aufgekündigt hat. Der eigentliche Prozess beginnt
daher bei der Erstellung unstrukturierter Dokumente durch einen Autoren, oder
der Erfassung durch Scannen, Bildbearbeitung oder Formularverarbeitung.
Natürlich ist es sinnvoll, alle Dokumente in Standard-Formaten wie XML, TIFF
Group 4, Adobe PDF oder JPEG zu speichern und zu archivieren. Gleichzeitig
sollte auch der bereits abgelegte Informationsbestand auf seine Formatvielfalt
hin überprüft werden. Sollen Dokumenten ohnehin der Archivierung zugeführt
werden, ist eine frühe Konvertierung in den ISO-zertifizierten
Archiverungsstandard PDF/A sinnvoll, der aus dem weithin bekannten PDF-Format
von Adobe hervorgegangen ist.
Die Stecknadel im Heuhaufen
Egal ob im Unternehmen oder im Bibliotheksarchiv, alle
Inhalte, die einmal in digitaler Form vorliegen, müssen intelligent geordnet
werden, damit sie auch irgendwann einmal wieder gefunden werden können. Erfasste
Dokumente sollten mit Hilfe von Metadaten klassifiziert und kategorisiert
werden. Informationen wie Dokumententyp, Autor, Zugriffsrechte oder
Verfallsdatum strukturieren die Informationsflut und machen sie über
Anwendungen hinweg recherchierbar. Bei größeren Unternehmen mit hohem
Datenaufkommen kann diese Phase schnell zur Mammutaufgabe werden. Eine große
Hilfe sind hier Software-Module, die die Klassifizierung der Unternehmensdaten
automatisieren. Die Ergebnisse der Klassifizierung dienen dann zur
Kategorisierung oder als Suchbegriffe, die in die Metadaten der Inhalte
einfließen. Viele Anwender tun sich schwer damit, die Metadaten bei der
Erzeugung von Inhalten konsistent einzugeben. Das schränkt die
Wiederauffindbarkeit und programmierte Verarbeitung von Inhalten erheblich ein.
Ein entsprechendes Programm schlägt bei der Datenerstellung automatisch
Metadaten vor, die der Anwender annehmen oder ablehnen kann. Die Erarbeitung
von Kategorien von Grund auf kann zur gewaltigen Aufgabe werden, für die zahlreiche
Funktionen in der Organisation zusammenwirken müssen. Um diesen Prozess zu
erleichtern, gibt es Software mit vorbereiteten Taxonomien (Hierarchieren von
Kategorien) für eine Reihe verschiedener Branchen und Aufgabenbereiche.
Archivsilos reduzieren oder zusammenführen
Die absolute Anzahl der Speichermedien sollte so klein wie
möglich gehalten werden, um die Administration zu vereinfachen und die Systeme
fit für die Anforderungen der Zukunft zu machen. Mit dem Preisverfall bei
Festplattenspeichern geht der Trend ganz klar weg von Magneto-optischen
Technologien, CD-ROM oder DVDs. Auch WORM-fähige Magnetbänder laufen den
Archiv-Jukeboxen von einst den Rang ab. Trotzdem müssen ältere Technologien
nicht gleich entsorgt werden. Je nach Anforderung im Unternehmen können diese
nach wie vor ausreichend sein. Entsprechende Archivierungssoftware hilft zudem
dabei, sämtliche Archivsilos in einem virtuellen Speicherpool zu verwalten. Um
die Lesbarkeit der Daten zu gewährleisten, empfiehlt das Bundesarchiv in Köln,
CDs und DVDs alle fünf Jahre umzukopieren. Wer sich von den glänzenden Scheiben
trennen möchte, sollte ihren Datenbestand sorgsam prüfen und auf entsprechende
Speichermedien migrieren. Auch Mikrofilme sind in den Unternehmen immer noch
ein weit verbreitetes Archivmedium. Da es sich um eine analoge Technologie
handelt, sollten Mikrofilme nur der nachgeordneten Archivierung bereits
digitalisierter Dokumente dienen. Einzig auf Mikrofilm gebannte steuerlich
relevante Belege haben dort seit Einführung der GDPdU (Grundsätze zum
Datenzugriff und zur Prüfbarkeit digitaler Unterlagen) im Jahr 2001 nichts mehr
zu suchen, oder sollten schnellstens gescannt und einem digitalen Speicher
zugeführt werden.
Magnetbänder sind als Archivdatenträger weiterhin äußerst
populär. Der Wehrmutstropfen dabei: die Bänder sollten alle zwei Jahre
ausgewechselt werden, da ihre Magnetisierung nicht von Dauer ist. Vor dem
Zugriff lädt ein Lesegerät jedes Band, was zu Wartezeiten führt. Hier muss jede
Organisation selbst entscheiden, wie schnell sie auf Archivdaten zugreifen muss
und ob es lohnt, sich eher der schnelleren Plattenspeicherung zuzuwenden. Mit
Einführung der CAS-Technologie (Content-Addressed-Storage) vor einigen Jahren
drängen auch die Festplattenhersteller in den Archivierungsmarkt. CAS
archiviert langlebige, gleich bleibende Informationen auf Plattenbasis
revisionssicher. Direkt mit ECM- und DMS-Systemen gekoppelt, erlaubt ein
solches Speichersystem den schnellen Online-Zugriff auf Archivdaten. Im
Vergleich mit den Tape-Klassikern verbrauchen die CAS-Archive zwar mehr Strom
und sind aufgrund ihrer Software-Intelligenz wartungsanfälliger. Vorteile wie
der RAID-Schutz der Archivdaten, die automatische Migration auf neue
Hardware-Generationen, die programmierbare Löschung von Informationen,
integrierte Rechteverwaltung sowie die höhere Performance stechen
Tape-Libraries allerdings rasch aus. Hinzu kommt, dass Anwender, die wenig
Stellplatz zur Verfügung haben oder diesen mieten müssen, bei Plattenarchiven
nur mit höchstens zwei 19-Zoll-Gehäusen im Rechenzentrum kalkulieren müssen.
Moderne Dokumentenablage und Langzeitarchivierung
Wer sich zu lange ziert und seine Datenablagetechnologien
nicht kontinuierlich modernisiert, riskiert die digitale Erinnerungslosigkeit:
Informationen können nicht in angemessener Zeit oder aufgrund mangelnder
Indizierung gar nicht wieder aufgefunden werden. Die eingangs erwähnte
ägyptische Methode der Langzeitarchivierung ist für flüchtige, digitale
Informationen leider nicht praktikabel. Viel Augenmerk sollten Unternehmen, die
ein Enterprise Content Management einführen, daher auf die Skalierbarkeit von
Formaten, Anwendungen und Systemen legen. Denn um die regelmäßige Nachrüstung
und Modernisierung der vorhandenen Medien und Infrastruktur kommt nach heutigem
Stand der Archivierungstechnik keine IT-Abteilung herum.
((12.330 Zeichen))
Autor
Titel: Herr
Vor- und Nachname: Malte
Rademacher
Funktion: Regional
Marketing Director Europe Central/East und Pressesprecher
Unternehmen/Organisation: EMC
Deutschland GmbH
Straße: Am
Kronberger Hang 2a
PLZ und Ort: D-65824
Schwalbach/Taunus
Tel. 06196/4728-0
Fax 06196/4728-218
eMail rademacher_malte@emc.com