Daten mit Geschichte

Zeitreise ins vergangene Jahrzehnt Das Internet bietet Zugang zu vielerlei Archiven - unter anderem zu Sammlungen "alter" Webseiten

Wohl kein anderes Medium als das Internet hat sich in so kurzer Zeit vom kleinen, elitären Netzwerk zu einem Massenmedium entwickelt. Und wohl kein zweites vermochte dabei die eigene Musealisierung so rasch und konsequent voranzutreiben. Quasi parallel zur allmählichen Verbreitung des weltweiten Datennetzes seit Mitte der neunziger Jahre haben sich Museen und Archive bereits um den Erhalt der digitalen Kultur bemüht. Negative Erfahrungen mit inkompatibler Soft- und Hardware, die mit älteren Geräteversionen und Programmiersprachen nicht mehr richtig funktionieren, ließen dies notwendig erscheinen.

Ein einzigartiges Projekt digitaler Denkmalpflege betreibt das Internet Archive (www.archive.org). Das seit 1996 in San Francisco ansässige Archiv hortet alle noch verfügbaren Webseiten und stellt Momentaufnahmen her, bevor der Mantel der Geschichte sie in Vergessenheit hüllt. Alte, verwaiste Homepages von Privatleuten aus den Anfangstagen des HTML-Codes, frühe kommerzielle Zeugnisse der digitalen Warenwelt, Presseportale mit den Nachrichten von Vorgestern und viele weitere Fundstücke aus der Prähistorie des World Wide Web sind im Internet Archive versammelt. Brewster Kahle, der Gründer des digitalen Fundus, will "universalen Zugang zu allem menschlichen Wissen schaffen" und scheut nicht den alttestamentarischen Vergleich mit der Bibliothek von Alexandria, wo heute ein Ableger des Internet Archive existiert.

Automatische Suchroboter, so genannte "Harvester" (Erntehelfer), kriechen fortwährend durchs Web und sammeln eifrig Daten. Bislang sind mehr als 55 Milliarden Einzelseiten zusammengetragen und gespeichert worden. Das gesamte Internet Archive beansprucht inzwischen zwei Petabyte Platz auf den Servern - das ist eine Zahl mit fünfzehn Nullen und entspricht einer Datenmenge von 40.000 Computern mit je 50 Gigabyte fassender Festplatte. Beeindruckend zwar, aber doch wohl nur ein Bruchteil des einmal digital Vorhandenen. Laut einer Studie der Schule für Informationsmanagement an der Universität von Berkeley wächst das Volumen gespeicherter Informationen pro Jahr um dreißig Prozent. Bevor die Archivroboter zurückkehren und die Spiegelung einer Webseite angelegt und indexiert haben, was zwischen sechs und neun Monate dauert, mag es die Seite gar nicht mehr geben.

Zurück an die Ursprünge des digitalen Universums gelangt man mit der Wayback Machine (Zeitmaschine), in deren Suchmaske eine beliebige Internetadresse einzugeben ist. Alle noch vorhandenen Versionen einer Webseite werden, nach Jahren sortiert, aufgelistet. Die frühen Verteilkämpfe um Repräsentanz und Aufmerksamkeit lassen sich dabei gut rekapitulieren. Bei Deutschland.de beispielsweise, damals noch nicht im Besitz der Bundesregierung, findet sich unter dem ersten Eintrag vom 2. November 1996 ein "Mega-Index" aller im Netz vertretenen Verlage, Buchhandlungen und Bibliotheken und unter der Rubrik "Bazaar" der "erste Hotelführer im Internet". Netscape.de, eines der ersten Web-Glossare, beschränkte sich 1996 noch auf Texte, Links und kleine Bilder. Grafische Schlichtheit war Trumpf, denn man surfte mit dem Modem. Die digitale Welt war überschaubar und ließ sich bequem mit ein paar Hyperlinks sortieren.

Neben Webseiten hortet das Internet Archive, das von einigen großen amerikanischen Stiftungen finanziert wird, auch Filme und Videos, Software und Bücher sowie Musik. Knapp 40.000 Live-Konzerte und über Hunderttausend Audio-Aufnahmen, von Country-Musik über experimentelle Klänge bis zu Bachs "wohltemperiertem Klavier", liegen zum freien Download bereit. In die Filmsammlung, die momentan 43.000 Einzelwerke umfasst, ist das komplette Prelinger Archiv aufgegangen, eine einzigartige Kollektion von Werbe-, Lehr- und Industriefilmen aus den USA. Zudem veranschaulichen US-Propagandafilme aus den 1940-er-Jahren, Wahlspots von 2004, Hunderte witziger "Brickfilme", die komplett aus Legosteinen hergestellt werden, sowie das Gesamtwerk des deutschen Avantgarde-Filmemacher Lutz Mommartz die Bandbreite der Sammlung.

Vor einem Jahr machte das Internet Archive mit der Digitalisierung von Büchern von sich reden. In Kooperation mit dem Gutenberg-Projekt und einigen renommierten Bibliotheken sind an der Universität von Toronto täglich 10.000 Buchseiten von speziellen Automaten eingescannt und mittels optischer Zeichenerkennung indexiert worden. Das ehrgeizige Million Book Project sollte bis Ende 2005 abgeschlossen sein. Bislang sind aber lediglich 10.000 Bücher digitalisiert worden. Seit Monaten liegt das Projekt still wegen eines Rechtsstreits um so genannte "orphan books", verwaiste Bücher, deren Urheberrecht abgelaufen ist. Archivgründer Kahle will gerichtlich klären lassen, ob diese Bücher juristisch als gemeinfrei gelten können.

Das in jedem Land anders gehandhabte Urheberrecht stellt die größte Hürde für das Internet Archive dar. Anders als das deutsche Urheberrecht, welches siebzig Jahre nach dem Tod des Autors erlischt, können beispielsweise nordamerikanische Rechteinhaber ihre Ansprüche beliebig verlängern. So ist der Klassiker Vom Winde verweht von Margaret Mitchell in den USA bis 2031 geschützt, während der Schutz in Australien 1999, fünfzig Jahre nach dem Tod der Autorin, verfallen ist. Dennoch darf das Werk auch in Australien nicht online verfügbar gemacht werden, da auch aus den USA darauf zugegriffen werden könnte. Einen Ausweg bilden Internet-Archive gegen Bezahlung oder geschlossene, nur für bestimmte Nutzergruppen zugängliche Archive wie Bibliotheken.

Dem Urteil sehen auch Internet-Firmen wie Google und Amazon mit großem Interesse entgegen, die immer mehr Archiv- statt bloß Katalogdienste anbieten. Mit Projekten wie Google Print und Amazons Search Inside the Book arbeiten beide mit Hochdruck an der Digitalisierung von Literatur. Zumindest Klappentexte, Inhaltsverzeichnisse und einige Textauszüge wollen die Händler zur besseren Orientierung von Lesern und potentiellen Käufern ins Netz stellen. Unter Bibliothekaren geht derweil das Unbehagen um: Was sind die Konsequenzen einer Privatisierung von Literatur? Was passiert mit den Daten etwa im Fall einer Firmeninsolvenz? Auch die Nachhaltigkeit der Digitalisierung in Form von allgemein gültigen Dateistandards sorgt die Archivare. Unlängst hat die britische Atomenergiebehörde ein Modellprojekt gestartet. Informationen über die Lagerung von Atommüll werden auf Spezialpapier gehortet - es gilt als das haltbarste Trägermedium.

Konkurrenz bekommen hat das Internet Archive von anderen Web-Portalen, die momentan unter dem Slogan Web 2.0 von sich reden machen. Besonders das Videoportal YouTube, das sich kürzlich der Suchmaschinenbetrieber Google für unfassbare 1,65 Milliarden Dollar einverleibt hat, erscheint ungleich populärer. Längst nicht nur Amateure von Handyfilmen in miserabler Qualität zieht es dort hin. Viele Filmemacher und Underground-Pioniere wie die Berliner Künstlergruppe Tödliche Doris haben ihr Super-8-Œuvre bei YouTube hinterlegt und nicht im Internet Archive. Hat man sich jedoch erst einmal von der Illusion verabschiedet, das "gesamte Weltwissen" zu horten, taucht schnell die Frage nach Auswahl und Qualität einer Sammlung auf. Sie lässt sich kaum von automatischen Suchrobotern beantworten.

Auch hierzulande wird der Traum vom Universalarchiv geträumt. Am 22. Juni beschloss der Deutsche Bundestag, "Medienwerke in unkörperlicher Form" in die Deutsche Nationalbibliothek aufzunehmen. Mit anderen Worten: das gesamte deutsche Internet, alle Webseiten mit einer .de-Endung. Einzige Einschränkung: sie müssen von "öffentlichem Interesse" sein. Mit diesem Passus sollen rein private sowie kommerzielle Seiten ausgeschlossen werden. Weitere Restriktionen existieren nicht, weil - wie aus der Leitung der Nationalbibliothek zu erfahren ist - man nicht wisse, was künftige Generationen für relevant halten. Für den Medientheoretiker Peter Weibel ist die Sache noch einfacher: "Wenn wir nicht wissen, was archiviert wurde, wissen wir auch nicht, was neu ist".


Liebe Leserin, lieber Leser,

dieser Artikel ist für Sie kostenlos.
Unabhängiger und kritischer Journalismus braucht aber auch in diesen Zeiten Unterstützung. Wir freuen uns daher, wenn Sie den Freitag hier abonnieren oder 3 Ausgaben gratis testen. Dafür bedanken wir uns schon jetzt bei Ihnen!

Ihre Freitag-Redaktion

00:00 01.12.2006

Ausgabe 41/2021

Hier finden Sie alle Inhalte der aktuellen Ausgabe

3 Ausgaben kostenlos lesen

Der Freitag ist eine Wochenzeitung, die für mutigen und unabhängigen Journalismus steht. Wir berichten über Politik, Kultur und Wirtschaft anders als die übrigen Medien. Überzeugen Sie sich selbst, und testen Sie den Freitag 3 Wochen kostenlos!

Kommentare