Wayback Machine

Die Wayback Machine (wörtlich, auf Deutsch übersetzt: Weg-Zurück-Maschine) ist ein Weg für eine Reise in die Vergangenheit, zumindest beim Betrachten von Webseiten. Die Wayback Machine greift hierbei auf die Datenbank vom Internet Archive zu. Das Internet Archive ist die größte Bibliothek der Welt für Webseiten. In regelmäßigen Zeitintervallen werden hier Milliarden an Webseiten besucht und dokumentiert.

Inzwischen umfasst die Sammlung dieser Momentaufnahmen bereits über 525 Milliarden Einträge. Täglich kommen neue Inhalte hinzu. Im Monat sind es schätzungsweise 20 Terabyte, die gesamte Datensammlung liegt inzwischen im Petabyte-Bereich.

Zum einen ist das schön, um sich den historischen Verlauf bestimmter Seiten anzusehen, zum anderen kann das Tool überaus nützlich sein. Beispielsweise um festzustellen, welche Seite einen Inhalt zuerst hatte oder um bei der Rekonstruktion einer Webseite an die ehemaligen Inhalte zu gelangen.

Besonders gut ist, dass es sich nicht einfach nur um einen Screenshot handelt, sondern um die gesamte HTML-Version, sodass nicht nur der Aufbau analysiert werden kann, sondern auch Links anklickbar sind. Aber beachte, dass du nicht auf den aktuellen Link springst, sondern auf den historischen in der Wayback Machine.

Wayback Machine

Wayback Machine Screenshot 2021

Die Geschichte der Wayback Machine

Im Jahr 1996 wurde dieses geniale und gemeinnützige Projekt von Brewster Kahle ins Leben gerufen. Das damalige Ziel war es, barrierefrei digitale Inhalte in einem Langzeitarchiv zu dokumentieren. Zu diesem enorm großen Archiv gelangst du durch die Wayback Machine.

Dieses lange Gedächtnis vergisst nichts und zeigt eindrucksvoll die Entwicklung der Webseiten mit Inhalt und Design. Eine echte Zeitreise im wahrsten Sinne des Wortes. Übrigens ist in den USA im Bundesstaat Kalifornien diese Institution eine anerkannte Bibliothek.

Aber dieses ehrgeizige Projekt, welches enorme Serverressourcen verbraucht, speichert nicht nur Webseiten, sondern zusätzlich Videos, Software, Musik, Audiodateien, Bücher und vieles mehr.

Ist meine Webseite in der Wayback Machine enthalten?

Das kannst du ganz einfach prüfen! Gehe auf die Seite archive.org/web/ und gib im Suchfeld deine Domain ein. Es dauert gar nicht lange, dann siehst du die Ergebnisse. Wenn deine Seite noch sehr neu oder unbekannt ist, dann es unter Umständen sein, dass sie nicht aufgeführt ist. Das kannst du aber ganz einfach und kostenfrei ändern. Gehe rechts unten auf „Save Page Now“ und gib die URL deiner Webseite ein:

Seite speichern Wayback

Schon wird deine Seite ins Archiv mit aufgenommen.

Wenn die gesuchte Webseite bereits aufgeführt ist, dann gelangst du ins Archiv. Hier siehst du als tabellarischen Kalender und als Balkendiagramm mit Zeitstrahl alle Einträge seit 1996:

Historie Wayback

Nun kannst du entweder noch das gewünschte Jahr oben im Zeitstrahl anklicken oder gleich zum gewünschten Eintrag springen. Alle blau markierten Daten bieten einen Eintrag, den du dir anzeigen lassen kannst. Wenn du das Datum klickst, dann siehst du, wie die Webseite zu diesem Zeitpunkt ausgesehen hat.

Tipp: Übrigens kann man nicht nur Webseiten suchen, sondern auch Suchbegriffe. Dann bekommst du relevante Webseiten zum Keyword angezeigt. Klicke einfach auf eine der angezeigten Websites und wähle das gewünschte Datum.

Wenn du deine Webseite nicht in der Wayback Machine indexiert sehen möchtest, dann kannst du den Crawler vom Internet Archive aussperren und damit das Sammeln der Daten verbieten. Hieran hält sich der Crawler. Folgender Code kommt in die robots.txt:

User-agent: ia_archiver
Disallow: /

Bedenke, dass die Verbannung erst für die Zukunft gilt. Aber es besteht auch die Möglichkeit, die Einträge der Vergangenheit als Besitzer löschen zu lassen. Nur weil der Inhalt aus der Maschine entfernt wurde, bedeutet das nicht, dass er aus dem Internet verschwunden ist. In irgendeiner dunklen Spalte kann immer noch eine Kopie lauern. Denn es gibt natürlich auch Bots, welche die Inhalte der Wayback Machine sammeln und speichern.

Probleme beim Abruf

Auch wenn das Projekt an sich ein echtes Goldstück ist, hat man von Zeit zu Zeit das ein oder andere Problem. Teilweise sind nicht alle Daten und Seiten in der Maschine zu sehen. Gerade wenn man die weiteren Funktionen nutzt und unter Summary sich die Statistiken zu den indexierten Dateien wie Text, HTML, Bilder, Videos etc. ansieht, muss man mitunter lange warten und bekommt am Ende kein vollständiges Ergebnis. Das kann mitunter auch an JavaScript liegen oder der Größe der Datei. Übrigens kann man auch eine Sitemap aller URLs abrufen.

Browser Erweiterungen

Für die Tech-Affinen gibt es ein geniales Plug-in bei Google Chrome. Hiermit kann man beim Surfen sich die Historie der Webseite ansehen. Zugegeben kommt das in der Praxis nicht so oft zum Tragen, aber es kann sehr praktisch sein, wenn man auf eine 404-Fehlerseite trifft. Neben dieser Funktion kann das Plug-in Folgendes:

  • aktuelle Seite im Archiv speichern
  • kürzliche Version anzeigen
  • erste gespeicherte Version anzeigen
  • Überblick geben
  • Alexa-Daten abrufen
  • eine Whois-Abfrage machen

Nutzen in der Praxis

Wayback Machine und Webdesign

Ich persönlich nutze die Wayback Machine gerne, wenn ich eine Webseite für Kunden gestalte, um mir den Verlauf seines Designs anzusehen. Dadurch bekomme ich ein gutes Gefühl für seine Entwicklung und mitunter entdecke ich auch Inhalte, die wieder ausgegraben werden. Beispielsweise konnte ich bei der Webseite eines Fotografen wunderschöne Bilder aus der Vergangenheit finden. Dieser wusste gar nicht mehr, dass es diese Aufnahme gibt und war vom Re-Design sichtlich begeistert.

SEO mit der Wayback Machine

Aber auch bei der Suchmaschinenoptimierung ist sie ein gängiges Tool. Hierfür habe ich mehrere Einsatzszenarien. Es kommen des Öfteren Kunden zu mir, die durch einen Webseitenumzug und fehlende Weiterleitungen ihre Rankings verloren haben. Über die Wayback Machine kann ich diese Inhalte rekonstruieren.

Aber auch die Struktur der vorherigen Seite kann dadurch analysiert werden. Mitunter ist ein Relaunch einer Webseite nicht immer ein Erfolg in der Webseite. Es sind oft kleine einfache Details, die den Kunden Rankings kosten. Hier ist ein Blick in die Vergangenheit ein wahrer Segen.

Ich kenne SEO-Kollegen, die sich auf den Domainkauf und die Rekonstruktion seiner Inhalte spezialisiert haben. Sie halten Ausschau nach Domains, die aufgegeben werden und zu ihrer Zeit eine starke Sichtbarkeit hatten. Diese werden dann gekauft und die Inhalte werden wieder zum Leben erweckt, in der Hoffnung, dass Google der Domain ihre alte Autorität zurückgibt.

Rechtliches zur Wayback Machine

Aber auch rechtlich kann die Zeitmaschine eine Hilfe sein. Wie weist man besser nach, dass man der Urheber eines Inhalts ist, als der Beweis durch ein unabhängiges Medium? Hier kann die Maschine zeigen, wer als Erstes einen Inhalt veröffentlicht hat. Die Snapshots aus der Wayback Machine wurden in der Vergangenheit bereits bei Gerichtsverfahren als Beweis zugelassen. Auch wenn man Duplicate Content von Mitbewerbern auch theoretisch über die Indexierung in der Search Console nachweisen kann.

Aber genau im rechtlichen Bereich gibt es auch Kritik an diesem Tool. Denn sie erstellt Kopien von Webseiten, ohne die Erlaubnis ihrer Besitzer einzuholen. Diese werden der Öffentlichkeit zur Verfügung gestellt. Der Urheber wird nicht gefragt, ob er damit einverstanden ist.

Fazit zur Nutzung

Egal ob für den romantischen Nostalgiker oder für den professionellen Webdesigner, die Wayback Machine ist in jedem Fall einen Besuch wert! Man kann mit diesem Werkzeug viele nützliche Erkenntnisse erlangen und sich auch Unmengen an Inspirationen holen. Dieses historische Verzeichnis ist eine Bereicherung für das Internet und verdient auch Unterstützung.

0 Kommentare

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht.

Sistrix – das SEO Tool im Portrait

Was ist Sistrix eigentlich und warum ist das wichtig für SEO? Wir stellen die Toolbox un ihre Funktionen vor.

Was ist Content Marketing?

Was ist Content Marketing? Ist es sinnvoll? Wie funktioniert es? Wir beantworten deine Fragen ganz ausführlich.

Was ist Affiliate Marketing?

Was ist Affiliate Marketing? Wir beschäftigen uns mit dieser Form der Vermarktung und klären alle Fragen auf!

Was ist ein SEO Keyword?

Was ist eigentlich ein SEO Keyword? Welche Keyword Arten gibt es? Warum sind die so wichtig? Wir erklären alles ganz ausführlich.

Google Search Console einrichten – die Anleitung für 2022

Du willst wissen, wie du die Google Search Console einrichten kannst? Wir erklären es dir, Schritt für Schritt, mit Bildern!

Was ist eine nachhaltige Suchmaschine?

Was ist eine nachhaltige Suchmaschine? Wir beantworten diese Fragen und stellen dir fünf verschiedene Maschinen vor.

Google Display Ads erstellen – Werbung im Displaynetzwerk 2022

Du willst mit Google Display Ads auf Millionen von Webseiten Werbung schalten? Dann bist du hier genau richtig. In unserer Anleitung zeigen wir dir, wie einfach du deine erste Displaykampagne erstellst und auf was du dabei achten solltest. Was sind Google Display Ads?...

Google Discovery Ads erstellen – die Anleitung 2022

Du willst Google Discovery Ads erstellen? Dann bist du hier genau richtig. In unserer Anleitung zeigen wir dir die Vorteile von Google Discovery Ads, wie du eine Discovery Kampagne erstellst und worauf du achten solltest. Vorteile Google Discovery Ads Google Discovery...

Google-Ranking verbessern: drei mal drei Tipps vom Profi!

Du kennst es vielleicht: Du hast deine Webseite erstellt, hast hundert verschiedene Begriffserklärungen zu SEO gelesen und willst jetzt endlich mit deiner eigenen Suchmaschinenoptimierung loslegen. Aber irgendwie steht man dann vor einem scheinbar riesigen Berg. Womit...

Backlinks aufbauen: die zehn größten Fehler!

Der Linkaufbau ist der wohl wichtigste Teil der Off-Page-Optimierung. Wenn du hier Fehler machst, gehst du ein enorm großes Risiko ein, denn du kannst deine gesamte Sichtbarkeit verlieren. Ich erkläre dir heute die zehn größten Fehler beim Backlinks aufbauen! Ehe wir...