Wayback Machine

Die Wayback Machine (wörtlich, auf Deutsch übersetzt: Weg-Zurück-Maschine) ist ein Weg für eine Reise in die Vergangenheit, zumindest beim Betrachten von Webseiten. Die Wayback Machine greift hierbei auf die Datenbank vom Internet Archive zu. Das Internet Archive ist die größte Bibliothek der Welt für Webseiten. In regelmäßigen Zeitintervallen werden hier Milliarden an Webseiten besucht und dokumentiert.

Inzwischen umfasst die Sammlung dieser Momentaufnahmen bereits über 525 Milliarden Einträge. Täglich kommen neue Inhalte hinzu. Im Monat sind es schätzungsweise 20 Terabyte, die gesamte Datensammlung liegt inzwischen im Petabyte-Bereich.

Zum einen ist das schön, um sich den historischen Verlauf bestimmter Seiten anzusehen, zum anderen kann das Tool überaus nützlich sein. Beispielsweise um festzustellen, welche Seite einen Inhalt zuerst hatte oder um bei der Rekonstruktion einer Webseite an die ehemaligen Inhalte zu gelangen.

Besonders gut ist, dass es sich nicht einfach nur um einen Screenshot handelt, sondern um die gesamte HTML-Version, sodass nicht nur der Aufbau analysiert werden kann, sondern auch Links anklickbar sind. Aber beachte, dass du nicht auf den aktuellen Link springst, sondern auf den historischen in der Wayback Machine.

Wayback Machine

Wayback Machine Screenshot 2021

Die Geschichte der Wayback Machine

Im Jahr 1996 wurde dieses geniale und gemeinnützige Projekt von Brewster Kahle ins Leben gerufen. Das damalige Ziel war es, barrierefrei digitale Inhalte in einem Langzeitarchiv zu dokumentieren. Zu diesem enorm großen Archiv gelangst du durch die Wayback Machine.

Dieses lange Gedächtnis vergisst nichts und zeigt eindrucksvoll die Entwicklung der Webseiten mit Inhalt und Design. Eine echte Zeitreise im wahrsten Sinne des Wortes. Übrigens ist in den USA im Bundesstaat Kalifornien diese Institution eine anerkannte Bibliothek.

Aber dieses ehrgeizige Projekt, welches enorme Serverressourcen verbraucht, speichert nicht nur Webseiten, sondern zusätzlich Videos, Software, Musik, Audiodateien, Bücher und vieles mehr.

Ist meine Webseite in der Wayback Machine enthalten?

Das kannst du ganz einfach prüfen! Gehe auf die Seite archive.org/web/ und gib im Suchfeld deine Domain ein. Es dauert gar nicht lange, dann siehst du die Ergebnisse. Wenn deine Seite noch sehr neu oder unbekannt ist, dann es unter Umständen sein, dass sie nicht aufgeführt ist. Das kannst du aber ganz einfach und kostenfrei ändern. Gehe rechts unten auf „Save Page Now“ und gib die URL deiner Webseite ein:

Seite speichern Wayback

Schon wird deine Seite ins Archiv mit aufgenommen.

Wenn die gesuchte Webseite bereits aufgeführt ist, dann gelangst du ins Archiv. Hier siehst du als tabellarischen Kalender und als Balkendiagramm mit Zeitstrahl alle Einträge seit 1996:

Historie Wayback

Nun kannst du entweder noch das gewünschte Jahr oben im Zeitstrahl anklicken oder gleich zum gewünschten Eintrag springen. Alle blau markierten Daten bieten einen Eintrag, den du dir anzeigen lassen kannst. Wenn du das Datum klickst, dann siehst du, wie die Webseite zu diesem Zeitpunkt ausgesehen hat.

Tipp: Übrigens kann man nicht nur Webseiten suchen, sondern auch Suchbegriffe. Dann bekommst du relevante Webseiten zum Keyword angezeigt. Klicke einfach auf eine der angezeigten Websites und wähle das gewünschte Datum.

Wenn du deine Webseite nicht in der Wayback Machine indexiert sehen möchtest, dann kannst du den Crawler vom Internet Archive aussperren und damit das Sammeln der Daten verbieten. Hieran hält sich der Crawler. Folgender Code kommt in die robots.txt:

User-agent: ia_archiver
Disallow: /

Bedenke, dass die Verbannung erst für die Zukunft gilt. Aber es besteht auch die Möglichkeit, die Einträge der Vergangenheit als Besitzer löschen zu lassen. Nur weil der Inhalt aus der Maschine entfernt wurde, bedeutet das nicht, dass er aus dem Internet verschwunden ist. In irgendeiner dunklen Spalte kann immer noch eine Kopie lauern. Denn es gibt natürlich auch Bots, welche die Inhalte der Wayback Machine sammeln und speichern.

Probleme beim Abruf

Auch wenn das Projekt an sich ein echtes Goldstück ist, hat man von Zeit zu Zeit das ein oder andere Problem. Teilweise sind nicht alle Daten und Seiten in der Maschine zu sehen. Gerade wenn man die weiteren Funktionen nutzt und unter Summary sich die Statistiken zu den indexierten Dateien wie Text, HTML, Bilder, Videos etc. ansieht, muss man mitunter lange warten und bekommt am Ende kein vollständiges Ergebnis. Das kann mitunter auch an JavaScript liegen oder der Größe der Datei. Übrigens kann man auch eine Sitemap aller URLs abrufen.

Browser Erweiterungen

Für die Tech-Affinen gibt es ein geniales Plug-in bei Google Chrome. Hiermit kann man beim Surfen sich die Historie der Webseite ansehen. Zugegeben kommt das in der Praxis nicht so oft zum Tragen, aber es kann sehr praktisch sein, wenn man auf eine 404-Fehlerseite trifft. Neben dieser Funktion kann das Plug-in Folgendes:

  • aktuelle Seite im Archiv speichern
  • kürzliche Version anzeigen
  • erste gespeicherte Version anzeigen
  • Überblick geben
  • Alexa-Daten abrufen
  • eine Whois-Abfrage machen

Nutzen in der Praxis

Wayback Machine und Webdesign

Ich persönlich nutze die Wayback Machine gerne, wenn ich eine Webseite für Kunden gestalte, um mir den Verlauf seines Designs anzusehen. Dadurch bekomme ich ein gutes Gefühl für seine Entwicklung und mitunter entdecke ich auch Inhalte, die wieder ausgegraben werden. Beispielsweise konnte ich bei der Webseite eines Fotografen wunderschöne Bilder aus der Vergangenheit finden. Dieser wusste gar nicht mehr, dass es diese Aufnahme gibt und war vom Re-Design sichtlich begeistert.

SEO mit der Wayback Machine

Aber auch bei der Suchmaschinenoptimierung ist sie ein gängiges Tool. Hierfür habe ich mehrere Einsatzszenarien. Es kommen des Öfteren Kunden zu mir, die durch einen Webseitenumzug und fehlende Weiterleitungen ihre Rankings verloren haben. Über die Wayback Machine kann ich diese Inhalte rekonstruieren.

Aber auch die Struktur der vorherigen Seite kann dadurch analysiert werden. Mitunter ist ein Relaunch einer Webseite nicht immer ein Erfolg in der Webseite. Es sind oft kleine einfache Details, die den Kunden Rankings kosten. Hier ist ein Blick in die Vergangenheit ein wahrer Segen.

Ich kenne SEO-Kollegen, die sich auf den Domainkauf und die Rekonstruktion seiner Inhalte spezialisiert haben. Sie halten Ausschau nach Domains, die aufgegeben werden und zu ihrer Zeit eine starke Sichtbarkeit hatten. Diese werden dann gekauft und die Inhalte werden wieder zum Leben erweckt, in der Hoffnung, dass Google der Domain ihre alte Autorität zurückgibt.

Rechtliches zur Wayback Machine

Aber auch rechtlich kann die Zeitmaschine eine Hilfe sein. Wie weist man besser nach, dass man der Urheber eines Inhalts ist, als der Beweis durch ein unabhängiges Medium? Hier kann die Maschine zeigen, wer als Erstes einen Inhalt veröffentlicht hat. Die Snapshots aus der Wayback Machine wurden in der Vergangenheit bereits bei Gerichtsverfahren als Beweis zugelassen. Auch wenn man Duplicate Content von Mitbewerbern auch theoretisch über die Indexierung in der Search Console nachweisen kann.

Aber genau im rechtlichen Bereich gibt es auch Kritik an diesem Tool. Denn sie erstellt Kopien von Webseiten, ohne die Erlaubnis ihrer Besitzer einzuholen. Diese werden der Öffentlichkeit zur Verfügung gestellt. Der Urheber wird nicht gefragt, ob er damit einverstanden ist.

Fazit zur Nutzung

Egal ob für den romantischen Nostalgiker oder für den professionellen Webdesigner, die Wayback Machine ist in jedem Fall einen Besuch wert! Man kann mit diesem Werkzeug viele nützliche Erkenntnisse erlangen und sich auch Unmengen an Inspirationen holen. Dieses historische Verzeichnis ist eine Bereicherung für das Internet und verdient auch Unterstützung.

0 Kommentare

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Dokumentation für das JTL Plugin – LMN Artikelhinweis

Nutzungsvoraussetzungen Außer einer gültigen Plugin-Lizenz sind keine weiteren Voraussetzungen zu beachten. Systemvoraussetzungen Es ist erforderlich, dass ein JTL-Shop ab Version 5.2.4 vorliegt und mindestens die PHP-Version 8.3 installiert ist. Installation...

Google Ads – Effektives Management saisonaler Schwankungen

Hey du, in deinem Business wirst du zwangsläufig mit Schwankungen in den Verkaufszahlen konfrontiert, und das liegt einfach mitunter an der Saisonalität. Mal steigen die Verkäufe, mal gehen sie in den Keller. Das zu managen, kann manuell verdammt knifflig sein. Zum...

10 Gründe, warum Du auf Google Ads Geld verbrennst

Als Google Ads Agentur sehen wir viele Ads Konten und stellen bei Neukunden immer wieder die gleichen Fehler fest.

Wie lang sollte ein Blogbeitrag sein?

Wie lang sollte ein Blogbeitrag sein – die Frage, die wohl jeden SEO schon beschäftigt hat. Wir gehen der Sache auf den Grund.

Wie kann ich besser im Internet gefunden werden? Eine Einführung

Wie kann ich besser im Internet gefunden werden? Das ist die Frage der Fragen und wir beantworten sie in diesem Guide für Einsteiger!

YouTube SEO: So rankst du auf der Video-Plattform

Starte mit YouTube SEO durch, damit deine Videos auch geklickt werden! Wir haben die wichtigsten Tipps und Tricks für die Videoplattform.

Lokales SEO: alles, was du wissen musst!

Lokales SEO: wir haben die Grundlagen und die wichtigsten Tipps für örtliche Unternehmen zusammengefasst. Ranken Sie ganz einfach ganz oben!

Likes kaufen – Was bringt das?

Was bringt Likes kaufen eigentlich? Welche Vor- und Nachteile hat es und ist Likes kaufen legal? Wir klären auf.

Was ist Google Analytics?

Was ist Google Analytics eigentlich und wie kann ich es einrichten? Wir erklären es einfach und unkompliziert!

Instagram Gewinnspiel: Darauf musst du achten!

Das Instagram Gewinnspiel wird manchmal als Lösung für alles dargestellt. Was es wirklich ist und worauf du achten musst, erfährst du hier.