Noch eine kleine Meldung für Nutzer, die gelegentlich verschwundene Webseiten über den Google Cache aufgespürt haben. Der Suchmaschinenriese hat diese Funktion abgeschaltet und alle im Cache gespeicherten Informationen gelöscht. Begründet wird dies damit dass diese Funktion inzwischen schlicht nicht mehr notwendig sei. Noch ein kurzer, nostalgischer Bild auf diese Funktion, die ich vermissen werde.
Anzeige
Der Google Cache
Beim Google Cache handelte es sich um eine Funktion, die die Google-Suchmaschine in der Vergangenheit automatisch bereitstellte. Bei der Indexierung von Webseiten wurden nicht nur Treffer in den Google Suchindex aufgenommen. Sondern die Suchmaschine hat auch den aktuellen Inhalt dieser Webseite in einem sogenannten Cache gespeichert. Lax gesprochen war das dann ein "Backup einer Webseite", die Google automatisch erstellte.
Wurde eine Webseite bzw. ein Artikel im Original gelöscht, konnte die Kopie im Google Cache meist noch abgerufen werden. Das wurde gerne genutzt, um bei Disputen korrigierte oder gelöschte Artikel in der Originalfassung abzurufen. Vor längerer Zeit gab es neben den Suchergebnissen auf google.com sogar noch ein Pulldown-Menü mit einem Eintrag für den Cache, so dass man sehr bequem auf diese Einträge zugreifen konnte.
Die Google-Beschreibung aus "Google Search Help" enthält diese Information auch noch in der obigen angegebenen Form (siehe vorhergehende Bild). Aber diese Information ist veraltet und stimmt so nicht mir. Mir war bereits aber vor längerer Zeit aufgefallen, dass dieses kleine Dreieck zum Öffnen eines Menüs neben den Links der Treffer verschwunden ist. Heute beinhalten die Treffer nur noch das Menü aus drei senkrechten Pünktchen, welches dann eine Info in der rechten Spalte der Suchseite einblendet.
Anzeige
Was bisher aber noch funktionierte, war die Möglichkeit, die Seite cachedview.com aufzurufen, dann die URL im Suchfeld einzutragen und dann die Schaltfläche Google Web-Cache anzuwählen. Sofern die Seite im Google Cache vorhanden war, ließ sie sich dann abrufen. Ich habe es gelegentlich verwendet, um im Internet nach gelöschten Seiten zu suchen. Und ein oder zwei Mal gab es den Fall, dass ich einen von mir versehentlich gelöschte Blog-Beitrag aus dem Cache restaurieren konnte. Hier ist von Vorteil, dass Google bei mir oft binnen einer Minute neue Beiträge in den Index aufnimmt.
Der Cache wird nicht mehr gebraucht
Nun ist es so, dass Google seinen Cache ganz offiziell abgeschaltet hat. Versucht man den Cache über cachedview.com abzurufen, kommt nun nur noch der Fehler 302 Moved, was für eine Weiterleitung steht. Auf der Weiterleitungsseite wird man seit einigen Wochen mit der irreführenden Meldung "Unsere Systeme haben ungewöhnlichen Datenverkehr aus Ihrem Computernetzwerk festgestellt. Bitte versuchen Sie es später erneut." begrüßt.
Die Erklärung, warum der Google Cache nicht mehr verfügbar ist, findet sich in nachfolgendem Tweet. Der Google Cache war dazu gedacht, den Leuten den Zugriff auf Seiten zu erleichtern, als man sich noch nicht darauf verlassen konnte, dass eine Seite geladen wird.
Heutzutage haben sich die Dinge stark verbessert, meint Google. Deshalb haben die Verantwortlichen beschlossen, die Funktion des Cache einzustellen. Was nun noch bleibt, wäre die WayBack-Machine als Internetarchiv zu nutzen. Wird in obigem Tweet auch als eine Antwort angerissen: Während Google jährlich Milliarden US-Dollar einfährt, muss das Internetarchiv jährlich um Finanzierung betteln (ich mache jährlich meine Donation, weil ich bei im Blog gebrochenen Links auf dieses Archiv zurückgreife). Bleibt zu hoffen, dass Google ein wenig von seinem Gewinn an das Internetarchiv abgibt, um dessen Arbeit zu finanzieren. SPON hat hier noch einen Artikel zum "gewipten Google Cache" publiziert, der das Ganze aus Sicht eines Normalanwenders sieht.
Anzeige
Falls es hilft, Bing hat diese Funktion (noch).
Schade. War hin und wieder eine schnelle einfache Möglichkeit, nachträgliche Manipulationen an Fakten aufzudecken.
Ist vielleicht so gewollt? Wehe dem, wer Böses denkt…
Kostet alles, irgendwo müssen diese Daten auch gespeichert werden, das ist nicht kostenlos bzw. wird vielleicht nicht durch Einnahmen aus Werbung aufgefangen und es gibt eine Alternative, die sich inzwischen mehr oder weniger überall durchgesetzt hat. Auch bei Google wird inzwischen stärker aufs Geld geschaut, wie man inzwischen weiß.
Die Daten weden und bleiben selbstverständlich weiter bei Google gespeichert, andere Annahmen wären sehr naiv.
Der Cache wurde schlicht deaktiviert, damit niemand mehr seine KI-Modelle damit trainieren kann.
So ein Cache ist ja auch nicht unproblematisch. Was nützt das Ringen mit Site-Betreibern, damit sie ihre Seiten von illegalen Inhalten säubern, wenn Google den ganzen Ranz dann weiterhin bereithält?
Auch wenn's zwischendurch ganz nett ist: Wir müssen uns von der „pauschal alles mitprotokollieren"-Mentalität befreien und akzeptieren, dass Dinge vergänglich sind.
Um so wichtiger ist ein Backup-Konzept der Urheber. Die haben unter dem Motto „Steht jetzt alles im Internet" gedruckte Kataloge und Dokumentationen abgeschafft, alle paar Jahre wechseln sie den Datenbanktyp – und wenn es zu spät ist fällt ihnen auf, dass ihnen das Archiv fehlt und sie schon nicht mehr wissen, was sie vor 5 Jahren eigentlich getrieben haben.
Ich fand den Cache bisweilen schon auch praktisch. Wenn ich etwa nach der Lösung irgendeines Problems googelte, fand ich manchmal eine Antwort in einem Forum. Klickte ich auf den von Google gefundenen Link, war der gesuchte Eintrag aber oft nicht mehr aufzufinden, weil er bereits durch aktuellere Einträge auf eine andere Seite verschoben wurde. Diesbezüglich war der Google-Cache oft sehr hilfreich.
"Der Google Cache war dazu gedacht, den Leuten den Zugriff auf Seiten zu erleichtern, als man sich noch nicht darauf verlassen konnte, dass eine Seite geladen wird."
Versteh ich nicht ganz, ging es um die Anzeige in den Google-Suchergebnissen?
Gab es irgendwo mal nennenswerte Probleme, dass Webseiten nicht erreichbar waren? Wenn dann waren die Webseiten wirklich mal down oder wurden gerade überarbeitet. In den Fällen war der Cache eher ein Problem, weil die Leute auf der Webseite etwas geändert haben und es war noch Ewigkeiten im Cache gespeichert, in den Suchergebnissen wurden alte Infos angezeigt oder die Seite wurde offline genommen, aber immer noch sichtbar/erreichbar.
In den Anfangszeiten des WWW war für mich der Cache tatsächlich mitunter hilfreich, wenn eine Seite aus irgendwelchen Gründen – über längere Zeit hinweg – nicht erreichbar war. Dieser Zweck kam aber schon länger nicht mehr zum Tragen.
Wie von Rocco Siffredi erwähnt, nutzte ich den Google Cache auch gelegentlich für nicht mehr sichtbare Problemlösungen in Foren.
"Was nun noch bleibt, wäre die WayBack-Machine als Internetarchiv zu nutzen."
Dieses Archiv ist insofern interessant, dass es die Grundstruktur einer Seite zu einem beliebigen Zeitpunkt anzeigt. Viele dynamische Informationen kann man dort aber nicht abrufen. Selbst zusätzliche Seiten, die auf der Originalseite über die Navigation erreichbar sind, werden teilweise nicht angezeigt. Bei einer von mir (inhaltlich) verwalteten Seite ist als Snapshot in der WayBack-Machine nur die Startseite verfügbar, sämtliche anderen Seiten jedoch nicht. Insofern können die Inhalte dort – per heutigen Stand – nicht als Ersatz für den Google Cache dienen. Dazu müssten zumindest die kurz zurückliegenden Snapshots komplettiert werden.
Wenn man eine ältere Version einer Website sucht, bietet sich die WayBackMachine an:
https://archive.org/web/
VG Bernie