Das Internet hat die globalen Wissens- und Kommunikationssysteme revolutioniert und die Art, wie unsere Gesellschaften mit Wissen umgehen und wie sie sich „erinnern“ nachhaltig verändert. Doch um das digitale Gedächtnis steht es weniger gut, als man meinen könnte. Wie eine aktuelle Analyse eines Teams des amerikanischen Pew Research Centers zeigt,1 verschwindet ein großer Teil des Wissens bzw. des Contents in wenigen Jahren wieder aus dem Netz.
Für diese Untersuchung wurden fast 1 Mio. zufällig ausgewählte Websites, die von der Non-Profit Organisation Common Crawl seit dem Jahr 2007 im www indexiert wurden, auf ihre Funktionsfähigkeit überprüft. Der Test zeigte: Ein Viertel aller Websites, die irgendwann zwischen 2013 und 2023 existierten, waren im Oktober 2023 nicht mehr aufrufbar. In den meisten Fällen dürfte das daran liegen, dass eine einzelne Seite einer ansonsten noch funktionsfähigen Website gelöscht oder entfernt wurde.
Bei älteren Inhalten und Websites ist dieser Trend sogar noch deutlicher. Etwa 38 % der Webseiten, die im Jahr 2013 existierten, sind heute nicht mehr verfügbar, verglichen mit 15 % der Seiten, die 2022 existierten.
News-Seiten und Behörden
Dieser „digitale Gedächtnisverlust“ findet in vielen verschiedenen Bereichen der digitalen Welt statt. Pew Research untersuchte unter anderem Links, die im Frühjahr 2023 auf Regierungs- und Nachrichten-Websites führten. Diese Analyse ergab, dass 23 % der Nachrichten-Websites mindestens einen defekten Link enthalten, ebenso wie 21 % der Webseiten von Regierungsseiten. News-Seiten mit hohem und solche mit geringerem Traffic enthalten etwa gleich häufig defekte Links. Besonders häufig sind defekte Links auf Websites lokaler Behörden (vor allem jener von US-Gemeinden) zu finden.
Wikipedia
Für diese Analyse wurde eine zufällige Stichprobe von 50.000 englischsprachigen Wikipedia-Seiten gesammelt und die Links in ihrem Abschnitt „Referenzen“ untersucht.
- Die überwiegende Mehrheit dieser Seiten (82 %) enthält mindestens einen Referenzlink – das heißt einen, der den Leser auf eine andere Webseite als Wikipedia selbst weiterleitet. Insgesamt gab es auf den untersuchten Seiten etwas mehr als 1 Million Referenzlinks. Eine typische Seite hatte vier Referenzlinks.
- Die Analyse zeigt, dass 11 % aller auf Wikipedia verlinkten Referenzen nicht mehr zugänglich sind. Auf etwa 2 % der Quellseiten mit Referenzlinks war jeder Link auf der Seite defekt oder anderweitig nicht zugänglich, während weitere 53 % der Seiten mindestens einen defekten Link enthielten.
Soziale Medien
Um zu sehen, wie sich der digitale Verfall in den Sozialen Medien auswirkt, wurde im Frühjahr 2023 auch eine Echtzeitstichprobe von Tweets auf der Social-Media-Plattform X (damals noch bekannt als Twitter) gesammelt und diese drei Monate lang verfolgt. Das Ergebnis:
- Fast jeder fünfte Tweet ist nur wenige Monate nach seiner Veröffentlichung nicht mehr öffentlich auf der Website sichtbar. In 60 % dieser Fälle wurde der Account, der den Tweet ursprünglich gepostet hatte, auf privat gesetzt, gesperrt oder ganz gelöscht. In den anderen 40 % löschte der Accountinhaber den einzelnen Tweet, der Account selbst existierte jedoch weiterhin.
- Bestimmte Tweet-Typen verschwinden häufiger als andere. Mehr als 40 % der auf Türkisch oder Arabisch verfassten Tweets sind innerhalb von drei Monaten nach ihrer Veröffentlichung nicht mehr sichtbar. Und Tweets von Accounts mit reinen Standardprofileinstellungen verschwinden besonders häufig aus der öffentlichen Ansicht. Dies deutet auf einen hohen Anteil von automatisiert erstellten Accounts hin.
Quelle:
Pew Research Center: When Online Content Disappears. 17.05.2024. URL: https://www.pewresearch.org/data-labs/2024/05/17/when-online-content-disappears/ [03.06.2024].