Nachruf: Abschied von robots.txt (1994-2025)

Das freiwillige Compliance-Protokoll, das das Internet zivilisierte, ist von uns gegangen, es verabschiedet sich Henning Fries.

https://www.heise.de/hintergrund/Nachruf-Abschied-von-robots-txt-1994-2025-10752448.html?wt_mc=sm.red.ho.mastodon.mastodon.md_beitraege.md_beitraege&utm_source=mastodon

#IT #Suchmaschine #Webentwicklung #news

Nachruf: Abschied von robots.txt (1994-2025)

Das freiwillige Compliance-Protokoll, das das Internet zivilisierte, ist von uns gegangen. Es verabschiedet sich Henning Fries.

Developer
@heisedeveloper
😭 The first line of defense is lost

@heisedeveloper
The queen is dead, long live the queen!

"Die Permission-based Modelle, die entstehen, sind das Gegenteil dessen, wofür robots.txt einst stand. Statt eines einfachen "Bitte nicht" erfordern sie komplexe Authentifizierung, Zahlung und rechtliche Verträge. Das Internet wird erwachsen – und verliert dabei seine Unschuld."

Wahre Worte. Letztendlich war sie aber genauso wie Do Not Track ein Gentlemens Agreement: Sie wird nichtig, sobald jemand aufhört Gentleman zu sein.

@heisedeveloper
Ich habe auf meiner Webseite die meisten KI Crawler schon seit ca. 1 1/2 Jahren geblockt, per IP Blocking und anhand des User Agent.
Gerade Anthropics hat sich sehr negativ verhalten.
Gab aber auch vereinzelt SEO Bots, die sich einen Dreck um die robots.txt geschert.
@heisedeveloper Wollen wir einfach ein neues Internet machen? Und das Fediverse in der Zwischenzeit ins Tor-Netzwerk umziehen? ​
@heisedeveloper Ich kann das bestätigen. Es gibt verstärkt Zugriffe aus Hostingnetzen, die sich als normale Browser tarnen bzw. Headless-Browser nutzen, die verstärkt PDFs abgrasen und keinerlei noindex, nofollow Links oder gar robots.txt beachten.

@heisedeveloper

"Mit dem Aufkommen der künstlichen Intelligenz verwandelte sich das Internet von einem kollaborativen Raum in eine Extraktionszone."

Leider sehr gute Zusammenfassung der Situation ☹️