Edit: Gefunden, danke! https://mastodon.world/@volzo/113517574933940712

Ich suche seit Wochen einen Tab, den ich offen hatte und offenbar geschlossen habe und nun einfach nicht mehr wiederfinde: Eine grafische Auswertung (IIRC eines journalistischen Mediums), welche Quellen welchen Umfang fuer das Training eines Sprachmodells (GPT-3?) hatten. Weiss jemand, was ich meine und kann mich in die richtige Richtung lenken?

Christopher Getschmann (@[email protected])

@[email protected] Die WP hatte da mal vor einiger Zeit eine interaktive Übersicht: https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/

Mastodon
@stk siehste, wäre Microsoft Recall doch ganz nützlich, oder?
@tessarakt ob ich's in der Browser-History oder in Recall nicht finde… ;p
@stk Die WP hatte da mal vor einiger Zeit eine interaktive Übersicht: https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/
See the websites that make AI bots like ChatGPT sound so smart

An analysis of a chatbot data set by The Washington Post reveals the proprietary, personal, and often offensive websites that go into an AI’s training data.

The Washington Post
@volzo yesss, das war's, danke!