https://nry.me/posts/2025-10-09/small-web-screenshots/ #flashywebsites #webdesign #cheeseburgers #CommonCrawl #HackerNews #ngated
Mashable: Common Crawl accused of feeding paywalled content to AI companies. “In a detailed investigation for The Atlantic, reporter Alex Reisner reveals that several major AI companies have quietly partnered with the Common Crawl Foundation — a nonprofit that scrapes the web to build a massive public archive of the internet for research purposes.”
„Auch Roboter sind Menschen.“, das sagt Rich Skrenta, Geschäftsführer von Common Crawl – einer gemeinnützigen Organisation, die Milliarden von Webseiten durchsucht und angeblich eine Hintertür für KI-Modelle geschaffen hat, um diese heimlich mit Artikeln hinter Bezahlschranken zu trainieren. Skrenta erklärte gegenüber „The Atlantic“ in „The Nonprofit Doing the AI Industry’s Dirty Work“ v. 04.11.2025, Anfragen zur Entfernung solcher Inhalte aus der Datenbank seien „total lästig“, und argumentiert, Bots sollten kostenlos alles lesen dürfen.
Kunden von Common Crawl sind u.a. OpenAI, Google, Anthropic, Nvidia, Meta und Amazon.
AI steals everything, everywhere...mehr fällt mir dazu gerade nicht ein, ausser: 🤮🤮🤮🤮🤮
#kishit #ki #ai #openai #google #meta #amazon #anthropic #nvidia #commoncrawl
Mehrere französische #Medienhäuser protestieren gegen die unautorisierte Nutzung ihrer Inhalte durch #KI-Systeme.
Besonders im Fokus stehen frei zugängliche Datenbanken wie #CommonCrawl, deren Inhalte zum Training von #Sprachmodellen genutzt werden.
Die #Verlage fordern die Entfernung urheberrechtlich geschützter Inhalte und kündigen rechtliche Schritte an.
#Urheberrecht #KünstlicheIntelligenz #Frankreich #Verwertungsrechte