En OpenStreetMap @openstreetmap @osm_tech están preocupados: miles de bots de IA llevan una semana escrapeando de manera coordinada el proyecto. Lo hacen utilizando más de 100.000 IPs, y cada IP hace varias peticiones. Así les resulta imposible bloquearlos.

Esto lleva no solo a que tengan más gastos de hosting, sino a que uno o varios chatbots estén trincando información del proyecto a petición de sus usuarios, y todo esto pueda poner el proyecto en peligro.

https://www.heise.de/en/news/OpenStreetMap-is-concerned-thousands-of-AI-bots-are-collecting-data-11157359.html

OpenStreetMap is concerned: thousands of AI bots are collecting data

Bots are said to be harvesting OpenStreetMap data on a large scale. This costs money and endangers the project.

heise online
@Argyle13
Esto me recuerda a "el dinero público no es de nadie". O el espacio público. O cualquier cosa pública. Saquean lo de todos y luego nos lo venden como algo propio... viva el liber(t)alismo...
@openstreetmap @osm_tech

@MrBlogger @Argyle13 @openstreetmap @osm_tech

existe el concepto y está teorizado desde hace 60 años, es "La tragedia de los bienes comunales" (tragedy of the commons): https://es.wikipedia.org/wiki/Tragedia_de_los_bienes_comunales

Tragedia de los bienes comunales - Wikipedia, la enciclopedia libre

@itorres
Imaginaba que esto no sería algo nuevo, pero no sabía ponerle nombre al concepto.
Muchas gracias :)
@Argyle13 @openstreetmap @osm_tech

@MrBlogger tu comentario era muy apropiado y como dices quería aportar ponerle nombre pero antes he sido muy escueto y puede que haya sonado borde. Gracias por tomarlo bien.

En castellano también tenemos la palabra "procomún" para hablar de los comunes. Artículo interesante para divulgar el concepto: https://www.elsaltodiario.com/guerrilla-translation/que-es-el-procomun

@Argyle13 @openstreetmap @osm_tech

¿Qué es el procomún?

<p>Existe un término importante que mucha gente no acaba de entender: el “procomún”. <br>¿Qué es? ¿A qué nos referimos cuando hablamos del “procomún” y de los “comunes”?<br>(Activad subtítulos en español a<a href="https://www.youtube.com/watch?v=xBtqYMXZhk8" target="_blank"> través de YouTube</a>)<br> </p>

El Salto Diario
The Tragedy of the Commons (feat. Alissa White-Gluz)

YouTube
OpenStreetMap Ops Team (@[email protected])

To keep #OpenStreetMap.org up and running while we're being deluged by scrapers, we've blocked 320,000+ primarily residential IPv4 addresses in the last 24 hours (+ 100,000 IPv6) involved in scraping. If you need OSM data, please don't scrape the website - use the official downloads at https://planet.openstreetmap.org 🙏🌍 #AI #Bots #Abuse

OSM Town | Mapstodon for OpenStreetMap
@salva_pl @Argyle13 Scrapear una web que tiene un enlace oficial para descargar el dataset en open data. Eso sobrepasa la categoría de egoista. Es que ni siquiera es estúpido, es directamente sádico.
@elrohir @salva_pl y no dire cosas más fuertes que no es plan
@Argyle13 @elrohir @salva_pl Es acaparar bienes tumbando el sitio original para luego ser el único proveedor de estos (pasando por su caja, por supuesto). Por ese motivo quienes administramos sitios pequeños vemos a los bots de GenAI como una plaga
@angeles @elrohir @salva_pl eso también se deja entrever. Y es una posibilidad no tan remota. Luego que por qué cualquier periodista hoy no abre un medio, sino una newsletter. Si pones algo en la web, se lo comen los bots.

@Argyle13 mientras leía esta noticia y esta otra, que de rebote, esa maldita actuación de los AIOverlords está jodiendo a internet archive https://www.niemanlab.org/2026/01/news-publishers-limit-internet-archive-access-due-to-ai-scraping-concerns/ (y por ende, al resto de internautas)

pensaban en la distopía de farenheit 451, los bomberos serían empleados de esas empresas para justamente para llevar a cabo lo que comentaba @angeles

horror! :(

@elrohir @salva_pl

News publishers limit Internet Archive access due to AI scraping concerns

Outlets like The Guardian and The New York Times are scrutinizing digital archives as potential backdoors for AI crawlers.

Nieman Lab
@rb3n @angeles @elrohir @salva_pl si, también hemos hablado de Farenheit 451 en la redacción esta mañana, pero con lo de la locura de la gente con el bot ese que ponen a correr en el ordenador y le dan acceso a todo. En fin...
@salva_pl @rb3n @elrohir @Argyle13 Esa es otra idea absolutamente brillante por lo tonto que es ese bicho al no ser capaz de diferenciar entre texto, metadatos e instrucciones a ejecutar 😈

@Argyle13 @openstreetmap @osm_tech Pero si pueden descargarse el planet.osm y ya está ¿no?

¿En serio son tan vagos/trozos de mierda que decidieron hacer scraping a lo cutre en vez de descargarse el puñetero archivo y ya está?

@arielcg @openstreetmap @osm_tech correcto. Y eso que desde OpenStreetMaps les piden que por favor usen los medios que tiene para ello. Pero se la pela
@Argyle13 @openstreetmap @osm_tech Al final la solución va meter Anubis o similares a saco, o hacer algún tipo de deep package inspection para detectar esos scrapers (seguro que tiene que haber formas de detectarlo, o por los cifrados TLS, o con un script que compruebe cosas del navegador), o bloquear países y ASNs del tirón y que paguen justos por pecadores
@arielcg @Argyle13 @openstreetmap Technically we're able to identify and block the abuse, but it takes up time and resources which would be better spent elsewhere. We are not unique in having to defend against this, we and others need help.
@osm_tech @arielcg @openstreetmap yes, lots of projects and webs have the same issue. They should stop, but instead they have "carte blanche" to do what they want. It is shameful
@Argyle13 @openstreetmap @osm_tech son una plaga. Nunca pensé que la IA acabaría con nosotros de esta forma
@maxxcan @openstreetmap @osm_tech antes de explotar están asegurandose de quedarse con todo
@Argyle13 @openstreetmap @osm_tech los muñecos de Remix, a robar y remezclar se dedican, sin documentación son incapaces de hacer nada
@Argyle13 @openstreetmap @osm_tech Qué asco dan. Incluso en mi humilde lugar de trabajo tenemos lío cada poco con el hosting de la web por los picos de tráfico que crean esos hijos de mil hienas.
@mictter @openstreetmap @osm_tech yo también lo veo en el analytics de las webs en las que curro. De repente sale un pico de la nada y "no se sabe" de donde viene. Claro claro. Asco