Los datos no son bienes comunes

Un artículo reciente de John Herrman comienza con una afirmación familiar y tranquilizadora: las empresas tecnológicas pueden quedarse sin datos de entrenamiento para sus modelos de IA. Cita un artículo de investigación escrito en coautoría por 49 investigadores (¡una proporción de más de un autor por página!) titulado “Consent in Crisis: The Rapid Decline of the AI ​​Data Commons” (Consentimiento en crisis: el rápido declive de los datos como bienes comunes para la IA). Como sugiere el título, el artículo parte de la cuestionable proposición de que algo así como que los “datos son bienes comunes” puede existir de la misma manera que un pueblo puede compartir tierras comunes, como si los datos simplemente estuvieran allí y lo importante fuera una forma equitativa de mantenerlos para su uso. “La web se ha convertido en la principal fuente comunitaria de datos, o ‘bien común de datos’, para sistemas de IA multimodales y de propósito general”.

¿De qué comunidad están hablando? ¿Y a qué aspecto de la “web” se refieren? ¿Al texto, a las interacciones, a los metadatos, a los datos de comportamiento, a los datos de localización o a qué? ¿Desde cuándo la “web” es propiedad común? Es casi una tautología, pero si una parte de una información es valiosa, alguien reivindicará derechos de propiedad sobre ella, y si se invocan derechos de propiedad, se puede asumir que la información en cuestión puede ser explotada. Una vez que los modelos de aprendizaje automático hagan que datos aparentemente sin valor vuelvan a ser supuestamente útiles, se empezarán a reclamar de nuevo derechos de propiedad. Asimismo, habrá un incentivo para que se produzcan más datos, con o sin el consentimiento de quienes producen esos datos.

Los “datos” se crean, no se encuentran ni se agotan como un recurso natural.

Rob Horning

#bienesComunes #datos #datosComoBienesComunes #desarrolloDeLaInteligenciaArtificial #inteligenciaArtificial

12ft