🤖 ¿Cómo usamos la IA en Civio?

Siempre hemos sido brutalmente transparentes con nuestras metodologías y este tema no iba a ser la excepción.

Hoy, compartimos contigo el código ético en el que te contamos en qué tareas está vetada, en cuáles se permite y cómo, con ejemplos claros.

Desarrollamos las claves ⬇️🧵

🔗 https://civio.es/novedades/2026/03/31/estas-son-nuestras-reglas-sobre-el-uso-de-la-ia/

Estas son nuestras reglas sobre el uso de la IA

Este código ético nace tras un debate interno en la organización y marca de forma transparente y específica, con ejemplos muy concretos, en qué tareas está vetada, en cuáles se permite y cómo.

Civio

1️⃣ No se va a usar IA, en ningún caso, para escribir nuestros artículos. Nuestro periodismo es artesano y se cocina a fuego lento por personas especializadas y rigurosas.

2️⃣ No se permitirá su uso en comunicados, propuestas de enmiendas, documentos presentados en juicios ni en la comunicación directa contigo.

3️⃣ Sí se permite, como apoyo, sobre todo en programación o a la hora de transformar formatos o extraer datos. El análisis de datos, nuestra seña de identidad, seguirá siendo humano.

Las reglas generales marcan tres claves:

❌️ La IA no hace nada por sí sola, nunca.
🔎 Si se usa se contará en las metodologías de forma detallada.
✅️ Se utilizarán sistemas validados, muchas veces solo en local, que respeten la protección de datos y fuentes.

Este código surge tras largos debates internos. Hemos aprendido mucho en este proceso, pero seguro que irán surgiendo ejemplos, casos o conflictos.

Así que es un trabajo en construcción y estas son las bases: https://civio.es/nosotros/uso-IA/

Uso de la Inteligencia Artificial (IA) en Civio

En este código establecemos las líneas generales que rigen el uso de la Inteligencia Artificial (IA) en el trabajo de Civio. Este documento ha sido creado tras una larga reflexión dentro del equipo y el patronato de la organización.

Civio
@civio El cambio de formato de los datos siempre es lo mismo. Paquetes estadísticos como GNU R te permiten abrir todo tipo de archivos y operar con los mismos tipos de datos (data frames). Tampoco veo motivo para usar LLMs en eso.
@Fedihacker @civio nos referimos a cosas como el OCR: los modelos multimodales recientes funcionan mejor que el OCR tradicional y sacan la información de forma más estructurada cuando el documento tiene tablas, por ejemplo

@dcabo @civio los LLMs ineractuan con software OCR como PaddleOCR https://www.paddleocr.ai/latest/ o Tesseract https://github.com/tesseract-ocr

Es decir, son una interfaz conversacional para ejecutar los programas OCR de siempre sobre los documentos que les envíes.

PaddleOCR 文档

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

@Fedihacker @civio pero es que PaddleOCR es IA: es un modelo neuronal de un porrón de parámetros. Cuando decimos que usamos IA para transformar un documento nos referimos justo a esto.
@dcabo @civio PaddleOCR es OCR, no es un LLM.
@Fedihacker @civio este en concreto yo no lo he mirado mucho, pero su Github dice "PaddleOCR-VL-1.5 (0.9B), the industry's leading lightweight vision-language model for document parsing". Pero hay otros como GLM-OCR: https://huggingface.co/zai-org/GLM-OCR
zai-org/GLM-OCR · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

@dcabo @civio Estás mezclando conceptos publicitarios.

https://github.com/PaddlePaddle/PaddleOCR

Y no es IA, es un OCR. Tesseract también utiliza una red neuronal desde su versión 4.

Que utilicen redes neuronales no lo convierten en algo distinto.

GitHub - PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages. - PaddlePaddle/Paddl...

GitHub
@Fedihacker @civio en esa página pone claramente que es un VLM de 0.9b parámetros. Un VLM es IA.

@dcabo @Fedihacker @civio

Es IA, pero no es IAg. La absorción del término IA por la industria de la IAg es mala cosa. La inteligencia artificial lleva realizándose desde hace mucho y seguirá realizándose. El rechazo actual es frente a la inteligencia artificial generativa, que realiza un uso desmedido para su desempeño.
Se que es difícil deshacer este tipo de enredos lingüísticos, pero deberíamos de tratar de no caer en ellos.

@ferne @Fedihacker @civio totalmente de acuerdo en que hay un mal uso de muchos términos. Por eso me parece útil hablar de tareas/modelos concretos, y toda esta conversación empezó cuando dije que nos parecía bien usar la IA para hacer un OCR estructurado. El debate sobre si OCR=IA=IAgen no lo he traído yo, y me da un poco igual, la verdad.