La urgencia por conseguir un diagnóstico rápido en el cáncer de piel más peligroso, el melanoma, ha llevado al País Vasco a apostar por la IA.

Quantus Skin promete agilizar el proceso decidiendo qué pacientes deben ser atendidos primero.

Sin embargo, los datos muestran una realidad preocupante.

https://civio.es/sanidad/2025/06/26/inteligencia-artificial-algoritmos-sanidad-sesgos-discriminacion/

En el segundo estudio realizado por dermatólogos del Hospital Ramón y Cajal de Madrid y profesores de la Universidad Complutense de Madrid para evaluar la eficacia clínica real de Quantus Skin‬ se mostró que el algoritmo pasa por alto uno de cada tres melanomas.

Deja escapar el 31% de los casos de este cáncer de piel tan agresivo. ‼️

https://civio.es/sanidad/2025/06/26/inteligencia-artificial-algoritmos-sanidad-sesgos-discriminacion/

@civio ¿podríais poner los enlaces a vuestro estudio y a los otros que citáis, por favor?
Con sólo estos datos no se pueden sacar conclusiones. Habría que ver si estos números (sensibilidad/especificidad) son aceptables para los expertos, cuáles son para los algoritmos utilizados hasta ahora, el coste del software y de los métodos actuales y también los sesgos de los métodos actuales, que habrá (incluso de la parte humana, que posiblemente se habrá entrenado con pacientes mayoritariamente de piel clara).
Y además, para qué está pensado: ¿cribado masivo o diagnóstico? Si es diagnóstico, ¿cómo ser va a usar? (en conjunto con otros tests* o va a tener un papel clave). Hay que tener en cuenta la prevalencia del melanoma. Si es para cribado, igual interesa más que haya pocos falsos positivos.
* aunque este tipo de tests pueden condicionar la decisión médica, si se acompaña de análisis subjetivo ya sabiendo su resultado.

@precariousmind @civio

Si me permites una pregunta, @precariousmind , ¿para un cribado no se debería buscar que los falsos negativos sean lo más bajos posible?

@int21h @civio por eso digo que depende de muchos factores (y aquí no hablo de un software de diagnóstico en consulta, sino uno que tenga la población en el móvil, es decir, autodiagnóstico, una diferencia fundamental). Si la prevalencia es muy baja, lo más probable es que un positivo sea falso, con lo cual conviene mover el umbral para reducir estos. Mi razonamiento tiene que ver también con lo que hay que detectar. Si te has encontrado un lunar, puedes vigilarlo. Si el software es mínimamente apañado, debería no solo identificarlo, sino detectar si cambia de forma o tamaño entre medidas y además proporcionar ejemplos de lunar anómalo al usuarie.
En esta situación, sería más aconsejable una buena especificidad. Que quien tenga un lunar claramente tipo melanoma se lo identifique y a los dudosos les ayude a hacer seguimiento. Si un sistema de autodiagnóstico tiene una baja especificidad (por subirle la sensibilidad), tendremos las consultas llenas de gente pudiendo revisión de lunares inocuos.
Y aquí está el punto de conexión con la noticia original: si, a pesar de toda la IA que dices que lleva, ti software tiene un poder de discriminación que es una kk, en cuando muevas el punto de corte para incrementar sensibilidad o especificidad, el otro indicador te va a bajar un montón. Pues crea un software con un buen poder de discriminación y así podrás tener los dos indicadores a un nivel bien alto.
@int21h @civio perdón, debí comenzar diciendo que su hablamos de cribados tipo COVID, que luego tenían otra fase confirmatoria y ahí lo que interesaba era reducir posibles contagios detectando gente infectada, entonces sí, te puedes permitir muchos falsos positivos, la sensibilidad manda.

@precariousmind @civio

Gracias por la explicación.

Yo, sin tener conocimiento en la materia, el razonamiento que hago es que una persona con un resultado negativo no va a pedir una segunda prueba, cosa que sí hacen los positivos. Por lo tanto sería preferible tener muchos falsos positivos que al fin y al cabo se van a rediagnosticar, con tal de eliminar o reducir los falsos negativos, cuyas consecuencias sí pueden ser malas.