Profesionales > Medicina

"Un modelo IA puede predecir bien en Medicina, pero no servir para decidir"

Julio Mayol ha participado en la elaboración del Manual de Buenas Prácticas de esta tecnología aplicada a Medicina

Julio Mayol, médico y catedrático.


05 jun 2026. 05.00H
SE LEE EN 5 minutos
La Organización Médica Colegial (OMC) ha publicado el Manual de Buenas Prácticas para la Inteligencia Artificial en Medicina, un documento que busca orientar el uso clínico, investigador, ético y jurídico de estas herramientas en el ámbito sanitario. En él participa Julio Mayol, catedrático de Cirugía y director científico del Instituto de Investigación Sanitaria San Carlos - IdISSC, como autor del capítulo dedicado a la inteligencia artificial en el ámbito del I+D y el futuro de la investigación.

Desde esa perspectiva, Mayol advierte de que la inteligencia artificial aplicada a la investigación biomédica no puede confundirse con una vía rápida para convertir cualquier predicción en una recomendación clínica. Para él, ese es uno de los mayores riesgos de esta tecnología: asumir que un modelo que predice bien ya está preparado para orientar decisiones sobre los pacientes.

"El mayor riesgo que percibo es el de convertir una predicción en una recomendación clínica sin demostrar que cambiará algo relevante para el paciente", afirma. A su juicio, "un modelo puede predecir bien y, aun así, no servir para decidir". La clave, explica, está en diferenciar tres planos que no siempre se separan con claridad: la predicción, la causalidad y la decisión clínica.

Según Mayol, predecir responde a la pregunta de "qué riesgo tiene este paciente". La causalidad, en cambio, intenta resolver "qué pasaría si intervengo". Y la decisión clínica exige ir un paso más allá: "qué voy a hacer distinto y qué resultado mejorará". Si esos niveles se confunden, el peligro es utilizar "correlaciones como si fueran causas y métricas técnicas como si fueran beneficio clínico".

Esta confusión no es menor en la literatura científica actual. Mayol lamenta que "gran parte de los estudios que se publican en la literatura científica médica son de asociación, no causalidad". Por ello, insiste en que los modelos basados en inteligencia artificial deben ser evaluados con criterios que vayan más allá del rendimiento técnico.

"La velocidad en ciencia solo aporta valor si aumenta la calidad del proceso"


En el caso de los datos de la vida real, el especialista defiende que deben cumplirse tres condiciones mínimas para que puedan transformarse en evidencia útil. La primera es la calidad y trazabilidad del dato. La segunda, un diseño robusto. La tercera, la verificación clínica y metodológica, con validación externa cuando se pretenda generalizar.

"Los datos de la vida real no son evidencia por acumulación de datos", subraya. Para Mayol, solo se convierten en pruebas de la vida real si el diseño permite responder una pregunta clínica con rigor. Es decir, no basta con disponer de grandes volúmenes de información: la utilidad científica depende de cómo se formula la pregunta, cómo se estructura el análisis y cómo se comprueba la validez de los resultados.

El capítulo del manual de la OMC en el que participa Mayol aborda precisamente este cambio de paradigma en la investigación biomédica, marcado por modelos fundacionales, datos del mundo real, ensayos adaptativos, gemelos digitales, gobernanza algorítmica e integridad científica en la era generativa. En ese marco, el especialista pide cautela ante la expansión de la inteligencia artificial generativa en investigación.

Mayol reconoce que esta tecnología puede ayudar a redactar, sintetizar, programar o explorar hipótesis, pero recuerda que se trata de "una técnica probabilística". Por este motivo, las citas, los datos, los resultados y las afirmaciones fácticas "tienen que comprobarse contra fuentes primarias".

La trazabilidad, en este contexto, se convierte en una exigencia central. Mayol defiende que debe documentarse "qué herramienta se ha usado, para qué tarea, con qué versión si procede, y qué controles se han aplicado". En su opinión, la rapidez solo tiene sentido si mejora el proceso científico. "La velocidad solo aporta valor si aumenta la calidad del proceso. Si reduce trazabilidad, reproducibilidad o juicio crítico, no acelera la ciencia, al revés, la debilita", señala.

IA en Medicina: tres pruebas de realidad


Su advertencia es clara: "La velocidad sin control puede generar desastres". En esa línea, recuerda que desde el IdISSC han participado en el desarrollo de las guías Chatbot Assessment Reporting Tool (CHART), orientadas a ayudar a los científicos a difundir con rigor los resultados de esta tecnología.

Para que una aplicación de inteligencia artificial pase de ser prometedora a convertirse en una herramienta útil, Mayol considera que debe superar tres "pruebas de realidad". La primera es la utilidad clínica. Esto implica que la aplicación no debe limitarse a mejorar una métrica, sino que debe contribuir a una toma de decisión específica.

La segunda es la sostenibilidad. Mayol remarca que no se trata solo de implantar una solución, sino de prever su monitorización, recalibración, mantenimiento, recursos necesarios y responsables claramente identificados. La tercera es la legitimidad, vinculada a la seguridad, la explicabilidad, la ausencia de inequidades y la posibilidad de retirar la herramienta si deja de aportar valor.
REGÍSTRATE GRATIS
PARA SEGUIR LEYENDO
¿Ya eres premium? Inicia sesión

Aunque pueda contener afirmaciones, datos o apuntes procedentes de instituciones o profesionales sanitarios, la información contenida en Redacción Médica está editada y elaborada por periodistas. Recomendamos al lector que cualquier duda relacionada con la salud sea consultada con un profesional del ámbito sanitario.