Marta entra en la consulta con tos, fiebre baja y cansancio. El médico la escucha mientras mira de reojo la pantalla. Va con retraso y el ordenador le reclama casillas que se multiplican.
Al terminar, aparece un aviso: faltan preguntas, convendría reconsiderar el diagnóstico y revisar el tratamiento. Lo ha escrito una
inteligencia artificial.
Marta pregunta: "¿Eso sabe lo que tengo?". Él tarda un segundo en responder.
La escena podría ser una realidad mañana en cualquier centro de salud español. De momento ocurrió, con sus diferencias, en Kenia y lo ha publicado
Nature Medicine.
Un ensayo clínico masivo en Atención Primaria
Se trata de un ensayo clínico desarrollado en dieciséis centros de Atención Primaria de Nairobi y Kiambu, con 103 profesionales y 9.702 consultas. Integrada en la
historia clínica electrónica, una IA analizaba la información registrada y ofrecía recomendaciones que el profesional podía aceptar, corregir o ignorar.
A los catorce días, el fracaso del tratamiento fue muy parecido en ambos grupos: 2% sin ayuda de la IA y 2,2% con ella. La diferencia
no alcanzó significación estadística.
Tampoco cambió la satisfacción de los pacientes ni se observaron mejoras claras en el uso correcto de antibióticos, el manejo de la hipertensión o la duración de la consulta, que mantuvo una
mediana de once minutos.
Ergo, la IA entró en la consulta, pero el paciente no salió clínicamente mejor por ello.
Sería fácil anunciar el fracaso de la inteligencia artificial. También sería torpe. La herramienta consiguió
notas clínicas más completas y mejores valoraciones del diagnóstico y del plan terapéutico. El gasto en antibióticos descendió ligeramente, aunque no aumentó la proporción de prescripciones consideradas correctas.
La pulcritud documental frente al destino del enfermo
Tenemos una máquina que ayuda a ordenar el pensamiento y a dejar constancia de él, aunque todavía ignoramos si esa
pulcritud documental modifica el destino del enfermo.
Ya sabemos que en medicina a menudo se confunde variables intermedias con resultados. Una historia clínica impecable puede facilitar la continuidad asistencial y hacer visible una omisión. También puede describir con elegancia una
decisión mediocre.
Una cosa queda clara, el estudio obliga a la IA a bajar del escenario. Hasta ahora nos impresionaba verla aprobar exámenes médicos, resolver casos complejos y producir diagnósticos diferenciales en segundos. Aquello demostraba capacidad lingüística y destreza para reconocer patrones.
No manifestaba beneficio clínico.
Este ensayo plantea una pregunta menos espectacular y mucho más seria: ¿qué le ocurre al paciente cuando el algoritmo se sienta junto al profesional?
La respuesta sigue siendo modesta.
El seguimiento de catorce días quizá resulte demasiado corto. Los fracasos fueron menos frecuentes de lo previsto y el ensayo estaba diseñado para detectar una
reducción relativa del 50%. Detectar diferencias pequeñas en acontecimientos graves exigiría poblaciones mucho mayores.
Además, he de decir que quedaron fuera las urgencias que precisaban estabilización inmediata y buena parte de la atención preventiva.
Tampoco debemos convertir Kenia en un pie de página.
La compleja extrapolación al Sistema Nacional de Salud
El ensayo se realizó en una red privada urbana, digitalizada y con estándares asistenciales relativamente altos. La mayoría de las consultas correspondía a procesos febriles o infecciosos y muchos pacientes eran adultos jóvenes. La extrapolación a España obliga a considerar una Atención Primaria atravesada por la
cronicidad, la multimorbilidad, la fragilidad, la salud mental, la dependencia y los problemas sociales.
Todo lo anterior rara vez cabe en un aviso verde, amarillo o rojo.
Por tanto, importar el programa y traducir sus instrucciones al castellano no bastaría. Habría que
validarlo con nuestros pacientes, guías, fármacos y circuitos de derivación. Tendría que convivir con los sistemas digitales autonómicos.
Un algoritmo ajustado para detectar una omisión en Nairobi puede comportarse de otra manera ante una anciana polimedicada de Lugo, un adolescente con sufrimiento psíquico en Madrid o un trabajador migrante sin continuidad asistencial en Almería.
Además, recordemos que Europa añade otra capa.
El
Reglamento europeo de inteligencia artificial impone obligaciones a los sistemas de alto riesgo, mientras el Espacio Europeo de Datos Sanitarios avanza hacia historias clínicas interoperables.
La regulación puede parecer una molestia al implantar herramientas a toda velocidad. En realidad, obliga a preguntar quién responde por el error, qué datos utiliza el modelo, cómo se vigila su rendimiento y qué ocurre cuando una actualización cambia su conducta.
El plan español de gobernanza y transcripción clínica
España ya ha decidido entrar en este terreno. Se ha planteado una gobernanza compartida, validación clínica y ética, formación profesional e interoperabilidad. El plan de Atención Primaria contempla sistemas de
transcripción conversacional para reducir burocracia. Es un comienzo razonable: quizá su primer gran beneficio sea devolver tiempo clínico al médico.
Ahí veo su aplicación más inmediata. Una IA integrada podría resumir antecedentes, señalar interacciones, recordar seguimientos pendientes y construir un borrador de la consulta. El médico
recuperaría minutos para preguntar, explorar y explicar. El riesgo aparece cuando ese ahorro se utiliza para añadir más pacientes a la agenda. Entonces la tecnología no aliviaría la sobrecarga: la haría rentable.
También existe el peligro de la obediencia cómoda. En el ensayo, una pequeña parte de las recomendaciones asociadas a alertas graves fue considerada insegura o inapropiada. Basta para recordar que un
error convincente puede resultar más peligroso que uno torpe.
No lo podemos olvidar, la máquina escribe con aplomo incluso cuando se equivoca. El clínico debe conservar la capacidad de discutirle, y para eso necesita formación, tiempo y responsabilidad real.
La IA será útil en la sanidad española cuando deje de presentarse como sustituta del médico y se comporte como una
residente incansable, rápida y algo insolente: propone, recuerda, ordena y a veces se confunde. Habrá que evaluarla después de cada cambio relevante y medir resultados que importen al paciente.
Una nota más larga no cura. Una consulta más humana quizá sí ayude.
Mas, volvamos a esa hipotética Marta del principio.
El médico lee la advertencia y le pregunta algo que había olvidado: "¿Desde cuándo le cuesta respirar al subir las escaleras?" Después aparta las manos del teclado y la explora.
La inteligencia artificial no ha hecho el diagnóstico. Ha señalado una puerta. Él decide abrirla. Marta repite su pregunta: "¿Eso sabe lo que tengo?". El médico sonríe:
"Todavía no. Por eso seguimos aquí los dos".
----
Artículo de referencia: Agweyu A. et al. Generative AI-enabled clinical decision support system in primary care: a pragmatic, cluster-randomized trial. Nature Medicine (2026). DOI: 10.1038/s41591-026-04503-6.
Aunque pueda contener afirmaciones, datos o apuntes procedentes de instituciones o profesionales sanitarios, la información contenida en Redacción Médica está editada y elaborada por periodistas. Recomendamos al lector que cualquier duda relacionada con la salud sea consultada con un profesional del ámbito sanitario.