Un equipo internacional de investigadores de universidades y centros de investigación de Estados Unidos y Europa ha publicado en Nature Medicine un trabajo que propone un cambio relevante en la forma de interpretar la polisomnografía (PSG). El estudio, desarrollado por investigadores de la Stanford University, con participación de la Harvard Medical School, la University of Copenhagen y la Technical University of Denmark, presenta SleepFM, un modelo fundacional de inteligencia artificial entrenado para aprender representaciones generales del sueño y reutilizarlas posteriormente en múltiples tareas clínicas, desde el estadiaje y la apnea hasta la estimación de riesgo futuro de enfermedad.
“Lo relevante no es solo que prediga una enfermedad concreta, sino que aprende el ‘idioma del sueño’, integrando señales del cerebro, el corazón y la respiración, y puede reutilizarse para muchas tareas clínicas”, explica Juan José Beunza, catedrático de Salud Pública y director de IASalud en la Universidad Europea. En ese sentido, SleepFM se aleja de los algoritmos diseñados para una única tarea y se plantea como una infraestructura reutilizable para el análisis multimodal del sueño.
El modelo se entrena a una escala inusual en este ámbito, con más de 585.000 horas de PSG correspondientes a aproximadamente 65.000 participantes, procedentes de varias cohortes (Stanford Sleep Clinic, BioSerenity, MESA y MrOS). El conjunto SHHS se reserva explícitamente para evaluar transferencia entre centros y no participa en el preentrenamiento. “El tamaño y la diversidad de los datos importan mucho cuando se quiere que un modelo generalice fuera del entorno en el que se ha desarrollado”, señala Beunza.
Uno de los principales retos que aborda el artículo es la heterogeneidad real de la PSG entre hospitales, donde cambian los montajes, los canales disponibles y la calidad de la señal. Para ello, SleepFM incorpora una arquitectura agnóstica a los canales, capaz de tolerar variaciones en número y orden, y un esquema de leave-one-out contrastive learning, que durante el preentrenamiento obliga al modelo a alinearse cuando falta una modalidad completa. “La traducción clínica es clara: se reduce la probabilidad de que el modelo falle cuando la polisomnografía real no viene ‘perfecta’”, resume Beunza.
Desde el punto de vista del procesamiento de señal, los autores estandarizan los registros a 128 Hz, segmentan en ventanas cortas y capturan dependencias temporales mediante un bloque tipo transformer con contexto de varios minutos. Para la predicción clínica agregan una ventana estandarizada de noche completa y emplean una cabeza ligera con LSTM bidireccional para generar puntuaciones de riesgo.
En la evaluación clínica, el estudio adopta un enfoque sistemático inspirado en PheWAS, explorando asociaciones predictivas entre PSG y enfermedad a partir de códigos clínicos. Se analizan 1.041 fenotipos y se identifica un subconjunto de 130 condiciones con rendimiento alto, con umbrales de C-index y AUROC ≥ 0,75 tras correcciones estrictas. Entre los desenlaces destacados figuran la mortalidad, la demencia, el ictus, la insuficiencia cardiaca, la enfermedad renal crónica o la fibrilación auricular. “Que una sola noche permita estimar riesgo para un abanico tan amplio de patologías es uno de los hallazgos más llamativos”, apunta Beunza.
El trabajo compara SleepFM con modelos basales demográficos (edad, sexo, IMC, raza/etnia) y con arquitecturas entrenadas desde cero. SleepFM muestra mejoras consistentes, por ejemplo, en mortalidad por cualquier causa, aunque el propio artículo subraya una cuestión clave para la práctica clínica: la edad sigue siendo un predictor dominante. “Una discusión relevante es cuánto aporta el modelo a igualdad de edad o en rangos estrechos; ahí es donde se decidirá su utilidad incremental real”, señala el catedrático.
Respecto a la validación externa, los autores evalúan transferencia en SHHS mediante fine-tuning, es decir, adaptación local previa al test. “No es un modelo ‘plug-and-play’, pero los resultados sugieren que, con miles de PSG locales, el hardware adecuado y experiencia técnica, puede adaptarse y mantener rendimiento”, explica Beunza.
Además de predicción de enfermedad, SleepFM rinde en tareas clásicas del laboratorio del sueño, con resultados competitivos en estadiaje y clasificación de apnea, lo que indica que aprende rasgos fisiológicos generales y no solo asociaciones con la historia clínica.
Para Beunza, el mensaje final es claro y prudente: “El sueño puede actuar como un biomarcador digital integrador, pero llevar estos modelos a la práctica exige planes de adaptación local, monitorización continua y una gobernanza clara antes de su uso clínico”.
Aunque pueda contener afirmaciones, datos o apuntes procedentes de instituciones o profesionales sanitarios, la información contenida en Redacción Médica está editada y elaborada por periodistas. Recomendamos al lector que cualquier duda relacionada con la salud sea consultada con un profesional del ámbito sanitario.