Por Christine Yue Leonard, editora sénior asociada
Expertos en inteligencia artificial discuten los desafíos peculiares que el campo y el panorama de la investigación actual enfrentan.
Hay numerosos algoritmos de inteligencia artificial en los trabajos para el glaucoma, desde herramientas de detección de enfermedades hasta modelos de pronóstico de progresión. Los expertos dicen que se necesitará un esfuerzo considerable para introducir modelos avanzados de IA en la clínica de glaucoma, y también están de acuerdo en que el potencial de la IA para mejorar la atención al paciente y abordar las desigualdades es bastante real.
En este artículo, los innovadores y expertos en IA discuten los obstáculos para el desarrollo de la IA para el glaucoma, la investigación actual y lo que está en el horizonte clínico.
Una cuestión de consenso
Existen ciertos desafíos relacionados con el glaucoma que pueden hacer que sea particularmente difícil para la IA diagnosticar y detectar. “Cuando se ven signos de retinopatía diabética (RD) en una fotografía del fondo de ojo, casi no hay duda de si el paciente la tiene o no”, dice Felipe Medeiros, MD, PhD, profesor distinguido de oftalmología del Joseph A.C. Wadsworth, vicepresidente de tecnología y profesor de bioestadística y bioinformática en la Duke University School of Medicine. “La clasificación humana de las fotografías del fondo de ojo puede servir como un estándar de oro confiable para el diagnóstico de la RD. Esto hace que sea más fácil desarrollar modelos de IA que puedan entrenarse para reconocer la retinopatía diabética en una fotografía. Sin embargo, para el glaucoma no es exactamente así justamente porque puede ser una enfermedad difícil de diagnosticar en las primeras etapas”.
El glaucoma se caracteriza por la muerte de las células ganglionares de la retina, la muerte axónica y la posterior excavación del borde neurorretiniano.1 No obstante, el tamaño de la cabeza del nervio óptico varía enormemente entre los individuos, desde 2,10 mm hasta 2,35 mm2, lo que dificulta la detección de la enfermedad.3 El tamaño del disco también varía según la edad y el origen étnico.
“Si se muestra una imagen del nervio óptico a diferentes expertos, es probable que no estén de acuerdo en si es glaucomatoso o no, especialmente en las primeras etapas de la enfermedad”, continúa. “Los calificadores tienden a sobrestimar o subestimar el daño glaucomatoso y tienen baja reproducibilidad de calificación y poca concordancia.4 Por lo tanto, entrenar modelos de IA para predecir clasificaciones subjetivas es problemático”.
En el caso del análisis fotográfico del fondo de ojo, si las imágenes se consideran no clasificables (p.ej., los lectores expertos no pudieron llegar a un consenso), se las excluyen de los conjuntos de entrenamiento, señala Sophia Ying Wang, MD, MS, profesora asistente de oftalmología y especialista en glaucoma de la Universidad de Stanford. “Esto puede turbar la capacidad del algoritmo para
reconocer el glaucoma en conjuntos de datos del mundo real”, dice. De hecho, un estudio que utilizó datos de campo visual reveló que la inclusión de campos visuales no confiables mejoró el rendimiento predictivo del algoritmo de la futura desviación media del campo visual.5
Los expertos dicen que la falta de criterios objetivos de diagnóstico coherentes del glaucoma puede explicar por qué la IA para el glaucoma no ha logrado una aplicación tan generalizada como la que tiene para retina y córnea. Este problema ha generado preguntas sobre la mejor manera de diagnosticar y detectar el glaucoma utilizando IA y cómo entrenar estos modelos de IA.
Dado que aún no hay una definición consensuada para el glaucoma, los investigadores de IA conciben sus propias definiciones para clasificar la enfermedad en categorías, como “sospechosa” o “cierta”, “neuropatía óptica glaucomatosa referible”, “probable” o “definida”.6 La Dra. Wang señala que el uso de definiciones binarias para el glaucoma, como “probable/definida”, puede detectar casos avanzados, pero limita la detección de casos tempranos, mientras que términos como “referible” pueden ser útiles cuando hay demasiados falsos positivos. “Varios grupos intentan predecir resultados similares de diferentes maneras, pero esto reduce la capacidad de comparar el rendimiento entre los estudios”, dice.
Actualmente, se está llevando a cabo un amplio estudio internacional del glaucoma de colaboración abierta sobre los datos y la clasificación de los pacientes, dirigido por investigadores de la Universidad Dalhousie, en Nueva Escocia. El estudio del glaucoma de colaboración abierta tiene como objetivo identificar criterios objetivos sobre los campos visuales y la OCT que coincidan con las evaluaciones de los especialistas en glaucoma sobre la probabilidad de la enfermedad.7 El estudio abarca 15 países de cinco continentes. La Dra. Wang participó como uno de los calificadores expertos. “Es una forma muy emocionante de recopilar datos de pacientes con glaucoma y de recopilar las clasificaciones de los calificadores para evaluar la confiabilidad entre evaluadores”, dice.
“Además, de una definición clínica, también necesitamos una definición llamada ‘computable‘, utilizando elementos de los datos que solemos tener en los conjuntos de datos utilizados para los estudios de IA, como los del EHR”, dice la Dr. Wang. “Esto es para que los algoritmos de IA puedan compararse entre sí o, incluso, validarse en diferentes conjuntos de datos. Estandarizar y armonizar las definiciones de glaucoma es especialmente complicado, ya que los elementos de los datos disponibles de los registros de salud pueden variar en diferentes entornos y estudios. El trabajo de la IA va de la mano con el desarrollo de los estándares de datos”.
El glaucoma definido por consenso será necesario para hacer frente a la creciente prevalencia de la enfermedad y a la necesidad de un cribado a gran escala. El Dr. Medeiros dice que un modelo de detección eficaz para el glaucoma debe ser económico, altamente preciso y fácil de administrar, y estar ampliamente disponible.
Los sistemas de imagen necesarios para la detección del glaucoma son caros, y se necesitan técnicos capacitados para operarlos. La mayoría de los centros de detección comunitaria, como los consultorios de atención primaria y los centros comunitarios, no tienen tales dispositivos. Aunque hay formas menos costosas de obtener imágenes de los pacientes (smartphones u otras cámaras retinianas de mano), esas modalidades no son tan potentes como los sistemas de mesa. Además, Louis R. Pasquale, MD, profesor de oftalmología en Icahn School of Medicine, y en la práctica en New York Eye & Ear Infirmary of Mount Sinai, señala que la variabilidad en la calidad de las diferentes cámaras de fondo de ojo, desde los dispositivos de mesa hasta las cámaras de smartphones, afectará la generalización de un algoritmo.
Diferentes dispositivos tampoco pueden usar el mismo algoritmo. “Al igual que los resultados de una máquina de OCT no se pueden comparar directamente con los de otra, un modelo de IA entrenado en una máquina Spectralis podría no funcionar de la misma manera en una Cirrus”, dice el Dr. Pasquale.
Disponibilidad de datos
Las grandes cantidades de datos y de registros de datos centralizados serán indispensables para entrenar y validar los algoritmos, dicen los expertos.6 “No se puede entrenar un algoritmo de IA con solo 100 pacientes”, dice el Dr. Pasquale. “Una vez que obtenemos un algoritmo que funciona, debemos asegurarnos de que no se salga de los rieles y se vuelva incorrecto con el tiempo. Se necesitan grandes conjuntos de datos y vigilancia constante para mantener la funcionalidad de un algoritmo de IA”.
Además del hecho de que grandes conjuntos de datos centralizados aún no están ampliamente disponibles, compartir los datos existentes tampoco es fácil debido a las diferentes políticas de privacidad de datos de las instituciones y el carácter confidencial de los datos de atención médica en general. “A medida que construimos algoritmos más generalizables, necesitamos mejorar la diversidad de nuestros datos de entrenamiento y validar los algoritmos externamente”, dice la Dra. Wang. “Es difícil compartir datos de salud entre los sitios. En este momento, hay muchos trabajos desarrollando métodos de entrenamiento que permiten que los algoritmos sean entrenados sobre los datos de diferentes sitios, pero sin intercambiarlos. Esto se llama aprendizaje federado, y puede ayudar a abordar temas de privacidad de datos, seguridad y acceso”.
Generalizabilidad
Es importante tener un buen entendimiento de cómo se desarrollan los modelos de IA para poder comprender sus limitaciones, dice el Dr. Medeiros. “Por ejemplo, antes de que los médicos usen un modelo de predicción, deben entender cómo se desarrolló el algoritmo, la población sobre la que se capacitó y las características de esa población”, dice. “Realmente no es diferente a cualquier prueba médica. Cuando esté utilizándose de una prueba médica en su práctica clínica, como una OCT o un campo visual, debe conocer las propiedades de la prueba y las características de la base de datos normativa para que pueda confiar en los resultados y determinar si son aplicables a su paciente”.
Los algoritmos entrenados en un tipo de paciente no son necesariamente generalizables a otros tipos de pacientes. Por ejemplo, un algoritmo entrenado en una población china podría contener un gran número de miopías altas y, por lo tanto, no ser adecuado para su uso en una población con diferentes características oculares.
“La generalización es importante si hay una discrepancia entre la población en la que desea implementar su algoritmo y la población en la que entrenó su algoritmo”, dice la Dra. Wang. “Como un aparte, se podría argumentar que no todos los algoritmos de IA tienen que ser universalmente generalizables, si planea entrenar e implementar localmente en su propia población particular. De hecho, es mucho más difícil desarrollar un algoritmo para gobernar a todos (y no creo que sea necesariamente un objetivo que queramos tener), especialmente cuando entramos en la era de la medicina de precisión.
“Tenemos que ser muy cuidadosos cuando entrenamos modelos para asegurarnos de que no los estamos capacitando sobre datos inherentemente sesgados y perpetuando ese sesgo”, continúa. “Por ejemplo, si tratamos de predecir cuán enferma está una persona en función de cuántas reclamaciones médicas hay, este número puede ser diferente entre las minorías por razones tales como el acceso desigual a la atención médica.
“Al entrar en la fase de implementación, también debemos ser conscientes de cualquier diferencia entre la población de entrenamiento y los pacientes previstos. Si el rendimiento del algoritmo no es tan bueno en un determinado subgrupo de pacientes, afectará negativamente a ese grupo y los derivará a un tratamiento inadecuado”.
Investigación actual
En los estudios tradicionales, los investigadores intentan llegar a algún tipo de verdad científica. En los estudios de IA que buscan la predicción o clasificación, el rendimiento de la predicción del algoritmo es primordial, señala la Dra. Wang.
Actualmente, hay numerosos estudios sobre IA en el ámbito del glaucoma con algoritmos para varias aplicaciones, desde detectar cambios estructurales en el ojo hasta predecir qué pacientes podrían empeorar rápidamente. He aquí algunas de las investigaciones actuales y en curso:
- Utilizar fotos del fondo de ojo para identificar ojos glaucomatosos. En 2017, investigadores entrenaron un sistema de aprendizaje profundo para evaluar el glaucoma utilizando 125.189 imágenes de la retina.8 El rendimiento del algoritmo se validó en 71.896 imágenes. El resultado muestra una prevalencia del 0.1% con un área bajo la curva para posible glaucoma de 0.942 (IC 95%, 0.929% a 0.954%), una sensibilidad del 96.4% (IC 95%, 81.7% a 99.9%) y una especificidad del 87.2% (IC 95%, 86.8% a 87.5%).
Un estudio de aprendizaje profundo publicado en 2018 para detectar la neuropatía óptica glaucomatosa (GON) a partir de fotografías del fondo de ojo en color demostró una sensibilidad del 95,6% y una especificidad del 92% para detectar la GON “referible”.9 Los oftalmólogos del estudio calificaron más de 48.000 fotos para la GON. Los investigadores señalaron que la miopía alta causó falsos negativos y el ahuecamiento fisiológico causó falsos positivos.
Otro estudio de aprendizaje profundo para detectar la GON usando Pegasus (un sistema de IA gratuito disponible en la plataforma Orbis Cybersight Consult) informó que el algoritmo superó a cinco de seis oftalmólogos en el diagnóstico, con un área bajo la curva del 92.6% frente al 69.6% al 84.9% de los oftalmólogos.10 El área bajo la curva del escenario de consenso en el mejor de los casos fue del 89,1%. La sensibilidad del algoritmo fue del 83.7% y la especificidad fue del 88.2%, en comparación con el 61.3% al 81.6% de sensibilidad y el 90% al 94% de especificidad para oftalmólogos (concordancia intraobservador del 0.62% al 0.97% vs. 1.00% para Pegasus). La correlación entre observaciones y predicciones fue de 0.88 (p<0,001; MAE: 27,8 µm). Los investigadores notaron que el algoritmo podía determinar la clasificación en un 10% del tiempo que les tomaba a los oftalmólogos. Sugirieron que la herramienta podría ser valiosa para examinar a los pacientes.
- Predicción de métricas de OCT a partir de fotos del fondo de ojo. El grupo del Dr. Medeiros ha desarrollado un modelo de IA M2M (machine-to-machine) capaz de predecir objetivamente métricas complejas de OCT, como el espesor del tejido nervioso a partir de una fotografía del fondo de ojo que se utilizará para el diagnóstico del glaucoma. El aprendizaje de M2M permite que los dispositivos intercambien datos sin requerir aportes humanos para el entrenamiento en red.
En un conjunto de prueba de 6.292 pares de fotografías del fondo de ojo y OCT, el espesor medio predicho de RNFL fue de 83,3 ±14,5 µm y el espesor medio observado de RNFL fue de 82,5 ±16,8 µm (p=0,164), con una fuerte correlación entre los dos (r=0,832; p<0,001).11
La fotografía del fondo de ojo ha sido un recurso infrautilizado en la subespecialidad de glaucoma debido a la gran cantidad de OCTs, señalan los expertos; sin embargo, la IA está empezando a cambiar eso. “El algoritmo es bastante poderoso, y hemos demostrado que es capaz de detectar enfermedades y predecir el daño y la progresión con el tiempo”, dice el Dr. Medeiros. “Desde el punto de vista de la detección de enfermedades, el uso de un método de imágenes de bajo costo como la fotografía podría beneficiar a los pacientes en sitios donde hay menos acceso a la atención médica”.
- Incorporar múltiples modalidades. El Dr. Medeiros dice que su grupo también está trabajando en la integración de múltiples modalidades de imágenes y el uso de IA para reconocer patrones del daño en la OCT en lugar de depender de parámetros de resumen para diagnosticar el glaucoma.
“Hay mucho más en una imagen de OCT que en los parámetros de resumen”, continúa. “Los modelos de IA que se han desarrollado y los que hemos publicado son capaces de realizar una evaluación mucho más completa de la imagen para la evaluación y el diagnóstico del glaucoma, así como reconocer artefactos y errores de segmentación. Esto es muy importante porque la OCT es tan buena como la calidad del escaneo. La incorporación de modelos de IA en el software actual ayudará a marcar artefactos y errores con mayor precisión, y los técnicos que adquieran escaneos podrían volver a escanear de inmediato”.
- Evaluación del disco óptico. En un estudio transversal sobre la cuantificación de la pérdida del borde neurorretiniano, se utilizaron 9.282 pares de fotografías del disco óptico y escaneos de la cabeza del nervio óptico (SD-OCT) de 927 ojos para entrenar y validar una red neuronal convolucional de aprendizaje profundo que pueda predecir los valores globales y sectoriales de BMO-MRW.12 El algoritmo podría cuantificar la cantidad de daño neurorretiniano en las fotografías con alta precisión utilizando el BMO-MRW como referencia, informó el grupo del Dr. Medeiros.
- Mapeo de la estructura a la función. El uso del SD-OCT para obtener imágenes del RNFL proporciona más datos que las fotografías del RNFL libres de rojo, señalaron los investigadores en el estudio TVST, de 2020.13 Usaron una red neuronal convolucional entrenada para predecir los límites de sensibilidad de SAP a partir del espesor peripapilar SD-OCT RNFL en pacientes con glaucoma, para generar información topográfica sobre la relación estructura-función a partir de defectos simulados de RNFL. Informaron que el mapa generado por la IA proporciona “información sobre el impacto funcional de los defectos del RNFL de ubicación y profundidad variables en la OCT”.
- Creación de herramientas de pronóstico clínico. “Actualmente, elegimos arbitrariamente una presión intraocular target en función de la edad del paciente, la cantidad de daño presente y el nivel de la PIO asociado con el daño”, dice el Dr. Pasquale. “Pero, si el paciente fuera identificado red flag para progresión rápida por un algoritmo de IA validado, podríamos elegir una PIO target más baja para evitar una pérdida significativa de la visión.
“Actualmente no existe tal algoritmo – en la clínica – porque se necesita mucho tiempo y esfuerzo para construirlo. No obstante, estoy muy ilusionado y animado a que esos algoritmos estén disponibles en el futuro”.
El desarrollo de una herramienta de pronóstico clínico podría implicar entrenar un algoritmo sobre los datos del paciente, como fotografías del nervio óptico, campos visuales y OCTs al inicio y a lo largo del seguimiento. Dicho algoritmo podría, entonces, ser capaz de predecir a partir de imágenes de referencia si un determinado paciente tendrá una progresión rápida o lenta, por ejemplo. En un estudio que utilizó 14.034 escaneos de 816 ojos seguidos a lo largo del tiempo y etiquetados como “progresión” o “estable” por expertos, los investigadores capacitaron un modelo de aprendizaje profundo para detectar la progresión del glaucoma en la SD-OCT. El área bajo la curva fue de 0.935, y los investigadores informaron que el modelo funcionó bien, replicando estrechamente la clasificación humana experta.14
“Muchos pacientes de glaucoma son estables y son seguidos a lo largo del tiempo por oftalmólogos. Pero, entre 5-10% de los pacientes caen por el precipicio’”, dice Jithin Yohannan, MD, MPH, profesor asistente de oftalmología, en Wilmer Eye Institute, Johns Hopkins University School of Medicine. “El uso de la IA para identificar a esos pacientes sería increíblemente útil porque estos son los pacientes que se beneficiarían más a partir de un seguimiento más cercano y posiblemente una terapia temprana o más agresiva”. Su grupo ha entrenado modelos de IA que utilizan el campo visual inicial del paciente, la OCT y la información clínica, para pronosticar su riesgo de empeoramiento rápido o cirugía para el glaucoma no controlado.
“En el futuro, modelos como estos podrían servir como una especie de sistema de alerta permitiéndole al médico darse cuenta de que debería prestar más atención a un determinado paciente”, dice. “Los oftalmólogos u optometristas integrales podrían informarse más rápidamente sobre qué pacientes requieren derivación a especialistas en glaucoma”.
- Herramientas para detectar un empeoramiento continuo. La detección temprana de la pérdida de campo visual puede ser más fácil con la IA. Un estudio realizado en 2013 que utilizó una red neuronal artificial para evaluar los campos visuales para el diagnóstico del glaucoma informó una sensibilidad del 93%, una especificidad del 91% y un rendimiento del diagnóstico que fue al menos tan bueno como el de los médicos.15 Un modelo no supervisado para analizar los campos visuales fue capaz de identificar patrones de pérdida clínicamente relevantes y asignar coeficientes ponderados para cada uno.16
Otro estudio de campo visual realizado en 2.085 ojos utilizó el análisis de machine-learning para detectar consistentemente los ojos que progresan antes que los índices globales, regionales y puntuales.17 El tiempo para detectar la progresión en una cuarta parte de los ojos usando la desviación media global fue de 5,2 años, 4,5 años utilizando la regional, 3,9 años utilizando la puntual y 3,5 años utilizando el análisis de machine-learning. Después de dos visitas adicionales, el tiempo hasta una cuarta parte de los ojos demostrar una progresión confirmada posteriormente fue de 6.6 años en términos globales, 5.7 años en términos regionales, 5.6 años en términos puntuales y 5.1 años utilizando el análisis de machine-learning.
El grupo del Dr. Yohannan ha entrenado modelos que detectan el empeoramiento del campo visual en una serie de campos visuales a lo largo del tiempo. Debido a que no hay una definición estándar de oro de lo que es el empeoramiento del campo visual, el modelo que su grupo desarrolló utiliza un consenso de muchos algoritmos empleados anteriormente para etiquetar el ojo como “empeoramiento” o “no empeoramiento”.
“Cuando comparamos el modelo con los médicos que ven de forma rutinaria a los pacientes en el consultorio, nuestro modelo rindió mejor que los médicos en nuestro conjunto de datos específico”, continúa. “Ahora, nuestro grupo está utilizando datos del EHR de los pacientes del Wilmer, informaciones de campo digital e imágenes del nervio óptico para desarrollar algoritmos de IA que pueden detectar el empeoramiento del glaucoma de modo más rápido y preciso, y luego predecir qué ojos o pacientes tienen un alto riesgo de empeoramiento futuro. Nuestro objetivo es seguir esos ojos o a los pacientes más de cerca, en comparación con el paciente promedio que entra a la clínica”.
- Identificación de pacientes para ensayos clínicos. El Dr. Yohannan dice que su grupo también está trabajando en el uso de la IA para mejorar los ensayos clínicos para el glaucoma. “Los ensayos clínicos, particularmente de los agentes neuroprotectores, requieren grandes tamaños de muestra”, explica. “Si usted es capaz de identificar los ojos de alto riesgo de empeorar, puede reclutar a esos pacientes para su ensayo clínico, lo que puede reducir sus requisitos de tamaño de muestra. Esto haría que fuera más rentable hacer algunos de estos estudios”.
Los estudios que revisan la IA en ensayos clínicos también han señalado que una mejor selección de pacientes podría reducir los efectos secundarios dañinos del tratamiento.18 Además, los investigadores señalan que el uso de la IA en la selección de pacientes podría reducir la heterogeneidad de la población al armonizar grandes cantidades de datos del EHR, elegir a pacientes que tienen más probabilidades de tener un criterio de valoración clínico medible e identificar aquellos que tienen más probabilidades de responder al tratamiento.19
Este reclutamiento basado en la IA funcionaría analizando los EHRs, las notas de los médicos, los datos de los dispositivos portátiles y las cuentas de las redes sociales, para identificar a subgrupos de personas que cumplen con los criterios de inclusión en el estudio y ayudar a difundir la información sobre los ensayos a los participantes potenciales. Sin embargo, este tipo de implementación todavía enfrenta obstáculos de privacidad de datos e interoperabilidad de la máquina. Los expertos señalan que las decisiones finales sobre la inclusión de los ensayos todavía recaerán en los seres humanos.
- Herramientas para reducir la carga de las pruebas de glaucoma. “Las pruebas de campo visual consumen mucho tiempo y requieren una cooperación significativa del paciente”, dice el Dr. Yohannan. “La OCT es más rápida y confiable, y si somos capaces de detectar un empeoramiento funcional significativo (p. ej., un empeoramiento del campo visual) utilizando los datos de la OCT, eso podría reducir la necesidad de realizar pruebas de campo visual. Nuestro grupo ha demostrado que podemos detectar el empeoramiento de la FV con datos de la OCT en un subconjunto de pacientes. Esto puede reducir en gran medida la necesidad de pruebas de FV en el futuro”.
- Pronóstico a partir de notas clínicas. “Mi grupo está muy interesado en aprovechar la riqueza de la información capturada por los médicos en notas de progreso clínico de texto libre para aumentar y mejorar nuestros algoritmos de predicción de IA”, dice la Dra. Wang. “Adaptamos las técnicas de procesamiento del lenguaje natural para trabajar con nuestro lenguaje oftalmológico especializado y las combinamos con otra información clínica estructurada del EHR para predecir la progresión del glaucoma”.
El grupo de la Dra. Wang asigna palabras a números para que sean computables por el algoritmo. “Es una técnica que toma palabras de la lengua inglesa y las convierte en vectores y espacio vectorial, para que el ordenador pueda discernir el significado de las palabras en función de otras palabras cercanas en el discurso o el texto. Lo hemos adaptado para operar con el léxico oftalmológico y lo estamos usando para predecir qué visión se recuperará y qué pacientes necesitarán cirugía de glaucoma en el futuro”.
- Aprender sobre la patogénesis de la enfermedad. El Dr. Pasquale está utilizando la IA para investigar la patogénesis primaria del glaucoma de ángulo abierto. Él y sus colegas plantean la hipótesis de que el glaucoma consiste en múltiples enfermedades en lugar de una sola. “Estamos argumentando que diferentes patrones de daño nervioso – que se reflejan en diferentes patrones de pérdida del campo visual – podrían darnos pistas sobre cómo estratificar mejor la enfermedad”, dice.
Utilizando casos del GPAA de inicio reciente en dos estudios de gran cohorte (Nurses’ Health Study y Health Professionals’ Follow-up Study), el Dr. Pasquale y sus colegas digitalizaron los campos visuales y utilizaron el análisis de arquetipos para cuantificar objetivamente los diferentes patrones de pérdida del campo visual. El algoritmo identificó 14 patrones diferentes de pérdida, cuatro de los cuales eran patrones de pérdida avanzada.
“Es interesante ver que un profesional de la salud que tiene acceso a la atención médica puede presentar una cantidad muy significativa de pérdida avanzada. Esto sucede con frecuencia en el glaucoma porque es una enfermedad de inicio insidioso”, señala. “Al analizar las posibles predisposiciones raciales para diferentes patrones de pérdida de campo, descubrimos que la herencia africana es un factor de riesgo independiente para patrones de pérdida avanzados. Nuestro objetivo a largo plazo es identificar los determinantes ambientales, genéticos o metabólicos de los subtipos de la enfermedad”.
¿Qué se necesita para la preparación clínica?
Se necesitará mucho esfuerzo para que la IA entre en el proceso de toma de decisiones clínicas. “En la clínica, recopilamos grandes cantidades de datos”, dice el Dr. Pasquale. “En una sola visita, podríamos obtener campo visual, OCT y fotografías del fondo de ojo. Lo que pasa es que simplemente no tenemos tiempo suficiente para digerir esos datos, sobre todo porque se acumulan con el tiempo para un paciente. Estamos dejando muchas informaciones sobre la mesa en nuestro proceso de toma de decisiones, pero, aunque pasáramos horas mirándolas, probablemente no lograríamos mantener todo eso en nuestras mentes. Sería genial si tuviéramos un algoritmo de IA para hacer este trabajo por nosotros. El desafío aquí sería integrar algoritmos útiles de IA para glaucoma en el sistema del EHR”.
“Obtener un algoritmo aprobado en un EHR requerirá, en primer lugar, trabajar estrechamente con la industria”, señala el Dr. Yohannan. “Por ejemplo, nuestro EHR (Epic) no se comunica con nuestro sistema de gestión de datos de imágenes (Zeiss Forum). Tendremos que encontrar una solución integrada para que todos estos datos puedan ingresarse en los modelos, de modo que el médico tenga fácil acceso a una puntuación de riesgo de IA”.
Es una tarea difícil. “Ya se necesita mucho esfuerzo solo para hacer un cambio simple en el EHR”, dice el Dr. Pasquale. “Digamos que un algoritmo aprobado está integrado en un sistema del EHR. Lo que sucederá es que habrá que sumergir una fotografía del fondo de ojo u OCT en un cuadro de diálogo para que pueda analizarse y decir si hay daño glaucomatoso, si un paciente está empeorando o, tal vez, progresando rápidamente. Someter los datos clínicos a un algoritmo de IA lleva tiempo y puede dificultar la capacidad de los médicos para ver a los pacientes. También existe la sensación entre los médicos de que “conozco mejor a mi paciente y no necesito un ordenador que me diga qué hacer”. Este sentimiento sumado a la noción de que la tecnología está enredando a los médicos en lugar de empoderarlos es comprensible y debe abordarse a medida que pensamos implementar la IA en un EHR”.
Próximo en la fila
“En un futuro próximo, creo que es probable que veamos más algoritmos que combinen múltiples fuentes, como OCT-A, campos visuales y OCT del nervio óptico o mácula, junto con la representación completa del paciente del EHR, incluidas las enfermedades y la demografía coexistentes”, continúa. “Algoritmos como estos podrían ofrecer recomendaciones sobre la frecuencia con la que se debe ver a un paciente, si a un determinado paciente le irá mejor con gotas en comparación con el láser o si es más probable que un determinado paciente se salte las gotas, por ejemplo.
“Ahora, los médicos no usarían tal algoritmo a ciegas”, dice. “La IA será un instrumento para ayudar a los médicos a hacer un mejor uso de la información y las pruebas de diagnóstico disponibles. Cualquier recomendación será tenida en cuenta por el médico al tomar decisiones”.
El Dr. Yohannan espera utilizar imágenes de OCT sin procesar para obtener más datos. “Actualmente utilizamos principalmente información numérica que proviene de la máquina de OCT”, dice. “Estamos trabajando en la extracción de imágenes sin procesar que contienen más información que los números. Entonces, la pregunta es: ¿hay alguna manera de que podamos extraer mejor información de esas imágenes y dársela a los modelos que estamos creando para pronosticar el empeoramiento del campo visual o detectar el empeoramiento con un poder aún mayor?”
La combinación de datos genómicos y clínicos puede ser otro desarrollo futuro de la IA, ya que los datos genómicos pueden ser un predictor independiente de glaucoma con un nivel modesto de éxito. “Hemos descubierto que tener una mayor carga genética para la enfermedad aumenta el riesgo de necesitar una cirugía de filtración”, dice el Dr. Pasquale. “Hemos identificado 127 loci para GPAA, y podríamos crear una puntuación de riesgo genético a partir de esos datos para predecir el glaucoma con aproximadamente un 75% de precisión. Eso es todo sin tener en cuenta los datos de imagen. Imagínese lo que es posible si fusionamos datos de imagen con datos genómicos.
“Más hospitales están desarrollando biorepositorios de datos genéticos de alto rendimiento”, añade. “Todo es investigación en este momento y no está directamente conectado a los EHRs. Quizás en 10 años, cuando tengamos la aceptación de los marcadores genómicos asociados con varias enfermedades complejas comunes, podrían fusionarse con los datos de imagen para crear algoritmos de toma de decisiones clínicas más potentes”.
“Es temprano para decir lo que realmente podría ser desplegado y adoptado de modo generalizado”, dice la Dra. Wang. “Como en todos los campos, hay un gran abismo entre el desarrollo de un algoritmo de IA en código y su implementación en la clínica, en pacientes. Puede ser que algunos de los primeros algoritmos que se implementen sean algoritmos de detección del glaucoma, o puede haber herramientas de apoyo a la decisión clínica para ayudar a los médicos a predecir la trayectoria clínica de un paciente con glaucoma”.
El Dr. Medeiros recibe apoyo de investigación de Carl-Zeiss Meditec, Heidelberg Engineering, GmBH, Reichert, Genentech y Google. Es consultor de Novartis, Aerie, Allergan, Reichert, Carl-Zeiss, Galimedix, Stuart Therapeutics, Annexon, Ocular Therapeutix y Perceive Biotherapeutics.
La Dra. Wang y el Dr. Yohannan reciben fondos de NIH y Research to Prevent Blindness.
El Dr. Yohannan también recibe apoyo de investigación de Genentech y es consultor de AbbVie, Ivantis y Topcon.
El Dr. Pasquale recibe apoyo de NIH para su investigación de IA.
Referencias
- Bourne RRA. The optic nerve head in glaucoma. Community Eye Health 2012;25:79-80:55-57.
- Tekeli O, Savku E, Abdullayev A. Optic disc area in different types of glaucoma. Int J Ophthalml 2016;9:8:1134-1137.
- Ting DSW, Pasquale LR, Peng L, et al. Artificial intelligence and deep learning in ophthalmology. Br J Ophthalmol 2019;103:2:167-175.
- O’Neill EC, Gurria LU, Pandav SS, et al. Glaucomatous optic neuropathy evaluation project: Factors associated with underestimation of glaucoma likelihood. JAMA Ophthalmol 2014;132:5:560-566.
- Villasana GA, Bradley C, Elze T, et al. Improving visual field forecasting by correcting for the effects of poor visual field reliability. Transl Vis Sci Technol 2022;11:5:27.
- Lee EB, Wang SY, Chang RT. Interpreting deep learning studies in glaucoma: Unresolved challenges. Asia Pac J Ophthalmol (Phila) 2021;10:261-267.
- Vianna JR, Quach J, Baniak G and Chauhan BC. Characteristics of the Crowd-sourced Glaucoma Study patient database. Invest Ophthalmol Vis Sci 2020;61:7:1989. ARVO Meeting Abstract June 2020.
- Ting DSW, Cheung CY, Lim G, et al. Development and validation of a deep learning system for diabetic retinopathy and related eye diseases using retinal images from multiethnic populations with diabetes. JAMA 2017;318:22:2211-2223.
- Li Z, He Y, Keel S, et al. Efficacy of a deep learning system for detecting glaucomatous optic neuropathy based on color fundus photographs. Ophthalmology 2018;125;1199-1206.
- Al-Aswad L, Kapoor R, Chu CK, et al. Evaluation of a deep learning system for identifying glaucomatous optic neuropathy based on color fundus photographs. J Glaucoma 2019;28:12:1029-1034.
- Medeiros FA, Jammal AA, Thompson AC. From machine to machine: An OCT-trained deep learning algorithm for objective quantification of glaucomatous damage in fundus photographs. Ophthalmology 2019;126:4:513-521.
- Thompson AC, Jammal AA, Medeiros FA. A deep learning algorithm to quantify neuroretinal rim loss from optic disc photographs. Am J Ophthalmol 2019;201:9-18.
- Mariottoni EB, Datta S, Dov D, et al. Artificial intelligence mapping of structure to function in glaucoma. TVST 2020;9:2:19.
- Mariottoni EB, Datta S, Shigueoka LS, et al. Deep learning assisted detection of glaucoma progression in spectral-domain optical coherence tomography. [In press].
- Andersson S, Heijl A, Bizios D, Bengtsson B. Comparison of clinicians and an artificial neural network regarding accuracy and certainty in performance of visual field assessment for the diagnosis of glaucoma. Acta Ophthalmol 2013;91:5:413-417.
- Elze T, Pasquale LR, Shen LQ, et al. Patterns of functional vision loss in glaucoma determined with archetypal analysis. J R Soc Interface 2015;12.
- Yousefi S, Kiwaki T, Zheng Y, et al. Detection of longitudinal visual field progression in glaucoma using machine learning. Am J Ophthalmol 2018;193:71–9.
- Cascini F, Beccia F, Causio FA, et al. Scoping review of the current landscape of AI-based applications in clinical trials. Front Public Health. [Epub August 12, 2022]. https://doi.org/10.3389/fpubh.2022.949377.
- Bhatt A. Artificial intelligence in managing clinical trial design and conduct: Man and machine still on the learning curve? Perspect Clin Res 2021;12:1:1-3.
- Lynch S. The state of AI in 9 charts. Stanford Institute for Human-centered Artificial Intelligence Annual AI Index Report. Updated March 16, 2022. Accessed October 14, 2022. https://hai.stanford.edu/news/state-ai-9-charts.