El Dr. Madhu Nair y la Dra. Asha Das estaban cerca de un gran avance que utilizaría modelos de inteligencia artificial (IA) para detectar células de cáncer de mama en imágenes escaneadas tomadas de muestras de tejido de pacientes.
Pero había un gran desafío en el camino de estos dos investigadores con sede en India: lucharon durante meses para enseñar a su modelo de IA a reconocer de manera precisa las células cancerosas. Das y su equipo solían pasar semanas revisando montones de fotos de alta resolución con millones de píxeles, marcando áreas cancerosas imagen por imagen.
El equipo necesitaba una solución que pudiera escanear estas imágenes con precisión y rapidez, sin supervisión humana.
Intel estaba allí para ayudar.
En 2022, el Dr. Das y el Dr. Nair, investigadores del Laboratorio de Inteligencia Artificial y Visión por Computadora de la Universidad de Ciencia y Tecnología de Cochin en India, se asociaron con los equipos de ingeniería y ventas y marketing de Intel para implementar una solución novedosa utilizando procesadores Intel Xeon Scalable y la Optimización de Intel® para TensorFlow, un conjunto de software que aprovecha al máximo las características de aceleración en las CPUs de Intel.
Las GPUs tienen dificultades con tareas exigentes.
Hoy en día, detectar los primeros signos de cáncer de mama depende en gran medida de la experiencia de radiólogos y médicos que escanean manualmente los resultados histopatológicos. Sin embargo, depender únicamente del ojo humano tiene sus desventajas: según el Instituto Nacional del Cáncer, se pierden aproximadamente el 20 por ciento de los signos de cáncer de mama.
Aquí es donde la IA puede ayudar. Gracias a los avances recientes en tecnología informática, cada vez más hospitales están considerando la idea de utilizar la inteligencia artificial para detectar lo que los médicos podrían pasar por alto. En diciembre, Intel y Penn Medicine anunciaron que habían ayudado a los investigadores a mejorar la detección de tumores cerebrales cancerosos en un 33%.
Das, quien se encuentra en Kerala, India, explicó cómo su equipo inicialmente recurrió a soluciones basadas en GPU para mejorar sus modelos de aprendizaje profundo. Sin embargo, había un problema: sus sistemas basados en GPU a menudo fallaban, ya que la cantidad de cálculos necesarios para procesar imágenes grandes superaba con creces los límites de diseño de los sistemas, lo que resultaba en bloqueos inexplicables y reinicios frustrantes.
«Nuestros modelos requerían un alto poder computacional, y nuestros intentos de entrenar el modelo utilizando GPUs fracasaron», escribió Nair, describiendo los desafíos. «Nos llevaba varios días ejecutarlo y nos resultaba difícil completar el entrenamiento para imágenes de alta resolución. Eso nos condujo a buscar una mejor solución informática».
Intel ofrece hardware y software
En 2022, Nair descubrió la oportunidad de Intel cuando planteó el desafío que enfrentaba a un representante de Dell con quien se estaba reuniendo para otro proyecto de investigación. Dell presentó a Nair al equipo de Intel en India.
Meses más tarde, implementaron cuatro servidores que funcionaban como un único clúster de cálculo sin ningún acelerador de aprendizaje profundo. Los servidores y el almacenamiento se conectaron utilizando una red Ethernet de alta velocidad.
En el lado del software, el equipo conjunto se volcó en Intel® Optimization para TensorFlow, un conjunto de software que mejora el desempeño de TensorFlow al aprovechar las características de aceleración en las CPU de Intel.
«Compartí nuestro problema con el equipo de Intel y me alegró enormemente que entendieran de inmediato la importancia de este trabajo», dijo Nair. «Nos dieron la oportunidad de utilizar esta arquitectura distribuida».
La nueva solución es precisa y rápida
Los resultados fueron exactamente lo que los investigadores esperaban, con un gran agregado: su modelo no solo detecta células cancerosas, sino que también distingue diferentes grados de cáncer.
Y es muy preciso: la solución logró una precisión del 98 por ciento, aproximadamente 10 puntos porcentuales mejor que otros modelos. (Obtenga más información acerca de la solución: CUSAT mejora la detección del cáncer con Deep Learning).
Eso es un estándar muy alto establecido desde el principio.
Con el tiempo, a medida que el equipo entrena su modelo con más conjuntos de datos, los investigadores esperan que la tasa de precisión aumente gradualmente.
«La arquitectura Intel fue increíble», dijo Nair. «Pudimos completar el entrenamiento en unas pocas horas. Debido a que los servidores tenían 192GB de memoria, más que los 40GB o 80GB disponibles en las tarjetas gráficas, pudimos utilizar imágenes de alta resolución y ajustar todo el modelo en la memoria. Intel también nos ayudó a mejorar el modelo y compartió optimizaciones con nosotros para que funcione. Esa es la razón por la cual pudimos tener éxito.»
Das afirmó que los resultados son aún más impresionantes, dado que las cifras de precisión se lograron con mucha menos cantidad de datos de entrenamiento que los modelos necesitaban, lo que acortó enormemente los tiempos de respuesta. «Estuvimos muy contentos con los resultados», agregó.
«Es notable que hayamos logrado una precisión del 98 por ciento con solo el 20 por ciento de los datos anotados Eso es realmente emocionante.»
Próximamente en un Centro de Patología cerca tuyo.
El siguiente paso para la tecnología es esperar mientras el equipo asegura patentes y consigue socios comerciales dispuestos a interrumpir un espacio de mercado que está acostumbrado al contacto humano. Das comparte cómo algunos escaneos pueden implicar la consulta de múltiples patólogos, cada uno aportando sus propias conclusiones basadas en sus diferentes experiencias.
También está el tema de la precisión. Si bien las tasas de precisión del 98 por ciento pueden parecer altas, aún no son lo suficientemente precisas para aplicaciones del mundo real.
Ahora que tanto Das como Nair han demostrado que su modelo detecta células de cáncer de mama de manera confiable, están considerando aplicar un enfoque similar a los aneurismas cerebrales y la clasificación de pólipos en endoscopias.
«También estamos planeando expandir este modelo para detectar cáncer en varios órganos», dijo Das, y agregó que ahora está trabajando en extender la solución para analizar imágenes de ganglios linfáticos, ya que el cáncer de mama a menudo se propaga a los ganglios linfáticos adyacentes debajo del brazo.
Nair dijo: «Estamos agradecidos a Intel por su apoyo. … Y esperamos continuar con esta colaboración».