El Aprendizaje Automático (Machine Learning, ML) está permitiendo encontrar mejores formas de diagnosticar y tratar peligrosas enfermedades que amenazan la vida, tales como el Cáncer.
Este beneficio ha sido adoptado por la Sociedad Americana Contra el Cáncer (American Cancer Society, ACS) mediante el uso de Google Cloud, con la intención de reinventar las formas en que se analizan los datos y salvar más vidas.
Thomas Kurian, CEO de Google Cloud, ha publicado que una de las aplicaciones más prometedoras e importantes del ML es precisamente esa capacidad de descubrir mejores formas de diagnóstico y manejo de enfermedades, incluyendo el Cáncer que acorta demasiadas vidas.
“En los Estados Unidos, el Cáncer es la segunda causa más común de muerte y representa casi una de cada cuatro muertes. La prevención y la detección temprana son fundamentales para mejorar la supervivencia, pero aún hay mucho que los profesionales médicos no entienden sobre los factores del estilo de vida, el diagnóstico y el tratamiento de subtipos específicos de cáncer”.
El ejecutivo ha informado que la ACS ha ejecutado, durante las últimas décadas, la cohorte de Nutrición del Estudio de Prevención del Cáncer-II (CPS-II).
Se trata de un estudio prospectivo de más de 184 mil hombres y mujeres estadounidenses para explorar la forma en que factores como la altura, el peso, las características demográficas, personales y la historia familiar, pueden afectar la etiología y el pronóstico del Cáncer.
Mia M. Gaudet, directora científica de Investigación en Epidemiología de ACS, ha podido usar un conducto de ML de extremo a extremo construido en Google Cloud para realizar un análisis profundo de muestras de tejido de Cáncer de mama, el tipo de Cáncer comúnmente diagnosticado entre las mujeres y la segunda causa principal de muerte por la enfermedad.
Gaudet ha estudiado imágenes de alta resolución del tejido tumoral, después de obtener registros médicos y muestras de tejido quirúrgico para mil 700 participantes en el estudio CPS-II, quienes han sido diagnosticados con Cáncer de mama en cientos de hospitales en todo Estados Unidos.
Todo esto lo ha hecho en medio de un esfuerzo por determinar qué estilo de vida, médico y factores genéticos estarían relacionados con los subtipos moleculares del Cáncer de mama y si las diferentes características en el tejido de este tipo de Cáncer se traducen en un mejor pronóstico.
ML y análisis de imágenes
La especialista, según lo publicado por Kurian, se ha enfrentado a algunos desafíos técnicos al analizar las mil 700 imágenes de tejido de tumor de mama. Y es que fueron capturadas en un formato propietario, sin comprimir y de alta resolución, hasta de 10 GB cada una, lo que hacía la conversión de imágenes extremadamente costosa y consumiría mucho tiempo.
Incluso, de llegarse a convertir las imágenes a un formato utilizable, el ejecutivo ha dicho que se necesitaría un equipo de patólogos altamente capacitados y hasta tres años para analizar los mil 700 pacientes, lo que supondría un costo significativo.
El análisis, además, estaría sujeto a fatiga y sesgo humanos, al tiempo que algunos patrones podrían no ser detectables por los humanos en absoluto.
Sin embargo, Gaudet y la ACS se han unido a Slalom para superar estos desafíos. Se trata de un socio principal de Cloud, que permite facilitar el aprendizaje a gran escala. Como se sabe, la calidad de la estandarización del preprocesamiento era crítica y las imágenes debían traducirse de manera consistente, con los colores normalizados.
Siendo así, la interpretación de los colores en todas las imágenes se ha estandarizado mediante la reducción de la variación de color y cada imagen se ha dividido en mosaicos de tamaño uniforme, todo esto para distribuir la carga de trabajo y optimizar la estructura de datos requerida para entrenar los modelos.
“Slalom usó GCP para construir un canal de aprendizaje de máquina de extremo a extremo, incluido el preproceso, la ingeniería de características y la agrupación en clústeres”.
De esta manera, el preprocesamiento de Cloud Machine Learning Engine (Cloud ML Engine) ha permitido el entrenamiento de modelos y la predicción de lotes, las imágenes fueron recogidas usando el almacenamiento en la nube y, Compute Engine, ha orquestado la conversión de imágenes e inició los trabajos de entrenamiento y predicción de Cloud ML Engine en la secuencia correcta.
También se ha añadido que Slalom ha creado un modelo de auto-codificador utilizando Keras, con un backend TensorFlow para la creación de prototipos. Luego ha usado entrenamiento distribuido en Cloud ML Engine para convertir las imágenes en vectores de características que representan patrones en las imágenes, como una secuencia de números.
Las características se han agrupado con TensorFlow, una vez más utilizando Cloud ML Engine. El resultado, según Kurian, ha sido un conjunto de asignaciones de grupo, una para cada mosaico en la imagen, que la Sociedad Americana Contra el Cáncer planea usar en los análisis de seguimiento.
ML y factor tiempo
Con este enfoque, el análisis de imágenes se ha completado en sólo tres meses, 12 veces más rápido que el tiempo proyectado, y con un mayor grado de precisión y coherencia.
De acuerdo a la publicación, el análisis ha encontrado resultados interesantes: aisló patrones potencialmente significativos en el tejido del cáncer que podrían ayudar a informar los factores de riesgo y el pronóstico en el futuro.
“Al aprovechar Cloud ML Engine para analizar imágenes de cáncer, estamos adquiriendo una mayor comprensión de la complejidad del tejido tumoral mamario y de cómo los factores de riesgo conocidos llevan a ciertos patrones”, ha confirmado Gaudet.
Se ha conocido que la ACS ahora ha establecido procesos y una infraestructura en la nube que será reutilizable en proyectos similares por venir. El CEO de Google Cloud ha expresado que en la compañía están orgullosos de que la tecnología ayude a los profesionales médicos que trabajan para prevenir muertes por Cáncer y mejorar los resultados.