Oracle Cloud Data Science Platform, ayudando a implementar modelos de Aprendizaje Automático

11

Oracle ya tiene disponible la Oracle Cloud Data Science Platform, cuyo núcleo es la Oracle Cloud Infrastructure Data Science. El objetivo de esta plataforma es ayudar a las empresas a construir, capacitar, administrar e implementar (en colaboración) modelos de Aprendizaje Automático (ML) para aumentar el éxito de los proyectos de ciencia de datos.

Oracle Cloud Infrastructure Data Science, a diferencia de otros productos de ciencia de datos que se enfocan en científicos de datos individuales, ayuda a mejorar la efectividad de los equipos de ciencia de datos con capacidades como proyectos compartidos, catálogos de modelos, políticas de seguridad de equipo, reproducibilidad y auditabilidad.

Además, en un comunicado de prensa se ha informado que selecciona automáticamente los conjuntos de datos de entrenamiento más óptimos a través de la selección y el ajuste del algoritmo AutoML, la evaluación y la explicación del modelo.

“Hoy en día, las organizaciones se dan cuenta de solo una fracción del enorme potencial de transformación de los datos porque los equipos de ciencia de datos no tienen fácil acceso a los datos y las herramientas adecuadas para construir e implementar modelos efectivos de Aprendizaje Automático”.

El resultado neto, entonces, es que los modelos tardan demasiado en desarrollarse, no siempre cumplen con los requisitos empresariales de precisión y robustez y con demasiada frecuencia nunca llegan a la producción.

A juicio de Greg Pavlik, vicepresidente senior de Desarrollo de productos, Data e IA (Inteligencia Artificial) Services de Oracle, los modelos efectivos de Aprendizaje Automático son la base de proyectos exitosos de ciencia de datos, pero el volumen y la variedad de datos que enfrentan las empresas pueden detener estas iniciativas antes de que despeguen.

“Con Oracle Cloud Infrastructure Data Science estamos mejorando la productividad de los científicos de datos individuales al automatizar todo su flujo de trabajo y agregando un fuerte apoyo de equipo para la colaboración para ayudar a garantizar que los proyectos de ciencia de datos entreguen un valor real a las empresas”.

Y es que Oracle Cloud Infrastructure Data Science incluye flujo de trabajo automatizado de ciencia de datos, ahorrando tiempo y reduciendo errores con varias capacidades.

Una de estas es la selección y ajuste automático de algoritmos de AutoML, que automatiza el proceso de ejecutar pruebas contra múltiples algoritmos y configuraciones de hiperparámetros.

Comprueba además la precisión de los resultados y confirma que se selecciona el modelo y la configuración óptimos para su uso. Esto, según lo indicado, ahorra un tiempo significativo para los científicos de datos y permite que cada uno de ellos obtenga los mismos resultados que los profesionales más experimentados.

“La selección automática de características predictivas simplifica la ingeniería de características al identificar automáticamente las características predictivas clave de conjuntos de datos más grandes”.

El modelo de evaluación también genera un amplio conjunto de métricas de evaluación y visualizaciones adecuadas para medir el rendimiento del modelo frente a los nuevos datos y modelos de rango con el tiempo para permitir un comportamiento óptimo en la producción.

Oracle Cloud Infrastructure Data Science igualmente proporciona una explicación automatizada de la ponderación relativa y la importancia de los factores que intervienen en la generación de una predicción.

Modelos efectivos de Aprendizaje Automático

Desde Oracle se ha señalado que se necesita más que solo personas dedicadas para obtener modelos efectivos de Aprendizaje Automático con éxito en la producción.

Se cree, entonces, que se requieren equipos de científicos de datos que trabajen juntos en colaboración. Siendo así, Oracle Cloud Infrastructure Data Science ofrece potentes capacidades de equipo que incluyen los proyectos compartidos.

Esto ayuda a los usuarios a organizar, habilitar el control de versiones y compartir de manera confiable el trabajo de un equipo, incluidas las sesiones de datos y portátiles.

“Los catálogos de modelos permiten a los miembros del equipo compartir de manera confiable modelos ya construidos y los artefactos necesarios para modificarlos y desplegarlos”.

Además, las políticas de seguridad basadas en equipos permiten a los usuarios controlar el acceso a modelos, códigos y datos, que están completamente integrados con Oracle Cloud Infrastructure Identity and Access Management.

Por último, las funcionalidades de reproducibilidad y auditabilidad permiten a la empresa realizar un seguimiento de todos los activos relevantes, de modo que todos los modelos se puedan reproducir y auditar, incluso si los miembros del equipo se van.

“Con Oracle Cloud Infrastructure Data Science las organizaciones pueden acelerar la implementación exitosa del modelo y producir resultados y desempeño de nivel empresarial para el análisis predictivo para generar resultados comerciales positivos”.

Oracle Cloud Data Science Platform

Se ha detallado que Oracle Cloud Data Science Platform incluye siete nuevos servicios que brindan una experiencia integral diseñada para acelerar y mejorar los resultados de la ciencia de datos.

Se trata de Oracle Cloud Infrastructure Data Science, que permite a los usuarios construir, entrenar y administrar nuevos modelos de Aprendizaje Automático en Oracle Cloud usando Python y otras herramientas y bibliotecas de código abierto, incluidas TensorFlow, Keras y Jupyter.

Oracle Cloud Data Science Platform también incluye nuevas y potentes capacidades de ML en la base de datos autónoma de Oracle, el catálogo de datos de Oracle Cloud Infrastructure, Oracle Big Data Service, Oracle Cloud SQL, flujo de datos de Oracle Cloud Infrastructure y máquinas virtuales de Oracle Cloud Infrastructure para ciencia de datos.