Comparte:
Cloud
19 de julio de 2018

Data science como servicio en entornos cloud

Data science como servicio en entornos cloud

Data science como servicio en entornos cloud

Escrito por , 19/07/2018

La semana pasada se celebró en Espacio Fundación Telefónica el evento “Data science como servicio en entornos cloud” para mostrar los últimos avances y las nuevas soluciones basadas en el análisis de datos que ofrecen las empresas especializadas en servicios en la nube.

De la mano de Synergic Partners y con la participación de Israel Olalla (Customer engineer de Google Cloud Platform), Pedro Romera (Business development manager for machine learning de Amazon Web Services) y Daniel Sánchez (Cloud solutions de Microsoft Azure), se analizaron las ventajas y facilidades que estas compañías ofrecen a las empresas y cuáles de sus servicios se adaptan mejor al objetivo de cada proyecto, el tipo de cliente y la estructura de los datos manejados.

El encargado de romper el hielo fue Israel Olalla, que explicó cómo el machine learning va a transformar la forma en la que trabajan muchas industrias, y el impacto que va a suponer en cuanto al incremento del volumen de datos que se genera a diario. Precisamente el objetivo de Google Cloud Platform es organizar toda esa información y hacerla accesible para todos los usuarios, ya que hoy en día uno de los principales problemas es la ingesta de los datos en sí misma porque, aunque existen herramientas que permiten gestionar toda esa información, es necesario garantizar tanto la fiabilidad como la calidad de la misma a la hora de recopilarla.

“Inteligencia artificial: It’s all about data”: así comenzó Pedro Romera la segunda ponencia de la tarde, afirmando que sin los datos no existe la posibilidad de introducirnos en el mundo del machine learning. En cualquier proyecto de big data lo primero es tener claro cuál es la información relevante de la que uno dispone, cómo quiere usarla y, sobre todo, cómo puede acceder a ella para, así, poder definir la estrategia y elegir los servicios que mejor se adapten a esas necesidades.

Una vez se sabe el uso que se quiere hacer de la información, lo ideal es comenzar a trabajar con los datos en un entorno cloud, por la seguridad, flexibilidad y agilidad que aporta. Porque permite hacerlo sin necesidad de disponer de infraestructuras ad hoc, ni hacer un gran desembolso inicial (recordemos que la nube utiliza un modelo de pago por uso). Y porque existe la posibilidad de probar los servicios que ya están implementados en cada una de las plataformas disponibles. En un entorno tan variable como el de big data esto permite ir adaptándose a las necesidades de cada proyecto. Además, no siempre es necesario ceñirse a los servicios de una única plataforma, sino que es posible combinar los servicios de los diferentes proveedores para trabajar en un entorno multicloud.

Para mostrarlo aún más claro, Daniel Sánchez enseñó, en una demo en tiempo real,  cómo funciona en cloud el ciclo de vida y la arquitectura de los datos en cuatro fases: ingesta, almacenamiento, preparación y entrenamiento de los modelos de evaluación y consumo en un entorno colaborativo

Cerró la jornada una mesa redonda en la que se debatió si data science y big data son la misma cosa ya que, aunque conceptualmente ambos términos están muy relacionados, en ningún caso son sinónimos. El concepto de big data se refiere a la eficiente recogida de un gran volumen de datos heterogéneos, a su almacenamiento y análisis. Y, a partir de ahí, se llega a data science. Los datos por sí solos no ofrecen ningún valor, ni a las empresas ni a la sociedad. En ocasiones, ni siquiera son legibles o comprensibles a simple vista, y es necesaria una transformación previa de los mismos para poder interpretarlos. Data science involucra métodos científicos, procesos y modelos para llevar a cabo esta extracción de valor.

En cuanto a si cualquier usuario puede convertirse en científico de datos gracias a los servicios que ofrece la nube, la respuesta claramente es no. Todos los ponentes coincidieron en que los servicios ofrecidos por sus respectivas plataformas ayudan al data scientist a la obtención de resultados, pero es él quien posee el conocimiento que debe aplicar a la hora de usar esas herramientas matemáticas, estadísticas e informáticas para hacer análisis inteligentes de los grandes volúmenes de datos de una empresa.

Como conclusión, aunque queda mucho camino por recorrer, gracias a la posibilidad de trabajar en un entorno cloud y a la combinación de los servicios que proporcionan los distintos proveedores, poco a poco los usuarios pueden ir adentrándose en el mundo del big data y el data science.

Imagen: janneke staaks

Sobre el autor

Patricia Robles Mansilla

Patricia Robles Mansilla

Ingeniera de Telecomunicaciones por la Universidad Politécnica de Madrid. En la actualidad trabajo como Ingeniera de optimización radio en el área de Acceso móvil de Telefónica España. Entre mis aficiones están viajar, la tecnología y, sobre todo, seguir aprendiendo en el día a día.
Ver todos sus artículos »