Snowflake, la plataforma de datos en la nube
Snowflake se ha convertido en pocos años en la herramienta Data Warehousing as a Service, DWaaS, referencia del mercado, destacándose como una alternativa a sistemas tradicionales como son Oracle o Hadoop.
Una de las grandes ventajas de Snowflake es su velocidad a la hora de procesar consultas: los datos son almacenados de forma distribuida en diferentes clústeres, lo que permite que las consultas sean procesadas en paralelo, acortando notablemente los tiempos de respuesta. Tal y como afirma Ken Wook, Data Team Manager en CapSpecialty: “Con Snowflake podemos ejecutar reportes que antes tardaban 2 - 3 días en solo 45 minutos”.
Esta velocidad es posible gracias a su arquitectura, formada por 3 capas separadas físicamente:
- Una capa superior con un conjunto de servicios en la nube, que permiten la gestión de la seguridad de acceso a los datos, la gestión de metadatos, diferentes interfaces para cargar y descargar datos, herramientas de optimización, etc.
- Una capa intermedia encargada de los cálculos, totalmente separada de los datos y organizada en clústeres entre los que se dividen las tareas de cómputo.
- Un almacenamiento independiente y centralizado, que puede funcionar sobre Amazon Web Services, Google Cloud o Microsoft Azure.
Otra de las grandes ventajas de Snowflake es la gestión de la seguridad y de los permisos de acceso a los datos, que facilita el intercambio de información. La información no se mueve ni se duplica, sino que se establecen permisos de acceso, de tal forma que la información siempre está actualizada y disponible para los usuarios u organizaciones con los permisos necesarios. Además, la información es cifrada automáticamente por Snowflake, lo que añade un nivel de seguridad extra de forma transparente para el usuario.
Snowflake es un producto desarrollado desde el inicio con una filosofía 100% cloud, por lo que la escalabilidad de recursos es extremadamente sencilla para el administrador, siendo gestionada desde el panel de control de la herramienta. Este escalado puede ser de dos tipos:
- Vertical para mejorar el rendimiento en escenarios de queries pesadas y carga de datos.
- Horizontal para mejorar el rendimiento en situaciones de alta concurrencia de queries.
Finalmente, siguiendo esta filosofía Cloud, todos los costes son variables, dependientes del tiempo de ejecución de las consultas y del volumen de datos almacenados, sin costes asociados a estructuras físicas, lo que permite pagar por el uso real de la herramienta.
Nuestra empresa ha cerrado un acuerdo de partnership, como ya hicimos con Qlik, en esta ocasión con Snowflake, lo que nos permitirá mejorar nuestro portfolio de servicios y capacidades en el ámbito de la gestión y el gobierno de los datos. En palabras de David Puig, Head of Data, “Snowflake se está convirtiendo en una de las herramientas con más crecimiento y más potencial en el campo de gobierno, almacenamiento, tratamiento y compartición de datos en la nube. Esta colaboración hace posible que Izertis siga a la vanguardia de las nuevas tecnologías y así proveer a todos nuestros clientes de nuevas soluciones tecnológicas, gracias al servicio de vigilancia tecnológica que ejecutamos y seguir siendo un referente en el universo de los datos”.