Fundamentos de Druid

Fundamentos de Druid
19.99 USD
Buy Now

Sin duda alguna cada vez nos enfrentamos a retos tecnolgicos que implican mayor volumen y velocidad (frecuencia) de datos, dos de las cinco Vs del Big Data. Y en muchos de estos caso una de la decisiones de arquitectura que debe tomarse es la persistencia. En los ltimos aos con el crecimiento de IoT en las diferentes industrias y sectores, se ha empezado a popularizar un tipo bases de datos que permiten mantener un histrico del estado a travs del tiempo de los diferentes sensores y sus mediciones. Adems, permiten soportar grandes volmenes de datos, con una alta escalabilidad y bajo tiempo de respuesta tanto en la ingesta como en el consumo. Nos referimos a las base de datos basados en series de tiempo o Time Series. En esta publicacin vamos a ver en detalle Apache Druid, y algunas recomendaciones para poder optimizar su uso. Apache Druid es un proyecto Open Source, y forma parte del Fundacin Apache desde 2015. Se describe como una base de datos analtica en tiempo real para grandes volmenes de datos, donde el rendimiento y la alta disponibilidad son factor vital de la solucin final. Algunos de los caso de uso puede ser: Streaming de eventos (web and mobile analytics).Analtica de redes (monitoreo y performance).Mtricas de servidores. IoT. Datos Financieros como Bolsa o Forex.Y en general cualquier tipo de datos cuyo hilo central sea el tiempo. Entre algunas de sus principales caractersticas podemos destacar: Base de datos columnar. Sistema escalable y distribuido. Procesamiento paralelo a travs de cluster. Ingesta en tiempo real y batch. Auto balanceo y auto recuperacin. Soporte de almacenamiento de segmentos en HDFS o S3. Particionado por tiempo. Agregaciones en tiempo de ingesta. Business intelligence / OLAP.