Tus datos en la nube: ETLs con Python en el cloud

Tus datos en la nube: ETLs con Python en el cloud
169.99 EUR
Buy Now

Quieres aprender a desplegar sistemas de gestin de datos en la nube mediante ETLs?Tienes conocimientos en el campo del anlisis de datos o el Machine Learning y quieres conocer cmo desplegar sistemas de consumo de datos en produccin?No te sientes suficientemente confiado en tus habilidades de programacin para crear tus propios sets de datos?Si la respuesta a alguna de estas preguntas es S, entonces este curso es para ti. La proliferacin exponencial de nuevos tipos de fuentes de datos y el ritmo de generacin de los mismos son probablemente los factores clave detrs del auge de toda la innovacin que conlleva el Big Data y el anlisis de datos en general. Por eso como profesionales en este sector, no slo es importante tener la capacidad de generar y entrenar modelos, sino aprender a desarrollar sistemas que puedan generar para nosotros nuestros propios sets de datos. Sin embargo, aun teniendo acceso a cantidades brutales de datos, estos no siempre son ni fcilmente accesibles ni suelen estar en los formatos ni estndares de calidad que deseamos. Nuestra misin ser dotarte de conocimientos y herramientas para poder afrontar estos escenarios con xito. En este curso vas a aprender a hacerlo cubriendo todo el ciclo de vida del dato y no slo con un enfoque prctico, sino tambin usando fuentes y datos reales. Conocers y practicars para dominar un montn de herramientas y tecnologas relacionadas con el mundo del manejo de datos, sobretodo en relacin a la obtencin, la transformacin o manipulacin y la carga de los mismos. El curso se desarrolla sobre el concepto de ETL, los procesos que permiten precisamente obtener, procesar y cargar los datos desde un sistema a otro para conocer y dominar todas las tecnologas implicadas. Adems aprenderemos a automatizar estos sistemas con un framework hbrido (cloud-local) basado en Python, uno de los lenguajes de programacin por excelencia en el mundo del anlisis de datos. Lo ms interesante de todo no solo es eso sino que: las herramientas que conocers son altamente compatibles entre s, con lo que crears una caja de herramientas que te ser muy til cuando enfrentes este tipo de escenarios. Ms all de las herramientas, te daremos un mtodo que te servir al abordar proyectos de forma profesional. En el desarrollo del curso, cubriremos temas como: El contexto en el que viven este tipo de proyectos, los sistemas de gestin empresariales. Cubriremos aspectos como qu tipos existen, en qu tipo de tecnologas de gestin de datos suelen basarse y como benefician a los negocios. Introduciremos el ecosistema IT donde se alojar nuestro proyecto: el cloud (la nube). Conoceremos qu tipos de servicios existen, el estado del mercado y las tecnologas que destacan en el mundo del tratamiento de datos en este modelo de consumo de recursos IT. Conoceremos con profundidad los sistemas ETL, que se encargan de gobernar la extraccin/obtencin de datos desde un sistema, el tratamiento basado en manipulaciones y conversiones que se les da a estos datos para que cumplan nuestros objetivos y la carga en sistemas preparados para el anlisis de datos a escala. Implementaremos estas ETLs en Python con un framework hbrido (cloud-local) llamado Prefect. Este framework nos permitir automatizar y orquestar nuestras tareas de ETL combinndolas con la flexibilidad y potencia que nos proporciona el tratamiento de datos con Python y sus libreras, el lenguaje ms usado en el mundo del anlisis de datos. Conoceremos y obtendremos datos desde APIs REST basadas en webservices, ficheros JSON o bases de datos SQL. Profundizaremos en uno de los campos ms interesantes en esta industria, el webscraping, con el que podremos extraer datos que estn en pginas web de forma automatizada de forma que todos los datos que estn en internet se convertirn en potenciales fuentes de datos para ti! Y crenos que eso es un gran poder; -).Aprenders a tratar texto con una de las tcnicas ms potentes, las expresiones regulares, cazando datos y patrones de inters de forma eficiente y automatizable desde strings o cadenas para ser extrados o tratados posteriormente. Revisaremos metodologas y cdigo para asegurarnos que nuestros datos tienen la forma, estructura y calidad que deseemos para nuestros anlisis. Crears y desplegars recursos cloud en un proveedor hiperescalar para alojar tus propios datos en la nube, as como desarrollar conexiones a ellos desde Python. Instalaremos y usaremos uno de los entornos de desarrollo (IDE) ms usados hoy en da, Visual Studio Code, con el que podrs trabajar de forma eficiente y profesional proyectos del mundo del anlisis de datos. Acabaremos poniendo todo esto en prctica con un caso real y de inters actual, en el que aprenders a obtener datos sobre el valor del Bitcoin as como de los valores burstiles de varias empresas cotizadas en la bolsa americana, a fin de crear un set de datos que permita analizar si existe dependencia entre los valores burstiles y el valor de la criptomoneda. Este curso es ideal para cualquiera que quiera obtener conocimientos acerca de la ingeniera y infraestructura de datos. En partic