Sans aucun doute Apache Spark est le framework open source qui a montr sa russite auprs de plusieurs gant de linformatique et de lindustrie. Apache Spark nous permet danalyser et traiter des donnes massives structures, semi structures et non structures. Apache Spark fonctionne avec de la programmation distribue et en mmoire (in-memory) afin dacclrer les traitements et en sappuyant sur plusieurs machines dun rseau ( Cluster ).Dans cette formation vous aurez besoin uniquement dun PC connect internet. Vous allez apprendre mettre en place un environnement local avec une machine Virtuelle Linux (VM), tlcharger Spark, Jupyter Notebook et la configuration de Spark en utilisant Pyspark. Vous allez vous familiariser avec les principes fondamentaux de Spark en utilisant le langage Python. Apache Spark fonctionne en Java virtuel machines (JVM). Vous aurez une mise niveau en douceur avec le langage de programmation Python avec une initiation la programmation fonctionnelle. Manipuler un RDD (le cur moteur de Apache Spark) avec des collections de donnes sera un jeux denfant. Vous allez dcouvrir dans la partie Spark SQL les DataFrame partir: dune collection de donnes, des fichiers en entre tel que csv, Json, Parquet de base de donnes PostgreSQLSurement vous avez entendu parler des traitements des donnes qui arrivent en temps rel, sous le nom Streaming. Une Partie de cette formation bien dtaille vous attend afin que vous puissiez monter en comptence rapidement avec Spark Streaming avec des cas pratiques.