Apache Spark pour la science des données : des fondamentaux à l'analyse prédictive

Maîtrisez Apache Spark, de ses concepts fondamentaux à l'implémentation de modèles prédictifs distribués, pour transformer et analyser des Big Data et en extraire des insights actionnables en science des données.

Fondamentaux de Spark et manipulation de données distribuées

Unit 1: Introduction à Spark et son écosystème

Unit 2: Manipulation de données avec les RDD

Unit 3: DataFrames et Datasets pour données structurées

Unit 4: Optimisation des performances Spark

Analyse avancée et Machine Learning avec Spark

Unit 1: Spark SQL : Interrogation et Analyse de Données Structurées

Unit 2: Spark Streaming : Traitement de Flux en Temps Réel

Unit 3: Machine Learning Distribué avec MLlib

Unit 4: Optimisation des Performances Spark