Advanced Streaming Big Data with Spark - eLearning
450,00 EUR
- 25 hours
Plongez dans le traitement de données en temps réel avec la formation « Streaming Big Data avec Spark », conçue pour vous aider à créer des pipelines de données hautes performances et évolutifs qui traitent l’information au moment où elle est produite. Ce cours vous présente les capacités de streaming d’Apache Spark, vous permettant de travailler avec des flux de données continus pour des systèmes modernes d’analytique et de prise de décision.
Caractéristiques principales
Langue
Cours et supports en anglais
Niveau
Niveau intermédiaire à avancé
Accès
Accès d’un an à la plateforme d’apprentissage
9 heures de vidéos à la demande
avec plus de 25 heures de temps d’étude recommandé
38 exercices pratiques guidés
13 évaluations notées automatiquement
33 quiz de révision
3 projets concrets
Certificat
Attestation de fin de programme incluse

Résultats d’apprentissage
À la fin de ce cours, vous serez capable de comprendre :
Exécution
Acquérir une compréhension complète de l’architecture d’exécution de Spark
DataFrame
Effectuer les opérations et fonctions essentielles sur les DataFrames dans Spark
Flux
Apprenez les bases du traitement de flux avec Spark
Kafka
Explorer l’intégration directe de Spark Streaming avec Apache Kafka
Amazon
Utiliser Spark Streaming avec Amazon Kinesis
Postuler
Comprendre et appliquer les opérations de fenêtre glissante dans le traitement de flux

Chronologie du cours
Le runtime Spark
Leçon 01
- Comprendre les RDD Spark
- Comprendre le DataFrame Spark
- Vue d’ensemble de l’architecture d’exécution de Spark
ETL avec Spark
Leçon 02
- Transformations de carte
- Les Transformations
- Actions de base
- Transformations de paires clé-valeur
- Opérations de jointure
- Opérations numériques sur les RDD et fonctions d’échantillonnage
- Partitionnement dans Spark
- Contrôle des partitions dans Spark
- Utilisation de programmes externes avec Spark
SparkSQL et DataFrames
Leçon 03
- Architecture de Spark SQL
- Aperçu de l’API DataFrame
- Création de DataFrames
- Modèle de données DataFrame et schémas
- Opérations de base sur les DataFrames
- Fonctions DataFrame
- Opérations ensemblistes et agrégations dans les DataFrames
- Stockage et sortie de DataFrame
- DÉMO Spark SQL et DataFrames
Introduction au traitement de flux avec Spark
Leçon 04
- Introduction à Spark Streaming
- Introduction aux DStreams
- Les opérations DStream
Traitement avec état avec Spark Streaming
Leçon 05
- Les opérations de l’État
- Introduction à l’Event Sourcing
- Démonstration du streaming avec état avec Spark
Opérations de fenêtre glissante avec Spark Streaming
Leçon 06
- Opérations de fenêtrage
- Fonctions de fenêtrage
- DÉMO des opérations de fenêtre glissante avec Spark Streaming
Introduction au streaming structuré
Leçon 07
- Vue d’ensemble de la diffusion structurée
- Modes de sortie et déclenchement avec Structured Streaming
- DÉMO Introduction au streaming structuré
Introduction à Apache Kafka
Leçon 08
- Vue d’ensemble et architecture d’Apache Kafka
- Messagerie avec Kafka
- Démo : Installation locale d’Apache Kafka
Intégration de Kafka avec Spark Streaming
Leçon 09
Utilisation de Spark Streaming avec Apache Kafka
Utiliser l’approche par récepteur
Leçon 10
- Démo : installation locale d’Apache Kafka
- Utiliser l’approche directe
- DÉMO Spark Streaming avec Apache Kafka en utilisant l’approche directe
Intégration de Kafka avec Structured Streaming
Leçon 11
- Streaming structuré et Kafka
- Lecture et écriture de données dans Kafka avec Structured Streaming
- DÉMO Kafka et Structured Streaming
Utilisation de Spark Streaming avec Kinesis
Leçon 12
- Utilisation des bibliothèques Producteur et Client Amazon Kinesis
- DÉMO Introduction à Amazon Kinesis
Utilisation de Spark Streaming avec Kinesis
Leçon 13
- Utilisation de Spark Streaming avec Amazon Kinesis
- DÉMO Utilisation de Spark Streaming avec Amazon Kinesis
- Utilisation de Structured Streaming avec Amazon Kinesis
- DÉMO Utilisation de Structured Streaming avec Amazon Kinesis
Intégrations supplémentaires de Spark Streaming
Leçon 14
- Spark Streaming avec MQTT
- Spark Streaming et Apache Flume
- Spark Streaming et Twitter
- Spark Streaming et Snowflake
- DÉMO Structured Streaming avec Snowflake

À qui s’adresse ce programme ?
Ingénieurs data travaillant avec des systèmes de données en temps réel
Professionnels du big data et développeurs Spark
Ingénieurs logiciels en transition vers des postes d’ingénieur data
Data scientists intéressés par l’analytique en streaming
Développeurs backend créant des applications fortement axées sur les données
Professionnels de l’informatique travaillant avec des systèmes distribués à grande échelle
Prérequis
- Connaissances de base en programmation (Java, Scala ou Python de préférence)
- Maîtrise des concepts de big data et des systèmes distribués
- Connaissances de base des processus de traitement des données ou des flux de travail analytiques
- Compréhension des bases de données et du SQL (utile mais pas obligatoire)
- Aucune expérience préalable avec Spark Streaming n’est requise.
Déclarations
Licences et accréditations
Ce cours est proposé conformément à l’Accord du programme partenaire et respecte les exigences de l’Accord de licence.
Politique d’équité
Nous encourageons les candidats à contacter l’AVC pour obtenir des conseils et un accompagnement tout au long du processus d’aménagement.
Foire aux questions

Avez-vous besoin de solutions d’entreprise ou d’une intégration LMS?
Vous n'avez pas trouvé le cours ou le programme adapté à votre entreprise ? Besoin d'une intégration LMS ? Écrivez-nous ! Nous réglerons tout !
