AI Reinforcement Learning - eLearning
450,00 EUR
- 30 hours
Entrez dans le futur de l’IA avec le cours sur l’apprentissage par renforcement, où les machines apprennent en interagissant, en s’adaptant et en s’améliorant grâce à l’expérience. Ce cours vous présente l’une des branches les plus puissantes de l’apprentissage automatique, utilisée en robotique, en IA pour les jeux, dans les systèmes de recommandation et pour la prise de décision autonome.
Caractéristiques principales
Langue
Cours et supports en anglais
Niveau
Niveau débutant à avancé
Accès
Accès d’un an à la plateforme d’apprentissage
9 heures de vidéos à la demande
avec plus de 30 heures de temps d’étude recommandé
30 exercices pratiques guidés
8 évaluations notées automatiquement
46 quiz de révision
2 devoirs complets
Certificat
Attestation de fin de programme incluse
Résultats d’apprentissage
À la fin de ce cours, vous serez en mesure de comprendre :
Fondamentaux
Maîtrisez les fondamentaux de l’apprentissage par renforcement multi‑agent (RL)
Paradigmes fondamentaux
Explorez les trois grands paradigmes de l’apprentissage automatique
Solde
Comprendre l’équilibre entre exploration et exploitation
Tabular-Q
Apprenez les approches Q-learning tabulaire et Deep Q-learning
RLib
Entraîner plusieurs agents avec RLib
Markov
Acquérir une compréhension des chaînes de Markov et des processus de décision

Chronologie du cours
Introduction à l’apprentissage par renforcement
Leçon 01
- Trois paradigmes de l’apprentissage automatique
- Histoires de réussite RL
- Éléments d’un problème d’apprentissage par renforcement
- Introduction à la salle de sport
- Entraîner votre premier agent RL avec RLlib
RL en un seul pas : bandits manchots à plusieurs bras
Leçon 02
- Cadre du bandit manchot à plusieurs bras
- Compromis exploration-exploitation
- Approches fondamentales pour concilier exploration et exploitation
- Approches avancées pour concilier exploration et exploitation
- Introduction aux problèmes de bandits contextuels
- Un exemple pratique de bandit contextuel
- Bandits contextuels profonds
- Exploration avec bandits contextuels profonds
- Un exemple pratique avec des bandits contextuels profonds
Apprentissage par renforcement multi-étapes
Leçon 03
- Introduction aux chaînes de Markov
- Processus de récompense de Markov
- Processus de décision de Markov
- Évaluation et itération des politiques
- Q-learning tabulaire
- Exemple pratique de Q-learning tabulaire
- Apprentissage profond par Q-learning
- Utiliser RLlib pour entraîner un réseau Deep Q
- Méthodes fondées sur des politiques
- Utiliser RLib pour entraîner un agent PPO
Approches pour l’apprentissage par renforcement en conditions réelles
Leçon 04
- Gérer les récompenses clairsemées et l’exploration difficile
- Mettre en œuvre le façonnage de récompense
- Inconvénients du façonnage de récompense
- Utiliser la mémoire pour gérer l’observabilité partielle
- Résoudre le Cartpole sans état à l’aide d’un LSTM
- Combler le fossé entre la simulation et le réel
- Introduction à l’apprentissage par renforcement multi-agent
- Former plusieurs agents avec RLib
- Apprentissage par renforcement multi-agent
- Apprentissage par renforcement hors ligne
- Conclusion et autres sujets avancés

Qui devrait s’inscrire à ce programme ?
Ingénieurs en IA et en apprentissage automatique en devenir
Data scientists souhaitant se lancer dans l’apprentissage par renforcement
Développeurs logiciels intéressés par les systèmes intelligents et l’automatisation
Passionnés de robotique et de développement de jeux vidéo
Étudiants et professionnels explorant des concepts avancés d’IA
Pour tous ceux qui se demandent comment l’IA apprend par essais et erreurs
Prérequis
- Compréhension de base de la programmation en Java Core
- Familiarité avec les concepts de programmation orientée objet (POO)
- Connaissances de base sur l’utilisation d’un IDE (par exemple Eclipse ou Spring Tool Suite)
- Une compréhension générale du fonctionnement des applications web est utile mais pas obligatoire
Déclarations
Licences et accréditations
Ce cours est proposé conformément à l’Accord du programme partenaire et respecte les exigences de l’Accord de licence.
Politique d’équité
Nous encourageons les candidats à contacter l’AVC pour obtenir des conseils et un accompagnement tout au long du processus d’aménagement.
Foire aux questions

Avez-vous besoin de solutions d’entreprise ou d’une intégration LMS?
Vous n'avez pas trouvé le cours ou le programme adapté à votre entreprise ? Besoin d'une intégration LMS ? Écrivez-nous ! Nous réglerons tout !
