AI Reinforcement Learning - eLearning

450,00 EUR

  • 30 hours
eLearning

Entrez dans le futur de l’IA avec le cours sur l’apprentissage par renforcement, où les machines apprennent en interagissant, en s’adaptant et en s’améliorant grâce à l’expérience. Ce cours vous présente l’une des branches les plus puissantes de l’apprentissage automatique, utilisée en robotique, en IA pour les jeux, dans les systèmes de recommandation et pour la prise de décision autonome.

Caractéristiques principales

Langue

Cours et supports en anglais

Niveau

Niveau débutant à avancé

Accès

Accès d’un an à la plateforme d’apprentissage

9 heures de vidéos à la demande

avec plus de 30 heures de temps d’étude recommandé

30 exercices pratiques guidés

8 évaluations notées automatiquement

46 quiz de révision

2 devoirs complets

Certificat

Attestation de fin de programme incluse

Résultats d’apprentissage

À la fin de ce cours, vous serez en mesure de comprendre :

Fondamentaux

Maîtrisez les fondamentaux de l’apprentissage par renforcement multi‑agent (RL)

Paradigmes fondamentaux

Explorez les trois grands paradigmes de l’apprentissage automatique

Solde

Comprendre l’équilibre entre exploration et exploitation

Tabular-Q

Apprenez les approches Q-learning tabulaire et Deep Q-learning

RLib

Entraîner plusieurs agents avec RLib

Markov

Acquérir une compréhension des chaînes de Markov et des processus de décision

Hero

Chronologie du cours

  1. Introduction à l’apprentissage par renforcement

    Leçon 01

    • Trois paradigmes de l’apprentissage automatique
    • Histoires de réussite RL
    • Éléments d’un problème d’apprentissage par renforcement
    • Introduction à la salle de sport
    • Entraîner votre premier agent RL avec RLlib
  2. RL en un seul pas : bandits manchots à plusieurs bras

    Leçon 02

    • Cadre du bandit manchot à plusieurs bras
    • Compromis exploration-exploitation
    • Approches fondamentales pour concilier exploration et exploitation
    • Approches avancées pour concilier exploration et exploitation
    • Introduction aux problèmes de bandits contextuels
    • Un exemple pratique de bandit contextuel
    • Bandits contextuels profonds
    • Exploration avec bandits contextuels profonds
    • Un exemple pratique avec des bandits contextuels profonds
  3. Apprentissage par renforcement multi-étapes

    Leçon 03

    • Introduction aux chaînes de Markov
    • Processus de récompense de Markov
    • Processus de décision de Markov
    • Évaluation et itération des politiques
    • Q-learning tabulaire
    • Exemple pratique de Q-learning tabulaire
    • Apprentissage profond par Q-learning
    • Utiliser RLlib pour entraîner un réseau Deep Q
    • Méthodes fondées sur des politiques
    • Utiliser RLib pour entraîner un agent PPO
  4. Approches pour l’apprentissage par renforcement en conditions réelles

    Leçon 04

    • Gérer les récompenses clairsemées et l’exploration difficile
    • Mettre en œuvre le façonnage de récompense
    • Inconvénients du façonnage de récompense
    • Utiliser la mémoire pour gérer l’observabilité partielle
    • Résoudre le Cartpole sans état à l’aide d’un LSTM
    • Combler le fossé entre la simulation et le réel
    • Introduction à l’apprentissage par renforcement multi-agent
    • Former plusieurs agents avec RLib
    • Apprentissage par renforcement multi-agent
    • Apprentissage par renforcement hors ligne
    • Conclusion et autres sujets avancés
Apprentissage par renforcement

Qui devrait s’inscrire à ce programme ?

Ingénieurs en IA et en apprentissage automatique en devenir

Data scientists souhaitant se lancer dans l’apprentissage par renforcement

Développeurs logiciels intéressés par les systèmes intelligents et l’automatisation

Passionnés de robotique et de développement de jeux vidéo

Étudiants et professionnels explorant des concepts avancés d’IA

Pour tous ceux qui se demandent comment l’IA apprend par essais et erreurs

Commencer le cours maintenant

Prérequis

  • Compréhension de base de la programmation en Java Core
  • Familiarité avec les concepts de programmation orientée objet (POO)
  • Connaissances de base sur l’utilisation d’un IDE (par exemple Eclipse ou Spring Tool Suite)
  • Une compréhension générale du fonctionnement des applications web est utile mais pas obligatoire

Déclarations

Licences et accréditations

Ce cours est proposé conformément à l’Accord du programme partenaire et respecte les exigences de l’Accord de licence.

Politique d’équité

Nous encourageons les candidats à contacter l’AVC pour obtenir des conseils et un accompagnement tout au long du processus d’aménagement.


Foire aux questions

Contact background

Avez-vous besoin de solutions d’entreprise ou d’une intégration LMS?

Vous n'avez pas trouvé le cours ou le programme adapté à votre entreprise ? Besoin d'une intégration LMS ? Écrivez-nous ! Nous réglerons tout !