M2 Modélisation Aléatoire

Master en statistique, probabilités et finance - Université Paris 7 - Paris Diderot

 
 
 
 
 
 
Liste des cours Cours Data Science Apprentissage par renforcement
 
 

Apprentissage par renforcement

Cours: J. Lussange

Période: Trimestre 3

Nombre de crédits: 3

Volume horaire: 15h 

Contexte

 

L'apprentissage par renforcement constitue, avec l'apprentissage supervisé et non-supervisé, l'une des trois grandes familles algorithmiques d'apprentissage automatique. Inspirée par la théorie de la décision et la psychologie comportementale, elle a pris une importance de premier plan ces dernières années en fusionnant avec d'autres méthodes d'apprentissage automatique, en particulier celle des réseaux profonds, donnant lieu à des champs d'application encore inexplorés.

 

Plan du cours

 

Nous aborderons les points suivants:

 

Différentes familles d'apprentissage par renforcement: model-based, model-free (Q-learning)

Exploration des limites structurelles par des cas pratiques d'application.

Dernières méthodes state-of-the-art et champs de recherche actuels.

Fusion avec d'autres méthodes d'apprentissage automatique.

 

Bibliographie:

Le cours s'appuie sur le grand classique : Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction (disponible gratuitement

online), ainsi que d'autres articles récents choisis.