M2MO: Modélisation Aléatoire, Finance et Data Science

Master en statistique, probabilités et finance - Université Paris 7 - Paris Diderot

 
 
 
 
 
 
Courses Group Data Science Introduction to reinforcement learning
 
 

Introduction to reinforcement learning

Lecturer: J. Lussange

Period: Term 3

ECTS: 3

Schedule: 16h 

Contexte

 

L'apprentissage par renforcement constitue, avec l'apprentissage supervisé et non-supervisé, l'une des trois grandes familles algorithmiques d'apprentissage automatique. Inspirée par la théorie de la décision et la psychologie comportementale, elle a pris une importance de premier plan ces dernières années en fusionnant avec d'autres méthodes d'apprentissage automatique, en particulier celle des réseaux profonds, donnant lieu à des champs d'application encore inexplorés.

 

Plan du cours

 

 

- Cours #1 (2h) : Le modèle de Rescorla-Wagner : apprendre c'est prédire, et le concept de "politique."

 

- Cours #2 (2h) : Le dilemme de l'exploration/exploitation & l'escompte des récompenses. 

 

- Cours #3 (2h) : Le fléau de la dimensionnalité. 

 

- Cours #4 (2h) : Théorie orthodoxe de l'apprentissage par renforcement. 

 

- Cours #5 (1h30 + 1h30) : Examen de mi-parcours (1h30) ; domaines de recherche actuels en apprentissage par renforcement (1h30).

 

- Cours #6 (2h) : Exemples et exercices pratiques d'apprentissage par renforcement. 

 

- Cours #7 (2h) : Exemples et exercices pratiques d'apprentissage par renforcement. 

 

- Cours #8 (2h) : Apprentissage par renforcement profond (deep reinforcement learning).

 

- Examen final : projet d'info.

 

 

Bibliographie:

Le cours s'appuie sur le grand classique : Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction (disponible gratuitement

online), ainsi que d'autres articles récents choisis.