Lecturer: J. Lussange
Period: Term 3
ECTS: 3
Schedule: 14h
Contexte
L'apprentissage par renforcement constitue, avec l'apprentissage supervisé et non-supervisé, l'une des trois grandes familles algorithmiques d'apprentissage automatique. Inspirée par la théorie de la décision et la psychologie comportementale, elle a pris une importance de premier plan ces dernières années en fusionnant avec d'autres méthodes d'apprentissage automatique, en particulier celle des réseaux profonds, donnant lieu à des champs d'application encore inexplorés.
Plan du cours
Nous aborderons les points suivants:
Différentes familles d'apprentissage par renforcement: model-based, model-free (Q-learning)
Exploration des limites structurelles par des cas pratiques d'application.
Dernières méthodes state-of-the-art et champs de recherche actuels.
Fusion avec d'autres méthodes d'apprentissage automatique.
Bibliographie:
Le cours s'appuie sur le grand classique : Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction (disponible gratuitement
online), ainsi que d'autres articles récents choisis.