M2MO: Modélisation Aléatoire, Finance et Data Science

Master en statistique, probabilités et finance - Université Paris 7 - Paris Diderot

 
 
 
 
 
 
Courses Group Data Science Data science and statistics for industry
 
 

Data science and statistics for industry

Lecturers: M. Abdel-Sayed & L. Massoulard
Period: 
Term 2
ECTS: 3
Schedule 3 hours of lectures/Tutorials per week

Ce cours prolonge le cours de Machine Learning. Il propose de resoudre des problematiques

industrielles en utilisant d'une part les connaissances introduites dans le cours de Machine Learning

et d'autre part de nouveaux algorithmes d'apprentissage statistique introduits

tout au long du module. Toutes les approches proposees sont confrontees a une realite

terrain en traitant des donnees reelles issues de problematiques operationnelles.

Surveillance automatique de courbes: Le but de ce projet est de mettre en

place une methode automatique de surveillance de courbes (donnees fonctionnelles) par

apprentissage statistique. Les outils statistiques abordes sont: l'analyse en composante

principale fonctionnelle.

Diagnostic et monitoring d'un equipement industriel: Le but de ce projet

est d'elaborer une methode de surveillance et de diagnostic automatique d'un equipement

industriel. A partir d'une problematique donnee, et de donnees operationnelles stoquees

dans une base, on mettra progressivement en place, a partir d'une analyse exploratoire

ne des donnees, une methode de surveillance et de diagnostic du bon fonctionnement de

l'equipement par apprentissage statistique.

Les outils statistiques abordes sont: la regression multiplte, la selection de modeles, la

regression avec penalisation, P-value, validation croisee.

Detection automatique des SPAMs L'objectif de ce projet est de comparer

plusieurs methodes de classication pour mettre en place une methode de classication

automatique des spams ayant la meilleure performance. Les methodes utilisees sont des

methodes parametriques et non parametriques comme la regression logistique, l'analyse

discriminante, la Methode des plus proches voisins, l'algorithme des kmeans, les arbres de

regression et les for^ets aleatoires,.

1