Pascal Germain, Researcher in Machine Learning

This page is deprecated! My new webage is here.


En apprentissage automatique, le problème d'adaptation de domaine 
consiste à entraîner un classificateur sur une distribution de données 
qui diffère (plus ou mois légèrement) de la distribution des données sur 
laquelle le classificateur devra effectuer une prédiction.
Voici un exemple d'un tel problème: on possède deux ensembles de textes 
critiques concernant des livres et des films. Chaque critique de livre 
est accompagnée d'une appréciation (une côte numérique), mais on ne 
possède pas l'appréciation associée aux critiques de films. À partir de 
ces données, on désire entraîner un classificateur à prédire 
l'appréciation d'un film à partir de sa critique. Lors de 
l'apprentissage, il faudra non seulement minimiser l'erreur sur la 
classification de livres, mais aussi "s'adapter" à la tâche de 
classification de film. Pour ce faire, il faut analyser la divergence 
entre les distributions de critiques de livres et de critiques de films.
Lors de la présentation, j'introduirai une analyse de l'adaptation de 
domaines inspirée de la théorie PAC-Bayésienne et je présenterai un 
algorithme d'apprentissage que nous avons développé à partir de cette 
analyse théorique.

[ Link to text file ]

<< Go back.