|
|
|
Thèmes de recherche
Mon travail de thèse a porté sur l'utilisation des capacités de généralisation des réseaux de neurones artificiels dans l'apprentissage par renforcement. Cela a permis de mettre au point des méthodes efficaces pour l'application de l'algorithme TD(lambda) continu à des tâches de contrôle moteur en dimension élevée. En particulier, l'algorithme a été raffiné pour traiter des problèmes avec une commande et des états discontinus, et pour rendre la descente de gradient beaucoup plus rapide dans le cas de l'utilisation de réseaux de neurones feedforward. Ces améliorations ont été appliquées avec succès à des problémes complexes originaux, comme la conduite d'une voiture de course et la natation d'un robot articulé.
Publications représentatives
- Apprentissage par renforcement utilisant des réseaux de neurones, avec des applications au contrôle moteur. Thèse de doctorat de l' Institut National Polytechnique de Grenoble, 2002. (PDF)
Pages personnelles
|