Apprentissage par renforcement profond

Projet de Découverte de la Recherche - Telecom Nancy 2019

Encadrants :

Olivier Buffet ([email protected] - 03 54 95 86 15)
Vincent Thomas ([email protected] - 03 54 95 85 08)

Etudiants :

Nathan Barloy ([email protected])
Aurélien Delage ([email protected])

Sujet

Dans le domaine de l'intelligence artificielle, l'apprentissage automatique (Machine Learning) permet à un ordinateur d'apprendre à effectuer une tâche (de classification, de reconnaissance de forme, ...) sur la base d'exemples qui lui sont fournis. Ces dernières années, des progrès importants ont été faits dans ce domaine à travers les techniques d'apprentissage profond (Deep Learning), lesquelles reposent sur des modèles connexionistes (tels que des réseaux neuronaux). Des travaux ont, entre autres, permis des avancées en apprentissage par renforcement (Reinforcement Learning), c'est-à-dire l'apprentissage par essais-erreurs du comportement d'un agent en interaction avec son environnement (le percevant et pouvant agir sur lui). On peut citer à ce titre des succès dans le cadre de jeux vidéo classiques et du jeu de Go.

Dans le cadre de ce projet, nous souhaitons reproduire certaines expériences d’apprentissage en utilisant une bibliothèque dédiée. Pour cela,

on commencera par se familiariser avec les bases de l'apprentissage par renforcement d'une part (sans approximateurs), comme le Q-learning, et de l'apprentissage profond d'autre part ;
on regardera ensuite comment utiliser une bibliothèque disponible (par exemple pytorch en python) en cherchant à résoudre un problème simple de classification à partir d’une base d’exemples fournies (reconnaissance de l’écriture) ;
enfin, on utilisera cette bibliothèque pour essayer d’effectuer de l’apprentissage par renforcement profond (Deep RL) sur un jeu à définir sur lequel conduire des expérimentations (par exemple flappy bird).

Références

Playing Atari With Deep Reinforcement Learning, de V. Mnih, K. Kavukcuoglu, D. Silver, A. Graves, I. Antonoglou, D. Wierstra, and M. Riedmiller. In NIPS Deep Learning Workshop, 2013.
Deep Learning de Ian Goodfellow and Yoshua Bengio and Aaron Courville, MIT Press 2016, http://www.deeplearningbook.org.

Instructions flappyBird

Pour lancer flappyBird, il faut lancer la commande : python temp.py ou python temp_gravite.py pour avoir la version gérant la gravite.
Il faut avoir installé la librairie Pygame
Il faut utiliser les flèches directionnelles haut et bas du clavier pour se déplacer.

Name		Name	Last commit message	Last commit date
Latest commit History 127 Commits
DQN/TensorFlow-FlappyBird		DQN/TensorFlow-FlappyBird
flappy		flappy
images		images
src		src
.gitignore		.gitignore
PIDR.pdf		PIDR.pdf
journal.txt		journal.txt
notes_references.txt		notes_references.txt
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Apprentissage par renforcement profond

Sujet

Références

Instructions flappyBird

About

Releases

Packages

Contributors 2

Languages

nathanBarloy/deep_reinforcement_learning

Folders and files

Latest commit

History

Repository files navigation

Apprentissage par renforcement profond

Sujet

Références

Instructions flappyBird

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages