D’après le cours de M. Eric Marchand, Professeur à Reims
- L'objectif de l'IA est d'apprendre à jouer au jeu Flappy Bird.
- Chaque oiseau est associé à un réseau de neurones qui possède 5 neurones d’entrée, 8 neurones
sur une couche intermédiaire et 2 neurones de sortie.
- Les 5 neurones d’entrée correspondent à :
- la position X du mur le plus proche de l’oiseau.
- la hauteur Y de l’oiseau.
- la hauteur Y₁ du bas du mur haut.
- la hauteur Y₂ du haut du mur bas.
- la vitesse verticale *v* de l’oiseau.
- Chaque neurone possède une fonction d’activation sigmoïde.
-
La fonction retenue pour évaluer chaque réseau est la distance parcourue dans le jeu sans heurter un mur, le sol ou le
plafond.
-
On utilise l’apprentissage par renforcement, le renforcement étant assuré par un algorithme génétique.
-
On démarre avec une population de 500 oiseaux, chacun possédant un réseau de neurone (5, 8, 2) avec des poids et
des biais tirés au hasard.
Lorsque les 500 oiseaux sont morts, on démarre une nouvelle génération en gardant les meilleurs réseaux (ceux qui ont
tenu le plus longtemps) et en les dupliquant pour avoir un total de 500. Ces 500 réseaux sont alors mutés en modifiant
un peu aléatoirement leurs poids et biais.