Algoritmy postupného zlepšovania učenia sa v počítačovej hre "Flappy bird"

Autor: Bc. Martin Glova
Vedúca: doc. RNDr. Gabriela Andrejková, CSc.
Konzultant: RNDr. Ľubomír Antoni, PhD.

Ciele práce

(1) Spracovať známe výsledky používajúce algoritmy postupného zlepšovania učenia pre hru Flappy Bird.

(2) Preskúmať známe algoritmy postupného zlepšovania učenia sa použiteľné pre hru Flappy Bird. Navrhnúť ďalšie algoritmy pre túto hru, sústrediť sa na použiteľnosť neurónových sietí.

(3) Navrhnuté algoritmy implementovať a porovnať ich s doposiaľ známymi algoritmami postupného zlepšovania učenia pre hru Flappy Bird vzhľadom na kvalitu učenia a časovú zložitosť učenia.

Literatúra

(1) N. Appiah and S. Vare. “Playing FlappyBird with Deep Reinforcement Learning”. In: Technical Report (2016).

(2) K. Chen. “Deep Reinforcement Learning for Flappy Bird”. In: Technical Report (2015).

(3) G. A. Rummery and M. Niranjan. “On-Line Q-Learning using connectionist systems”. In: CUED/F-INFENG/TR 166 (1994).

(4) Sarvagya Vaish. Flappy Bird RL. URL : http://sarvagyavaish.github.io/FlappyBirdRL/.

(5) Sourabh Verma. FlapPy Bird. URL : https://github.com/sourabhv/FlapPyBird.

(6) M. H. Hassoun: Fundamentals of artificial neural networks. MIT Press, Cambridge, 1995.

(7) S. Rogers, M. Girolami: A First Course in Machine Learning. Chapman & Hall/CRC, 2012.

Progres práce

Rešerš podobných prác
Teoretická časť
Návrh vlastného riešenia
Implementácia riešenia

To Do List

Topic Chosen
Q-learning Algorithm Analyzed
First Optimal Values Found
First Draft Written
New Algorithms Analyzed
New Code Prepared
Neural Network Analyzed
Different Parameter's Values Tested
Second Draft Written
New Ideas Implemented
Conclusion and Future Works Written
Printing Thesis
Handing Thesis
Defending Thesis

E-mail: