Simple view
Full metadata view
Authors
Statistics
Deep reinforcement learning in an OpenAI Gym environment
Głębokie uczenie ze wzmocnieniem w środowisku OpenAI Gym
uczenie maszynowe, uczenie ze wzmocnieniem, głębokie uczenie ze wzmocnieniem, a2c, dqn, ppo, trpo, openai gym, pygame, sieci neuronowe, gry wideo
machine learning, reinforcement learning, deep reinforcement learning, ml, rl, drl, a2c, dqn, ppo, trpo, openai gym, pygame, neural networks, deep q-networks, advantage actor-critic, proximal policy optimization, trust region policy optimization, video games
Celem pracy było stworzenie nowego środowiska OpenAI Gym w formie gry arcade stworzonej przy użyciu biblioteki Pygame. Nowe środowisko zostało przetestowane przy pomocy zbioru nowoczesnych algorytmów głębokiego uczenia ze wzmocnieniem (A2C, DQN, PPO, TRPO) z użyciem referencyjnych implementacji z biblioteki Stable Baselines 3. Eksperymenty wykazały, że algorytmy były w stanie nauczyć się reguł gry, a w przypadku algorytmów PPO i TRPO osiągnąć efektywność lepszą od człowieka.
The goal of the thesis was to create a new OpenAI Gym environment in the form of an arcade video game built in Pygame. The new environment has been tested with a set of modern deep reinforcement learning algorithms (A2C, DQN, PPO, TRPO) using the reference implementations from the Stable Baselines 3 library. Experiments have shown that algorithms were able to learn the dynamics of the game and, in case of PPO and TRPO algorithms, demonstrate super-human performance.
dc.abstract.en | The goal of the thesis was to create a new OpenAI Gym environment in the form of an arcade video game built in Pygame. The new environment has been tested with a set of modern deep reinforcement learning algorithms (A2C, DQN, PPO, TRPO) using the reference implementations from the Stable Baselines 3 library. Experiments have shown that algorithms were able to learn the dynamics of the game and, in case of PPO and TRPO algorithms, demonstrate super-human performance. | pl |
dc.abstract.pl | Celem pracy było stworzenie nowego środowiska OpenAI Gym w formie gry arcade stworzonej przy użyciu biblioteki Pygame. Nowe środowisko zostało przetestowane przy pomocy zbioru nowoczesnych algorytmów głębokiego uczenia ze wzmocnieniem (A2C, DQN, PPO, TRPO) z użyciem referencyjnych implementacji z biblioteki Stable Baselines 3. Eksperymenty wykazały, że algorytmy były w stanie nauczyć się reguł gry, a w przypadku algorytmów PPO i TRPO osiągnąć efektywność lepszą od człowieka. | pl |
dc.affiliation | Uniwersytet Jagielloński w Krakowie | pl |
dc.contributor.advisor | Kutt, Krzysztof | pl |
dc.contributor.author | Dadał, Sebastian | pl |
dc.contributor.departmentbycode | UJK/UJK | pl |
dc.contributor.reviewer | Białas, Piotr - 127296 | pl |
dc.contributor.reviewer | Kutt, Krzysztof | pl |
dc.date.accessioned | 2023-10-27T21:35:37Z | |
dc.date.available | 2023-10-27T21:35:37Z | |
dc.date.submitted | 2023-10-18 | pl |
dc.fieldofstudy | informatyka stosowana | pl |
dc.identifier.apd | diploma-162701-162799 | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/322416 | |
dc.language | eng | pl |
dc.subject.en | machine learning, reinforcement learning, deep reinforcement learning, ml, rl, drl, a2c, dqn, ppo, trpo, openai gym, pygame, neural networks, deep q-networks, advantage actor-critic, proximal policy optimization, trust region policy optimization, video games | pl |
dc.subject.pl | uczenie maszynowe, uczenie ze wzmocnieniem, głębokie uczenie ze wzmocnieniem, a2c, dqn, ppo, trpo, openai gym, pygame, sieci neuronowe, gry wideo | pl |
dc.title | Deep reinforcement learning in an OpenAI Gym environment | pl |
dc.title.alternative | Głębokie uczenie ze wzmocnieniem w środowisku OpenAI Gym | pl |
dc.type | master | pl |
dspace.entity.type | Publication |