Deep reinforcement learning in an OpenAI Gym environment

master
dc.abstract.enThe goal of the thesis was to create a new OpenAI Gym environment in the form of an arcade video game built in Pygame. The new environment has been tested with a set of modern deep reinforcement learning algorithms (A2C, DQN, PPO, TRPO) using the reference implementations from the Stable Baselines 3 library. Experiments have shown that algorithms were able to learn the dynamics of the game and, in case of PPO and TRPO algorithms, demonstrate super-human performance.pl
dc.abstract.plCelem pracy było stworzenie nowego środowiska OpenAI Gym w formie gry arcade stworzonej przy użyciu biblioteki Pygame. Nowe środowisko zostało przetestowane przy pomocy zbioru nowoczesnych algorytmów głębokiego uczenia ze wzmocnieniem (A2C, DQN, PPO, TRPO) z użyciem referencyjnych implementacji z biblioteki Stable Baselines 3. Eksperymenty wykazały, że algorytmy były w stanie nauczyć się reguł gry, a w przypadku algorytmów PPO i TRPO osiągnąć efektywność lepszą od człowieka.pl
dc.affiliationUniwersytet Jagielloński w Krakowiepl
dc.contributor.advisorKutt, Krzysztofpl
dc.contributor.authorDadał, Sebastianpl
dc.contributor.departmentbycodeUJK/UJKpl
dc.contributor.reviewerBiałas, Piotr - 127296 pl
dc.contributor.reviewerKutt, Krzysztofpl
dc.date.accessioned2023-10-27T21:35:37Z
dc.date.available2023-10-27T21:35:37Z
dc.date.submitted2023-10-18pl
dc.fieldofstudyinformatyka stosowanapl
dc.identifier.apddiploma-162701-162799pl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/322416
dc.languageengpl
dc.subject.enmachine learning, reinforcement learning, deep reinforcement learning, ml, rl, drl, a2c, dqn, ppo, trpo, openai gym, pygame, neural networks, deep q-networks, advantage actor-critic, proximal policy optimization, trust region policy optimization, video gamespl
dc.subject.pluczenie maszynowe, uczenie ze wzmocnieniem, głębokie uczenie ze wzmocnieniem, a2c, dqn, ppo, trpo, openai gym, pygame, sieci neuronowe, gry wideopl
dc.titleDeep reinforcement learning in an OpenAI Gym environmentpl
dc.title.alternativeGłębokie uczenie ze wzmocnieniem w środowisku OpenAI Gympl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
The goal of the thesis was to create a new OpenAI Gym environment in the form of an arcade video game built in Pygame. The new environment has been tested with a set of modern deep reinforcement learning algorithms (A2C, DQN, PPO, TRPO) using the reference implementations from the Stable Baselines 3 library. Experiments have shown that algorithms were able to learn the dynamics of the game and, in case of PPO and TRPO algorithms, demonstrate super-human performance.
dc.abstract.plpl
Celem pracy było stworzenie nowego środowiska OpenAI Gym w formie gry arcade stworzonej przy użyciu biblioteki Pygame. Nowe środowisko zostało przetestowane przy pomocy zbioru nowoczesnych algorytmów głębokiego uczenia ze wzmocnieniem (A2C, DQN, PPO, TRPO) z użyciem referencyjnych implementacji z biblioteki Stable Baselines 3. Eksperymenty wykazały, że algorytmy były w stanie nauczyć się reguł gry, a w przypadku algorytmów PPO i TRPO osiągnąć efektywność lepszą od człowieka.
dc.affiliationpl
Uniwersytet Jagielloński w Krakowie
dc.contributor.advisorpl
Kutt, Krzysztof
dc.contributor.authorpl
Dadał, Sebastian
dc.contributor.departmentbycodepl
UJK/UJK
dc.contributor.reviewerpl
Białas, Piotr - 127296
dc.contributor.reviewerpl
Kutt, Krzysztof
dc.date.accessioned
2023-10-27T21:35:37Z
dc.date.available
2023-10-27T21:35:37Z
dc.date.submittedpl
2023-10-18
dc.fieldofstudypl
informatyka stosowana
dc.identifier.apdpl
diploma-162701-162799
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/322416
dc.languagepl
eng
dc.subject.enpl
machine learning, reinforcement learning, deep reinforcement learning, ml, rl, drl, a2c, dqn, ppo, trpo, openai gym, pygame, neural networks, deep q-networks, advantage actor-critic, proximal policy optimization, trust region policy optimization, video games
dc.subject.plpl
uczenie maszynowe, uczenie ze wzmocnieniem, głębokie uczenie ze wzmocnieniem, a2c, dqn, ppo, trpo, openai gym, pygame, sieci neuronowe, gry wideo
dc.titlepl
Deep reinforcement learning in an OpenAI Gym environment
dc.title.alternativepl
Głębokie uczenie ze wzmocnieniem w środowisku OpenAI Gym
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
103
Views per month
Views per city
Warsaw
20
Bielefeld
7
Johannesburg
3
Karachi
3
Semenyih
3
Istanbul
2
Kuala Lumpur
2
Mannheim
2
New York
2
Osaka
2

No access

No Thumbnail Available
Collections