Simple view
Full metadata view
Authors
Statistics
Analiza algorytmów Deep Q-learning oraz Proximal Policy Optimization.
Analysis of Deep Q-learning and Proximal Policy Optimization algorithms
Uczenie przez wzmacnianie, Deep Q-learning, Proximal Policy Optimization, uczenie maszynowe, decyzyjne procesy Markova
Reinforcement learning, Deep Q-learning, Proximal Policy Optimization, machine learning, Markov decision process
Uczenie przez wzmacnianie jest jedną z gałęzi uczenia maszynowego w której celem jest znalezienie optymalnej strategii dla agenta w nieznanym środowisku. W pracy wyjaśnione zostają dwa algorytmy uczenia przez wzmacnianie. Pierwszym z nich jest algorytm Deep Q-Networks oparty na idei Q-learningu. Drugim jest algorytm Proximal Policy Optimization opisany pierwszy raz w 2017 roku. Do pracy dołączona jest implementacja powyższych algorytmów.
Reinforcement learning is an area of machine learning where the goal is to find the optimal strategy for an agent in a certain environment. The thesis presents two reinforcement learning algorithms. The first is the Deep Q-Networks algorithm based on the idea of Q-learning. The second is the Proximal Policy Optimization algorithm described for the first time in 2017. The implementation of the above algorithms is attached to the work.
| dc.abstract.en | Reinforcement learning is an area of machine learning where the goal is to find the optimal strategy for an agent in a certain environment. The thesis presents two reinforcement learning algorithms. The first is the Deep Q-Networks algorithm based on the idea of Q-learning. The second is the Proximal Policy Optimization algorithm described for the first time in 2017. The implementation of the above algorithms is attached to the work. | pl |
| dc.abstract.pl | Uczenie przez wzmacnianie jest jedną z gałęzi uczenia maszynowego w której celem jest znalezienie optymalnej strategii dla agenta w nieznanym środowisku. W pracy wyjaśnione zostają dwa algorytmy uczenia przez wzmacnianie. Pierwszym z nich jest algorytm Deep Q-Networks oparty na idei Q-learningu. Drugim jest algorytm Proximal Policy Optimization opisany pierwszy raz w 2017 roku. Do pracy dołączona jest implementacja powyższych algorytmów. | pl |
| dc.affiliation | Wydział Matematyki i Informatyki | pl |
| dc.area | obszar nauk ścisłych | pl |
| dc.contributor.advisor | Wrona, Michał | pl |
| dc.contributor.author | Dyczek, Jakub | pl |
| dc.contributor.departmentbycode | UJK/WMI2 | pl |
| dc.contributor.reviewer | Micek, Piotr - 142050 | pl |
| dc.contributor.reviewer | Wrona, Michał | pl |
| dc.date.accessioned | 2020-07-28T08:19:12Z | |
| dc.date.available | 2020-07-28T08:19:12Z | |
| dc.date.submitted | 2020-07-17 | pl |
| dc.fieldofstudy | informatyka analityczna | pl |
| dc.identifier.apd | diploma-143600-212796 | pl |
| dc.identifier.project | APD / O | pl |
| dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/242621 | |
| dc.language | pol | pl |
| dc.subject.en | Reinforcement learning, Deep Q-learning, Proximal Policy Optimization, machine learning, Markov decision process | pl |
| dc.subject.pl | Uczenie przez wzmacnianie, Deep Q-learning, Proximal Policy Optimization, uczenie maszynowe, decyzyjne procesy Markova | pl |
| dc.title | Analiza algorytmów Deep Q-learning oraz Proximal Policy Optimization. | pl |
| dc.title.alternative | Analysis of Deep Q-learning and Proximal Policy Optimization algorithms | pl |
| dc.type | licenciate | pl |
| dspace.entity.type | Publication |