Simple view
Full metadata view
Authors
Statistics
Nauczanie przez wzmacnianie
Reinforcement learning
nauczanie maszynowe, wzmocnienie, nauczanie inkrementacyjne, problemy sterowania
machine learning, reinforcement, incremental learning, control problems
Celem pracy jest przedstawienie algorytmów nauczania przez wzmacnianie. Omówione zostają metody rozwiązujące problemy z jednym stanem. Po wprowadzeniu pojęcia decyzyjnych procesów Markowa, zostaje wyprowadzone i omówione równanie Bellmana. Pod koniec pracy przedstawione są dwa algorytmy nauczania przez wzmacnianie - Sarsa oraz Q-Learning, oraz przy użyciu drugiego z nich, rozwiązany jest problem sterowania.
The purpose of this thesis is to present the basics of reinforcement learning algorithms. Firstly, methods of solving one state problems are presented. After introducing the concept of Markov decision process, the Bellman equation is derived and described. At the end of this paper, Sarsa and Q-Learning algorithms are introduced and compared, the second algorithm is used to solve the control problem.
dc.abstract.en | The purpose of this thesis is to present the basics of reinforcement learning algorithms. Firstly, methods of solving one state problems are presented. After introducing the concept of Markov decision process, the Bellman equation is derived and described. At the end of this paper, Sarsa and Q-Learning algorithms are introduced and compared, the second algorithm is used to solve the control problem. | pl |
dc.abstract.pl | Celem pracy jest przedstawienie algorytmów nauczania przez wzmacnianie. Omówione zostają metody rozwiązujące problemy z jednym stanem. Po wprowadzeniu pojęcia decyzyjnych procesów Markowa, zostaje wyprowadzone i omówione równanie Bellmana. Pod koniec pracy przedstawione są dwa algorytmy nauczania przez wzmacnianie - Sarsa oraz Q-Learning, oraz przy użyciu drugiego z nich, rozwiązany jest problem sterowania. | pl |
dc.affiliation | Wydział Matematyki i Informatyki | pl |
dc.area | obszar nauk ścisłych | pl |
dc.contributor.advisor | Kapela, Tomasz - 128624 | pl |
dc.contributor.author | Maresca, Rocco | pl |
dc.contributor.departmentbycode | UJK/WMI2 | pl |
dc.contributor.reviewer | Kapela, Tomasz - 128624 | pl |
dc.contributor.reviewer | Spurek, Przemysław | pl |
dc.date.accessioned | 2020-07-27T15:27:46Z | |
dc.date.available | 2020-07-27T15:27:46Z | |
dc.date.submitted | 2018-07-05 | pl |
dc.fieldofstudy | matematyka komputerowa | pl |
dc.identifier.apd | diploma-122863-210808 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/227273 | |
dc.language | pol | pl |
dc.subject.en | machine learning, reinforcement, incremental learning, control problems | pl |
dc.subject.pl | nauczanie maszynowe, wzmocnienie, nauczanie inkrementacyjne, problemy sterowania | pl |
dc.title | Nauczanie przez wzmacnianie | pl |
dc.title.alternative | Reinforcement learning | pl |
dc.type | licenciate | pl |
dspace.entity.type | Publication |