Simple view
Full metadata view
Authors
Statistics
Przeszukiwanie drzewa gier metodą Monte Carlo
Searching through game tree using Monte-Carlo methods
drzewo gry, symulacje Monte-Carlo, sztuczna~inteligencja, AlphaZero, kółko-krzyżyk, warcaby
game tree, Monte-Carlo playouts, artificial intelligence, AlphaZero, Tic-tac-toe, Checkers
Kluczowym elementem niezbędnym do rozwoju sztucznej inteligencji jest odnalezienie dobrej strategii w procesie podejmowania decyzji. Konstruowanie zaawansowanych struktur często prowadzi do zbyt złożonych wydajnościowo obliczeń i w rezultacie daje przeciętne skutki. Ryzyko, że bazowy algorytm jest słabym fundamentem, maleje, gdy wprowadza się prostsze i bardziej eleganckie rozwiązania.Głównym celem pracy jest implementacja algorytmu przeszukiwania drzewa decyzji w grach deterministycznych wspomagane symulacjami Monte-Carlo. Metoda odniosła duży sukces w programie AlphaZero, który zdominował wszystkie poprzednio istniejące programy do gry Go, jak i szachów. W pierwszej części pracy wprowadzone są podstawowe pojęcia potrzebne do zrozumienia tej metody, a następnie przedstawiona jest najprostsza wersja algorytmu przeszukiwania, powszechnie znanego pod nazwą Monte Carlo Tree Search. Idea wykorzystania symulacji i umiejętnej klasyfikacji próbek jest zwięzła i nieskomplikowana, pozwalając na szybkie zrozumienie problemu. Jednakże, aby rozwiązanie zbiegało się do optimum, wymagana jest duża liczba iteracji, co powoduje, że bez modyfikacji optymalizujących mogą być podjęte złe decyzje. Wszystko zależy od rodzaju gry, a dokładniej od tego ile jest możliwości oraz jak długo trwa jedna rozgrywka. Zaimplementowane gry to kółko krzyżyk 3x3, 5x5 i warcaby angielskie.
The key to development of artificial intelligence lies in finding a good strategy algorithm for a decision process. The creation of advanced structures often leads to heavy calculations in terms of performance and eventually gives average results. The risk of a base algorithm being a weak foundation is smaller, the simpler and more elegant the solutions are.The purpose of this study is to implement a search algorithm of a decision tree for deterministic games using Monte-Carlo playouts. This method has shown to be successful in AlphaZero program who dominated all previous algorithms for the game of Go and Chess. The beginning of the work explains basic concepts, necessary to understand the method and then demonstrates a pure version of the algorithm, widely known as Monte Carlo Tree Search. The idea of simulations along with competent classification of game samples is concise and simple thus allowing quick understanding of the problem. Yet, a large number of iterations is required for the solution to converge to optimum implying the use of optimizations without which the algorithm could fail. All in all, the complexity increases depending on how long a game lasts and how many possibilities a game has. Implemented games are Tic-tac-toe 3x3, 5x5 and English Draughts (Checkers).
dc.abstract.en | The key to development of artificial intelligence lies in finding a good strategy algorithm for a decision process. The creation of advanced structures often leads to heavy calculations in terms of performance and eventually gives average results. The risk of a base algorithm being a weak foundation is smaller, the simpler and more elegant the solutions are.The purpose of this study is to implement a search algorithm of a decision tree for deterministic games using Monte-Carlo playouts. This method has shown to be successful in AlphaZero program who dominated all previous algorithms for the game of Go and Chess. The beginning of the work explains basic concepts, necessary to understand the method and then demonstrates a pure version of the algorithm, widely known as Monte Carlo Tree Search. The idea of simulations along with competent classification of game samples is concise and simple thus allowing quick understanding of the problem. Yet, a large number of iterations is required for the solution to converge to optimum implying the use of optimizations without which the algorithm could fail. All in all, the complexity increases depending on how long a game lasts and how many possibilities a game has. Implemented games are Tic-tac-toe 3x3, 5x5 and English Draughts (Checkers). | pl |
dc.abstract.pl | Kluczowym elementem niezbędnym do rozwoju sztucznej inteligencji jest odnalezienie dobrej strategii w procesie podejmowania decyzji. Konstruowanie zaawansowanych struktur często prowadzi do zbyt złożonych wydajnościowo obliczeń i w rezultacie daje przeciętne skutki. Ryzyko, że bazowy algorytm jest słabym fundamentem, maleje, gdy wprowadza się prostsze i bardziej eleganckie rozwiązania.Głównym celem pracy jest implementacja algorytmu przeszukiwania drzewa decyzji w grach deterministycznych wspomagane symulacjami Monte-Carlo. Metoda odniosła duży sukces w programie AlphaZero, który zdominował wszystkie poprzednio istniejące programy do gry Go, jak i szachów. W pierwszej części pracy wprowadzone są podstawowe pojęcia potrzebne do zrozumienia tej metody, a następnie przedstawiona jest najprostsza wersja algorytmu przeszukiwania, powszechnie znanego pod nazwą Monte Carlo Tree Search. Idea wykorzystania symulacji i umiejętnej klasyfikacji próbek jest zwięzła i nieskomplikowana, pozwalając na szybkie zrozumienie problemu. Jednakże, aby rozwiązanie zbiegało się do optimum, wymagana jest duża liczba iteracji, co powoduje, że bez modyfikacji optymalizujących mogą być podjęte złe decyzje. Wszystko zależy od rodzaju gry, a dokładniej od tego ile jest możliwości oraz jak długo trwa jedna rozgrywka. Zaimplementowane gry to kółko krzyżyk 3x3, 5x5 i warcaby angielskie. | pl |
dc.affiliation | Wydział Fizyki, Astronomii i Informatyki Stosowanej | pl |
dc.area | obszar nauk ścisłych | pl |
dc.contributor.advisor | Görlich, Andrzej - 135185 | pl |
dc.contributor.author | Paruzel, Paweł | pl |
dc.contributor.departmentbycode | UJK/WFAIS | pl |
dc.contributor.reviewer | Płaczek, Wiesław - 131447 | pl |
dc.contributor.reviewer | Görlich, Andrzej - 135185 | pl |
dc.date.accessioned | 2020-07-27T17:01:15Z | |
dc.date.available | 2020-07-27T17:01:15Z | |
dc.date.submitted | 2018-06-29 | pl |
dc.fieldofstudy | informatyka | pl |
dc.identifier.apd | diploma-124410-198076 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/228696 | |
dc.language | pol | pl |
dc.subject.en | game tree, Monte-Carlo playouts, artificial intelligence, AlphaZero, Tic-tac-toe, Checkers | pl |
dc.subject.pl | drzewo gry, symulacje Monte-Carlo, sztuczna~inteligencja, AlphaZero, kółko-krzyżyk, warcaby | pl |
dc.title | Przeszukiwanie drzewa gier metodą Monte Carlo | pl |
dc.title.alternative | Searching through game tree using Monte-Carlo methods | pl |
dc.type | licenciate | pl |
dspace.entity.type | Publication |