Uczenie maszynowe z językiem Python

master
dc.abstract.enThis thesis presents the application simulating sports betting markets and a bot player that performs transactions on markets and utilizes machine learning for improving it's performance.In the beginning, the introduction to machine learning is provided with examples of it's effective usage in robotics. Development tool set used is presented, which contains Python language, NumPy and Matplotlib modules among the others. Reinforcement learning is presented as a novel approach in machine learning. Mathematic model of the approach is explained with Markov decission process.Two concrete algorithms of temporal difference learning paradigm are presented: Q-learning and Sarsa. The description contains possibly complex versions, which contain usage of eligibility traces that, in theory, help to improve learning process efficiency.Implemenation of mentioned algorithms is developed and used to build simulation of trading on betting exchange. Effectiveness of the application isexamined via various experiments. The role and selection of all the learning parameter values is described in a context of the problem being solved. The application is supplemented with other tools built that are used to visualize exchange markets data and generate artificial price change sequences.pl
dc.abstract.plNiniejsza praca przedstawia aplikację, która symuluje giełdę zakładów sportowych, oraz gracza-bota wykorzystującego uczenie maszynowe do zwiększania skuteczności swojej gry.Początek pracy zawiera wprowadzenie do dziedziny uczenia maszynowego oraz przybliża jeden z przykładów jego zastosowania w robotyce. Opisane zostają narzędzia wykorzystane w projekcie, w których skład wchodzi język Python oraz wybrane biblioteki, takie jak NumPy i Matplotlib.Omówiono uczenie ze wzmocnieniem, jako nowe podejście w obszarze uczenia się maszyn. Opisano wszystkie składowe potrzebne do definicji tego typu algorytmów. Przedstawiono matematyczny model tego paradygmatu, czyli proces decyzyjny Markowa.Zaprezentowano dwa popularne algorytmy z klasy zwanej metodami różnic czasowych: Q-learning oraz Sarsa. Zostają one przedstawione w możliwe kompletnej wersji uwzględniającej wykorzystanie tzw. śladów aktywności, które w teorii pomagają przyspieszyć proces nauki.Stworzono implementację wymienionych algorytmów, na podstawie której zbudowana jest symulacja gry na giełdzie. Przy pomocy przeprowadzonych testów sprawdzono skuteczność zaprogramowanej symulacji. Szczegółowo opisana jest rola oraz dobór wartości poszczególnych parametrów nauki w kontekście rozwiązywanego problemu. Wspomnianą aplikację uzupełniają programy pomocnicze służące do wizualizacji danych giełdowych na wykresach oraz generowania sztucznych sekwencji zmian kursu.pl
dc.affiliationWydział Fizyki, Astronomii i Informatyki Stosowanejpl
dc.areaobszar nauk ścisłychpl
dc.contributor.advisorKapanowski, Andrzej - 100452 pl
dc.contributor.authorJancarz, Mateuszpl
dc.contributor.departmentbycodeUJK/WFAISpl
dc.contributor.reviewerCieśla, Michał - 101020 pl
dc.contributor.reviewerKapanowski, Andrzej - 100452 pl
dc.date.accessioned2020-07-26T18:26:31Z
dc.date.available2020-07-26T18:26:31Z
dc.date.submitted2015-10-22pl
dc.fieldofstudyinformatyka stosowanapl
dc.identifier.apddiploma-101351-184282pl
dc.identifier.projectAPD / Opl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/208350
dc.languagepolpl
dc.subject.enartificial intelligence, machine learning, reinforcement learning, temporal differences learning, Q-learning algorithm, Sarsa algorithm, eligibility traces, Markov decision processpl
dc.subject.plsztuczna inteligencja, uczenie maszynowe, uczenie ze wzmocnieniem, metody różnic czasowych, algorytm O-learning, algorytm Sarsa, ślady aktywności, proces decyzyjny Markowapl
dc.titleUczenie maszynowe z językiem Pythonpl
dc.title.alternativeMachine learning with Pythonpl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
This thesis presents the application simulating sports betting markets and a bot player that performs transactions on markets and utilizes machine learning for improving it's performance.In the beginning, the introduction to machine learning is provided with examples of it's effective usage in robotics. Development tool set used is presented, which contains Python language, NumPy and Matplotlib modules among the others. Reinforcement learning is presented as a novel approach in machine learning. Mathematic model of the approach is explained with Markov decission process.Two concrete algorithms of temporal difference learning paradigm are presented: Q-learning and Sarsa. The description contains possibly complex versions, which contain usage of eligibility traces that, in theory, help to improve learning process efficiency.Implemenation of mentioned algorithms is developed and used to build simulation of trading on betting exchange. Effectiveness of the application isexamined via various experiments. The role and selection of all the learning parameter values is described in a context of the problem being solved. The application is supplemented with other tools built that are used to visualize exchange markets data and generate artificial price change sequences.
dc.abstract.plpl
Niniejsza praca przedstawia aplikację, która symuluje giełdę zakładów sportowych, oraz gracza-bota wykorzystującego uczenie maszynowe do zwiększania skuteczności swojej gry.Początek pracy zawiera wprowadzenie do dziedziny uczenia maszynowego oraz przybliża jeden z przykładów jego zastosowania w robotyce. Opisane zostają narzędzia wykorzystane w projekcie, w których skład wchodzi język Python oraz wybrane biblioteki, takie jak NumPy i Matplotlib.Omówiono uczenie ze wzmocnieniem, jako nowe podejście w obszarze uczenia się maszyn. Opisano wszystkie składowe potrzebne do definicji tego typu algorytmów. Przedstawiono matematyczny model tego paradygmatu, czyli proces decyzyjny Markowa.Zaprezentowano dwa popularne algorytmy z klasy zwanej metodami różnic czasowych: Q-learning oraz Sarsa. Zostają one przedstawione w możliwe kompletnej wersji uwzględniającej wykorzystanie tzw. śladów aktywności, które w teorii pomagają przyspieszyć proces nauki.Stworzono implementację wymienionych algorytmów, na podstawie której zbudowana jest symulacja gry na giełdzie. Przy pomocy przeprowadzonych testów sprawdzono skuteczność zaprogramowanej symulacji. Szczegółowo opisana jest rola oraz dobór wartości poszczególnych parametrów nauki w kontekście rozwiązywanego problemu. Wspomnianą aplikację uzupełniają programy pomocnicze służące do wizualizacji danych giełdowych na wykresach oraz generowania sztucznych sekwencji zmian kursu.
dc.affiliationpl
Wydział Fizyki, Astronomii i Informatyki Stosowanej
dc.areapl
obszar nauk ścisłych
dc.contributor.advisorpl
Kapanowski, Andrzej - 100452
dc.contributor.authorpl
Jancarz, Mateusz
dc.contributor.departmentbycodepl
UJK/WFAIS
dc.contributor.reviewerpl
Cieśla, Michał - 101020
dc.contributor.reviewerpl
Kapanowski, Andrzej - 100452
dc.date.accessioned
2020-07-26T18:26:31Z
dc.date.available
2020-07-26T18:26:31Z
dc.date.submittedpl
2015-10-22
dc.fieldofstudypl
informatyka stosowana
dc.identifier.apdpl
diploma-101351-184282
dc.identifier.projectpl
APD / O
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/208350
dc.languagepl
pol
dc.subject.enpl
artificial intelligence, machine learning, reinforcement learning, temporal differences learning, Q-learning algorithm, Sarsa algorithm, eligibility traces, Markov decision process
dc.subject.plpl
sztuczna inteligencja, uczenie maszynowe, uczenie ze wzmocnieniem, metody różnic czasowych, algorytm O-learning, algorytm Sarsa, ślady aktywności, proces decyzyjny Markowa
dc.titlepl
Uczenie maszynowe z językiem Python
dc.title.alternativepl
Machine learning with Python
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
167
Views per month
Views per city
Krakow
26
Poznan
26
Warsaw
24
Gdansk
7
Wroclaw
7
Gdynia
6
Bialystok
4
Leba
3
Tychy
3
Dublin
2

No access

No Thumbnail Available