Uczenie maszynowe z językiem Python

Jancarz, Mateusz

Simple view

Full metadata view

Authors

Statistics

Uczenie maszynowe z językiem Python

master

Alternative title

Machine learning with Python

Author

Jancarz Mateusz

Reviewer

Cieśla Michał

Kapanowski Andrzej

Advisor

Kapanowski Andrzej

Date of defence

2015-10-22

Keywords in Polish

sztuczna inteligencja, uczenie maszynowe, uczenie ze wzmocnieniem, metody różnic czasowych, algorytm O-learning, algorytm Sarsa, ślady aktywności, proces decyzyjny Markowa

Keywords in English

artificial intelligence, machine learning, reinforcement learning, temporal differences learning, Q-learning algorithm, Sarsa algorithm, eligibility traces, Markov decision process

Language

Polish

Abstract in Polish

Niniejsza praca przedstawia aplikację, która symuluje giełdę zakładów sportowych, oraz gracza-bota wykorzystującego uczenie maszynowe do zwiększania skuteczności swojej gry.Początek pracy zawiera wprowadzenie do dziedziny uczenia maszynowego oraz przybliża jeden z przykładów jego zastosowania w robotyce. Opisane zostają narzędzia wykorzystane w projekcie, w których skład wchodzi język Python oraz wybrane biblioteki, takie jak NumPy i Matplotlib.Omówiono uczenie ze wzmocnieniem, jako nowe podejście w obszarze uczenia się maszyn. Opisano wszystkie składowe potrzebne do definicji tego typu algorytmów. Przedstawiono matematyczny model tego paradygmatu, czyli proces decyzyjny Markowa.Zaprezentowano dwa popularne algorytmy z klasy zwanej metodami różnic czasowych: Q-learning oraz Sarsa. Zostają one przedstawione w możliwe kompletnej wersji uwzględniającej wykorzystanie tzw. śladów aktywności, które w teorii pomagają przyspieszyć proces nauki.Stworzono implementację wymienionych algorytmów, na podstawie której zbudowana jest symulacja gry na giełdzie. Przy pomocy przeprowadzonych testów sprawdzono skuteczność zaprogramowanej symulacji. Szczegółowo opisana jest rola oraz dobór wartości poszczególnych parametrów nauki w kontekście rozwiązywanego problemu. Wspomnianą aplikację uzupełniają programy pomocnicze służące do wizualizacji danych giełdowych na wykresach oraz generowania sztucznych sekwencji zmian kursu.

Abstract in English

This thesis presents the application simulating sports betting markets and a bot player that performs transactions on markets and utilizes machine learning for improving it's performance.In the beginning, the introduction to machine learning is provided with examples of it's effective usage in robotics. Development tool set used is presented, which contains Python language, NumPy and Matplotlib modules among the others. Reinforcement learning is presented as a novel approach in machine learning. Mathematic model of the approach is explained with Markov decission process.Two concrete algorithms of temporal difference learning paradigm are presented: Q-learning and Sarsa. The description contains possibly complex versions, which contain usage of eligibility traces that, in theory, help to improve learning process efficiency.Implemenation of mentioned algorithms is developed and used to build simulation of trading on betting exchange. Effectiveness of the application isexamined via various experiments. The role and selection of all the learning parameter values is described in a context of the problem being solved. The application is supplemented with other tools built that are used to visualize exchange markets data and generate artificial price change sequences.

dc.abstract.en	This thesis presents the application simulating sports betting markets and a bot player that performs transactions on markets and utilizes machine learning for improving it's performance.In the beginning, the introduction to machine learning is provided with examples of it's effective usage in robotics. Development tool set used is presented, which contains Python language, NumPy and Matplotlib modules among the others. Reinforcement learning is presented as a novel approach in machine learning. Mathematic model of the approach is explained with Markov decission process.Two concrete algorithms of temporal difference learning paradigm are presented: Q-learning and Sarsa. The description contains possibly complex versions, which contain usage of eligibility traces that, in theory, help to improve learning process efficiency.Implemenation of mentioned algorithms is developed and used to build simulation of trading on betting exchange. Effectiveness of the application isexamined via various experiments. The role and selection of all the learning parameter values is described in a context of the problem being solved. The application is supplemented with other tools built that are used to visualize exchange markets data and generate artificial price change sequences.	pl
dc.abstract.pl	Niniejsza praca przedstawia aplikację, która symuluje giełdę zakładów sportowych, oraz gracza-bota wykorzystującego uczenie maszynowe do zwiększania skuteczności swojej gry.Początek pracy zawiera wprowadzenie do dziedziny uczenia maszynowego oraz przybliża jeden z przykładów jego zastosowania w robotyce. Opisane zostają narzędzia wykorzystane w projekcie, w których skład wchodzi język Python oraz wybrane biblioteki, takie jak NumPy i Matplotlib.Omówiono uczenie ze wzmocnieniem, jako nowe podejście w obszarze uczenia się maszyn. Opisano wszystkie składowe potrzebne do definicji tego typu algorytmów. Przedstawiono matematyczny model tego paradygmatu, czyli proces decyzyjny Markowa.Zaprezentowano dwa popularne algorytmy z klasy zwanej metodami różnic czasowych: Q-learning oraz Sarsa. Zostają one przedstawione w możliwe kompletnej wersji uwzględniającej wykorzystanie tzw. śladów aktywności, które w teorii pomagają przyspieszyć proces nauki.Stworzono implementację wymienionych algorytmów, na podstawie której zbudowana jest symulacja gry na giełdzie. Przy pomocy przeprowadzonych testów sprawdzono skuteczność zaprogramowanej symulacji. Szczegółowo opisana jest rola oraz dobór wartości poszczególnych parametrów nauki w kontekście rozwiązywanego problemu. Wspomnianą aplikację uzupełniają programy pomocnicze służące do wizualizacji danych giełdowych na wykresach oraz generowania sztucznych sekwencji zmian kursu.	pl
dc.affiliation	Wydział Fizyki, Astronomii i Informatyki Stosowanej	pl
dc.area	obszar nauk ścisłych	pl
dc.contributor.advisor	Kapanowski, Andrzej - 100452	pl
dc.contributor.author	Jancarz, Mateusz	pl
dc.contributor.departmentbycode	UJK/WFAIS	pl
dc.contributor.reviewer	Cieśla, Michał - 101020	pl
dc.contributor.reviewer	Kapanowski, Andrzej - 100452	pl
dc.date.accessioned	2020-07-26T18:26:31Z
dc.date.available	2020-07-26T18:26:31Z
dc.date.submitted	2015-10-22	pl
dc.fieldofstudy	informatyka stosowana	pl
dc.identifier.apd	diploma-101351-184282	pl
dc.identifier.project	APD / O	pl
dc.identifier.uri	https://ruj.uj.edu.pl/xmlui/handle/item/208350
dc.language	pol	pl
dc.subject.en	artificial intelligence, machine learning, reinforcement learning, temporal differences learning, Q-learning algorithm, Sarsa algorithm, eligibility traces, Markov decision process	pl
dc.subject.pl	sztuczna inteligencja, uczenie maszynowe, uczenie ze wzmocnieniem, metody różnic czasowych, algorytm O-learning, algorytm Sarsa, ślady aktywności, proces decyzyjny Markowa	pl
dc.title	Uczenie maszynowe z językiem Python	pl
dc.title.alternative	Machine learning with Python	pl
dc.type	master	pl
dspace.entity.type	Publication

dc.abstract.enpl

This thesis presents the application simulating sports betting markets and a bot player that performs transactions on markets and utilizes machine learning for improving it's performance.In the beginning, the introduction to machine learning is provided with examples of it's effective usage in robotics. Development tool set used is presented, which contains Python language, NumPy and Matplotlib modules among the others. Reinforcement learning is presented as a novel approach in machine learning. Mathematic model of the approach is explained with Markov decission process.Two concrete algorithms of temporal difference learning paradigm are presented: Q-learning and Sarsa. The description contains possibly complex versions, which contain usage of eligibility traces that, in theory, help to improve learning process efficiency.Implemenation of mentioned algorithms is developed and used to build simulation of trading on betting exchange. Effectiveness of the application isexamined via various experiments. The role and selection of all the learning parameter values is described in a context of the problem being solved. The application is supplemented with other tools built that are used to visualize exchange markets data and generate artificial price change sequences.

dc.abstract.plpl

Niniejsza praca przedstawia aplikację, która symuluje giełdę zakładów sportowych, oraz gracza-bota wykorzystującego uczenie maszynowe do zwiększania skuteczności swojej gry.Początek pracy zawiera wprowadzenie do dziedziny uczenia maszynowego oraz przybliża jeden z przykładów jego zastosowania w robotyce. Opisane zostają narzędzia wykorzystane w projekcie, w których skład wchodzi język Python oraz wybrane biblioteki, takie jak NumPy i Matplotlib.Omówiono uczenie ze wzmocnieniem, jako nowe podejście w obszarze uczenia się maszyn. Opisano wszystkie składowe potrzebne do definicji tego typu algorytmów. Przedstawiono matematyczny model tego paradygmatu, czyli proces decyzyjny Markowa.Zaprezentowano dwa popularne algorytmy z klasy zwanej metodami różnic czasowych: Q-learning oraz Sarsa. Zostają one przedstawione w możliwe kompletnej wersji uwzględniającej wykorzystanie tzw. śladów aktywności, które w teorii pomagają przyspieszyć proces nauki.Stworzono implementację wymienionych algorytmów, na podstawie której zbudowana jest symulacja gry na giełdzie. Przy pomocy przeprowadzonych testów sprawdzono skuteczność zaprogramowanej symulacji. Szczegółowo opisana jest rola oraz dobór wartości poszczególnych parametrów nauki w kontekście rozwiązywanego problemu. Wspomnianą aplikację uzupełniają programy pomocnicze służące do wizualizacji danych giełdowych na wykresach oraz generowania sztucznych sekwencji zmian kursu.

dc.affiliationpl

Wydział Fizyki, Astronomii i Informatyki Stosowanej

dc.areapl

obszar nauk ścisłych

dc.contributor.advisorpl

Kapanowski, Andrzej - 100452

dc.contributor.authorpl

Jancarz, Mateusz

dc.contributor.departmentbycodepl

UJK/WFAIS

dc.contributor.reviewerpl

Cieśla, Michał - 101020

dc.contributor.reviewerpl

Kapanowski, Andrzej - 100452

dc.date.accessioned

2020-07-26T18:26:31Z

dc.date.available

2020-07-26T18:26:31Z

dc.date.submittedpl

2015-10-22

dc.fieldofstudypl

informatyka stosowana

dc.identifier.apdpl

diploma-101351-184282

dc.identifier.projectpl

APD / O

dc.identifier.uri

https://ruj.uj.edu.pl/xmlui/handle/item/208350

dc.languagepl

pol

dc.subject.enpl

artificial intelligence, machine learning, reinforcement learning, temporal differences learning, Q-learning algorithm, Sarsa algorithm, eligibility traces, Markov decision process

dc.subject.plpl

sztuczna inteligencja, uczenie maszynowe, uczenie ze wzmocnieniem, metody różnic czasowych, algorytm O-learning, algorytm Sarsa, ślady aktywności, proces decyzyjny Markowa

dc.titlepl

Uczenie maszynowe z językiem Python

dc.title.alternativepl

Machine learning with Python

dc.typepl

master

dspace.entity.type

Publication

Affiliations

No affiliation

Jancarz, Mateusz

Cieśla, Michał

Kapanowski, Andrzej

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views

167 Views per month

Views per city

Krakow

26

Poznan

26

Warsaw

24

Gdansk

7

Wroclaw

7

Gdynia

6

Bialystok

4

Leba

3

Tychy

3

Dublin

2

No access

Collections

Masters theses

ROD UJ