Simple view
Full metadata view
Authors
Statistics
Algorytm klasyfikacyjny XGBoost
XGBoost classification algorithm
Algorytm XGBoost, uczenie maszynowe, sztuczna inteligencja, drzewa decyzyjne, uczenie nadzorowane
XGBoost algorithm, machine learning, artificial intelligence, decision trees, supervised learning
Niniejsza praca opisuje algorytm XGBoost nadzorowanego uczenia maszynowego. Praca bazuje na artykule „Higgs Boson Discovery with Boosted Trees” Tianqi Chen oraz Tong He.W rozdziale pierwszym pracy znajdują się podstawowe definicje związane ze strukturą drzew, metoda ich tworzenia oraz opis i analiza funkcji celu, która pozwala na uzyskanie dobrych rezultatów przewidywania nowych przypadków.Rozdział drugi poświęcony jest opisowi problemu przeuczania modeli, metodzie poszukiwania parametrów modelu oraz praktycznemu zastosowaniu algorytmu dla problemu klasyfikacji binarnej wraz z porównaniem z innymi metodami uczenia maszynowego. Przewidywany jest fakt przekroczenia rocznego progu zarobkowego na podstawie danych socjodemograficznych.Ostatni rozdział opisuje metody uogólnienia algorytmu na klasyfikację wieloklasową: funkcję Softmax oraz uczenie przez drzewiastą strukturę zbiorów wraz z doborem par oraz metryką liczącą odległości między zbiorami. Ponownie pojawia się praktyczne zastosowanie: przewidywanie dotyczy ustalenia która osoba znajdujące się na zdjęciu.
This thesis describes XGBoost algorithm of supervised machine learning. It is based on article „Higgs Boson Discovery with Boosted Trees” Tianqi Chen and Tong He.First chapter introduces definitions required to explain tree structure, method of constructing those trees and target function thanks to which algorithm presents good quality with predicting new cases.Second section is devoted to overfitting problem in data analysis, methods of searching good parameters of the models and practical application of binary classification with comparison with other popular machine learning algorithms. The aim is prediction if particular person exceeds given threshold of earnings per year based on sociodemographic data.In last chapter described are methods of generalization algorithm to multiclass classification with Softmax function and training process with usage tree based set structure with proposed metric to calculate distances between those sets.
dc.abstract.en | This thesis describes XGBoost algorithm of supervised machine learning. It is based on article „Higgs Boson Discovery with Boosted Trees” Tianqi Chen and Tong He.First chapter introduces definitions required to explain tree structure, method of constructing those trees and target function thanks to which algorithm presents good quality with predicting new cases.Second section is devoted to overfitting problem in data analysis, methods of searching good parameters of the models and practical application of binary classification with comparison with other popular machine learning algorithms. The aim is prediction if particular person exceeds given threshold of earnings per year based on sociodemographic data.In last chapter described are methods of generalization algorithm to multiclass classification with Softmax function and training process with usage tree based set structure with proposed metric to calculate distances between those sets. | pl |
dc.abstract.pl | Niniejsza praca opisuje algorytm XGBoost nadzorowanego uczenia maszynowego. Praca bazuje na artykule „Higgs Boson Discovery with Boosted Trees” Tianqi Chen oraz Tong He.W rozdziale pierwszym pracy znajdują się podstawowe definicje związane ze strukturą drzew, metoda ich tworzenia oraz opis i analiza funkcji celu, która pozwala na uzyskanie dobrych rezultatów przewidywania nowych przypadków.Rozdział drugi poświęcony jest opisowi problemu przeuczania modeli, metodzie poszukiwania parametrów modelu oraz praktycznemu zastosowaniu algorytmu dla problemu klasyfikacji binarnej wraz z porównaniem z innymi metodami uczenia maszynowego. Przewidywany jest fakt przekroczenia rocznego progu zarobkowego na podstawie danych socjodemograficznych.Ostatni rozdział opisuje metody uogólnienia algorytmu na klasyfikację wieloklasową: funkcję Softmax oraz uczenie przez drzewiastą strukturę zbiorów wraz z doborem par oraz metryką liczącą odległości między zbiorami. Ponownie pojawia się praktyczne zastosowanie: przewidywanie dotyczy ustalenia która osoba znajdujące się na zdjęciu. | pl |
dc.affiliation | Wydział Matematyki i Informatyki | pl |
dc.area | obszar nauk ścisłych | pl |
dc.contributor.advisor | Kościelniak, Piotr - 129220 | pl |
dc.contributor.author | Sikorski, Krzysztof | pl |
dc.contributor.departmentbycode | UJK/WMI2 | pl |
dc.contributor.reviewer | Mazur, Marcin - 130444 | pl |
dc.contributor.reviewer | Kościelniak, Piotr - 129220 | pl |
dc.contributor.reviewer | Mazur, Marcin | pl |
dc.date.accessioned | 2020-07-27T03:44:07Z | |
dc.date.available | 2020-07-27T03:44:07Z | |
dc.date.submitted | 2016-10-18 | pl |
dc.fieldofstudy | matematyka finansowa | pl |
dc.identifier.apd | diploma-110952-139343 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/216905 | |
dc.language | pol | pl |
dc.subject.en | XGBoost algorithm, machine learning, artificial intelligence, decision trees, supervised learning | pl |
dc.subject.pl | Algorytm XGBoost, uczenie maszynowe, sztuczna inteligencja, drzewa decyzyjne, uczenie nadzorowane | pl |
dc.title | Algorytm klasyfikacyjny XGBoost | pl |
dc.title.alternative | XGBoost classification algorithm | pl |
dc.type | master | pl |
dspace.entity.type | Publication |