Algorytm klasyfikacyjny XGBoost

master
dc.abstract.enThis thesis describes XGBoost algorithm of supervised machine learning. It is based on article „Higgs Boson Discovery with Boosted Trees” Tianqi Chen and Tong He.First chapter introduces definitions required to explain tree structure, method of constructing those trees and target function thanks to which algorithm presents good quality with predicting new cases.Second section is devoted to overfitting problem in data analysis, methods of searching good parameters of the models and practical application of binary classification with comparison with other popular machine learning algorithms. The aim is prediction if particular person exceeds given threshold of earnings per year based on sociodemographic data.In last chapter described are methods of generalization algorithm to multiclass classification with Softmax function and training process with usage tree based set structure with proposed metric to calculate distances between those sets.pl
dc.abstract.plNiniejsza praca opisuje algorytm XGBoost nadzorowanego uczenia maszynowego. Praca bazuje na artykule „Higgs Boson Discovery with Boosted Trees” Tianqi Chen oraz Tong He.W rozdziale pierwszym pracy znajdują się podstawowe definicje związane ze strukturą drzew, metoda ich tworzenia oraz opis i analiza funkcji celu, która pozwala na uzyskanie dobrych rezultatów przewidywania nowych przypadków.Rozdział drugi poświęcony jest opisowi problemu przeuczania modeli, metodzie poszukiwania parametrów modelu oraz praktycznemu zastosowaniu algorytmu dla problemu klasyfikacji binarnej wraz z porównaniem z innymi metodami uczenia maszynowego. Przewidywany jest fakt przekroczenia rocznego progu zarobkowego na podstawie danych socjodemograficznych.Ostatni rozdział opisuje metody uogólnienia algorytmu na klasyfikację wieloklasową: funkcję Softmax oraz uczenie przez drzewiastą strukturę zbiorów wraz z doborem par oraz metryką liczącą odległości między zbiorami. Ponownie pojawia się praktyczne zastosowanie: przewidywanie dotyczy ustalenia która osoba znajdujące się na zdjęciu.pl
dc.affiliationWydział Matematyki i Informatykipl
dc.areaobszar nauk ścisłychpl
dc.contributor.advisorKościelniak, Piotr - 129220 pl
dc.contributor.authorSikorski, Krzysztofpl
dc.contributor.departmentbycodeUJK/WMI2pl
dc.contributor.reviewerMazur, Marcin - 130444 pl
dc.contributor.reviewerKościelniak, Piotr - 129220 pl
dc.contributor.reviewerMazur, Marcinpl
dc.date.accessioned2020-07-27T03:44:07Z
dc.date.available2020-07-27T03:44:07Z
dc.date.submitted2016-10-18pl
dc.fieldofstudymatematyka finansowapl
dc.identifier.apddiploma-110952-139343pl
dc.identifier.projectAPD / Opl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/216905
dc.languagepolpl
dc.subject.enXGBoost algorithm, machine learning, artificial intelligence, decision trees, supervised learningpl
dc.subject.plAlgorytm XGBoost, uczenie maszynowe, sztuczna inteligencja, drzewa decyzyjne, uczenie nadzorowanepl
dc.titleAlgorytm klasyfikacyjny XGBoostpl
dc.title.alternativeXGBoost classification algorithmpl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
This thesis describes XGBoost algorithm of supervised machine learning. It is based on article „Higgs Boson Discovery with Boosted Trees” Tianqi Chen and Tong He.First chapter introduces definitions required to explain tree structure, method of constructing those trees and target function thanks to which algorithm presents good quality with predicting new cases.Second section is devoted to overfitting problem in data analysis, methods of searching good parameters of the models and practical application of binary classification with comparison with other popular machine learning algorithms. The aim is prediction if particular person exceeds given threshold of earnings per year based on sociodemographic data.In last chapter described are methods of generalization algorithm to multiclass classification with Softmax function and training process with usage tree based set structure with proposed metric to calculate distances between those sets.
dc.abstract.plpl
Niniejsza praca opisuje algorytm XGBoost nadzorowanego uczenia maszynowego. Praca bazuje na artykule „Higgs Boson Discovery with Boosted Trees” Tianqi Chen oraz Tong He.W rozdziale pierwszym pracy znajdują się podstawowe definicje związane ze strukturą drzew, metoda ich tworzenia oraz opis i analiza funkcji celu, która pozwala na uzyskanie dobrych rezultatów przewidywania nowych przypadków.Rozdział drugi poświęcony jest opisowi problemu przeuczania modeli, metodzie poszukiwania parametrów modelu oraz praktycznemu zastosowaniu algorytmu dla problemu klasyfikacji binarnej wraz z porównaniem z innymi metodami uczenia maszynowego. Przewidywany jest fakt przekroczenia rocznego progu zarobkowego na podstawie danych socjodemograficznych.Ostatni rozdział opisuje metody uogólnienia algorytmu na klasyfikację wieloklasową: funkcję Softmax oraz uczenie przez drzewiastą strukturę zbiorów wraz z doborem par oraz metryką liczącą odległości między zbiorami. Ponownie pojawia się praktyczne zastosowanie: przewidywanie dotyczy ustalenia która osoba znajdujące się na zdjęciu.
dc.affiliationpl
Wydział Matematyki i Informatyki
dc.areapl
obszar nauk ścisłych
dc.contributor.advisorpl
Kościelniak, Piotr - 129220
dc.contributor.authorpl
Sikorski, Krzysztof
dc.contributor.departmentbycodepl
UJK/WMI2
dc.contributor.reviewerpl
Mazur, Marcin - 130444
dc.contributor.reviewerpl
Kościelniak, Piotr - 129220
dc.contributor.reviewerpl
Mazur, Marcin
dc.date.accessioned
2020-07-27T03:44:07Z
dc.date.available
2020-07-27T03:44:07Z
dc.date.submittedpl
2016-10-18
dc.fieldofstudypl
matematyka finansowa
dc.identifier.apdpl
diploma-110952-139343
dc.identifier.projectpl
APD / O
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/216905
dc.languagepl
pol
dc.subject.enpl
XGBoost algorithm, machine learning, artificial intelligence, decision trees, supervised learning
dc.subject.plpl
Algorytm XGBoost, uczenie maszynowe, sztuczna inteligencja, drzewa decyzyjne, uczenie nadzorowane
dc.titlepl
Algorytm klasyfikacyjny XGBoost
dc.title.alternativepl
XGBoost classification algorithm
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
276
Views per month
Views per city
Warsaw
59
Krakow
37
Wroclaw
30
Poznan
23
Katowice
7
Bydgoszcz
6
Gdansk
6
Lublin
6
Nysa
4
Otwock
4

No access

No Thumbnail Available