Drzewa klasyfikacyjne z użyciem pakietu R

master
dc.abstract.enThe main topic of this thesis is theory of decision trees and it's practical use in data mining with R program. It contains three chapters. In the first chapter we introduce in which kind of data set we are going to work, we also formulate definitions of classifier and classification problem. In the second chapter we present a theory regarding builiding of decision trees. A method of their interpretation with the use of graph theory is also introduced. The concept of the impurity measure is defined as well as it's two examples: Entropy and Gini Index. Moreover, stop criteria and prunning criteria of classification trees are provided. At the end of this chapter, the concept of a random forest was described. In the third chapter, the introduced theory of classification trees and random forest is used for build a classification model using R. The analysis was carried out on the banking and medical data.pl
dc.abstract.plGłównym tematem pracy jest teoria drzew klasyfikacyjnych oraz jej praktyczne wykorzystanie przy analizie danych w programie R. Praca składa się z trzech rozdziałów. W pierwszym rozdziale wprowadzona jest postać danych na których będziemy pracowali oraz zdefiniowane zostaje pojęcia klasyfikatora i problemu klasyfikacyjnego. Drugi rozdział poświęcony jest w pełni drzewom klasyfikacyjnym. Wprowadzony zostaje sposób ich interpretacji przy wykorzystaniu teorii grafów. Zdefiniowane zostaje pojęcie miary różnorodności a także jej dwa przykłady: Entropia, wskaźnik Giniego. Ponadto, podane zostają kryteria stopu oraz kryteria przycinania drzew klasyfikacyjnych. Na końcu rozdziału została wprowadzone pojęcie lasu losowego. W trzecim rozdziale wykorzystana zostaje wprowadzona teoria drzew klasyfikacyjnych i lasu losowego do budowy modelu klasyfikacyjnego z wykorzystaniem programu R. Analiza zostaje przeprowadzona na podstawie dwóch rodzajów danych: bankowych i medycznych.pl
dc.affiliationWydział Matematyki i Informatykipl
dc.areaobszar nauk ścisłychpl
dc.contributor.advisorKościelniak, Piotr - 129220 pl
dc.contributor.authorBryła, Jakubpl
dc.contributor.departmentbycodeUJK/WMI2pl
dc.contributor.reviewerKościelniak, Piotr - 129220 pl
dc.contributor.reviewerWojtylak, Michał - 147997 pl
dc.date.accessioned2020-10-21T19:36:18Z
dc.date.available2020-10-21T19:36:18Z
dc.date.submitted2020-09-30pl
dc.fieldofstudymatematyka finansowapl
dc.identifier.apddiploma-145589-213955pl
dc.identifier.projectAPD / Opl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/250513
dc.languagepolpl
dc.subject.endecision trees, random forest, classifier, Gini Index, Entropypl
dc.subject.pldrzewa klasyfikacyjne, las losowe, klasyfikacja, Indeks Giniego, Entropiapl
dc.titleDrzewa klasyfikacyjne z użyciem pakietu Rpl
dc.title.alternativeDecision trees with R.pl
dc.typemasterpl
dspace.entity.typePublication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
0
Views per month

No access

No Thumbnail Available