Simple view
Full metadata view
Authors
Statistics
Wybrane jądra grafowe.
Selected graph kernels.
jądra, graf, uczenie maszynowe, chemoinformatyka, klasyfikatory, analiza danych, podobieństwo, Python, graflety, spacery losowe, najkrótsze ścieżki
kernels, graph, machine-learning, chemoinformatics, classifiers, data analysis, similarity, Python, graphlets, random walks, shortest paths
Metody jądrowe należą do jednych z najpopularniejszych narzędzi statystycznych wykorzystywanych do budowy klasyfikatorów. Istnieje wiele różnych jąder pozwalających na pracę z szeroką gamą typów danych, od wektorów rzeczywistych przez obrazy po dane tekstowe i biologiczne. W ostatnich latach Borgwardt et al. oraz Vishwanathan et al. wprowadzili bogatą rodzinę jąder dla etykietowanych grafów, osiągających rekordowe wyniki dla zastosowań biologicznych i chemicznych.Implementacje tych metod istnieją przede wszystkim dla języków C++ oraz Matlab. C++, mimo swej wydajności, nie jest zbyt często używany w analizie danych ze względu na zbyt skomplikowaną składnię oraz powolność implementowania rozwiązań. Matlab, mimo bycia pozbawionym powyższych wad - ma ograniczoną aplikowalność z powodu zamkniętego charakteru oraz wysokich opłat licencyjnych. Obecnie nie istnieje żadna implementacja jąder grafowych dla języka Python, który stal sie jednym z najpopularniejszych narzędzi do analizy danych.W poniższej pracy licencjackiej przedstawione zostały skrótowo wybrane jądra grafowe oraz ich implementacje w języku Python. Stworzone rozwiązanie jest częścią biblioteki pykernels, kompatybilnej z największym modułem do uczenia maszynowego dla Pythona - scikit-learn.
Kernel methods are one of the most popular statistical tools for building classifiers. Existing kernels allow working on a broad selection of datatypes. Recently, Borgwardt et al. and Vishwanathan et al. have developed a kernel family with numerous applications on biological and chemical data.The existing implementations are mainly written in C++ and Matlab. Despite it's efficiency, C++ is rarely used in data analysis due to complicated syntax and slowness in implementation. Matlab, on the other hand, is not broadly applied because of high license costs. No implementation of graph kernels in Python has been introduced, despite its being one of the most popular data analysis tools.My bachelor thesis briefly describes selected graph kernels together with their Python implementation. The implemented methods are a part of pykernels module, which is compatible with scikit-learn - the largest machine-learning Python library.
dc.abstract.en | Kernel methods are one of the most popular statistical tools for building classifiers. Existing kernels allow working on a broad selection of datatypes. Recently, Borgwardt et al. and Vishwanathan et al. have developed a kernel family with numerous applications on biological and chemical data.The existing implementations are mainly written in C++ and Matlab. Despite it's efficiency, C++ is rarely used in data analysis due to complicated syntax and slowness in implementation. Matlab, on the other hand, is not broadly applied because of high license costs. No implementation of graph kernels in Python has been introduced, despite its being one of the most popular data analysis tools.My bachelor thesis briefly describes selected graph kernels together with their Python implementation. The implemented methods are a part of pykernels module, which is compatible with scikit-learn - the largest machine-learning Python library. | pl |
dc.abstract.pl | Metody jądrowe należą do jednych z najpopularniejszych narzędzi statystycznych wykorzystywanych do budowy klasyfikatorów. Istnieje wiele różnych jąder pozwalających na pracę z szeroką gamą typów danych, od wektorów rzeczywistych przez obrazy po dane tekstowe i biologiczne. W ostatnich latach Borgwardt et al. oraz Vishwanathan et al. wprowadzili bogatą rodzinę jąder dla etykietowanych grafów, osiągających rekordowe wyniki dla zastosowań biologicznych i chemicznych.Implementacje tych metod istnieją przede wszystkim dla języków C++ oraz Matlab. C++, mimo swej wydajności, nie jest zbyt często używany w analizie danych ze względu na zbyt skomplikowaną składnię oraz powolność implementowania rozwiązań. Matlab, mimo bycia pozbawionym powyższych wad - ma ograniczoną aplikowalność z powodu zamkniętego charakteru oraz wysokich opłat licencyjnych. Obecnie nie istnieje żadna implementacja jąder grafowych dla języka Python, który stal sie jednym z najpopularniejszych narzędzi do analizy danych.W poniższej pracy licencjackiej przedstawione zostały skrótowo wybrane jądra grafowe oraz ich implementacje w języku Python. Stworzone rozwiązanie jest częścią biblioteki pykernels, kompatybilnej z największym modułem do uczenia maszynowego dla Pythona - scikit-learn. | pl |
dc.affiliation | Wydział Matematyki i Informatyki | pl |
dc.area | obszar nauk ścisłych | pl |
dc.contributor.advisor | Kozik, Jakub - 129355 | pl |
dc.contributor.author | Janocha, Katarzyna | pl |
dc.contributor.departmentbycode | UJK/WMI2 | pl |
dc.contributor.reviewer | Gutowski, Grzegorz | pl |
dc.contributor.reviewer | Kozik, Jakub - 129355 | pl |
dc.date.accessioned | 2020-07-26T12:46:17Z | |
dc.date.available | 2020-07-26T12:46:17Z | |
dc.date.submitted | 2015-09-11 | pl |
dc.fieldofstudy | informatyka analityczna | pl |
dc.identifier.apd | diploma-95762-162704 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/203280 | |
dc.language | pol | pl |
dc.subject.en | kernels, graph, machine-learning, chemoinformatics, classifiers, data analysis, similarity, Python, graphlets, random walks, shortest paths | pl |
dc.subject.pl | jądra, graf, uczenie maszynowe, chemoinformatyka, klasyfikatory, analiza danych, podobieństwo, Python, graflety, spacery losowe, najkrótsze ścieżki | pl |
dc.title | Wybrane jądra grafowe. | pl |
dc.title.alternative | Selected graph kernels. | pl |
dc.type | licenciate | pl |
dspace.entity.type | Publication |