W dniach od 2 kwietnia do 5 kwietnia 2024 r. prowadzone będą prace związane z wdrożeniem nowej wersji systemu Repozytorium UJ. Nie będzie możliwe wprowadzanie nowych informacji do repozytorium. Za utrudnienia przepraszamy.
The selection of data representation and metric for a given data set is one of the most crucial problems in machine learning since it affects the results of classification and clustering methods. In this paper we investigate how to combine a various data representations and metrics into a single function which better reflects the relationships between data set elements than a single representation-metric pair. Our approach relies on optimizing a linear combination of selected distance measures with use of least square approximation. The application of our method for classification and clustering of chemical compounds seems to increase the accuracy of these methods.
słowa kluczowe w j. angielskim:
metric learning, clustering, classification, chemical compound activity, fingerprint
wydział: instytut / zakład / katedra:
Wydział Matematyki i Informatyki : Instytut Informatyki i Matematyki Komputerowej