Zastosowanie algorytmu klasteryzacji DBscan w metodzie macierzy kropkowych

licenciate
dc.abstract.enThis bachelor's thesis focuses on the utilization of programming tools for the analysis of biological sequences. Its primary research objective is to apply the dot matrix method to understand and detect patterns in DNA, RNA, and protein sequences.The first part of the thesis provides a detailed description of the dot matrix method and its use in conjunction with clustering using the DBSCAN technique. It also discusses why these methods are significant in sequence analysis. It explains how to construct dot matrices based on sequence comparisons and how to interpret the results of these comparisons.Subsequently, the focus is on the programming tool - Matplotlib in Python. It presents its basic functions and capabilities and discusses why it is a useful tool for data visualization in sequence analysis. The implementation process of the dot matrix method using Matplotlib in Python is also described. The source code is presented, individual analysis steps are explained, and the possibilities of adapting this method to different types of sequences are discussed.Towards the end, the results of the research conducted using the described method are presented. Examples of analysis on test sequence samples are provided, along with an explanation of the information that can be obtained from dot matrix analysis.This bachelor's thesis serves as a valuable source of knowledge for anyone interested in the analysis of biological sequences and programming in Python. The utilization of Matplotlib in conjunction with the dot matrix method opens up new possibilities in genome and protein sequence research, which may contribute to a better understanding of biological processes and the discovery of new therapies in medicine.pl
dc.abstract.plTa praca licencjacka skupia się na wykorzystaniu narzędzi programistycznych do analizy sekwencji biologicznych. Jej głównym celem badawczym jest zastosowanie metody macierzy kropkowych w celu zrozumienia i wykrywania wzorców w sekwencjach DNA, RNA i białkach.Pierwsza część pracy zawiera szczegółowy opis metody macierzy kropkowych oraz jej zastosowanie w połączeniu z klastrowaniem przy użyciu techniki DBSCAN. Omawia również dlaczego te metody są istotne w analizie sekwencji. Wyjaśniono, jak budować macierze kropkowe na podstawie porównań sekwencji oraz jak interpretować wyniki tych porównań.Następnie skupiono się na narzędziu programistycznym - Matplotlib w języku Python. Przedstawiono jego podstawowe funkcje i możliwości oraz omówiono, dlaczego jest to przydatne narzędzie do wizualizacji danych w analizie sekwencji. Opisano również proces implementacji metody macierzy kropkowych z wykorzystaniem Matplotlib w Pythonie. Zaprezentowano kod źródłowy, wyjaśniono poszczególne kroki analizy oraz omówiono możliwości dostosowania tej metody do różnych rodzajów sekwencji.Pod koniec przedstawiono wyniki badań przeprowadzonych przy użyciu opisanej metody. Zaprezentowano przykłady analizy na testowych przykładach sekwencji oraz wyjaśniono, jakie informacje można uzyskać z analizy macierzy kropkowych.Ta praca licencjacka stanowi cenne źródło wiedzy dla wszystkich, którzy interesują się analizą sekwencji biologicznych i programowaniem w języku Python. Wykorzystanie Matplotlib w połączeniu z metodą macierzy kropkowych otwiera nowe możliwości w badaniach nad genomami i sekwencjami białek, co może przyczynić się do lepszego zrozumienia procesów biologicznych i znalezienia nowych terapii w medycynie.pl
dc.affiliationUniwersytet Jagielloński w Krakowiepl
dc.contributor.advisorSarapata, Krzysztof - 133360 pl
dc.contributor.authorTymofieieva, Yuliia - USOS296627 pl
dc.contributor.departmentbycodeUJK/UJKpl
dc.contributor.reviewerSarapata, Krzysztof - 133360 pl
dc.contributor.reviewerWójcik-Augustyn, Anna - USOS11854 pl
dc.date.accessioned2024-07-30T23:13:18Z
dc.date.available2024-07-30T23:13:18Z
dc.date.submitted2024-07-02pl
dc.fieldofstudybioinformatykapl
dc.identifier.apddiploma-169088-296627pl
dc.identifier.urihttps://ruj.uj.edu.pl/handle/item/392012
dc.languagepolpl
dc.subject.enClustering algorithms, DBscan, dot plot matrix, biological sequences, sequence analysis, clustering, density algorithmpl
dc.subject.plAlgorytmy klasteryzacji, DBscan, macierz kroprowa, sekwencje biologiczne, analiza sekwencji, grupowanie, klastry, algorytm gęstościowypl
dc.titleZastosowanie algorytmu klasteryzacji DBscan w metodzie macierzy kropkowychpl
dc.title.alternativeApplication of the DBscan clustering algorithm in the dot matrix methodpl
dc.typelicenciatepl
dspace.entity.typePublication
dc.abstract.enpl
This bachelor's thesis focuses on the utilization of programming tools for the analysis of biological sequences. Its primary research objective is to apply the dot matrix method to understand and detect patterns in DNA, RNA, and protein sequences.The first part of the thesis provides a detailed description of the dot matrix method and its use in conjunction with clustering using the DBSCAN technique. It also discusses why these methods are significant in sequence analysis. It explains how to construct dot matrices based on sequence comparisons and how to interpret the results of these comparisons.Subsequently, the focus is on the programming tool - Matplotlib in Python. It presents its basic functions and capabilities and discusses why it is a useful tool for data visualization in sequence analysis. The implementation process of the dot matrix method using Matplotlib in Python is also described. The source code is presented, individual analysis steps are explained, and the possibilities of adapting this method to different types of sequences are discussed.Towards the end, the results of the research conducted using the described method are presented. Examples of analysis on test sequence samples are provided, along with an explanation of the information that can be obtained from dot matrix analysis.This bachelor's thesis serves as a valuable source of knowledge for anyone interested in the analysis of biological sequences and programming in Python. The utilization of Matplotlib in conjunction with the dot matrix method opens up new possibilities in genome and protein sequence research, which may contribute to a better understanding of biological processes and the discovery of new therapies in medicine.
dc.abstract.plpl
Ta praca licencjacka skupia się na wykorzystaniu narzędzi programistycznych do analizy sekwencji biologicznych. Jej głównym celem badawczym jest zastosowanie metody macierzy kropkowych w celu zrozumienia i wykrywania wzorców w sekwencjach DNA, RNA i białkach.Pierwsza część pracy zawiera szczegółowy opis metody macierzy kropkowych oraz jej zastosowanie w połączeniu z klastrowaniem przy użyciu techniki DBSCAN. Omawia również dlaczego te metody są istotne w analizie sekwencji. Wyjaśniono, jak budować macierze kropkowe na podstawie porównań sekwencji oraz jak interpretować wyniki tych porównań.Następnie skupiono się na narzędziu programistycznym - Matplotlib w języku Python. Przedstawiono jego podstawowe funkcje i możliwości oraz omówiono, dlaczego jest to przydatne narzędzie do wizualizacji danych w analizie sekwencji. Opisano również proces implementacji metody macierzy kropkowych z wykorzystaniem Matplotlib w Pythonie. Zaprezentowano kod źródłowy, wyjaśniono poszczególne kroki analizy oraz omówiono możliwości dostosowania tej metody do różnych rodzajów sekwencji.Pod koniec przedstawiono wyniki badań przeprowadzonych przy użyciu opisanej metody. Zaprezentowano przykłady analizy na testowych przykładach sekwencji oraz wyjaśniono, jakie informacje można uzyskać z analizy macierzy kropkowych.Ta praca licencjacka stanowi cenne źródło wiedzy dla wszystkich, którzy interesują się analizą sekwencji biologicznych i programowaniem w języku Python. Wykorzystanie Matplotlib w połączeniu z metodą macierzy kropkowych otwiera nowe możliwości w badaniach nad genomami i sekwencjami białek, co może przyczynić się do lepszego zrozumienia procesów biologicznych i znalezienia nowych terapii w medycynie.
dc.affiliationpl
Uniwersytet Jagielloński w Krakowie
dc.contributor.advisorpl
Sarapata, Krzysztof - 133360
dc.contributor.authorpl
Tymofieieva, Yuliia - USOS296627
dc.contributor.departmentbycodepl
UJK/UJK
dc.contributor.reviewerpl
Sarapata, Krzysztof - 133360
dc.contributor.reviewerpl
Wójcik-Augustyn, Anna - USOS11854
dc.date.accessioned
2024-07-30T23:13:18Z
dc.date.available
2024-07-30T23:13:18Z
dc.date.submittedpl
2024-07-02
dc.fieldofstudypl
bioinformatyka
dc.identifier.apdpl
diploma-169088-296627
dc.identifier.uri
https://ruj.uj.edu.pl/handle/item/392012
dc.languagepl
pol
dc.subject.enpl
Clustering algorithms, DBscan, dot plot matrix, biological sequences, sequence analysis, clustering, density algorithm
dc.subject.plpl
Algorytmy klasteryzacji, DBscan, macierz kroprowa, sekwencje biologiczne, analiza sekwencji, grupowanie, klastry, algorytm gęstościowy
dc.titlepl
Zastosowanie algorytmu klasteryzacji DBscan w metodzie macierzy kropkowych
dc.title.alternativepl
Application of the DBscan clustering algorithm in the dot matrix method
dc.typepl
licenciate
dspace.entity.type
Publication

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

No access

No Thumbnail Available