Łańcuchy Markowa i ich zastosowanie w filogenetyce

master
dc.abstract.enMarkov chains are mathematical models for phenomena evolvind randomly in time. Their simple structure makes possible to tell a great deal about their behaviour. At the same time they are sufficiently complicated to serve in many applications, e.g. in physics, chemistry, biology, economics and finance. Markov chains are named after the Russian mathematician A. A. Markov. The idea of chains emerged in his paper of 1907. It is suprising that Markov did not foresee a wide application of his theory. To indicate the usefulness of Markov chains he analyzed the sequence of 200000 letters from a poem by Pushkin "Eugene Onegin " to show that the sequence of vowels and consonants in the text is accurately described by a Markov chain with an appropriate transition matrix.Markov chains are also widely used in molecular biology, especially in phylogenetics - the study of evolutionary relationships among organisms, which are illustrated by phylogenetic trees.This paper consists of two parts. The first one describes some of the elements of the theory of Markov chains with discrete time and discussed the results of the extended processes with continuous time. Next we presents hidden Markov models in which the observed events are dependent on the unknown realization of a Markov process.The second part of the paper involves the use of the theory presented earlier in phylogenetics. We presents some probabilistic models of evolution based on DNA sequences. Next we give methods of reconstruction of phylogenetic trees based on these models and describes phylogenetic hidden Markov models, which are extended version of the classic phylogenetic tree.pl
dc.abstract.plŁańcuchy Markowa są modelami matematycznymi zjawisk zmieniających się w sposób losowy w czasie. Ich prosta struktura pozwala powiedzieć bardzo wiele na temat ich zachowania. Równocześnie są one dostatecznie skomplikowane, by znaleźć zastosowania w bardzo wielu dziedzinach nauki, m. in. w fizyce, chemii, biologii, ekonomii i finansach. Nazwa tego procesu losowego pochodzi od nazwiska rosyjskiego matematyka A. A. Markowa. Markow opublikował ponad 120 prac, przy czym około jedna trzecia dotyczyła zagadnień związanych z teorią prawdopodobieństwa. Pomysłem łańcuchów podzielił się w jednej z publikacji w 1907 roku. Zaskakujące jest to, że Markow nie przewidział szerokiego zastosowania swojej teorii. Aby wskazać użyteczność łańcuchów, przeanalizował ciąg 200000 liter z poematu Puszkina "Eugeniusz Oniegin", dowodząc, że następstwo samogłosek i spółgłosek w tym tekście jest dokładnie opisane przez pewien łańcuch Markowa z odpowiednią macierzą przejścia.Na bazie teorii łańcuchów Markowa zbudowano także bardziej skomplikowane struktury, takie jak ukryte modele Markowa. W latach 60. poprzedniego wieku zaczęto je powszechnie wykorzystywać w algorytmach rozpoznawania mowy. Z czasem zauważono, że można modelować w podobny sposób inne zjawiska obserwowane w przyrodzie. Łańcuchy Markowa znalazły szerokie zastosowanie w biologii molekularnej, a w szczególności w filogenetyce. Nauka ta zajmuje się ewolucyjnymi powiązaniami między organizmami żywymi, które przedstawia się w postaci tzw. drzew filogenetycznych. Praca składa się z dwóch części. W pierwszej opisano wybrane elementy teorii łańcuchów Markowa z czasem dyskretnym oraz rozszerzono omówione rezultaty na procesy z czasem ciągłym. Dalej zaprezentowano ukryte modele Markowa, w których obserwowane zdarzenia zależne są od nieznanych realizacji pewnego procesu Markowa. Przedstawiono definicję modelu, algorytmy prefiksowy-sufiksowy i Bauma-Welcha (służące do estymacji jego parametrów) oraz algorytm Viterbiego (pozwalający oszacować sekwencję stanów ukrytego łańcucha Markowa). Druga część pracy obejmuje zastosowanie przedstawionej wcześniej teorii w filogenetyce. Omówiono wybrane probabilistyczne modele ewolucji sekwencji DNA organizmów, będące w istocie łańcuchami Markowa z czasem ciągłym. Dalej zaprezentowano sposoby rekonstrukcji drzew filogenetycznych opartych na tych modelach ewolucji oraz przedstawiono filogenetyczne ukryte modele Markowa, stanowiące rozbudowaną wersję klasycznego drzewa filogenetycznego.pl
dc.affiliationWydział Matematyki i Informatykipl
dc.contributor.advisorOrewczyk, Joanna - 131182 pl
dc.contributor.authorSękiewicz, Joannapl
dc.contributor.departmentbycodeUJK/WMI2pl
dc.contributor.reviewerTabor, Jacek - 132362 pl
dc.contributor.reviewerOrewczyk, Joanna - 131182 pl
dc.date.accessioned2020-07-24T10:54:34Z
dc.date.available2020-07-24T10:54:34Z
dc.date.submitted2012-10-18pl
dc.fieldofstudymatematyka finansowapl
dc.identifier.apddiploma-69632-79599pl
dc.identifier.projectAPD / Opl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/182784
dc.languagepolpl
dc.subject.enMarkov chains, hidden Markov models, phylogenetics, phylogenetic treepl
dc.subject.plłańcuchy Markowa, ukryte modele Markowa, filogenetyka, drzewo filogenetycznepl
dc.titleŁańcuchy Markowa i ich zastosowanie w filogenetycepl
dc.title.alternativeMarkov chains and applications in phylogeneticspl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
Markov chains are mathematical models for phenomena evolvind randomly in time. Their simple structure makes possible to tell a great deal about their behaviour. At the same time they are sufficiently complicated to serve in many applications, e.g. in physics, chemistry, biology, economics and finance. Markov chains are named after the Russian mathematician A. A. Markov. The idea of chains emerged in his paper of 1907. It is suprising that Markov did not foresee a wide application of his theory. To indicate the usefulness of Markov chains he analyzed the sequence of 200000 letters from a poem by Pushkin "Eugene Onegin " to show that the sequence of vowels and consonants in the text is accurately described by a Markov chain with an appropriate transition matrix.Markov chains are also widely used in molecular biology, especially in phylogenetics - the study of evolutionary relationships among organisms, which are illustrated by phylogenetic trees.This paper consists of two parts. The first one describes some of the elements of the theory of Markov chains with discrete time and discussed the results of the extended processes with continuous time. Next we presents hidden Markov models in which the observed events are dependent on the unknown realization of a Markov process.The second part of the paper involves the use of the theory presented earlier in phylogenetics. We presents some probabilistic models of evolution based on DNA sequences. Next we give methods of reconstruction of phylogenetic trees based on these models and describes phylogenetic hidden Markov models, which are extended version of the classic phylogenetic tree.
dc.abstract.plpl
Łańcuchy Markowa są modelami matematycznymi zjawisk zmieniających się w sposób losowy w czasie. Ich prosta struktura pozwala powiedzieć bardzo wiele na temat ich zachowania. Równocześnie są one dostatecznie skomplikowane, by znaleźć zastosowania w bardzo wielu dziedzinach nauki, m. in. w fizyce, chemii, biologii, ekonomii i finansach. Nazwa tego procesu losowego pochodzi od nazwiska rosyjskiego matematyka A. A. Markowa. Markow opublikował ponad 120 prac, przy czym około jedna trzecia dotyczyła zagadnień związanych z teorią prawdopodobieństwa. Pomysłem łańcuchów podzielił się w jednej z publikacji w 1907 roku. Zaskakujące jest to, że Markow nie przewidział szerokiego zastosowania swojej teorii. Aby wskazać użyteczność łańcuchów, przeanalizował ciąg 200000 liter z poematu Puszkina "Eugeniusz Oniegin", dowodząc, że następstwo samogłosek i spółgłosek w tym tekście jest dokładnie opisane przez pewien łańcuch Markowa z odpowiednią macierzą przejścia.Na bazie teorii łańcuchów Markowa zbudowano także bardziej skomplikowane struktury, takie jak ukryte modele Markowa. W latach 60. poprzedniego wieku zaczęto je powszechnie wykorzystywać w algorytmach rozpoznawania mowy. Z czasem zauważono, że można modelować w podobny sposób inne zjawiska obserwowane w przyrodzie. Łańcuchy Markowa znalazły szerokie zastosowanie w biologii molekularnej, a w szczególności w filogenetyce. Nauka ta zajmuje się ewolucyjnymi powiązaniami między organizmami żywymi, które przedstawia się w postaci tzw. drzew filogenetycznych. Praca składa się z dwóch części. W pierwszej opisano wybrane elementy teorii łańcuchów Markowa z czasem dyskretnym oraz rozszerzono omówione rezultaty na procesy z czasem ciągłym. Dalej zaprezentowano ukryte modele Markowa, w których obserwowane zdarzenia zależne są od nieznanych realizacji pewnego procesu Markowa. Przedstawiono definicję modelu, algorytmy prefiksowy-sufiksowy i Bauma-Welcha (służące do estymacji jego parametrów) oraz algorytm Viterbiego (pozwalający oszacować sekwencję stanów ukrytego łańcucha Markowa). Druga część pracy obejmuje zastosowanie przedstawionej wcześniej teorii w filogenetyce. Omówiono wybrane probabilistyczne modele ewolucji sekwencji DNA organizmów, będące w istocie łańcuchami Markowa z czasem ciągłym. Dalej zaprezentowano sposoby rekonstrukcji drzew filogenetycznych opartych na tych modelach ewolucji oraz przedstawiono filogenetyczne ukryte modele Markowa, stanowiące rozbudowaną wersję klasycznego drzewa filogenetycznego.
dc.affiliationpl
Wydział Matematyki i Informatyki
dc.contributor.advisorpl
Orewczyk, Joanna - 131182
dc.contributor.authorpl
Sękiewicz, Joanna
dc.contributor.departmentbycodepl
UJK/WMI2
dc.contributor.reviewerpl
Tabor, Jacek - 132362
dc.contributor.reviewerpl
Orewczyk, Joanna - 131182
dc.date.accessioned
2020-07-24T10:54:34Z
dc.date.available
2020-07-24T10:54:34Z
dc.date.submittedpl
2012-10-18
dc.fieldofstudypl
matematyka finansowa
dc.identifier.apdpl
diploma-69632-79599
dc.identifier.projectpl
APD / O
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/182784
dc.languagepl
pol
dc.subject.enpl
Markov chains, hidden Markov models, phylogenetics, phylogenetic tree
dc.subject.plpl
łańcuchy Markowa, ukryte modele Markowa, filogenetyka, drzewo filogenetyczne
dc.titlepl
Łańcuchy Markowa i ich zastosowanie w filogenetyce
dc.title.alternativepl
Markov chains and applications in phylogenetics
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
88
Views per month
Views per city
Warsaw
14
Krakow
10
Częstochowa
6
Wroclaw
6
Gdansk
5
Katowice
3
Sanok
3
Dublin
2
Gdynia
2
Gliwice
2

No access

No Thumbnail Available