Analiza obliczeniowa modularnej architektury klastrów genowych odpowiedzialnych za biosyntezę metabolitów drugorzędowych

Computational analysis of the modular architecture of secondary metabolite biosynthesis gene clusters

master
dc.abstract.enThe biosynthetic pathways of the great majority of secondary metabolites with pharmaceutical activities are encoded by huge clusters of genes, termed secondary metabolite gene clusters (SMGCs). Inside SMGCs, genes are further grouped into conserved multigene modules. These modules encode proteins with a range of functions like regulation and transport. There are also biosynthetic modules, each of which is responsible for the biosynthesis of a part of the end product. To gain deeper insight into the evolution of SMGCs and to open up new ways to discover novel compounds, we analyzed the modularity of SMGCs computationally in a high-throughput fashion.As a starting point of our analysis, we created a list of SMGCs from all available actinomycete nucleotide data using our previously published software pipeline antiSMASH [1]. To identify all highly conserved modules, we then studied co-conservation of the genes within these gene clusters. Based on a classification of all SMGC genes into Clusters of Orthologous Groups (COGs), we reconstructed interaction networks linking COGs by gene synteny and by co-localization of genes within the same gene clusters. A simple algorithm that overlaid the two networks could then identify highly connected motifs of COGs. These motifs represent conserved modules that can be directly linked to the chemical moieties of the secondary metabolite end product. Using these data, we were able to identify a number of gene clusters with conserved architectures (module compositions) that had not been reported earlier, which may be responsible for the biosynthesis of compounds with novel chemical structures.Intriguingly, our catalogue of conserved modules enables a deep analysis of the evolution of SMGCs, by comparing module compositions of homologous gene clusters from different species and using parsimony or likelihood methods to infer the most probable evolutionary route that has resulted in the observed variety of architectures. It also enables screening for novel types of gene clusters on an unprecedented scale. Finally, this new approach can be integrated into the antiSMASH pipeline to allow more detailed predictions of the secondary metabolite end products of unknown SMGCs from their module compositions.pl
dc.abstract.plSzlaki biosyntetyczne znacznej większości metabolitów drugorzędowych posiadających zastosowanie farmaceutyczne kodowane są przed olbrzymie klastry genowe, zwane klastrami genów metabolitów drugorzędowych (ang. SMGCs - Secondary Metabolite Gene Clusters). Wewnątrz SMGCs geny są zgrupowane w konserwowane wielogenowy moduły. Kodują one białka posiadające szeroki zakres funkcji między innymi regulacyjne oraz transportowe. Występują również moduły biosyntetyczne, z których każdy odpowiada za biosyntezę fragmentu końcowego produktu. Aby otrzymać wgląd w ewolucję tych elementów genetycznych oraz stworzyć możliwość odkrycia nowych molekuł, została wykonana wysokoprzepustowa analiza obliczeniowa modularności SMGCs.Punktem początkowym analizy jest lista wszystkich SMGCs pochodzących ze wszystkich dostępnych sekwencji nukleotydowych bakterii z rzędu Actinomyces. Lista ta została utworzona przy użyciu programu antiSMASH [1]. W celu zidentyfikowania silnie konserwowanych modułów, zbadana została kokonserwacja genów wewnątrz klastrów. W oparciu o podział genów na Klastry Grup Ortologicznych (ang COGs - Clusters of Orthologous Groups), zrekonstruowano sieć interakcji łączących COGs poprzez syntenię genów oraz kolokalizację wewnątrz SMGCs. Prosty algorytm został użyty do identyfikacji grup COGs połączonych znaczną ilością interakcji, reprezentujących konserwowane moduły, które mogą zostać przyporządkowane do chemicznych grup składających się na molekuły metabolitów drugorzędowych. W uzyskanym zbiorze danych możliwa jest identyfikacja licznych SMGCs posiadających zestawy modułów, których nie znano wcześniej i które mogą być odpowiedzialne ze produkcję nie znanych dotychczas molekuł. Co ciekawe, otrzymany katalog konserwowanych modułów umożliwia dogłębną analizę ewolucji SMGCs poprzez porównanie klastrów będących homologami, pod kątem zawartych w nich modułów oraz zaproponować najbardziej prawdopodobną ścieżkę ewolucji, która skutkowałaby obserwowaną różnorodnością molekuł. Dodatkowo, po integracji z programem antiSMASH, uzyskany katalog pozwoli na lepsze przewidywanie struktury końcowego produktu nowoodkrytych SMGCs.pl
dc.affiliationWydział Biochemii, Biofizyki i Biotechnologiipl
dc.areaobszar nauk przyrodniczychpl
dc.contributor.advisorJansen, Ritsertpl
dc.contributor.authorZych, Konradpl
dc.contributor.departmentbycodeUJK/WBBBpl
dc.contributor.reviewerPłonka, Przemysław - 131459 pl
dc.contributor.reviewerJansen, Ritsertpl
dc.contributor.reviewerJansen, Ritsertpl
dc.date.accessioned2020-07-24T06:40:52Z
dc.date.available2020-07-24T06:40:52Z
dc.date.submitted2012-06-29pl
dc.fieldofstudybiotechnologiapl
dc.identifier.apddiploma-66154-80130pl
dc.identifier.projectAPD / Opl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/179652
dc.languageengpl
dc.subject.enbioinformatics, antibiotic, secondary metabolite, Secondary Metabolite Gene Cluster, actinomycespl
dc.subject.plbioinformatyka, antybiotyk, metabolit drugorzędowy, klastry genów metabolitów drugorzędowych, actinomycespl
dc.titleAnaliza obliczeniowa modularnej architektury klastrów genowych odpowiedzialnych za biosyntezę metabolitów drugorzędowychpl
dc.titleComputational analysis of the modular architecture of secondary metabolite biosynthesis gene clusterspl
dc.title.alternativeComputational analysis of the modular architecture of secondary metabolite biosynthesis gene clusters.pl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
The biosynthetic pathways of the great majority of secondary metabolites with pharmaceutical activities are encoded by huge clusters of genes, termed secondary metabolite gene clusters (SMGCs). Inside SMGCs, genes are further grouped into conserved multigene modules. These modules encode proteins with a range of functions like regulation and transport. There are also biosynthetic modules, each of which is responsible for the biosynthesis of a part of the end product. To gain deeper insight into the evolution of SMGCs and to open up new ways to discover novel compounds, we analyzed the modularity of SMGCs computationally in a high-throughput fashion.As a starting point of our analysis, we created a list of SMGCs from all available actinomycete nucleotide data using our previously published software pipeline antiSMASH [1]. To identify all highly conserved modules, we then studied co-conservation of the genes within these gene clusters. Based on a classification of all SMGC genes into Clusters of Orthologous Groups (COGs), we reconstructed interaction networks linking COGs by gene synteny and by co-localization of genes within the same gene clusters. A simple algorithm that overlaid the two networks could then identify highly connected motifs of COGs. These motifs represent conserved modules that can be directly linked to the chemical moieties of the secondary metabolite end product. Using these data, we were able to identify a number of gene clusters with conserved architectures (module compositions) that had not been reported earlier, which may be responsible for the biosynthesis of compounds with novel chemical structures.Intriguingly, our catalogue of conserved modules enables a deep analysis of the evolution of SMGCs, by comparing module compositions of homologous gene clusters from different species and using parsimony or likelihood methods to infer the most probable evolutionary route that has resulted in the observed variety of architectures. It also enables screening for novel types of gene clusters on an unprecedented scale. Finally, this new approach can be integrated into the antiSMASH pipeline to allow more detailed predictions of the secondary metabolite end products of unknown SMGCs from their module compositions.
dc.abstract.plpl
Szlaki biosyntetyczne znacznej większości metabolitów drugorzędowych posiadających zastosowanie farmaceutyczne kodowane są przed olbrzymie klastry genowe, zwane klastrami genów metabolitów drugorzędowych (ang. SMGCs - Secondary Metabolite Gene Clusters). Wewnątrz SMGCs geny są zgrupowane w konserwowane wielogenowy moduły. Kodują one białka posiadające szeroki zakres funkcji między innymi regulacyjne oraz transportowe. Występują również moduły biosyntetyczne, z których każdy odpowiada za biosyntezę fragmentu końcowego produktu. Aby otrzymać wgląd w ewolucję tych elementów genetycznych oraz stworzyć możliwość odkrycia nowych molekuł, została wykonana wysokoprzepustowa analiza obliczeniowa modularności SMGCs.Punktem początkowym analizy jest lista wszystkich SMGCs pochodzących ze wszystkich dostępnych sekwencji nukleotydowych bakterii z rzędu Actinomyces. Lista ta została utworzona przy użyciu programu antiSMASH [1]. W celu zidentyfikowania silnie konserwowanych modułów, zbadana została kokonserwacja genów wewnątrz klastrów. W oparciu o podział genów na Klastry Grup Ortologicznych (ang COGs - Clusters of Orthologous Groups), zrekonstruowano sieć interakcji łączących COGs poprzez syntenię genów oraz kolokalizację wewnątrz SMGCs. Prosty algorytm został użyty do identyfikacji grup COGs połączonych znaczną ilością interakcji, reprezentujących konserwowane moduły, które mogą zostać przyporządkowane do chemicznych grup składających się na molekuły metabolitów drugorzędowych. W uzyskanym zbiorze danych możliwa jest identyfikacja licznych SMGCs posiadających zestawy modułów, których nie znano wcześniej i które mogą być odpowiedzialne ze produkcję nie znanych dotychczas molekuł. Co ciekawe, otrzymany katalog konserwowanych modułów umożliwia dogłębną analizę ewolucji SMGCs poprzez porównanie klastrów będących homologami, pod kątem zawartych w nich modułów oraz zaproponować najbardziej prawdopodobną ścieżkę ewolucji, która skutkowałaby obserwowaną różnorodnością molekuł. Dodatkowo, po integracji z programem antiSMASH, uzyskany katalog pozwoli na lepsze przewidywanie struktury końcowego produktu nowoodkrytych SMGCs.
dc.affiliationpl
Wydział Biochemii, Biofizyki i Biotechnologii
dc.areapl
obszar nauk przyrodniczych
dc.contributor.advisorpl
Jansen, Ritsert
dc.contributor.authorpl
Zych, Konrad
dc.contributor.departmentbycodepl
UJK/WBBB
dc.contributor.reviewerpl
Płonka, Przemysław - 131459
dc.contributor.reviewerpl
Jansen, Ritsert
dc.contributor.reviewerpl
Jansen, Ritsert
dc.date.accessioned
2020-07-24T06:40:52Z
dc.date.available
2020-07-24T06:40:52Z
dc.date.submittedpl
2012-06-29
dc.fieldofstudypl
biotechnologia
dc.identifier.apdpl
diploma-66154-80130
dc.identifier.projectpl
APD / O
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/179652
dc.languagepl
eng
dc.subject.enpl
bioinformatics, antibiotic, secondary metabolite, Secondary Metabolite Gene Cluster, actinomyces
dc.subject.plpl
bioinformatyka, antybiotyk, metabolit drugorzędowy, klastry genów metabolitów drugorzędowych, actinomyces
dc.titlepl
Analiza obliczeniowa modularnej architektury klastrów genowych odpowiedzialnych za biosyntezę metabolitów drugorzędowych
dc.titlepl
Computational analysis of the modular architecture of secondary metabolite biosynthesis gene clusters
dc.title.alternativepl
Computational analysis of the modular architecture of secondary metabolite biosynthesis gene clusters.
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
17
Views per month
Views per city
Wroclaw
3
Katowice
2
Warsaw
2
Częstochowa
1
Dublin
1
Gdynia
1
Gorzów Wielkopolski
1
Mysłowice
1
Suchy Las
1

No access

No Thumbnail Available