Analiza właściwości aminokwasów w regionach centrów aktywnych białek

licenciate
dc.abstract.enApart from the most known and associated with the scientific literature properties of amino acids (such as, for example, water solubility, amino acid pH or molecular weight), there is a large number of physicochemical properties of amino acids about which there is a small number of publications, and which may have a key impact on functions of proteins and their active regions. The use of the multiple sequence alignment (MSA) approach allowed the determination of a high degree of conservation among a representative number of amino acid sequences of the active sites of enzymes. In the work presented here, resources from the AAindex database and the PROSITE database were used in order to group more physicochemical properties of amino acids and subject the results to the collected match set to be clustered and to determine preferences in the centers of active proteins. The final results are presented in a series of diagrams included in the paper. To optimize the script's operation on a larger amount of data, an iterative algorithm was created that initially groups and filters amino acid properties. The analysis showed that there are families of properties that greatly predominate in terms of protein active site preference. It was also possible to present the relationship between the amino acid indices and the characteristic features of the active site sequence, such as their length or the number of sequence gaps.pl
dc.abstract.plOprócz najbardziej znanych i kojarzonych z literatury naukowej właściwości aminokwasów jakimi są np. rozpuszczalność w wodzie, pH aminokwasu czy masa molekularna istnieje duża ilość cech fizykochemicznych, na temat których jest niewielka liczba publikacji, a które mogą wpływać w sposób kluczowy na funkcje białek w ich aktywnych regionach. Pełną listę znanych właściwości aminokwasów znajdziemy w bazie AAindex. Dopasowanie wielu sekwencji (ang. msa – multiple sequence alignment) w centrach aktywnych białek pozwala określić stopień konserwatywności występujących tam aminokwasów a następnie wyznaczyć charakterystyczny motyw dla rodziny białek. Zestaw tych dopasowań oraz motywy odnajdziemy w bazie PROSITE. W przedstawionej pracy wykorzystano zasoby ze wymienionych już baz: AAindex oraz PROSITE po to, aby przeanalizować właściwości fizykochemiczne aminokwasów w centrach aktywnych białek. Analiza ta obejmuje: grupowanie właściwości fizykochemicznych wg. współczynnika korelacji Pearsona, ocenę konserwatywności tych właściwości w MSA dla rodzin PROSITE selekcja maksymalnych wartości właściwości w kolumnach MSA, klasteryzację uzyskanych wyników – analiza składowych głównych PCA oraz grupowanie – k-means. Ostateczne rezultaty zostały zaprezentowane na serii diagramów. Analiza wykazała, że istnieją rodziny właściwości, które znacznie przeważają pod względem preferencji występowania w miejscach aktywnych białek. Udało się także przedstawić relację pomiędzy indeksami aminokwasowymi a charakterystycznymi cechami sekwencji miejsc aktywnych jak ich długość czy liczba przerw w sekwencji.pl
dc.affiliationUniwersytet Jagielloński w Krakowiepl
dc.contributor.advisorSarapata, Krzysztof - 133360 pl
dc.contributor.authorNęcki, Makspl
dc.contributor.departmentbycodeUJK/UJKpl
dc.contributor.reviewerWójcik-Augustyn, Annapl
dc.contributor.reviewerSarapata, Krzysztof - 133360 pl
dc.date.accessioned2022-07-08T22:16:05Z
dc.date.available2022-07-08T22:16:05Z
dc.date.submitted2022-07-07pl
dc.fieldofstudybioinformatykapl
dc.identifier.apddiploma-160316-259116pl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/295817
dc.languagepolpl
dc.subject.enamino acid properties, short conservative motifs, AAindex database, PROSITE database, clustering, principal component analysis, k-means algorithm, substitution matrix, amino acid index, Python programming language, correlation coefficient, protein families, preference parameter, protein active centers, hydrophobicity, data normalizationpl
dc.subject.plwłaściwości aminokwasowe, krótkie motywy konserwatywne, baza AAindex, baza PROSITE, klasteryzacja, analiza skupień, algorytm k-średnich, macierz substytucji, indeks aminokwasowy, język programowania Python, współczynnik korelacji, rodziny białek, parametr preferencji, centra aktywne białek, hydrofobowość, normalizacja danychpl
dc.titleAnaliza właściwości aminokwasów w regionach centrów aktywnych białekpl
dc.title.alternativeAnalysis of the properties of amino acids in the regions of active centers of proteinspl
dc.typelicenciatepl
dspace.entity.typePublication
dc.abstract.enpl
Apart from the most known and associated with the scientific literature properties of amino acids (such as, for example, water solubility, amino acid pH or molecular weight), there is a large number of physicochemical properties of amino acids about which there is a small number of publications, and which may have a key impact on functions of proteins and their active regions. The use of the multiple sequence alignment (MSA) approach allowed the determination of a high degree of conservation among a representative number of amino acid sequences of the active sites of enzymes. In the work presented here, resources from the AAindex database and the PROSITE database were used in order to group more physicochemical properties of amino acids and subject the results to the collected match set to be clustered and to determine preferences in the centers of active proteins. The final results are presented in a series of diagrams included in the paper. To optimize the script's operation on a larger amount of data, an iterative algorithm was created that initially groups and filters amino acid properties. The analysis showed that there are families of properties that greatly predominate in terms of protein active site preference. It was also possible to present the relationship between the amino acid indices and the characteristic features of the active site sequence, such as their length or the number of sequence gaps.
dc.abstract.plpl
Oprócz najbardziej znanych i kojarzonych z literatury naukowej właściwości aminokwasów jakimi są np. rozpuszczalność w wodzie, pH aminokwasu czy masa molekularna istnieje duża ilość cech fizykochemicznych, na temat których jest niewielka liczba publikacji, a które mogą wpływać w sposób kluczowy na funkcje białek w ich aktywnych regionach. Pełną listę znanych właściwości aminokwasów znajdziemy w bazie AAindex. Dopasowanie wielu sekwencji (ang. msa – multiple sequence alignment) w centrach aktywnych białek pozwala określić stopień konserwatywności występujących tam aminokwasów a następnie wyznaczyć charakterystyczny motyw dla rodziny białek. Zestaw tych dopasowań oraz motywy odnajdziemy w bazie PROSITE. W przedstawionej pracy wykorzystano zasoby ze wymienionych już baz: AAindex oraz PROSITE po to, aby przeanalizować właściwości fizykochemiczne aminokwasów w centrach aktywnych białek. Analiza ta obejmuje: grupowanie właściwości fizykochemicznych wg. współczynnika korelacji Pearsona, ocenę konserwatywności tych właściwości w MSA dla rodzin PROSITE selekcja maksymalnych wartości właściwości w kolumnach MSA, klasteryzację uzyskanych wyników – analiza składowych głównych PCA oraz grupowanie – k-means. Ostateczne rezultaty zostały zaprezentowane na serii diagramów. Analiza wykazała, że istnieją rodziny właściwości, które znacznie przeważają pod względem preferencji występowania w miejscach aktywnych białek. Udało się także przedstawić relację pomiędzy indeksami aminokwasowymi a charakterystycznymi cechami sekwencji miejsc aktywnych jak ich długość czy liczba przerw w sekwencji.
dc.affiliationpl
Uniwersytet Jagielloński w Krakowie
dc.contributor.advisorpl
Sarapata, Krzysztof - 133360
dc.contributor.authorpl
Nęcki, Maks
dc.contributor.departmentbycodepl
UJK/UJK
dc.contributor.reviewerpl
Wójcik-Augustyn, Anna
dc.contributor.reviewerpl
Sarapata, Krzysztof - 133360
dc.date.accessioned
2022-07-08T22:16:05Z
dc.date.available
2022-07-08T22:16:05Z
dc.date.submittedpl
2022-07-07
dc.fieldofstudypl
bioinformatyka
dc.identifier.apdpl
diploma-160316-259116
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/295817
dc.languagepl
pol
dc.subject.enpl
amino acid properties, short conservative motifs, AAindex database, PROSITE database, clustering, principal component analysis, k-means algorithm, substitution matrix, amino acid index, Python programming language, correlation coefficient, protein families, preference parameter, protein active centers, hydrophobicity, data normalization
dc.subject.plpl
właściwości aminokwasowe, krótkie motywy konserwatywne, baza AAindex, baza PROSITE, klasteryzacja, analiza skupień, algorytm k-średnich, macierz substytucji, indeks aminokwasowy, język programowania Python, współczynnik korelacji, rodziny białek, parametr preferencji, centra aktywne białek, hydrofobowość, normalizacja danych
dc.titlepl
Analiza właściwości aminokwasów w regionach centrów aktywnych białek
dc.title.alternativepl
Analysis of the properties of amino acids in the regions of active centers of proteins
dc.typepl
licenciate
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
18
Views per month
Views per city
Poznan
4
Warsaw
3
Krakow
2
Bibice
1
Bydgoszcz
1
Gdansk
1
Lodz
1
Skierniewice
1
Tenczynek
1
Zielona Góra
1

No access

No Thumbnail Available