Artificial intelligence ensemble-based QSAR models for serotonin receptors

master
dc.abstract.enInventing a new drug is a time-consuming and resource-intensive process. Increased in-terest in phenotypic or genotypic-based projects implicates that there is needed to develop tools capable of analyzing genomics data. Consequently, looking for new ways to im-prove this process is the natural course of things. The development of computer technolo-gy alongside the development of artificial intelligence (AI) and machine learning (ML) allows for the implementation of a modern approach to the modeling of the parameters of chemical compounds in vivo. Herein, using the achievements and advantages of artificial intelligence, the predictive modeling of the affinity of chemical compounds to the seroto-nin 5-HT1A receptor was performed. The models were built in accordance with the Cub-ist, RandomForest, MONMLP, or AutoML methodology. The source of training and test datasets were repositories containing chemical, biological, and gene expression de-scriptors. The databases used for this experiment are CHEMBL, ZINC and LINCS. The main assumption of this work was to assess whether ensemble models based on gene expression would outperform classic models created with the basis of statistics. Further-more, this thesis presents QSAR predictive ensemble models that achieved 0.68-0.70 R2, and RMSE equal to 0.5880 (NRMSE = 11.6523) with the use of only 14 out of 978 landmark gene expression profile. This approach opens the opportunity to advance the virtual screening stage or lead optimization stage of drug discovery and development.pl
dc.abstract.plWynalezienie nowego leku jest procesem czasochłonnym i wymagającym dużych zasobów. Zwiększone zainteresowanie projektami fenotypowymi lub genetycznymi implikuje potrzebę opracowania narzędzi zdolnych do analizy danych genomicznych. Dlatego naturalnym biegiem rzeczy jest poszukiwanie nowych sposobów na usprawnienie tego procesu. Rozwój technologii komputerowej, mocy obliczeniowej oraz związany z tym rozwój sztucznej inteligencji (AI) i uczenia maszynowego (ML) pozwala na wdrożenie nowoczesnego podejścia do modelowania niektórych parametrów związków chemicznych in vivo (na podstawie danych zebranych eksperymentalnie). W tym artykule, wykorzystując osiągnięcia i zalety sztucznej inteligencji, przeprowadzono modelowanie predykcyjne powinowactwa związków chemicznych do receptora serotoninowego 5-HT1A. Modele zostały zbudowane zgodnie z metodologią Cubist, RandomForest, MONMLP lub AutoML. Źródłem treningowych i testowych baz danych były repozytoria zawierające deskryptory chemiczne, biologicznej i deskryptory ekspresji genów. Bazy danych użyte w tym eksperymencie to ChEMBL, ZINC i LINCS. Głównym założeniem tej pracy była ocena, czy modele złożone oparte na ekspresji genów będą w stanie lepiej przewidywać wybrane endpointy niż klasyczne modele tworzone na podstawie statystyki. Ponadto w pracy przedstawiono predyktywne modele złożone QSAR, które osiągnęły 0,68-0,70 R2 i RMSE równe 0,5880 (NRMSE = 11,6523) przy użyciu tylko 14 z 978 profili ekspresji genów. Takie podejście do modelowania pozwala myśleć o przyspieszenia etapu virtual screening lub lead optimization w procesie opracowywania i odkrywania nowych leków.pl
dc.affiliationWydział Farmaceutycznypl
dc.areaobszar nauk medycznych, nauk o zdrowiu oraz nauk o kulturze fizycznejpl
dc.contributor.advisorSzlęk, Jakub - 162262 pl
dc.contributor.authorStraś, Jakubpl
dc.contributor.departmentbycodeUJK/WFOAM2pl
dc.contributor.reviewerMendyk, Aleksander - 130937 pl
dc.contributor.reviewerSzlęk, Jakub - 162262 pl
dc.date.accessioned2021-07-01T21:36:39Z
dc.date.available2021-07-01T21:36:39Z
dc.date.submitted2021-07-01pl
dc.fieldofstudyDrug Discovery and Developmentpl
dc.identifier.apddiploma-146931-226691pl
dc.identifier.projectAPD / Opl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/275895
dc.languageengpl
dc.subject.enArtificial Intelligence, Ensemble Models, QSAR, Serotonin, Modeling, AI, Receptors.pl
dc.subject.plModelowanie Komputerowe, Sztuczna Inteligencja, QSAR, Serotonina, Receptory, Modele Złożone, AI.pl
dc.titleArtificial intelligence ensemble-based QSAR models for serotonin receptorspl
dc.title.alternativeZłożone modele QSAR dla receptorów serotoninowych oparte na sztucznej inteligencjipl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
Inventing a new drug is a time-consuming and resource-intensive process. Increased in-terest in phenotypic or genotypic-based projects implicates that there is needed to develop tools capable of analyzing genomics data. Consequently, looking for new ways to im-prove this process is the natural course of things. The development of computer technolo-gy alongside the development of artificial intelligence (AI) and machine learning (ML) allows for the implementation of a modern approach to the modeling of the parameters of chemical compounds in vivo. Herein, using the achievements and advantages of artificial intelligence, the predictive modeling of the affinity of chemical compounds to the seroto-nin 5-HT1A receptor was performed. The models were built in accordance with the Cub-ist, RandomForest, MONMLP, or AutoML methodology. The source of training and test datasets were repositories containing chemical, biological, and gene expression de-scriptors. The databases used for this experiment are CHEMBL, ZINC and LINCS. The main assumption of this work was to assess whether ensemble models based on gene expression would outperform classic models created with the basis of statistics. Further-more, this thesis presents QSAR predictive ensemble models that achieved 0.68-0.70 R2, and RMSE equal to 0.5880 (NRMSE = 11.6523) with the use of only 14 out of 978 landmark gene expression profile. This approach opens the opportunity to advance the virtual screening stage or lead optimization stage of drug discovery and development.
dc.abstract.plpl
Wynalezienie nowego leku jest procesem czasochłonnym i wymagającym dużych zasobów. Zwiększone zainteresowanie projektami fenotypowymi lub genetycznymi implikuje potrzebę opracowania narzędzi zdolnych do analizy danych genomicznych. Dlatego naturalnym biegiem rzeczy jest poszukiwanie nowych sposobów na usprawnienie tego procesu. Rozwój technologii komputerowej, mocy obliczeniowej oraz związany z tym rozwój sztucznej inteligencji (AI) i uczenia maszynowego (ML) pozwala na wdrożenie nowoczesnego podejścia do modelowania niektórych parametrów związków chemicznych in vivo (na podstawie danych zebranych eksperymentalnie). W tym artykule, wykorzystując osiągnięcia i zalety sztucznej inteligencji, przeprowadzono modelowanie predykcyjne powinowactwa związków chemicznych do receptora serotoninowego 5-HT1A. Modele zostały zbudowane zgodnie z metodologią Cubist, RandomForest, MONMLP lub AutoML. Źródłem treningowych i testowych baz danych były repozytoria zawierające deskryptory chemiczne, biologicznej i deskryptory ekspresji genów. Bazy danych użyte w tym eksperymencie to ChEMBL, ZINC i LINCS. Głównym założeniem tej pracy była ocena, czy modele złożone oparte na ekspresji genów będą w stanie lepiej przewidywać wybrane endpointy niż klasyczne modele tworzone na podstawie statystyki. Ponadto w pracy przedstawiono predyktywne modele złożone QSAR, które osiągnęły 0,68-0,70 R2 i RMSE równe 0,5880 (NRMSE = 11,6523) przy użyciu tylko 14 z 978 profili ekspresji genów. Takie podejście do modelowania pozwala myśleć o przyspieszenia etapu virtual screening lub lead optimization w procesie opracowywania i odkrywania nowych leków.
dc.affiliationpl
Wydział Farmaceutyczny
dc.areapl
obszar nauk medycznych, nauk o zdrowiu oraz nauk o kulturze fizycznej
dc.contributor.advisorpl
Szlęk, Jakub - 162262
dc.contributor.authorpl
Straś, Jakub
dc.contributor.departmentbycodepl
UJK/WFOAM2
dc.contributor.reviewerpl
Mendyk, Aleksander - 130937
dc.contributor.reviewerpl
Szlęk, Jakub - 162262
dc.date.accessioned
2021-07-01T21:36:39Z
dc.date.available
2021-07-01T21:36:39Z
dc.date.submittedpl
2021-07-01
dc.fieldofstudypl
Drug Discovery and Development
dc.identifier.apdpl
diploma-146931-226691
dc.identifier.projectpl
APD / O
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/275895
dc.languagepl
eng
dc.subject.enpl
Artificial Intelligence, Ensemble Models, QSAR, Serotonin, Modeling, AI, Receptors.
dc.subject.plpl
Modelowanie Komputerowe, Sztuczna Inteligencja, QSAR, Serotonina, Receptory, Modele Złożone, AI.
dc.titlepl
Artificial intelligence ensemble-based QSAR models for serotonin receptors
dc.title.alternativepl
Złożone modele QSAR dla receptorów serotoninowych oparte na sztucznej inteligencji
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

No access

No Thumbnail Available