Simple view
Full metadata view
Authors
Statistics
Artificial intelligence ensemble-based QSAR models for serotonin receptors
Złożone modele QSAR dla receptorów serotoninowych oparte na sztucznej inteligencji
Modelowanie Komputerowe, Sztuczna Inteligencja, QSAR, Serotonina, Receptory, Modele Złożone, AI.
Artificial Intelligence, Ensemble Models, QSAR, Serotonin, Modeling, AI, Receptors.
Wynalezienie nowego leku jest procesem czasochłonnym i wymagającym dużych zasobów. Zwiększone zainteresowanie projektami fenotypowymi lub genetycznymi implikuje potrzebę opracowania narzędzi zdolnych do analizy danych genomicznych. Dlatego naturalnym biegiem rzeczy jest poszukiwanie nowych sposobów na usprawnienie tego procesu. Rozwój technologii komputerowej, mocy obliczeniowej oraz związany z tym rozwój sztucznej inteligencji (AI) i uczenia maszynowego (ML) pozwala na wdrożenie nowoczesnego podejścia do modelowania niektórych parametrów związków chemicznych in vivo (na podstawie danych zebranych eksperymentalnie). W tym artykule, wykorzystując osiągnięcia i zalety sztucznej inteligencji, przeprowadzono modelowanie predykcyjne powinowactwa związków chemicznych do receptora serotoninowego 5-HT1A. Modele zostały zbudowane zgodnie z metodologią Cubist, RandomForest, MONMLP lub AutoML. Źródłem treningowych i testowych baz danych były repozytoria zawierające deskryptory chemiczne, biologicznej i deskryptory ekspresji genów. Bazy danych użyte w tym eksperymencie to ChEMBL, ZINC i LINCS. Głównym założeniem tej pracy była ocena, czy modele złożone oparte na ekspresji genów będą w stanie lepiej przewidywać wybrane endpointy niż klasyczne modele tworzone na podstawie statystyki. Ponadto w pracy przedstawiono predyktywne modele złożone QSAR, które osiągnęły 0,68-0,70 R2 i RMSE równe 0,5880 (NRMSE = 11,6523) przy użyciu tylko 14 z 978 profili ekspresji genów. Takie podejście do modelowania pozwala myśleć o przyspieszenia etapu virtual screening lub lead optimization w procesie opracowywania i odkrywania nowych leków.
Inventing a new drug is a time-consuming and resource-intensive process. Increased in-terest in phenotypic or genotypic-based projects implicates that there is needed to develop tools capable of analyzing genomics data. Consequently, looking for new ways to im-prove this process is the natural course of things. The development of computer technolo-gy alongside the development of artificial intelligence (AI) and machine learning (ML) allows for the implementation of a modern approach to the modeling of the parameters of chemical compounds in vivo. Herein, using the achievements and advantages of artificial intelligence, the predictive modeling of the affinity of chemical compounds to the seroto-nin 5-HT1A receptor was performed. The models were built in accordance with the Cub-ist, RandomForest, MONMLP, or AutoML methodology. The source of training and test datasets were repositories containing chemical, biological, and gene expression de-scriptors. The databases used for this experiment are CHEMBL, ZINC and LINCS. The main assumption of this work was to assess whether ensemble models based on gene expression would outperform classic models created with the basis of statistics. Further-more, this thesis presents QSAR predictive ensemble models that achieved 0.68-0.70 R2, and RMSE equal to 0.5880 (NRMSE = 11.6523) with the use of only 14 out of 978 landmark gene expression profile. This approach opens the opportunity to advance the virtual screening stage or lead optimization stage of drug discovery and development.
dc.abstract.en | Inventing a new drug is a time-consuming and resource-intensive process. Increased in-terest in phenotypic or genotypic-based projects implicates that there is needed to develop tools capable of analyzing genomics data. Consequently, looking for new ways to im-prove this process is the natural course of things. The development of computer technolo-gy alongside the development of artificial intelligence (AI) and machine learning (ML) allows for the implementation of a modern approach to the modeling of the parameters of chemical compounds in vivo. Herein, using the achievements and advantages of artificial intelligence, the predictive modeling of the affinity of chemical compounds to the seroto-nin 5-HT1A receptor was performed. The models were built in accordance with the Cub-ist, RandomForest, MONMLP, or AutoML methodology. The source of training and test datasets were repositories containing chemical, biological, and gene expression de-scriptors. The databases used for this experiment are CHEMBL, ZINC and LINCS. The main assumption of this work was to assess whether ensemble models based on gene expression would outperform classic models created with the basis of statistics. Further-more, this thesis presents QSAR predictive ensemble models that achieved 0.68-0.70 R2, and RMSE equal to 0.5880 (NRMSE = 11.6523) with the use of only 14 out of 978 landmark gene expression profile. This approach opens the opportunity to advance the virtual screening stage or lead optimization stage of drug discovery and development. | pl |
dc.abstract.pl | Wynalezienie nowego leku jest procesem czasochłonnym i wymagającym dużych zasobów. Zwiększone zainteresowanie projektami fenotypowymi lub genetycznymi implikuje potrzebę opracowania narzędzi zdolnych do analizy danych genomicznych. Dlatego naturalnym biegiem rzeczy jest poszukiwanie nowych sposobów na usprawnienie tego procesu. Rozwój technologii komputerowej, mocy obliczeniowej oraz związany z tym rozwój sztucznej inteligencji (AI) i uczenia maszynowego (ML) pozwala na wdrożenie nowoczesnego podejścia do modelowania niektórych parametrów związków chemicznych in vivo (na podstawie danych zebranych eksperymentalnie). W tym artykule, wykorzystując osiągnięcia i zalety sztucznej inteligencji, przeprowadzono modelowanie predykcyjne powinowactwa związków chemicznych do receptora serotoninowego 5-HT1A. Modele zostały zbudowane zgodnie z metodologią Cubist, RandomForest, MONMLP lub AutoML. Źródłem treningowych i testowych baz danych były repozytoria zawierające deskryptory chemiczne, biologicznej i deskryptory ekspresji genów. Bazy danych użyte w tym eksperymencie to ChEMBL, ZINC i LINCS. Głównym założeniem tej pracy była ocena, czy modele złożone oparte na ekspresji genów będą w stanie lepiej przewidywać wybrane endpointy niż klasyczne modele tworzone na podstawie statystyki. Ponadto w pracy przedstawiono predyktywne modele złożone QSAR, które osiągnęły 0,68-0,70 R2 i RMSE równe 0,5880 (NRMSE = 11,6523) przy użyciu tylko 14 z 978 profili ekspresji genów. Takie podejście do modelowania pozwala myśleć o przyspieszenia etapu virtual screening lub lead optimization w procesie opracowywania i odkrywania nowych leków. | pl |
dc.affiliation | Wydział Farmaceutyczny | pl |
dc.area | obszar nauk medycznych, nauk o zdrowiu oraz nauk o kulturze fizycznej | pl |
dc.contributor.advisor | Szlęk, Jakub - 162262 | pl |
dc.contributor.author | Straś, Jakub | pl |
dc.contributor.departmentbycode | UJK/WFOAM2 | pl |
dc.contributor.reviewer | Mendyk, Aleksander - 130937 | pl |
dc.contributor.reviewer | Szlęk, Jakub - 162262 | pl |
dc.date.accessioned | 2021-07-01T21:36:39Z | |
dc.date.available | 2021-07-01T21:36:39Z | |
dc.date.submitted | 2021-07-01 | pl |
dc.fieldofstudy | Drug Discovery and Development | pl |
dc.identifier.apd | diploma-146931-226691 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/275895 | |
dc.language | eng | pl |
dc.subject.en | Artificial Intelligence, Ensemble Models, QSAR, Serotonin, Modeling, AI, Receptors. | pl |
dc.subject.pl | Modelowanie Komputerowe, Sztuczna Inteligencja, QSAR, Serotonina, Receptory, Modele Złożone, AI. | pl |
dc.title | Artificial intelligence ensemble-based QSAR models for serotonin receptors | pl |
dc.title.alternative | Złożone modele QSAR dla receptorów serotoninowych oparte na sztucznej inteligencji | pl |
dc.type | master | pl |
dspace.entity.type | Publication |