Artificial intelligence ensemble-based QSAR models for serotonin receptors

Straś, Jakub

Simple view

Full metadata view

Authors

Statistics

Artificial intelligence ensemble-based QSAR models for serotonin receptors

master

Alternative title

Złożone modele QSAR dla receptorów serotoninowych oparte na sztucznej inteligencji

Author

Straś Jakub

Reviewer

Mendyk Aleksander

Szlęk Jakub

Advisor

Szlęk Jakub

Date of defence

2021-07-01

Keywords in Polish

Modelowanie Komputerowe, Sztuczna Inteligencja, QSAR, Serotonina, Receptory, Modele Złożone, AI.

Keywords in English

Artificial Intelligence, Ensemble Models, QSAR, Serotonin, Modeling, AI, Receptors.

Language

English

Abstract in Polish

Wynalezienie nowego leku jest procesem czasochłonnym i wymagającym dużych zasobów. Zwiększone zainteresowanie projektami fenotypowymi lub genetycznymi implikuje potrzebę opracowania narzędzi zdolnych do analizy danych genomicznych. Dlatego naturalnym biegiem rzeczy jest poszukiwanie nowych sposobów na usprawnienie tego procesu. Rozwój technologii komputerowej, mocy obliczeniowej oraz związany z tym rozwój sztucznej inteligencji (AI) i uczenia maszynowego (ML) pozwala na wdrożenie nowoczesnego podejścia do modelowania niektórych parametrów związków chemicznych in vivo (na podstawie danych zebranych eksperymentalnie). W tym artykule, wykorzystując osiągnięcia i zalety sztucznej inteligencji, przeprowadzono modelowanie predykcyjne powinowactwa związków chemicznych do receptora serotoninowego 5-HT1A. Modele zostały zbudowane zgodnie z metodologią Cubist, RandomForest, MONMLP lub AutoML. Źródłem treningowych i testowych baz danych były repozytoria zawierające deskryptory chemiczne, biologicznej i deskryptory ekspresji genów. Bazy danych użyte w tym eksperymencie to ChEMBL, ZINC i LINCS. Głównym założeniem tej pracy była ocena, czy modele złożone oparte na ekspresji genów będą w stanie lepiej przewidywać wybrane endpointy niż klasyczne modele tworzone na podstawie statystyki. Ponadto w pracy przedstawiono predyktywne modele złożone QSAR, które osiągnęły 0,68-0,70 R2 i RMSE równe 0,5880 (NRMSE = 11,6523) przy użyciu tylko 14 z 978 profili ekspresji genów. Takie podejście do modelowania pozwala myśleć o przyspieszenia etapu virtual screening lub lead optimization w procesie opracowywania i odkrywania nowych leków.

Abstract in English

Inventing a new drug is a time-consuming and resource-intensive process. Increased in-terest in phenotypic or genotypic-based projects implicates that there is needed to develop tools capable of analyzing genomics data. Consequently, looking for new ways to im-prove this process is the natural course of things. The development of computer technolo-gy alongside the development of artificial intelligence (AI) and machine learning (ML) allows for the implementation of a modern approach to the modeling of the parameters of chemical compounds in vivo. Herein, using the achievements and advantages of artificial intelligence, the predictive modeling of the affinity of chemical compounds to the seroto-nin 5-HT1A receptor was performed. The models were built in accordance with the Cub-ist, RandomForest, MONMLP, or AutoML methodology. The source of training and test datasets were repositories containing chemical, biological, and gene expression de-scriptors. The databases used for this experiment are CHEMBL, ZINC and LINCS. The main assumption of this work was to assess whether ensemble models based on gene expression would outperform classic models created with the basis of statistics. Further-more, this thesis presents QSAR predictive ensemble models that achieved 0.68-0.70 R2, and RMSE equal to 0.5880 (NRMSE = 11.6523) with the use of only 14 out of 978 landmark gene expression profile. This approach opens the opportunity to advance the virtual screening stage or lead optimization stage of drug discovery and development.

dc.abstract.en	Inventing a new drug is a time-consuming and resource-intensive process. Increased in-terest in phenotypic or genotypic-based projects implicates that there is needed to develop tools capable of analyzing genomics data. Consequently, looking for new ways to im-prove this process is the natural course of things. The development of computer technolo-gy alongside the development of artificial intelligence (AI) and machine learning (ML) allows for the implementation of a modern approach to the modeling of the parameters of chemical compounds in vivo. Herein, using the achievements and advantages of artificial intelligence, the predictive modeling of the affinity of chemical compounds to the seroto-nin 5-HT1A receptor was performed. The models were built in accordance with the Cub-ist, RandomForest, MONMLP, or AutoML methodology. The source of training and test datasets were repositories containing chemical, biological, and gene expression de-scriptors. The databases used for this experiment are CHEMBL, ZINC and LINCS. The main assumption of this work was to assess whether ensemble models based on gene expression would outperform classic models created with the basis of statistics. Further-more, this thesis presents QSAR predictive ensemble models that achieved 0.68-0.70 R2, and RMSE equal to 0.5880 (NRMSE = 11.6523) with the use of only 14 out of 978 landmark gene expression profile. This approach opens the opportunity to advance the virtual screening stage or lead optimization stage of drug discovery and development.	pl
dc.abstract.pl	Wynalezienie nowego leku jest procesem czasochłonnym i wymagającym dużych zasobów. Zwiększone zainteresowanie projektami fenotypowymi lub genetycznymi implikuje potrzebę opracowania narzędzi zdolnych do analizy danych genomicznych. Dlatego naturalnym biegiem rzeczy jest poszukiwanie nowych sposobów na usprawnienie tego procesu. Rozwój technologii komputerowej, mocy obliczeniowej oraz związany z tym rozwój sztucznej inteligencji (AI) i uczenia maszynowego (ML) pozwala na wdrożenie nowoczesnego podejścia do modelowania niektórych parametrów związków chemicznych in vivo (na podstawie danych zebranych eksperymentalnie). W tym artykule, wykorzystując osiągnięcia i zalety sztucznej inteligencji, przeprowadzono modelowanie predykcyjne powinowactwa związków chemicznych do receptora serotoninowego 5-HT1A. Modele zostały zbudowane zgodnie z metodologią Cubist, RandomForest, MONMLP lub AutoML. Źródłem treningowych i testowych baz danych były repozytoria zawierające deskryptory chemiczne, biologicznej i deskryptory ekspresji genów. Bazy danych użyte w tym eksperymencie to ChEMBL, ZINC i LINCS. Głównym założeniem tej pracy była ocena, czy modele złożone oparte na ekspresji genów będą w stanie lepiej przewidywać wybrane endpointy niż klasyczne modele tworzone na podstawie statystyki. Ponadto w pracy przedstawiono predyktywne modele złożone QSAR, które osiągnęły 0,68-0,70 R2 i RMSE równe 0,5880 (NRMSE = 11,6523) przy użyciu tylko 14 z 978 profili ekspresji genów. Takie podejście do modelowania pozwala myśleć o przyspieszenia etapu virtual screening lub lead optimization w procesie opracowywania i odkrywania nowych leków.	pl
dc.affiliation	Wydział Farmaceutyczny	pl
dc.area	obszar nauk medycznych, nauk o zdrowiu oraz nauk o kulturze fizycznej	pl
dc.contributor.advisor	Szlęk, Jakub - 162262	pl
dc.contributor.author	Straś, Jakub	pl
dc.contributor.departmentbycode	UJK/WFOAM2	pl
dc.contributor.reviewer	Mendyk, Aleksander - 130937	pl
dc.contributor.reviewer	Szlęk, Jakub - 162262	pl
dc.date.accessioned	2021-07-01T21:36:39Z
dc.date.available	2021-07-01T21:36:39Z
dc.date.submitted	2021-07-01	pl
dc.fieldofstudy	Drug Discovery and Development	pl
dc.identifier.apd	diploma-146931-226691	pl
dc.identifier.project	APD / O	pl
dc.identifier.uri	https://ruj.uj.edu.pl/xmlui/handle/item/275895
dc.language	eng	pl
dc.subject.en	Artificial Intelligence, Ensemble Models, QSAR, Serotonin, Modeling, AI, Receptors.	pl
dc.subject.pl	Modelowanie Komputerowe, Sztuczna Inteligencja, QSAR, Serotonina, Receptory, Modele Złożone, AI.	pl
dc.title	Artificial intelligence ensemble-based QSAR models for serotonin receptors	pl
dc.title.alternative	Złożone modele QSAR dla receptorów serotoninowych oparte na sztucznej inteligencji	pl
dc.type	master	pl
dspace.entity.type	Publication

dc.abstract.enpl

Inventing a new drug is a time-consuming and resource-intensive process. Increased in-terest in phenotypic or genotypic-based projects implicates that there is needed to develop tools capable of analyzing genomics data. Consequently, looking for new ways to im-prove this process is the natural course of things. The development of computer technolo-gy alongside the development of artificial intelligence (AI) and machine learning (ML) allows for the implementation of a modern approach to the modeling of the parameters of chemical compounds in vivo. Herein, using the achievements and advantages of artificial intelligence, the predictive modeling of the affinity of chemical compounds to the seroto-nin 5-HT1A receptor was performed. The models were built in accordance with the Cub-ist, RandomForest, MONMLP, or AutoML methodology. The source of training and test datasets were repositories containing chemical, biological, and gene expression de-scriptors. The databases used for this experiment are CHEMBL, ZINC and LINCS. The main assumption of this work was to assess whether ensemble models based on gene expression would outperform classic models created with the basis of statistics. Further-more, this thesis presents QSAR predictive ensemble models that achieved 0.68-0.70 R2, and RMSE equal to 0.5880 (NRMSE = 11.6523) with the use of only 14 out of 978 landmark gene expression profile. This approach opens the opportunity to advance the virtual screening stage or lead optimization stage of drug discovery and development.

dc.abstract.plpl

Wynalezienie nowego leku jest procesem czasochłonnym i wymagającym dużych zasobów. Zwiększone zainteresowanie projektami fenotypowymi lub genetycznymi implikuje potrzebę opracowania narzędzi zdolnych do analizy danych genomicznych. Dlatego naturalnym biegiem rzeczy jest poszukiwanie nowych sposobów na usprawnienie tego procesu. Rozwój technologii komputerowej, mocy obliczeniowej oraz związany z tym rozwój sztucznej inteligencji (AI) i uczenia maszynowego (ML) pozwala na wdrożenie nowoczesnego podejścia do modelowania niektórych parametrów związków chemicznych in vivo (na podstawie danych zebranych eksperymentalnie). W tym artykule, wykorzystując osiągnięcia i zalety sztucznej inteligencji, przeprowadzono modelowanie predykcyjne powinowactwa związków chemicznych do receptora serotoninowego 5-HT1A. Modele zostały zbudowane zgodnie z metodologią Cubist, RandomForest, MONMLP lub AutoML. Źródłem treningowych i testowych baz danych były repozytoria zawierające deskryptory chemiczne, biologicznej i deskryptory ekspresji genów. Bazy danych użyte w tym eksperymencie to ChEMBL, ZINC i LINCS. Głównym założeniem tej pracy była ocena, czy modele złożone oparte na ekspresji genów będą w stanie lepiej przewidywać wybrane endpointy niż klasyczne modele tworzone na podstawie statystyki. Ponadto w pracy przedstawiono predyktywne modele złożone QSAR, które osiągnęły 0,68-0,70 R2 i RMSE równe 0,5880 (NRMSE = 11,6523) przy użyciu tylko 14 z 978 profili ekspresji genów. Takie podejście do modelowania pozwala myśleć o przyspieszenia etapu virtual screening lub lead optimization w procesie opracowywania i odkrywania nowych leków.

dc.affiliationpl

Wydział Farmaceutyczny

dc.areapl

obszar nauk medycznych, nauk o zdrowiu oraz nauk o kulturze fizycznej

dc.contributor.advisorpl

Szlęk, Jakub - 162262

dc.contributor.authorpl

Straś, Jakub

dc.contributor.departmentbycodepl

UJK/WFOAM2

dc.contributor.reviewerpl

Mendyk, Aleksander - 130937

dc.contributor.reviewerpl

Szlęk, Jakub - 162262

dc.date.accessioned

2021-07-01T21:36:39Z

dc.date.available

2021-07-01T21:36:39Z

dc.date.submittedpl

2021-07-01

dc.fieldofstudypl

Drug Discovery and Development

dc.identifier.apdpl

diploma-146931-226691

dc.identifier.projectpl

APD / O

dc.identifier.uri

https://ruj.uj.edu.pl/xmlui/handle/item/275895

dc.languagepl

eng

dc.subject.enpl

Artificial Intelligence, Ensemble Models, QSAR, Serotonin, Modeling, AI, Receptors.

dc.subject.plpl

Modelowanie Komputerowe, Sztuczna Inteligencja, QSAR, Serotonina, Receptory, Modele Złożone, AI.

dc.titlepl

Artificial intelligence ensemble-based QSAR models for serotonin receptors

dc.title.alternativepl

Złożone modele QSAR dla receptorów serotoninowych oparte na sztucznej inteligencji

dc.typepl

master

dspace.entity.type

Publication

Affiliations

No affiliation

Straś, Jakub

Mendyk, Aleksander

Szlęk, Jakub

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

No access

Collections

Masters theses

ROD UJ