Molecular optimization and conditional generation using normalizing flows

master
dc.abstract.enFinding a novel chemical compound with desired properties is one of the most difficult challenges in drug development, as it requires optimization of chemical compound structures with respect to many complex properties. Recently, a variety of deep learning methods have been used to automate and speed up this process. While modern generative models excel in a wide range of tasks, including modeling chemical molecules, existing approaches often lack the ability to generate examples with the desired properties.In this paper, we discuss a technique that transforms the entangled latent space of a generative model using a normalizing flow into a disentangled latent space, where attribute values are modeled as an independent variable. This allows for input optimization and conditional generation. We focus on the application of this method to different types of attributes: discrete and continuous, ordinal and categorical. Besides, here, we exclusively discuss modeling chemical molecules.With experiments, we argue that this flow-based method is able to achieve great results for ordinal attributes in both molecular optimization and conditional generation. For categorical attributes, we show promising results, although they leave plenty of room for improvement, which is discussed in the future work.pl
dc.abstract.plZnajdowanie związków chemicznych o pożądanych cechach jest jednym z najtrudniejszych wyzwań w procesie produkcji nowych leków, gdyż wymaga optymalizacji pod kątem wielu złożonych własności. Aby zautomatyzować i przyspieszyć ten proces, wykorzystuje się między innymi metody uczenia głębokiego. Mimo iż nowoczesne modele generatywne doskonale sprawdzają się w wielu zadaniach, również w modelowaniu związków chemicznych, istniejącym podejściom często brakuje możliwości generowania przykładów o pożądanych cechach.W tej pracy omawiamy metodę, która przy użyciu modelu flowowego przekształca splątaną ukrytą przestrzeń modelu generatywnego w rozplątaną przestrzeń, w której wartości wybranej cechy są modelowane jako zmienna niezależna. Pozwala to na modyfikacje danych wejściowych tak, aby miały one pożądane cechy oraz na generowanie takich związków chemicznych od zera. W pracy rozważamy różne typy właściwości: dyskretne i ciągłe, porządkowe i kategoryczne, a eksperymenty przeprowadzamy na zbiorze związków chemicznych.Na podstawie eksperymentów twierdzimy, że opisywana tu metoda jest w stanie osiągnąć bardzo dobre wyniki w przypadku właściwości porządkowych zarówno dla modyfikowania istniejących przykładów, jak i dla warunkowego generowania zupełnie nowych przykładów. Dla zmiennych kategorycznych pokazujemy obiecujące wyniki oraz sugerujemy, jak można je poprawić w dalszych badaniach.pl
dc.affiliationWydział Matematyki i Informatykipl
dc.areaobszar nauk ścisłychpl
dc.contributor.advisorŚmieja, Marekpl
dc.contributor.authorProszewska, Magdalenapl
dc.contributor.departmentbycodeUJK/WMI2pl
dc.contributor.reviewerŚmieja, Marekpl
dc.contributor.reviewerPodolak, Igor - 100165 pl
dc.date.accessioned2022-07-08T21:51:15Z
dc.date.available2022-07-08T21:51:15Z
dc.date.submitted2022-06-30pl
dc.fieldofstudyinformatykapl
dc.identifier.apddiploma-158719-227013pl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/295688
dc.languageengpl
dc.subject.enoptimization, conditional generation, normalizing flows, molecular modelingpl
dc.subject.ploptymalizacja, generowanie warunkowe, modele flowowe, modelowanie molekularnepl
dc.titleMolecular optimization and conditional generation using normalizing flowspl
dc.title.alternativeOptymalizacja i warunkowe generowanie molekuł z wykorzystaniem modeli flowowychpl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
Finding a novel chemical compound with desired properties is one of the most difficult challenges in drug development, as it requires optimization of chemical compound structures with respect to many complex properties. Recently, a variety of deep learning methods have been used to automate and speed up this process. While modern generative models excel in a wide range of tasks, including modeling chemical molecules, existing approaches often lack the ability to generate examples with the desired properties.In this paper, we discuss a technique that transforms the entangled latent space of a generative model using a normalizing flow into a disentangled latent space, where attribute values are modeled as an independent variable. This allows for input optimization and conditional generation. We focus on the application of this method to different types of attributes: discrete and continuous, ordinal and categorical. Besides, here, we exclusively discuss modeling chemical molecules.With experiments, we argue that this flow-based method is able to achieve great results for ordinal attributes in both molecular optimization and conditional generation. For categorical attributes, we show promising results, although they leave plenty of room for improvement, which is discussed in the future work.
dc.abstract.plpl
Znajdowanie związków chemicznych o pożądanych cechach jest jednym z najtrudniejszych wyzwań w procesie produkcji nowych leków, gdyż wymaga optymalizacji pod kątem wielu złożonych własności. Aby zautomatyzować i przyspieszyć ten proces, wykorzystuje się między innymi metody uczenia głębokiego. Mimo iż nowoczesne modele generatywne doskonale sprawdzają się w wielu zadaniach, również w modelowaniu związków chemicznych, istniejącym podejściom często brakuje możliwości generowania przykładów o pożądanych cechach.W tej pracy omawiamy metodę, która przy użyciu modelu flowowego przekształca splątaną ukrytą przestrzeń modelu generatywnego w rozplątaną przestrzeń, w której wartości wybranej cechy są modelowane jako zmienna niezależna. Pozwala to na modyfikacje danych wejściowych tak, aby miały one pożądane cechy oraz na generowanie takich związków chemicznych od zera. W pracy rozważamy różne typy właściwości: dyskretne i ciągłe, porządkowe i kategoryczne, a eksperymenty przeprowadzamy na zbiorze związków chemicznych.Na podstawie eksperymentów twierdzimy, że opisywana tu metoda jest w stanie osiągnąć bardzo dobre wyniki w przypadku właściwości porządkowych zarówno dla modyfikowania istniejących przykładów, jak i dla warunkowego generowania zupełnie nowych przykładów. Dla zmiennych kategorycznych pokazujemy obiecujące wyniki oraz sugerujemy, jak można je poprawić w dalszych badaniach.
dc.affiliationpl
Wydział Matematyki i Informatyki
dc.areapl
obszar nauk ścisłych
dc.contributor.advisorpl
Śmieja, Marek
dc.contributor.authorpl
Proszewska, Magdalena
dc.contributor.departmentbycodepl
UJK/WMI2
dc.contributor.reviewerpl
Śmieja, Marek
dc.contributor.reviewerpl
Podolak, Igor - 100165
dc.date.accessioned
2022-07-08T21:51:15Z
dc.date.available
2022-07-08T21:51:15Z
dc.date.submittedpl
2022-06-30
dc.fieldofstudypl
informatyka
dc.identifier.apdpl
diploma-158719-227013
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/295688
dc.languagepl
eng
dc.subject.enpl
optimization, conditional generation, normalizing flows, molecular modeling
dc.subject.plpl
optymalizacja, generowanie warunkowe, modele flowowe, modelowanie molekularne
dc.titlepl
Molecular optimization and conditional generation using normalizing flows
dc.title.alternativepl
Optymalizacja i warunkowe generowanie molekuł z wykorzystaniem modeli flowowych
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
9
Views per month
Views per city
Beijing
1
Edinburgh
1
Krakow
1
Leszno
1
Seattle
1
Taipei
1
Windsor
1
Zurich
1

No access

No Thumbnail Available
Collections