Simple view
Full metadata view
Authors
Statistics
Molecular optimization and conditional generation using normalizing flows
Optymalizacja i warunkowe generowanie molekuł z wykorzystaniem modeli flowowych
optymalizacja, generowanie warunkowe, modele flowowe, modelowanie molekularne
optimization, conditional generation, normalizing flows, molecular modeling
Znajdowanie związków chemicznych o pożądanych cechach jest jednym z najtrudniejszych wyzwań w procesie produkcji nowych leków, gdyż wymaga optymalizacji pod kątem wielu złożonych własności. Aby zautomatyzować i przyspieszyć ten proces, wykorzystuje się między innymi metody uczenia głębokiego. Mimo iż nowoczesne modele generatywne doskonale sprawdzają się w wielu zadaniach, również w modelowaniu związków chemicznych, istniejącym podejściom często brakuje możliwości generowania przykładów o pożądanych cechach.W tej pracy omawiamy metodę, która przy użyciu modelu flowowego przekształca splątaną ukrytą przestrzeń modelu generatywnego w rozplątaną przestrzeń, w której wartości wybranej cechy są modelowane jako zmienna niezależna. Pozwala to na modyfikacje danych wejściowych tak, aby miały one pożądane cechy oraz na generowanie takich związków chemicznych od zera. W pracy rozważamy różne typy właściwości: dyskretne i ciągłe, porządkowe i kategoryczne, a eksperymenty przeprowadzamy na zbiorze związków chemicznych.Na podstawie eksperymentów twierdzimy, że opisywana tu metoda jest w stanie osiągnąć bardzo dobre wyniki w przypadku właściwości porządkowych zarówno dla modyfikowania istniejących przykładów, jak i dla warunkowego generowania zupełnie nowych przykładów. Dla zmiennych kategorycznych pokazujemy obiecujące wyniki oraz sugerujemy, jak można je poprawić w dalszych badaniach.
Finding a novel chemical compound with desired properties is one of the most difficult challenges in drug development, as it requires optimization of chemical compound structures with respect to many complex properties. Recently, a variety of deep learning methods have been used to automate and speed up this process. While modern generative models excel in a wide range of tasks, including modeling chemical molecules, existing approaches often lack the ability to generate examples with the desired properties.In this paper, we discuss a technique that transforms the entangled latent space of a generative model using a normalizing flow into a disentangled latent space, where attribute values are modeled as an independent variable. This allows for input optimization and conditional generation. We focus on the application of this method to different types of attributes: discrete and continuous, ordinal and categorical. Besides, here, we exclusively discuss modeling chemical molecules.With experiments, we argue that this flow-based method is able to achieve great results for ordinal attributes in both molecular optimization and conditional generation. For categorical attributes, we show promising results, although they leave plenty of room for improvement, which is discussed in the future work.
dc.abstract.en | Finding a novel chemical compound with desired properties is one of the most difficult challenges in drug development, as it requires optimization of chemical compound structures with respect to many complex properties. Recently, a variety of deep learning methods have been used to automate and speed up this process. While modern generative models excel in a wide range of tasks, including modeling chemical molecules, existing approaches often lack the ability to generate examples with the desired properties.In this paper, we discuss a technique that transforms the entangled latent space of a generative model using a normalizing flow into a disentangled latent space, where attribute values are modeled as an independent variable. This allows for input optimization and conditional generation. We focus on the application of this method to different types of attributes: discrete and continuous, ordinal and categorical. Besides, here, we exclusively discuss modeling chemical molecules.With experiments, we argue that this flow-based method is able to achieve great results for ordinal attributes in both molecular optimization and conditional generation. For categorical attributes, we show promising results, although they leave plenty of room for improvement, which is discussed in the future work. | pl |
dc.abstract.pl | Znajdowanie związków chemicznych o pożądanych cechach jest jednym z najtrudniejszych wyzwań w procesie produkcji nowych leków, gdyż wymaga optymalizacji pod kątem wielu złożonych własności. Aby zautomatyzować i przyspieszyć ten proces, wykorzystuje się między innymi metody uczenia głębokiego. Mimo iż nowoczesne modele generatywne doskonale sprawdzają się w wielu zadaniach, również w modelowaniu związków chemicznych, istniejącym podejściom często brakuje możliwości generowania przykładów o pożądanych cechach.W tej pracy omawiamy metodę, która przy użyciu modelu flowowego przekształca splątaną ukrytą przestrzeń modelu generatywnego w rozplątaną przestrzeń, w której wartości wybranej cechy są modelowane jako zmienna niezależna. Pozwala to na modyfikacje danych wejściowych tak, aby miały one pożądane cechy oraz na generowanie takich związków chemicznych od zera. W pracy rozważamy różne typy właściwości: dyskretne i ciągłe, porządkowe i kategoryczne, a eksperymenty przeprowadzamy na zbiorze związków chemicznych.Na podstawie eksperymentów twierdzimy, że opisywana tu metoda jest w stanie osiągnąć bardzo dobre wyniki w przypadku właściwości porządkowych zarówno dla modyfikowania istniejących przykładów, jak i dla warunkowego generowania zupełnie nowych przykładów. Dla zmiennych kategorycznych pokazujemy obiecujące wyniki oraz sugerujemy, jak można je poprawić w dalszych badaniach. | pl |
dc.affiliation | Wydział Matematyki i Informatyki | pl |
dc.area | obszar nauk ścisłych | pl |
dc.contributor.advisor | Śmieja, Marek | pl |
dc.contributor.author | Proszewska, Magdalena | pl |
dc.contributor.departmentbycode | UJK/WMI2 | pl |
dc.contributor.reviewer | Śmieja, Marek | pl |
dc.contributor.reviewer | Podolak, Igor - 100165 | pl |
dc.date.accessioned | 2022-07-08T21:51:15Z | |
dc.date.available | 2022-07-08T21:51:15Z | |
dc.date.submitted | 2022-06-30 | pl |
dc.fieldofstudy | informatyka | pl |
dc.identifier.apd | diploma-158719-227013 | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/295688 | |
dc.language | eng | pl |
dc.subject.en | optimization, conditional generation, normalizing flows, molecular modeling | pl |
dc.subject.pl | optymalizacja, generowanie warunkowe, modele flowowe, modelowanie molekularne | pl |
dc.title | Molecular optimization and conditional generation using normalizing flows | pl |
dc.title.alternative | Optymalizacja i warunkowe generowanie molekuł z wykorzystaniem modeli flowowych | pl |
dc.type | master | pl |
dspace.entity.type | Publication |