Universal perturbation in the reinforcement learning

master
dc.abstract.enDeep neural networks, despite their superhuman performance on many tasks, are susceptible to adversarial examples. This phenomenon has been demonstrated also in the context of reinforcement learning. We demonstrate that one can construct a universal attack that, for a given game, adds the same perturbation for different frames to fool the neural network policy. Also, we show that such perturbation transfers, to some extent, to different games that it was not trained on. We perform our experiments on Atari 2600 games.pl
dc.abstract.plGłębokie sieci neuronowe, mimo tego że osiągają wyniki przekraczające ludzkie możliwości dla wielu zadań, są podatne na przykłady adwersarialne. Zjawisko to zostało zaprezentowane także dla uczenia ze wzmocnieniem. Demonstrujemy, że można skonstruować uniwersalny atak, tak że dodajemy tą samą perturbację do różnych ramek dla pewnej gry w celu oszukania strategii sieci neuronowej. Pokazujemy także, że nasze perturbacje przenoszą się, w pewnym stopniu, do gier na których perturbacja nie była trenowana. Do eksperymentów wykorzystaliśmy gry Atari 2600.pl
dc.affiliationWydział Matematyki i Informatykipl
dc.areaobszar nauk ścisłychpl
dc.contributor.advisorTabor, Jacek - 132362 pl
dc.contributor.authorStachura, Damianpl
dc.contributor.departmentbycodeUJK/WMI2pl
dc.contributor.reviewerSpurek, Przemysławpl
dc.contributor.reviewerTabor, Jacek - 132362 pl
dc.date.accessioned2020-10-20T19:21:39Z
dc.date.available2020-10-20T19:21:39Z
dc.date.submitted2020-09-14pl
dc.fieldofstudynauczanie maszynowepl
dc.identifier.apddiploma-141438-209204pl
dc.identifier.projectAPD / Opl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/249160
dc.languageengpl
dc.subject.enreinforcement learning, adversarial examples, universal adversarial perturbations, machine learning, Atari 2600, gradient descent method, TensorFlow, OpenAI Gympl
dc.subject.pluczenie ze wzmocnieniem, przykłady adwersarialne, uniwersalne perturbacje, uczenie maszynowe, Atari 2600, metoda gradientu prostego, TensorFlow, OpenAI Gympl
dc.titleUniversal perturbation in the reinforcement learningpl
dc.title.alternativeUniwersalne perturbacje w uczeniu ze wzmocnieniempl
dc.typemasterpl
dspace.entity.typePublication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
0
Views per month

No access

No Thumbnail Available