Task Scheduling on a Cluster of Non-Homogoneus Machines

Tracz, Dawid

Simple view

Full metadata view

Authors

Statistics

Task Scheduling on a Cluster of Non-Homogoneus Machines

master

Alternative title

Kolejkowanie zadań na klastrze maszyn niejednorodnych

Author

Tracz Dawid

Reviewer

Gutowski Grzegorz

Micek Piotr

Advisor

Gutowski Grzegorz

Date of defence

2022-10-19

Keywords in Polish

Kolejkowanie zadań,Heterogeniczna infrastruktura,Symulacje,Bin-packing,Uczenie maszynowe,Policy gradient

Keywords in English

Job scheduling,Heterogeneous infrastructure,Simulations,Bin-packing,Machine learning,Policy gradient

Language

English

Abstract in Polish

W tej pracy badamy problem schedulingu zadań on-line na heterogenicznej infrastrukturze chmurowej wyposażonej w różne zasoby. Każde zadanie jest opisane przez czas zgłoszenia, liczbę operacji, wektor opisujący konieczne zasoby i priorytet. Maszyny są opisane popprzez krotkę dostępnych zasobów, które różnią się w zależności od maszyny. Każda maszyna może przetwarzać wiele zadań jednocześnie, pod warunkiem, że dysponuje wystarczającą ilością zasobów, aby spełnić wymagania wszystkich uruchomionych zadań. Niedozwolone jest przerywanie raz rozpoczętych zadań.Naszym celem jest stworzenie algorytmu przypisującego zadania do maszyn i decydującego o kolejności ich wykonania. Ponieważ nie istnieją algorytmy rozwiązujące takie problemy w czasie wielomianowym, został on podzielony na dwie fazy i przybliżony przy użyciu heurystyk. Do wyboru maszyn dla przychodzących zadań, zaprojektowano i nauczono sieć neuronową. Rozwiązanie problemu kolejkowania zadań na jednej maszynie zostało rozwuiązane w oparciu o przybliżenia rozwiązań bin-packingu.Wszystkie prezentowane rozwiązania zostały przetestowane na specjalnie zaprojektowanym symulatorze obliczeń chmurowych. W tym celu wykorzystano również dane na temat prawdziwych zadań liczonych wczesniej na naszych maszynach. Symulator posłużył również do wytrenowania sieci neuronowych.

Abstract in English

In this work we investigate a problem of on-line job scheduling on a heterogeneous infrastructure with multiple resources. In this setting, each job is described by the release time, number of operations and a vector of necessary resources. We also allow for prioritization of the jobs. Machines are described by the vector of available resources which differs from one machine to the other. Each machine can process multiple jobs at the same time provided that it has enough resources to satisfy requirements of all jobs simultaneously. The whole considered infrastructure works in the non-preemptive manner.Our goal is to create a scheduling algorithm assigning jobs to machines and deciding an order of execution. Because such scheduling problems are notoriously difficult to solve, or even to approximate the optimal solution, we divided it into two phases and used heuristics to achieve good enough solutions. To handle machine selections for incoming jobs a machine learning model was designed and trained. Approximating the best job execution order on a single machine was done basing on solutions of the bin packing problem.All presented solutions were tested on specially designed cloud computation simulator. For this purpose we also used data about real life jobs parameters from our records. Simulator was also used for training of the machine learning models.

dc.abstract.en	In this work we investigate a problem of on-line job scheduling on a heterogeneous infrastructure with multiple resources. In this setting, each job is described by the release time, number of operations and a vector of necessary resources. We also allow for prioritization of the jobs. Machines are described by the vector of available resources which differs from one machine to the other. Each machine can process multiple jobs at the same time provided that it has enough resources to satisfy requirements of all jobs simultaneously. The whole considered infrastructure works in the non-preemptive manner.Our goal is to create a scheduling algorithm assigning jobs to machines and deciding an order of execution. Because such scheduling problems are notoriously difficult to solve, or even to approximate the optimal solution, we divided it into two phases and used heuristics to achieve good enough solutions. To handle machine selections for incoming jobs a machine learning model was designed and trained. Approximating the best job execution order on a single machine was done basing on solutions of the bin packing problem.All presented solutions were tested on specially designed cloud computation simulator. For this purpose we also used data about real life jobs parameters from our records. Simulator was also used for training of the machine learning models.	pl
dc.abstract.pl	W tej pracy badamy problem schedulingu zadań on-line na heterogenicznej infrastrukturze chmurowej wyposażonej w różne zasoby. Każde zadanie jest opisane przez czas zgłoszenia, liczbę operacji, wektor opisujący konieczne zasoby i priorytet. Maszyny są opisane popprzez krotkę dostępnych zasobów, które różnią się w zależności od maszyny. Każda maszyna może przetwarzać wiele zadań jednocześnie, pod warunkiem, że dysponuje wystarczającą ilością zasobów, aby spełnić wymagania wszystkich uruchomionych zadań. Niedozwolone jest przerywanie raz rozpoczętych zadań.Naszym celem jest stworzenie algorytmu przypisującego zadania do maszyn i decydującego o kolejności ich wykonania. Ponieważ nie istnieją algorytmy rozwiązujące takie problemy w czasie wielomianowym, został on podzielony na dwie fazy i przybliżony przy użyciu heurystyk. Do wyboru maszyn dla przychodzących zadań, zaprojektowano i nauczono sieć neuronową. Rozwiązanie problemu kolejkowania zadań na jednej maszynie zostało rozwuiązane w oparciu o przybliżenia rozwiązań bin-packingu.Wszystkie prezentowane rozwiązania zostały przetestowane na specjalnie zaprojektowanym symulatorze obliczeń chmurowych. W tym celu wykorzystano również dane na temat prawdziwych zadań liczonych wczesniej na naszych maszynach. Symulator posłużył również do wytrenowania sieci neuronowych.	pl
dc.affiliation	Wydział Matematyki i Informatyki	pl
dc.area	obszar nauk ścisłych	pl
dc.contributor.advisor	Gutowski, Grzegorz	pl
dc.contributor.author	Tracz, Dawid	pl
dc.contributor.departmentbycode	UJK/WMI2	pl
dc.contributor.reviewer	Gutowski, Grzegorz	pl
dc.contributor.reviewer	Micek, Piotr - 142050	pl
dc.date.accessioned	2022-10-20T22:03:23Z
dc.date.available	2022-10-20T22:03:23Z
dc.date.submitted	2022-10-19	pl
dc.fieldofstudy	informatyka analityczna	pl
dc.identifier.apd	diploma-162740-181304	pl
dc.identifier.uri	https://ruj.uj.edu.pl/xmlui/handle/item/302251
dc.language	eng	pl
dc.subject.en	Job scheduling,Heterogeneous infrastructure,Simulations,Bin-packing,Machine learning,Policy gradient	pl
dc.subject.pl	Kolejkowanie zadań,Heterogeniczna infrastruktura,Symulacje,Bin-packing,Uczenie maszynowe,Policy gradient	pl
dc.title	Task Scheduling on a Cluster of Non-Homogoneus Machines	pl
dc.title.alternative	Kolejkowanie zadań na klastrze maszyn niejednorodnych	pl
dc.type	master	pl
dspace.entity.type	Publication

dc.abstract.enpl

In this work we investigate a problem of on-line job scheduling on a heterogeneous infrastructure with multiple resources. In this setting, each job is described by the release time, number of operations and a vector of necessary resources. We also allow for prioritization of the jobs. Machines are described by the vector of available resources which differs from one machine to the other. Each machine can process multiple jobs at the same time provided that it has enough resources to satisfy requirements of all jobs simultaneously. The whole considered infrastructure works in the non-preemptive manner.Our goal is to create a scheduling algorithm assigning jobs to machines and deciding an order of execution. Because such scheduling problems are notoriously difficult to solve, or even to approximate the optimal solution, we divided it into two phases and used heuristics to achieve good enough solutions. To handle machine selections for incoming jobs a machine learning model was designed and trained. Approximating the best job execution order on a single machine was done basing on solutions of the bin packing problem.All presented solutions were tested on specially designed cloud computation simulator. For this purpose we also used data about real life jobs parameters from our records. Simulator was also used for training of the machine learning models.

dc.abstract.plpl

W tej pracy badamy problem schedulingu zadań on-line na heterogenicznej infrastrukturze chmurowej wyposażonej w różne zasoby. Każde zadanie jest opisane przez czas zgłoszenia, liczbę operacji, wektor opisujący konieczne zasoby i priorytet. Maszyny są opisane popprzez krotkę dostępnych zasobów, które różnią się w zależności od maszyny. Każda maszyna może przetwarzać wiele zadań jednocześnie, pod warunkiem, że dysponuje wystarczającą ilością zasobów, aby spełnić wymagania wszystkich uruchomionych zadań. Niedozwolone jest przerywanie raz rozpoczętych zadań.Naszym celem jest stworzenie algorytmu przypisującego zadania do maszyn i decydującego o kolejności ich wykonania. Ponieważ nie istnieją algorytmy rozwiązujące takie problemy w czasie wielomianowym, został on podzielony na dwie fazy i przybliżony przy użyciu heurystyk. Do wyboru maszyn dla przychodzących zadań, zaprojektowano i nauczono sieć neuronową. Rozwiązanie problemu kolejkowania zadań na jednej maszynie zostało rozwuiązane w oparciu o przybliżenia rozwiązań bin-packingu.Wszystkie prezentowane rozwiązania zostały przetestowane na specjalnie zaprojektowanym symulatorze obliczeń chmurowych. W tym celu wykorzystano również dane na temat prawdziwych zadań liczonych wczesniej na naszych maszynach. Symulator posłużył również do wytrenowania sieci neuronowych.

dc.affiliationpl

Wydział Matematyki i Informatyki

dc.areapl

obszar nauk ścisłych

dc.contributor.advisorpl

Gutowski, Grzegorz

dc.contributor.authorpl

Tracz, Dawid

dc.contributor.departmentbycodepl

UJK/WMI2

dc.contributor.reviewerpl

Gutowski, Grzegorz

dc.contributor.reviewerpl

Micek, Piotr - 142050

dc.date.accessioned

2022-10-20T22:03:23Z

dc.date.available

2022-10-20T22:03:23Z

dc.date.submittedpl

2022-10-19

dc.fieldofstudypl

informatyka analityczna

dc.identifier.apdpl

diploma-162740-181304

dc.identifier.uri

https://ruj.uj.edu.pl/xmlui/handle/item/302251

dc.languagepl

eng

dc.subject.enpl

Job scheduling,Heterogeneous infrastructure,Simulations,Bin-packing,Machine learning,Policy gradient

dc.subject.plpl

Kolejkowanie zadań,Heterogeniczna infrastruktura,Symulacje,Bin-packing,Uczenie maszynowe,Policy gradient

dc.titlepl

Task Scheduling on a Cluster of Non-Homogoneus Machines

dc.title.alternativepl

Kolejkowanie zadań na klastrze maszyn niejednorodnych

dc.typepl

master

dspace.entity.type

Publication

Affiliations

No affiliation

Tracz, Dawid

Gutowski, Grzegorz

Micek, Piotr

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views

1 Views per month

Views per city

Krakow

1

No access

Collections

Masters theses