Simple view
Full metadata view
Authors
Statistics
Rozpoznawanie liter na zdjęciach za pomocą sieci neuronowych
Identifying letters in photos using neural networks
Python, sieci konwolucyjne, Keras, sieci neuronowe
Python, convolutional network, Keras, neural network
Celem pracy magisterskiej było stworzenie programu znajdującego litery na zdjęciach oraz rozpoznawanie ich. Hipotezą, którą chcemy sprawdzić w tej pracy, jest stwierdzenie, że jest możliwe wykrywanie liter na podstawie prawdopodobieństwa. Zakłada się, że w klatkach obejmujących jedną literę prawdopodobieństwo to będzie wysokie. Natomiast klatki obejmujące więcej niż jedną literę cechować się będą niskim prawdopodobieństwem.Projekt składał się z czterech etapów i został stworzony przy użyciu języka Python oraz biblioteki Keras z pakietu Tensorflow. Pierwszym było stworzenie odpowiednich modeli. Do następnego etapu należały czynności związane z trenowaniem modelu na zbiorze treningowym. Kolejnym etapem było sprawdzenie skuteczności wytrenowanego modelu na początku na wygenerowanych obrazach przedstawiających wybrany tekst. Obrazy zostały podzielone na klatki o wymiarach 32 x 32 piksele i kolejno były danymi wejściowymi dla stworzonych w pierwszej części modeli. Ostatecznym etapem było przetestowanie modelu na zdjęciach wydrukowanego tekstu, taką samą metodą jak w kroku trzecim. Z uwagi na wysoką pewność modelu co do rozpoznanych liter, tego procesu nie da się zautomatyzować.
The aim of the master's thesis was to create a program to find letters in photos and recognizing them.The hypothesis we want to test in this paper is that it is possible to detect letters based on probability. In frames with a single letter, this probability is assumed to be high. In contrast, frames with more than one letter will have a low probability.The project consisted of four stages and was created using the Python language and the Keras library from the Tensorflow package. The first was to create the right models. The activities related to training the model on the training set belonged to the next stage. The next step was to check the effectiveness of the trained model at the beginning on the generated images representing the selected text. The images were divided into frames with dimensions of 32 x 32 pixels and were subsequently the input data for the models created in the first part. The final step was to test the model on the photos of the printed text, using the same method as in step three. Due to the high certainty of the model as to the recognized letters, this process cannot be automated.
dc.abstract.en | The aim of the master's thesis was to create a program to find letters in photos and recognizing them.The hypothesis we want to test in this paper is that it is possible to detect letters based on probability. In frames with a single letter, this probability is assumed to be high. In contrast, frames with more than one letter will have a low probability.The project consisted of four stages and was created using the Python language and the Keras library from the Tensorflow package. The first was to create the right models. The activities related to training the model on the training set belonged to the next stage. The next step was to check the effectiveness of the trained model at the beginning on the generated images representing the selected text. The images were divided into frames with dimensions of 32 x 32 pixels and were subsequently the input data for the models created in the first part. The final step was to test the model on the photos of the printed text, using the same method as in step three. Due to the high certainty of the model as to the recognized letters, this process cannot be automated. | pl |
dc.abstract.pl | Celem pracy magisterskiej było stworzenie programu znajdującego litery na zdjęciach oraz rozpoznawanie ich. Hipotezą, którą chcemy sprawdzić w tej pracy, jest stwierdzenie, że jest możliwe wykrywanie liter na podstawie prawdopodobieństwa. Zakłada się, że w klatkach obejmujących jedną literę prawdopodobieństwo to będzie wysokie. Natomiast klatki obejmujące więcej niż jedną literę cechować się będą niskim prawdopodobieństwem.Projekt składał się z czterech etapów i został stworzony przy użyciu języka Python oraz biblioteki Keras z pakietu Tensorflow. Pierwszym było stworzenie odpowiednich modeli. Do następnego etapu należały czynności związane z trenowaniem modelu na zbiorze treningowym. Kolejnym etapem było sprawdzenie skuteczności wytrenowanego modelu na początku na wygenerowanych obrazach przedstawiających wybrany tekst. Obrazy zostały podzielone na klatki o wymiarach 32 x 32 piksele i kolejno były danymi wejściowymi dla stworzonych w pierwszej części modeli. Ostatecznym etapem było przetestowanie modelu na zdjęciach wydrukowanego tekstu, taką samą metodą jak w kroku trzecim. Z uwagi na wysoką pewność modelu co do rozpoznanych liter, tego procesu nie da się zautomatyzować. | pl |
dc.affiliation | Uniwersytet Jagielloński w Krakowie | pl |
dc.contributor.advisor | Białas, Piotr - 127296 | pl |
dc.contributor.author | Szarek, Filip | pl |
dc.contributor.departmentbycode | UJK/UJK | pl |
dc.contributor.reviewer | Przystalski, Karol - 126070 | pl |
dc.contributor.reviewer | Białas, Piotr - 127296 | pl |
dc.date.accessioned | 2021-11-29T22:38:53Z | |
dc.date.available | 2021-11-29T22:38:53Z | |
dc.date.submitted | 2021-11-29 | pl |
dc.fieldofstudy | informatyka gier komputerowych | pl |
dc.identifier.apd | diploma-152506-177043 | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/284524 | |
dc.language | pol | pl |
dc.subject.en | Python, convolutional network, Keras, neural network | pl |
dc.subject.pl | Python, sieci konwolucyjne, Keras, sieci neuronowe | pl |
dc.title | Rozpoznawanie liter na zdjęciach za pomocą sieci neuronowych | pl |
dc.title.alternative | Identifying letters in photos using neural networks | pl |
dc.type | master | pl |
dspace.entity.type | Publication |