Aplikacja rozszerzonej rzeczywistości w systemie Android

Ziobro, Rafał

Simple view

Full metadata view

Authors

Statistics

Aplikacja rozszerzonej rzeczywistości w systemie Android

licenciate

Alternative title

Augmented reality android application

Author

Ziobro Rafał

Reviewer

Surówka Grzegorz

Oramus Piotr

Advisor

Surówka Grzegorz

Date of defence

2019-09-25

Keywords in Polish

informatyka, język Java, aplikacja na system Android, OCR, kamera API, wizja komputerowa, test biblioteki, uczenie maszynowe

Keywords in English

IT, Java, Android application, OCR, API camera, computer vision, library test, machine learning

Language

Polish

Abstract in Polish

Głównym celem pracy licencjacka jest stworzenie aplikacji w systemie Android, która będzie rozpoznawać przystanki MPK w Krakowie.Z tego powodu były testowane i oceniane możliwości wykorzystania API kamery, API OCR, API wizji komputerowej i API uczenia maszynowego.Spośród API kamery przetestowano: Camera API, Camera2 API i CameraKit. Pod uwagę brane były zdolności do wyświetlania obrazu na ekranie smartfona, kontrolowania zoomu i latarki oraz tworzenia zdjęć. W aplikacji została zaimplementowana Camera2 API, ponieważ z jej pomocą udało spełnić powyższe wymagania.W testach API OCR użyto bibliotek Tesseract i Mobile Vision. Do testowania obu bibliotek użyto tekst o długości 100 słów w języku polskim. W testach tych bibliotek celem było wyznaczenie skrajnych warunków (niekorzytny kąt, słaba rozdzielczość, kiepski oświetlenie, brak wyostrzenia), w których potrafiły odczytać tekst. W aplikacji zaimplementowano Mobile Vision, która najlepiej poradziła sobie w testach.Celem wizji komputerowej była poprawa jakości obrazu dla narzędzi OCR. Do testowania metod wizji komputerowej użyto bibliotekę OpenCV. Pod uwagę wzięto metody zmieniające kontrast, jasność, korekcję gamma, adaptacyjne progowanie, wyrównanie histogramowe oraz kilka filtrów.Owe metody testowano na obrazach dobrze oświetlonych, słabo oświetlonych z tekstem wyostrzonym i tekstem niewyostrzonym. Małą poprawę dawały metody zmieniające kontrast, jasność i korekcję gamma w obrazach ze słabym oświetleniem i wyostrzonym tekstem. W pozostałych przypadkach żadna metoda nie dawała poprawy. W aplikacji nie użyto żadnych metod wizji komputerowej.W ostatniej części przedstawiono zrzuty ekranu z działającej aplikacji.

Abstract in English

The main goal of the bachelor's thesis is to create an application in Android, which will recognize MPK stops in Krakow. For this reason, the possibilities of using API camera, API OCR, API computer vision and API machine learning were tested and evaluated.Among API cameras were tested: Camera API, Camera2 API and CameraKit. The capabilities of displaying images on a smartphone screen, controlling zoom and flashlight and creating photos were taken into account. Camera2 API was implemented in the application, because with its help it managed to meet the above requirements.Tesseract and Mobile Vision libraries were used in OCR API tests. To test both libraries a text of 100 words in Polish was used. In the tests of these libraries the aim was to determine the extreme conditions (unfavorable angle, poor resolution, poor lighting, lack of sharpness) in which they could read the text. Mobile Vision was implemented in the application, which did the best in the tests.The aim of the computer vision was to improve the image quality for OCR tools. The OpenCV library was used to test the methods of computer vision. We took into account methods changing contrast, brightness, gamma correction, adaptive threshold, histogram compensation and several filters.These methods were tested on focused and unfocused images that were well lit, poorly lit. The methods changing contrast, brightness and gamma correction in images with low light and sharpened text resulted in a slight improvement. In other cases, none of the methods provided improvement. No methods of computer vision were used in the application.The last section shows screenshots from a running application.

dc.abstract.en	The main goal of the bachelor's thesis is to create an application in Android, which will recognize MPK stops in Krakow. For this reason, the possibilities of using API camera, API OCR, API computer vision and API machine learning were tested and evaluated.Among API cameras were tested: Camera API, Camera2 API and CameraKit. The capabilities of displaying images on a smartphone screen, controlling zoom and flashlight and creating photos were taken into account. Camera2 API was implemented in the application, because with its help it managed to meet the above requirements.Tesseract and Mobile Vision libraries were used in OCR API tests. To test both libraries a text of 100 words in Polish was used. In the tests of these libraries the aim was to determine the extreme conditions (unfavorable angle, poor resolution, poor lighting, lack of sharpness) in which they could read the text. Mobile Vision was implemented in the application, which did the best in the tests.The aim of the computer vision was to improve the image quality for OCR tools. The OpenCV library was used to test the methods of computer vision. We took into account methods changing contrast, brightness, gamma correction, adaptive threshold, histogram compensation and several filters.These methods were tested on focused and unfocused images that were well lit, poorly lit. The methods changing contrast, brightness and gamma correction in images with low light and sharpened text resulted in a slight improvement. In other cases, none of the methods provided improvement. No methods of computer vision were used in the application.The last section shows screenshots from a running application.	pl
dc.abstract.pl	Głównym celem pracy licencjacka jest stworzenie aplikacji w systemie Android, która będzie rozpoznawać przystanki MPK w Krakowie.Z tego powodu były testowane i oceniane możliwości wykorzystania API kamery, API OCR, API wizji komputerowej i API uczenia maszynowego.Spośród API kamery przetestowano: Camera API, Camera2 API i CameraKit. Pod uwagę brane były zdolności do wyświetlania obrazu na ekranie smartfona, kontrolowania zoomu i latarki oraz tworzenia zdjęć. W aplikacji została zaimplementowana Camera2 API, ponieważ z jej pomocą udało spełnić powyższe wymagania.W testach API OCR użyto bibliotek Tesseract i Mobile Vision. Do testowania obu bibliotek użyto tekst o długości 100 słów w języku polskim. W testach tych bibliotek celem było wyznaczenie skrajnych warunków (niekorzytny kąt, słaba rozdzielczość, kiepski oświetlenie, brak wyostrzenia), w których potrafiły odczytać tekst. W aplikacji zaimplementowano Mobile Vision, która najlepiej poradziła sobie w testach.Celem wizji komputerowej była poprawa jakości obrazu dla narzędzi OCR. Do testowania metod wizji komputerowej użyto bibliotekę OpenCV. Pod uwagę wzięto metody zmieniające kontrast, jasność, korekcję gamma, adaptacyjne progowanie, wyrównanie histogramowe oraz kilka filtrów.Owe metody testowano na obrazach dobrze oświetlonych, słabo oświetlonych z tekstem wyostrzonym i tekstem niewyostrzonym. Małą poprawę dawały metody zmieniające kontrast, jasność i korekcję gamma w obrazach ze słabym oświetleniem i wyostrzonym tekstem. W pozostałych przypadkach żadna metoda nie dawała poprawy. W aplikacji nie użyto żadnych metod wizji komputerowej.W ostatniej części przedstawiono zrzuty ekranu z działającej aplikacji.	pl
dc.affiliation	Wydział Fizyki, Astronomii i Informatyki Stosowanej	pl
dc.area	obszar nauk ścisłych	pl
dc.contributor.advisor	Surówka, Grzegorz - 100453	pl
dc.contributor.author	Ziobro, Rafał	pl
dc.contributor.departmentbycode	UJK/WFAIS	pl
dc.contributor.reviewer	Surówka, Grzegorz - 100453	pl
dc.contributor.reviewer	Oramus, Piotr - 100396	pl
dc.date.accessioned	2020-07-28T00:37:44Z
dc.date.available	2020-07-28T00:37:44Z
dc.date.submitted	2019-09-25	pl
dc.fieldofstudy	informatyka	pl
dc.identifier.apd	diploma-133394-164792	pl
dc.identifier.project	APD / O	pl
dc.identifier.uri	https://ruj.uj.edu.pl/xmlui/handle/item/235709
dc.language	pol	pl
dc.subject.en	IT, Java, Android application, OCR, API camera, computer vision, library test, machine learning	pl
dc.subject.pl	informatyka, język Java, aplikacja na system Android, OCR, kamera API, wizja komputerowa, test biblioteki, uczenie maszynowe	pl
dc.title	Aplikacja rozszerzonej rzeczywistości w systemie Android	pl
dc.title.alternative	Augmented reality android application	pl
dc.type	licenciate	pl
dspace.entity.type	Publication

dc.abstract.enpl

The main goal of the bachelor's thesis is to create an application in Android, which will recognize MPK stops in Krakow. For this reason, the possibilities of using API camera, API OCR, API computer vision and API machine learning were tested and evaluated.Among API cameras were tested: Camera API, Camera2 API and CameraKit. The capabilities of displaying images on a smartphone screen, controlling zoom and flashlight and creating photos were taken into account. Camera2 API was implemented in the application, because with its help it managed to meet the above requirements.Tesseract and Mobile Vision libraries were used in OCR API tests. To test both libraries a text of 100 words in Polish was used. In the tests of these libraries the aim was to determine the extreme conditions (unfavorable angle, poor resolution, poor lighting, lack of sharpness) in which they could read the text. Mobile Vision was implemented in the application, which did the best in the tests.The aim of the computer vision was to improve the image quality for OCR tools. The OpenCV library was used to test the methods of computer vision. We took into account methods changing contrast, brightness, gamma correction, adaptive threshold, histogram compensation and several filters.These methods were tested on focused and unfocused images that were well lit, poorly lit. The methods changing contrast, brightness and gamma correction in images with low light and sharpened text resulted in a slight improvement. In other cases, none of the methods provided improvement. No methods of computer vision were used in the application.The last section shows screenshots from a running application.

dc.abstract.plpl

Głównym celem pracy licencjacka jest stworzenie aplikacji w systemie Android, która będzie rozpoznawać przystanki MPK w Krakowie.Z tego powodu były testowane i oceniane możliwości wykorzystania API kamery, API OCR, API wizji komputerowej i API uczenia maszynowego.Spośród API kamery przetestowano: Camera API, Camera2 API i CameraKit. Pod uwagę brane były zdolności do wyświetlania obrazu na ekranie smartfona, kontrolowania zoomu i latarki oraz tworzenia zdjęć. W aplikacji została zaimplementowana Camera2 API, ponieważ z jej pomocą udało spełnić powyższe wymagania.W testach API OCR użyto bibliotek Tesseract i Mobile Vision. Do testowania obu bibliotek użyto tekst o długości 100 słów w języku polskim. W testach tych bibliotek celem było wyznaczenie skrajnych warunków (niekorzytny kąt, słaba rozdzielczość, kiepski oświetlenie, brak wyostrzenia), w których potrafiły odczytać tekst. W aplikacji zaimplementowano Mobile Vision, która najlepiej poradziła sobie w testach.Celem wizji komputerowej była poprawa jakości obrazu dla narzędzi OCR. Do testowania metod wizji komputerowej użyto bibliotekę OpenCV. Pod uwagę wzięto metody zmieniające kontrast, jasność, korekcję gamma, adaptacyjne progowanie, wyrównanie histogramowe oraz kilka filtrów.Owe metody testowano na obrazach dobrze oświetlonych, słabo oświetlonych z tekstem wyostrzonym i tekstem niewyostrzonym. Małą poprawę dawały metody zmieniające kontrast, jasność i korekcję gamma w obrazach ze słabym oświetleniem i wyostrzonym tekstem. W pozostałych przypadkach żadna metoda nie dawała poprawy. W aplikacji nie użyto żadnych metod wizji komputerowej.W ostatniej części przedstawiono zrzuty ekranu z działającej aplikacji.

dc.affiliationpl

Wydział Fizyki, Astronomii i Informatyki Stosowanej

dc.areapl

obszar nauk ścisłych

dc.contributor.advisorpl

Surówka, Grzegorz - 100453

dc.contributor.authorpl

Ziobro, Rafał

dc.contributor.departmentbycodepl

UJK/WFAIS

dc.contributor.reviewerpl

Surówka, Grzegorz - 100453

dc.contributor.reviewerpl

Oramus, Piotr - 100396

dc.date.accessioned

2020-07-28T00:37:44Z

dc.date.available

2020-07-28T00:37:44Z

dc.date.submittedpl

2019-09-25

dc.fieldofstudypl

informatyka

dc.identifier.apdpl

diploma-133394-164792

dc.identifier.projectpl

APD / O

dc.identifier.uri

https://ruj.uj.edu.pl/xmlui/handle/item/235709

dc.languagepl

pol

dc.subject.enpl

IT, Java, Android application, OCR, API camera, computer vision, library test, machine learning

dc.subject.plpl

informatyka, język Java, aplikacja na system Android, OCR, kamera API, wizja komputerowa, test biblioteki, uczenie maszynowe

dc.titlepl

Aplikacja rozszerzonej rzeczywistości w systemie Android

dc.title.alternativepl

Augmented reality android application

dc.typepl

licenciate

dspace.entity.type

Publication

Affiliations

No affiliation

Ziobro, Rafał

Surówka, Grzegorz

Oramus, Piotr

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views

29 Views per month

Views per city

Warsaw

9

Wroclaw

4

Ashburn

2

Krakow

2

Bogotá

1

Dublin

1

Kwidzyn

1

Lublin

1

Obryte

1

Poznan

1

No access

Collections

Bachelor's theses

ROD UJ