Simple view
Full metadata view
Authors
Statistics
Analiza danych dzwiekow miejskich metodami uczenia maszynowego
Data analysis of urban sounds using machine learning methods
Uczenie maszynowe, sztuczne sieci neuronowe, splotowe sieci neuronowe, konwolucyjne sieci neuronowe, analiza dźwięków, generacja syntetycznych próbek, spektrogram, dźwięki miejskie, transformacja Fouriera, skala melowa, perceptron, postać fali dźwiękowej, funkcja aktywacyjna, klasyfikacja dźwięków miejskich, syntetyczne dane, Python, Keras, Tensorflow, MUDA, librosa, Jupyter Notebook, CNN, ANN
Machine learning, artificial neural networks, convolutional neural networks, convolutional neural networks, sound analysis, data augmentation, spectrogram, urban sounds, Fourier transform, mel-scale, perceptron, audio waveform, activation function, urban sound classification, Environmental Sound Classification, Python, Keras, Tensorflow, MUDA, librosa, Jupyter Notebook, CNN, ANN
Praca licencjacka zawiera analizę danych dźwięków miejskich należących do odpowiednich kategorii i przedstawia modele sieci neuronowych będące w stanie je sklasyfikować.We wstępie zaprezentowany został użyty zbiór danych oraz ukazane zostały jego cechy charakterystyczne. Przedstawiono etapy wstępnego przetwarzania plików audio, umożliwiające uzyskanie reprezentacji nadającej się do trenowania modeli. Wyjaśniona została postać dźwięków w poszczególnych fazach transformacji. W pracy opisane zostały podstawowe pojęcia związane z zagadnieniem sztucznych sieci neuronowych, splotowych sieci neuronowych oraz ich parametrów. Przedstawione zostały modele uczenia maszynowego, użyte w celach klasyfikacji dźwięków miejskich. Ich architektura, wzorowana na wcześniejszych pracach, zilustrowana została na odpowiednich rysunkach oraz została opisana w tekście. Zaprezentowany został proces generacji syntetycznych danych, w celu powiększenia zbioru treningowego, służący uzyskaniu lepszych osiągów poszczególnych modeli. W końcowej części pracy ukazane zostały możliwe rozszerzenia projektu oraz moje obserwacje przy próbach ich zastosowania.Wszystkie wykorzystane w pracy programy zostały napisane w języku Python oraz przy użyciu narzędzia Jupyter Notebook.
The bachelor’s thesis includes analysis of urban sounds which belong to appropriate categories and presents neural networks models, which can classify them. The introduction presents the dataset used and its characteristic features. The stages of pre-processing of audio files are presented, which enable to obtain a representation suitable for model training. The form of sounds in particular phases of transformation is explained.The thesis describes the basic concepts related to the issue of artificial neural networks, convolutional neural networks, and their parameters.Machine learning models used for the classification of urban sounds are presented. Their architecture, modelled on other papers, are illustrated on the relevant drawings, and described in the text.The process of generating synthetic data is presented to increase the training set, and to obtain better performance of individual models.In the final part of the work, possible extensions to the project and my observations on their application are presented.All the programs used at work are written in Python and with use of the Jupyter Notebook tool.
dc.abstract.en | The bachelor’s thesis includes analysis of urban sounds which belong to appropriate categories and presents neural networks models, which can classify them. The introduction presents the dataset used and its characteristic features. The stages of pre-processing of audio files are presented, which enable to obtain a representation suitable for model training. The form of sounds in particular phases of transformation is explained.The thesis describes the basic concepts related to the issue of artificial neural networks, convolutional neural networks, and their parameters.Machine learning models used for the classification of urban sounds are presented. Their architecture, modelled on other papers, are illustrated on the relevant drawings, and described in the text.The process of generating synthetic data is presented to increase the training set, and to obtain better performance of individual models.In the final part of the work, possible extensions to the project and my observations on their application are presented.All the programs used at work are written in Python and with use of the Jupyter Notebook tool. | pl |
dc.abstract.pl | Praca licencjacka zawiera analizę danych dźwięków miejskich należących do odpowiednich kategorii i przedstawia modele sieci neuronowych będące w stanie je sklasyfikować.We wstępie zaprezentowany został użyty zbiór danych oraz ukazane zostały jego cechy charakterystyczne. Przedstawiono etapy wstępnego przetwarzania plików audio, umożliwiające uzyskanie reprezentacji nadającej się do trenowania modeli. Wyjaśniona została postać dźwięków w poszczególnych fazach transformacji. W pracy opisane zostały podstawowe pojęcia związane z zagadnieniem sztucznych sieci neuronowych, splotowych sieci neuronowych oraz ich parametrów. Przedstawione zostały modele uczenia maszynowego, użyte w celach klasyfikacji dźwięków miejskich. Ich architektura, wzorowana na wcześniejszych pracach, zilustrowana została na odpowiednich rysunkach oraz została opisana w tekście. Zaprezentowany został proces generacji syntetycznych danych, w celu powiększenia zbioru treningowego, służący uzyskaniu lepszych osiągów poszczególnych modeli. W końcowej części pracy ukazane zostały możliwe rozszerzenia projektu oraz moje obserwacje przy próbach ich zastosowania.Wszystkie wykorzystane w pracy programy zostały napisane w języku Python oraz przy użyciu narzędzia Jupyter Notebook. | pl |
dc.affiliation | Wydział Fizyki, Astronomii i Informatyki Stosowanej | pl |
dc.area | obszar nauk ścisłych | pl |
dc.contributor.advisor | Richter-Wąs, Elżbieta - 131657 | pl |
dc.contributor.author | Przemielewski, Piotr | pl |
dc.contributor.departmentbycode | UJK/WFAIS | pl |
dc.contributor.reviewer | Richter-Wąs, Elżbieta - 131657 | pl |
dc.contributor.reviewer | Białas, Piotr - 127296 | pl |
dc.date.accessioned | 2021-07-01T22:01:05Z | |
dc.date.available | 2021-07-01T22:01:05Z | |
dc.date.submitted | 2021-07-01 | pl |
dc.fieldofstudy | informatyka | pl |
dc.identifier.apd | diploma-149847-261696 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/276033 | |
dc.language | pol | pl |
dc.subject.en | Machine learning, artificial neural networks, convolutional neural networks, convolutional neural networks, sound analysis, data augmentation, spectrogram, urban sounds, Fourier transform, mel-scale, perceptron, audio waveform, activation function, urban sound classification, Environmental Sound Classification, Python, Keras, Tensorflow, MUDA, librosa, Jupyter Notebook, CNN, ANN | pl |
dc.subject.pl | Uczenie maszynowe, sztuczne sieci neuronowe, splotowe sieci neuronowe, konwolucyjne sieci neuronowe, analiza dźwięków, generacja syntetycznych próbek, spektrogram, dźwięki miejskie, transformacja Fouriera, skala melowa, perceptron, postać fali dźwiękowej, funkcja aktywacyjna, klasyfikacja dźwięków miejskich, syntetyczne dane, Python, Keras, Tensorflow, MUDA, librosa, Jupyter Notebook, CNN, ANN | pl |
dc.title | Analiza danych dzwiekow miejskich metodami uczenia maszynowego | pl |
dc.title.alternative | Data analysis of urban sounds using machine learning methods | pl |
dc.type | licenciate | pl |
dspace.entity.type | Publication |