Simple view
Full metadata view
Authors
Statistics
Zastosowanie n-gramowej analizy informacji
N-Gram-Based Techniques Applications
n-gram, modelowanie językowe, przetwarzanie języka naturalnego
n-gram, language modelling, natural language processing
W pracy przedstawiono pojęcie modelu n-gramowego oraz sposób budowania takiego modelu. Opisano historię użycia n-gramowej analizy informacji, a także wymieniono część jej współczesnych zastosowań. Przybliżono takie zastosowania jak rozpoznawanie mowy, identyfikacja autorstwa i kategoryzacja tekstów. Wykonano też eksperyment, który miał na celu zbadać skuteczność modeli n-gramowych w przewidywaniu kolejnych słów wpisywanej wiadomości e-mail. W celu ułatwienia przeprowadzenia eksperymentu, został stworzony program MailAnalyst, pozwalający na pobranie wiadomości e-mail wysłanych przez użytkownika, zbudowanie na ich podstawie modelów bi- i trigramowego oraz określenie ich skuteczności.
This master's thesis presents a concept of n-gram model and a method to build such model. It describes the history of n-gram based techniques and mentions a few of their contemporary applications. A closer look is taken at such applications as speech recognition, authorship attribution and text categorization. An experiment is performed to measure the effectiveness of n-gram models in predicting the words in an e-mail message being typed. A program called MailAnalyst was created for the purpose of conducting this experiment. The program is able to download e-mail messages that were sent by the user, build bi- and trigram models based on these messages and measure the effectiveness of the models.
dc.abstract.en | This master's thesis presents a concept of n-gram model and a method to build such model. It describes the history of n-gram based techniques and mentions a few of their contemporary applications. A closer look is taken at such applications as speech recognition, authorship attribution and text categorization. An experiment is performed to measure the effectiveness of n-gram models in predicting the words in an e-mail message being typed. A program called MailAnalyst was created for the purpose of conducting this experiment. The program is able to download e-mail messages that were sent by the user, build bi- and trigram models based on these messages and measure the effectiveness of the models. | pl |
dc.abstract.pl | W pracy przedstawiono pojęcie modelu n-gramowego oraz sposób budowania takiego modelu. Opisano historię użycia n-gramowej analizy informacji, a także wymieniono część jej współczesnych zastosowań. Przybliżono takie zastosowania jak rozpoznawanie mowy, identyfikacja autorstwa i kategoryzacja tekstów. Wykonano też eksperyment, który miał na celu zbadać skuteczność modeli n-gramowych w przewidywaniu kolejnych słów wpisywanej wiadomości e-mail. W celu ułatwienia przeprowadzenia eksperymentu, został stworzony program MailAnalyst, pozwalający na pobranie wiadomości e-mail wysłanych przez użytkownika, zbudowanie na ich podstawie modelów bi- i trigramowego oraz określenie ich skuteczności. | pl |
dc.affiliation | Wydział Fizyki, Astronomii i Informatyki Stosowanej | pl |
dc.contributor.advisor | Grzesiak-Kopeć, Katarzyna - 102580 | pl |
dc.contributor.author | Suwiński, Krzysztof | pl |
dc.contributor.departmentbycode | UJK/WFAIS | pl |
dc.contributor.reviewer | Białas, Piotr - 127296 | pl |
dc.contributor.reviewer | Grzesiak-Kopeć, Katarzyna - 102580 | pl |
dc.date.accessioned | 2020-07-24T21:29:26Z | |
dc.date.available | 2020-07-24T21:29:26Z | |
dc.date.submitted | 2013-10-17 | pl |
dc.fieldofstudy | informatyka stosowana | pl |
dc.identifier.apd | diploma-83125-80657 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/192602 | |
dc.language | pol | pl |
dc.subject.en | n-gram, language modelling, natural language processing | pl |
dc.subject.pl | n-gram, modelowanie językowe, przetwarzanie języka naturalnego | pl |
dc.title | Zastosowanie n-gramowej analizy informacji | pl |
dc.title.alternative | N-Gram-Based Techniques Applications | pl |
dc.type | master | pl |
dspace.entity.type | Publication |