Simple view
Full metadata view
Authors
Statistics
The use of electronic historical dictionary data in corpus design
korpus tekstów
anotacja tekstu
słownik historyczny
korpus historyczny
język średniopolski
analiza gramatyczna
text corpus
text annotation
historical dictionary
historical corpus
Middle Polish
inflectional analysis
Bibliogr. s. 56
W Pracowni Historii Języka Polskiego XVII i XVIII w. Instytutu Języka Polskiego Polskiej Akademii Nauk powstają obecnie dwie obszerne bazy danych: Elektroniczny słownik języka polskiego XVII i XVIII w. oraz Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772) - ten ostatni we współpracy z Instytutem Podstaw Informatyki PAN. Połączenie tych dwóch zasobów może pomóc zrealizować cele obu projektów. Niniejszy artykuł przedstawia korzyści, jakie mogą odnieść twórcy korpusu, używając danych słownika, m.in poprzez wykorzystanie informacji gramatycznej z haseł słownika do budowy narzędzi do automatycznej anotacji tekstu.
The History of the 17th and 18th c. Polish Language Laboratory, Institute of Polish Language, Polish Academy of Sciences, is in the process of creating two large databases: The Electronic Dictionary of the 17th-18th c. Polish and The Electronic Corpus of the 17th and 18th c. Polish Texts (up to 1772), the latter in cooperation with the Institute of Computer Science, Polish Academy of Sciences. It is expected that combining these two sets of data will help to achieve the objectives established for both database projects. The present article shows the benefits that the Corpus creators can get from the data gathered in the dictionary, with special emphasis put on the use of grammatical information included in the dictionary entries to design tools for automatic text annotation in the Corpus.
cris.lastimport.wos | 2024-04-10T02:21:00Z | |
dc.abstract.en | The History of the 17th and 18th c. Polish Language Laboratory, Institute of Polish Language, Polish Academy of Sciences, is in the process of creating two large databases: The Electronic Dictionary of the 17th-18th c. Polish and The Electronic Corpus of the 17th and 18th c. Polish Texts (up to 1772), the latter in cooperation with the Institute of Computer Science, Polish Academy of Sciences. It is expected that combining these two sets of data will help to achieve the objectives established for both database projects. The present article shows the benefits that the Corpus creators can get from the data gathered in the dictionary, with special emphasis put on the use of grammatical information included in the dictionary entries to design tools for automatic text annotation in the Corpus. | pl |
dc.abstract.pl | W Pracowni Historii Języka Polskiego XVII i XVIII w. Instytutu Języka Polskiego Polskiej Akademii Nauk powstają obecnie dwie obszerne bazy danych: Elektroniczny słownik języka polskiego XVII i XVIII w. oraz Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772) - ten ostatni we współpracy z Instytutem Podstaw Informatyki PAN. Połączenie tych dwóch zasobów może pomóc zrealizować cele obu projektów. Niniejszy artykuł przedstawia korzyści, jakie mogą odnieść twórcy korpusu, używając danych słownika, m.in. poprzez wykorzystanie informacji gramatycznej z haseł słownika do budowy narzędzi do automatycznej anotacji tekstu. | pl |
dc.contributor.author | Bronikowska, Renata | pl |
dc.contributor.author | Gruszczyński, Włodzimierz | pl |
dc.contributor.author | Ogrodniczuk, Maciej | pl |
dc.contributor.author | Woliński, Marcin | pl |
dc.date.accessioned | 2019-05-22T15:05:24Z | |
dc.date.available | 2019-05-22T15:05:24Z | |
dc.date.issued | 2016 | pl |
dc.date.openaccess | 0 | |
dc.description.accesstime | w momencie opublikowania | |
dc.description.additional | Bibliogr. s. 56 | pl |
dc.description.number | 2 | pl |
dc.description.physical | 47-56 | pl |
dc.description.version | ostateczna wersja wydawcy | |
dc.description.volume | 11 | pl |
dc.identifier.doi | 10.4467/23005920SPL.16.003.4818 | pl |
dc.identifier.eissn | 2300-5920 | pl |
dc.identifier.issn | 1732-8160 | pl |
dc.identifier.project | ROD UJ / OP | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/75535 | |
dc.language | eng | pl |
dc.language.container | eng | pl |
dc.rights | Udzielam licencji. Uznanie autorstwa - Użycie niekomercyjne - Na tych samych warunkach 4.0 Międzynarodowa | * |
dc.rights.licence | CC-BY-NC-SA | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.pl | * |
dc.share.type | otwarte czasopismo | |
dc.subject.en | text corpus | pl |
dc.subject.en | text annotation | pl |
dc.subject.en | historical dictionary | pl |
dc.subject.en | historical corpus | pl |
dc.subject.en | Middle Polish | pl |
dc.subject.en | inflectional analysis | pl |
dc.subject.pl | korpus tekstów | pl |
dc.subject.pl | anotacja tekstu | pl |
dc.subject.pl | słownik historyczny | pl |
dc.subject.pl | korpus historyczny | pl |
dc.subject.pl | język średniopolski | pl |
dc.subject.pl | analiza gramatyczna | pl |
dc.subtype | Article | pl |
dc.title | The use of electronic historical dictionary data in corpus design | pl |
dc.title.journal | Studies in Polish Linguistics | pl |
dc.type | JournalArticle | pl |
dspace.entity.type | Publication |
* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.
Views
1
Views per month
Downloads
Open Access