The use of electronic historical dictionary data in corpus design

2016
journal article
article
cris.lastimport.wos2024-04-10T02:21:00Z
dc.abstract.enThe History of the 17th and 18th c. Polish Language Laboratory, Institute of Polish Language, Polish Academy of Sciences, is in the process of creating two large databases: The Electronic Dictionary of the 17th-18th c. Polish and The Electronic Corpus of the 17th and 18th c. Polish Texts (up to 1772), the latter in cooperation with the Institute of Computer Science, Polish Academy of Sciences. It is expected that combining these two sets of data will help to achieve the objectives established for both database projects. The present article shows the benefits that the Corpus creators can get from the data gathered in the dictionary, with special emphasis put on the use of grammatical information included in the dictionary entries to design tools for automatic text annotation in the Corpus.pl
dc.abstract.plW Pracowni Historii Języka Polskiego XVII i XVIII w. Instytutu Języka Polskiego Polskiej Akademii Nauk powstają obecnie dwie obszerne bazy danych: Elektroniczny słownik języka polskiego XVII i XVIII w. oraz Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772) - ten ostatni we współpracy z Instytutem Podstaw Informatyki PAN. Połączenie tych dwóch zasobów może pomóc zrealizować cele obu projektów. Niniejszy artykuł przedstawia korzyści, jakie mogą odnieść twórcy korpusu, używając danych słownika, m.in. poprzez wykorzystanie informacji gramatycznej z haseł słownika do budowy narzędzi do automatycznej anotacji tekstu.pl
dc.contributor.authorBronikowska, Renatapl
dc.contributor.authorGruszczyński, Włodzimierzpl
dc.contributor.authorOgrodniczuk, Maciejpl
dc.contributor.authorWoliński, Marcinpl
dc.date.accessioned2019-05-22T15:05:24Z
dc.date.available2019-05-22T15:05:24Z
dc.date.issued2016pl
dc.date.openaccess0
dc.description.accesstimew momencie opublikowania
dc.description.additionalBibliogr. s. 56pl
dc.description.number2pl
dc.description.physical47-56pl
dc.description.versionostateczna wersja wydawcy
dc.description.volume11pl
dc.identifier.doi10.4467/23005920SPL.16.003.4818pl
dc.identifier.eissn2300-5920pl
dc.identifier.issn1732-8160pl
dc.identifier.projectROD UJ / OPpl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/75535
dc.languageengpl
dc.language.containerengpl
dc.rightsUdzielam licencji. Uznanie autorstwa - Użycie niekomercyjne - Na tych samych warunkach 4.0 Międzynarodowa*
dc.rights.licenceCC-BY-NC-SA
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.pl*
dc.share.typeotwarte czasopismo
dc.subject.entext corpuspl
dc.subject.entext annotationpl
dc.subject.enhistorical dictionarypl
dc.subject.enhistorical corpuspl
dc.subject.enMiddle Polishpl
dc.subject.eninflectional analysispl
dc.subject.plkorpus tekstówpl
dc.subject.planotacja tekstupl
dc.subject.plsłownik historycznypl
dc.subject.plkorpus historycznypl
dc.subject.pljęzyk średniopolskipl
dc.subject.planaliza gramatycznapl
dc.subtypeArticlepl
dc.titleThe use of electronic historical dictionary data in corpus designpl
dc.title.journalStudies in Polish Linguisticspl
dc.typeJournalArticlepl
dspace.entity.typePublication
cris.lastimport.wos
2024-04-10T02:21:00Z
dc.abstract.enpl
The History of the 17th and 18th c. Polish Language Laboratory, Institute of Polish Language, Polish Academy of Sciences, is in the process of creating two large databases: The Electronic Dictionary of the 17th-18th c. Polish and The Electronic Corpus of the 17th and 18th c. Polish Texts (up to 1772), the latter in cooperation with the Institute of Computer Science, Polish Academy of Sciences. It is expected that combining these two sets of data will help to achieve the objectives established for both database projects. The present article shows the benefits that the Corpus creators can get from the data gathered in the dictionary, with special emphasis put on the use of grammatical information included in the dictionary entries to design tools for automatic text annotation in the Corpus.
dc.abstract.plpl
W Pracowni Historii Języka Polskiego XVII i XVIII w. Instytutu Języka Polskiego Polskiej Akademii Nauk powstają obecnie dwie obszerne bazy danych: Elektroniczny słownik języka polskiego XVII i XVIII w. oraz Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772) - ten ostatni we współpracy z Instytutem Podstaw Informatyki PAN. Połączenie tych dwóch zasobów może pomóc zrealizować cele obu projektów. Niniejszy artykuł przedstawia korzyści, jakie mogą odnieść twórcy korpusu, używając danych słownika, m.in. poprzez wykorzystanie informacji gramatycznej z haseł słownika do budowy narzędzi do automatycznej anotacji tekstu.
dc.contributor.authorpl
Bronikowska, Renata
dc.contributor.authorpl
Gruszczyński, Włodzimierz
dc.contributor.authorpl
Ogrodniczuk, Maciej
dc.contributor.authorpl
Woliński, Marcin
dc.date.accessioned
2019-05-22T15:05:24Z
dc.date.available
2019-05-22T15:05:24Z
dc.date.issuedpl
2016
dc.date.openaccess
0
dc.description.accesstime
w momencie opublikowania
dc.description.additionalpl
Bibliogr. s. 56
dc.description.numberpl
2
dc.description.physicalpl
47-56
dc.description.version
ostateczna wersja wydawcy
dc.description.volumepl
11
dc.identifier.doipl
10.4467/23005920SPL.16.003.4818
dc.identifier.eissnpl
2300-5920
dc.identifier.issnpl
1732-8160
dc.identifier.projectpl
ROD UJ / OP
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/75535
dc.languagepl
eng
dc.language.containerpl
eng
dc.rights*
Udzielam licencji. Uznanie autorstwa - Użycie niekomercyjne - Na tych samych warunkach 4.0 Międzynarodowa
dc.rights.licence
CC-BY-NC-SA
dc.rights.uri*
http://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.pl
dc.share.type
otwarte czasopismo
dc.subject.enpl
text corpus
dc.subject.enpl
text annotation
dc.subject.enpl
historical dictionary
dc.subject.enpl
historical corpus
dc.subject.enpl
Middle Polish
dc.subject.enpl
inflectional analysis
dc.subject.plpl
korpus tekstów
dc.subject.plpl
anotacja tekstu
dc.subject.plpl
słownik historyczny
dc.subject.plpl
korpus historyczny
dc.subject.plpl
język średniopolski
dc.subject.plpl
analiza gramatyczna
dc.subtypepl
Article
dc.titlepl
The use of electronic historical dictionary data in corpus design
dc.title.journalpl
Studies in Polish Linguistics
dc.typepl
JournalArticle
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
1
Views per month
Downloads
bronikowska_gruszczynski_ogrodniczuk_wolinski_the_use_of_electronic_historical_dictionary_data_2016.odt
11
bronikowska_gruszczynski_ogrodniczuk_wolinski_the_use_of_electronic_historical_dictionary_data_2016.pdf
5