Simple view
Full metadata view
Authors
Statistics
Success rates in most-frequent-word-based authorship attribution : a case study of 1000 Polish novels from Ignacy Krasicki to Jerzy Pilch
analiza wielowymiarowa
atrybucja autorska
literatura polska
stylometria
multivariate analysis
authorship contribution
Polish literature
stylometry
Bibliogr. s. 103-104
W artykule zbadano skuteczność atrybucji autorskiej opartej na wielowymiarowej analizie najczęstszych słów w korpusie 1000 powieści polskich napisanych między końcem XVIII i początkiem XXI wieku. Oceniono wpływ liczby autorów i/lub tekstów na uzyskane wyniki. Porównano skuteczność atrybucji w niniejszej pracy z wynikami uzyskanymi we wcześniejszych opracowaniach wykorzystujących mniejsze korpusy – a więc te, które mogły nie wykazywać regularnych prawidłowości pod tym względem. Wykazano, że w dużych kolekcjach tekstów sprawdzają się intuicyjne przypuszczenia: 1) im więcej autorów, tym trudniej o skuteczną atrybucję; 2) przy tej samej liczbie autorów liczba tekstów nie ma wpływu na skuteczność atrybucji.
The success rate of authorship attribution by multivariate analysis of most-frequent-word frequencies is studied in a 1000-novel corpus of Polish literary works from the late 18th to the early 21st century. The results are examined for possible influences of the number of authors and/or the number of texts to be attributed. Also, the success rates achieved in this study are compared to those obtained in earlier studies for smaller corpora, too small perhaps to produce regular patterns. This study shows that text sets of this size confirm the intuitive predictions as to those influences: 1) the more authors, the less successful attribution; 2) for the same number of authors, the number of texts to be attributed does not influence success rate.
dc.abstract.en | The success rate of authorship attribution by multivariate analysis of most-frequent-word frequencies is studied in a 1000-novel corpus of Polish literary works from the late 18th to the early 21st century. The results are examined for possible influences of the number of authors and/or the number of texts to be attributed. Also, the success rates achieved in this study are compared to those obtained in earlier studies for smaller corpora, too small perhaps to produce regular patterns. This study shows that text sets of this size confirm the intuitive predictions as to those influences: 1) the more authors, the less successful attribution; 2) for the same number of authors, the number of texts to be attributed does not influence success rate. | |
dc.abstract.pl | W artykule zbadano skuteczność atrybucji autorskiej opartej na wielowymiarowej analizie najczęstszych słów w korpusie 1000 powieści polskich napisanych między końcem XVIII i początkiem XXI wieku. Oceniono wpływ liczby autorów i/lub tekstów na uzyskane wyniki. Porównano skuteczność atrybucji w niniejszej pracy z wynikami uzyskanymi we wcześniejszych opracowaniach wykorzystujących mniejsze korpusy – a więc te, które mogły nie wykazywać regularnych prawidłowości pod tym względem. Wykazano, że w dużych kolekcjach tekstów sprawdzają się intuicyjne przypuszczenia: 1) im więcej autorów, tym trudniej o skuteczną atrybucję; 2) przy tej samej liczbie autorów liczba tekstów nie ma wpływu na skuteczność atrybucji. | pl |
dc.affiliation | Wydział Filologiczny : Instytut Filologii Angielskiej | pl |
dc.contributor.author | Rybicki, Jan - 214316 | pl |
dc.date.accessioned | 2016-03-18T15:53:17Z | |
dc.date.available | 2016-03-18T15:53:17Z | |
dc.date.issued | 2015 | pl |
dc.date.openaccess | 0 | |
dc.description.accesstime | w momencie opublikowania | |
dc.description.additional | Bibliogr. s. 103-104 | pl |
dc.description.number | 2 | pl |
dc.description.physical | 87-104 | pl |
dc.description.publication | 1,2 | pl |
dc.description.version | ostateczna wersja wydawcy | |
dc.description.volume | 10 | pl |
dc.identifier.doi | 10.4467/23005920SPL.15.004.3561 | pl |
dc.identifier.eissn | 2300-5920 | pl |
dc.identifier.issn | 1732-8160 | pl |
dc.identifier.project | ROD UJ / P | pl |
dc.identifier.uri | http://ruj.uj.edu.pl/xmlui/handle/item/22676 | |
dc.language | eng | pl |
dc.language.container | eng | pl |
dc.participation | Rybicki, Jan: 100%; | pl |
dc.rights | Udzielam licencji. Uznanie autorstwa - Użycie niekomercyjne - Na tych samych warunkach 4.0 Międzynarodowa | * |
dc.rights.licence | CC-BY-NC-SA | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.pl | * |
dc.share.type | otwarte czasopismo | |
dc.subject.en | multivariate analysis | pl |
dc.subject.en | authorship contribution | pl |
dc.subject.en | Polish literature | pl |
dc.subject.en | stylometry | pl |
dc.subject.pl | analiza wielowymiarowa | pl |
dc.subject.pl | atrybucja autorska | pl |
dc.subject.pl | literatura polska | pl |
dc.subject.pl | stylometria | pl |
dc.subtype | Article | pl |
dc.title | Success rates in most-frequent-word-based authorship attribution : a case study of 1000 Polish novels from Ignacy Krasicki to Jerzy Pilch | pl |
dc.title.journal | Studies in Polish Linguistics | pl |
dc.type | JournalArticle | pl |
dspace.entity.type | Publication |
* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.
Views
3
Views per month
Views per city
Downloads
Open Access