Simple view
Full metadata view
Authors
Statistics
Style-markers in authorship attribution : a cross-language study of the authorial fingerprint
Wskaźniki stylu w atrybucji autorskiej : studium porównawcze autorskiego "odcisku palca" w kilku językach
atrybucja autorska
stylometria
wskaźniki stylu
metody wielowymiarowe
metoda Delta
kontrolowany test atrybucyjny
authorship attribution
stylometry
style-markers
multidimensional methods
Delta method
controlled attribution test
Bibliogr. s. 113-114
Niniejszy artykuł poświęcony jest jednemu z teoretycznych problemów atrybucji autorskiej opartej o metody ilościowe, mianowicie kwestii, które kategorie językowe zdradzają indywidualny rys autorski (stylistyczny "odcisk palca") w tekstach literackich. Liczne prace powstające w ostatnich latach dowodzą, że oprócz miar leksykalnych - szczególnie tych, które oparte są na częstości wystąpień najczęstszych wyrazów - także inne cechy języka pisanego okazują się stosunkowo silnymi czynnikami różnicującymi styl autorski. Do tej pory nie pojawiły się jednak prace, które próbowałyby porównać atrybucyjne możliwości tych cech językowych z sobą. Celem niniejszego studium było zatem przetestowanie siły dyskryminacyjnej kilku wskaźników stylu w rozpoznawaniu autorów. Do empirycznej analizy wybrano te wskaźniki, które można wyłonić z nielematyzowanego korpusu, tj. ze zwykłych plików tekstowych, takie jak najczęstsze wyrazy, zestawienia dwóch słów, różne połączenia literowe, wreszcie wskaźniki niejednorodne, połączone w jednej próbce. Równie ważne było jednak porównanie przydatności owych wybranych wskaźników stylu w kilku językach: angielskim, polskim, niemieckim i łacińskim. Wyniki potwierdziły wysoką wartość wskaźników leksykalnych w języku angielskim, podczas gdy w innych językach na ogół dokładniejsze okazywały się wskaźniki alternatywne.
The present study addresses one of the theoretical problems of computer-assisted authorship attribution, namely the question which traceable features of language can betray authorial uniqueness (a stylistic fi ngerprint) of literary texts. A number of recent approaches show that apart from lexical measures - especially those relying on the frequencies of the most frequent words - also some other features of written language are considerably effective as discriminators of authorial style. However, there have been no attempts to compare the attribution potential of these features. The aim of the present study, then, was to examine the effectiveness of several style-markers in authorship attribution. The style-markers chosen for the empirical investigation are those that can be retrieved from a non-lemmatized corpus of plain text files, such as the most frequent words, word bi-grams, different letter sequences, and markers of different nature, combined in one sample. Equally important, however, was to compare usefulness of the chosen style-markers across a few languages: English, Polish, German, and Latin. The results confirmed a high attribution effectiveness of word-based style-markers in the English corpus, but the alternative markers are shown to be usually more effective in the other languages.
dc.abstract.en | The present study addresses one of the theoretical problems of computer-assisted authorship attribution, namely the question which traceable features of language can betray authorial uniqueness (a stylistic fi ngerprint) of literary texts. A number of recent approaches show that apart from lexical measures - especially those relying on the frequencies of the most frequent words - also some other features of written language are considerably effective as discriminators of authorial style. However, there have been no attempts to compare the attribution potential of these features. The aim of the present study, then, was to examine the effectiveness of several style-markers in authorship attribution. The style-markers chosen for the empirical investigation are those that can be retrieved from a non-lemmatized corpus of plain text files, such as the most frequent words, word bi-grams, different letter sequences, and markers of different nature, combined in one sample. Equally important, however, was to compare usefulness of the chosen style-markers across a few languages: English, Polish, German, and Latin. The results confirmed a high attribution effectiveness of word-based style-markers in the English corpus, but the alternative markers are shown to be usually more effective in the other languages. | pl |
dc.abstract.pl | Niniejszy artykuł poświęcony jest jednemu z teoretycznych problemów atrybucji autorskiej opartej o metody ilościowe, mianowicie kwestii, które kategorie językowe zdradzają indywidualny rys autorski (stylistyczny "odcisk palca") w tekstach literackich. Liczne prace powstające w ostatnich latach dowodzą, że oprócz miar leksykalnych - szczególnie tych, które oparte są na częstości wystąpień najczęstszych wyrazów - także inne cechy języka pisanego okazują się stosunkowo silnymi czynnikami różnicującymi styl autorski. Do tej pory nie pojawiły się jednak prace, które próbowałyby porównać atrybucyjne możliwości tych cech językowych z sobą. Celem niniejszego studium było zatem przetestowanie siły dyskryminacyjnej kilku wskaźników stylu w rozpoznawaniu autorów. Do empirycznej analizy wybrano te wskaźniki, które można wyłonić z nielematyzowanego korpusu, tj. ze zwykłych plików tekstowych, takie jak najczęstsze wyrazy, zestawienia dwóch słów, różne połączenia literowe, wreszcie wskaźniki niejednorodne, połączone w jednej próbce. Równie ważne było jednak porównanie przydatności owych wybranych wskaźników stylu w kilku językach: angielskim, polskim, niemieckim i łacińskim. Wyniki potwierdziły wysoką wartość wskaźników leksykalnych w języku angielskim, podczas gdy w innych językach na ogół dokładniejsze okazywały się wskaźniki alternatywne. | pl |
dc.contributor.author | Eder, Maciej | pl |
dc.date.accession | 2019-02-13 | pl |
dc.date.accessioned | 2019-02-13T18:56:34Z | |
dc.date.available | 2019-02-13T18:56:34Z | |
dc.date.issued | 2011 | pl |
dc.date.openaccess | 0 | |
dc.description.accesstime | w momencie opublikowania | |
dc.description.additional | Bibliogr. s. 113-114 | pl |
dc.description.number | 1 | pl |
dc.description.physical | 99-114 | pl |
dc.description.version | ostateczna wersja wydawcy | |
dc.description.volume | 6 | pl |
dc.identifier.eissn | 2300-5920 | pl |
dc.identifier.issn | 1732-8160 | pl |
dc.identifier.project | ROD UJ / OP | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/68325 | |
dc.identifier.weblink | http://www.ejournals.eu/SPL/2011/SPL-vol-6-2011/art/1171/ | pl |
dc.language | eng | pl |
dc.language.container | eng | pl |
dc.rights | Udzielam licencji. Uznanie autorstwa - Użycie niekomercyjne - Na tych samych warunkach 4.0 Międzynarodowa | * |
dc.rights.licence | CC-BY-NC-SA | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.pl | * |
dc.share.type | otwarte czasopismo | |
dc.subject.en | authorship attribution | pl |
dc.subject.en | stylometry | pl |
dc.subject.en | style-markers | pl |
dc.subject.en | multidimensional methods | pl |
dc.subject.en | Delta method | pl |
dc.subject.en | controlled attribution test | pl |
dc.subject.pl | atrybucja autorska | pl |
dc.subject.pl | stylometria | pl |
dc.subject.pl | wskaźniki stylu | pl |
dc.subject.pl | metody wielowymiarowe | pl |
dc.subject.pl | metoda Delta | pl |
dc.subject.pl | kontrolowany test atrybucyjny | pl |
dc.subtype | Article | pl |
dc.title | Style-markers in authorship attribution : a cross-language study of the authorial fingerprint | pl |
dc.title.alternative | Wskaźniki stylu w atrybucji autorskiej : studium porównawcze autorskiego "odcisku palca" w kilku językach | pl |
dc.title.journal | Studies in Polish Linguistics | pl |
dc.type | JournalArticle | pl |
dspace.entity.type | Publication |
* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.
Views
42
Views per month
Views per city
Downloads
Open Access