Jagiellonian University Repository

A stylometric analysis of dialog transcripts from films of eight contemporary English-language writer-directors in two parallel corpora

pcg.skipToMenu

A stylometric analysis of dialog transcripts from films of eight contemporary English-language writer-directors in two parallel corpora

Show full item record

dc.contributor.advisor Rybicki, Jan pl
dc.contributor.author Gąbka, Aleksandra pl
dc.date.accessioned 2020-07-26T18:22:30Z
dc.date.available 2020-07-26T18:22:30Z
dc.date.submitted 2015-10-23 pl
dc.identifier.uri https://ruj.uj.edu.pl/xmlui/handle/item/208287
dc.language eng pl
dc.title A stylometric analysis of dialog transcripts from films of eight contemporary English-language writer-directors in two parallel corpora pl
dc.title.alternative Analiza stylometryczna list dialogowych filmów ośmiu anglojęzycznych twórców filmowych zawartych w dwóch korpusach równoległych pl
dc.type master pl
dc.abstract.pl Głównym celem niniejszej pracy było zbadanie możliwych zastosowań Delty oraz Zety Burrowsa w analizie stylometrycznej dialogów filmowych. Do badań wykorzystano korpus złożony z siedemdziesięciu pięciu plików napisów do filmów ośmiu popularnych twórców filmowych: Woody’ego Allena, Wesa Andersona, Francisa Forda Coppoli, Stanleya Kubricka, Christophera Nolana, Roberta Rodrigueza, Martina Scorsese i Quentina Tarantino. Większość badań przeprowadzono na oryginalnym korpusie w języku angielskim oraz korpusie równoległym złożonym z tłumaczeń na język polski. Rozdział pierwszy zawiera zarys metodologii stosowanej we współczesnych badaniach stylometrycznych oraz opis wykorzystanych w pracy narzędzi wchodzących w skład pakietu stylo. Rozdział wymienia również kilka możliwych ograniczeń metody uzależnionych od cech korpusu, takich jak długość oraz cechy języka szczególne dla danego typu tekstów. Rozdział drugi prezentuje wyniki analizy Deltą napisów w języku angielskim z wykorzystaniem dwóch metod wizualizacji oraz podejmuje próbę interpretacji zaobserwowanych podobieństw. Rozdział trzeci zawiera porównanie wyników uzyskanych dla obu korpusów równoległych. W ostatnim rozdziale zaprezentowano wyniki kilku testów przeprowadzonych z użyciem Zety Burrowsa, w których zdefiniowane zostały słowa kluczowe dla wybranych podkorpusów złożonych z filmów podzielonych chronologicznie na kilka różych sposobów. Badania przeprowadzone w ramach pracy wykazały, że choć przedstawione metody mają wyższą skuteczność w przypadku tekstów w języku angielskim, napisy filmowe stanowią cenny materiał do badań stylometrycznych zajmujących się atrybucją autorską oraz tendencjami uwarunkowanymi chronologicznie, a być może również przekładem filmowym. pl
dc.abstract.en The primary goal of the present dissertation was to investigate the possibility of the application of Burrows’s Delta and Zeta procedures in stylometric research of film dialogs. The corpus for the analysis was composed of seventy-five subtitle files corresponding to films written and directed by eight popular English-speaking filmmakers: Woody Allen, Wes Anderson, Francis Ford Coppola, Stanley Kubrick, Christopher Nolan, Robert Rodriguez, Martin Scorsese and Quentin Tarantino. Most of the tests were conducted on two parallel corpora: the original texts in English and their corresponding Polish translations. The first chapter outlines the current methodology applied in computational stylistics and introduces stylo R package as the tool used to provide analysis results. Primary limitations to the method dependable on sample parameters, such as size and specific linguistic features, are briefly discussed. The second chapter presents the results of a Delta test performed on the original corpus with the use of two visualization methods: R’s Bootstrap Consensus Tree diagram and Gephi’s consensus network. The interpretation of the connections observed in the diagram is followed by their comparison with the results obtained for the parallel Polish corpus in the third chapter. The last chapter introduces the Zeta procedure and describes the results of several tests performed on the keywords for defined set of films, divided according to chronology-related criteria. The study concludes that while the method has a higher rate of success in case of original texts, film subtitles can be a resourceful material for stylometric research related to both authorship concerns and chronological trends, and potentially subtitle translations. pl
dc.subject.pl stylometria, komputerowa analiza tekstów, dialogi filmowe, tłumaczenie list dialogowych pl
dc.subject.en stylometry, computer-assisted analysis, film dialogue, subtitle translation pl
dc.contributor.reviewer Górski, Rafał [SAP14000107] pl
dc.contributor.reviewer Rybicki, Jan pl
dc.affiliation Wydział Filologiczny pl
dc.identifier.project APD / O pl
dc.identifier.apd diploma-101275-97734 pl
dc.contributor.departmentbycode UJK/WF6 pl
dc.area obszar nauk humanistycznych pl
dc.fieldofstudy lingwistyka pl


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)