A stylometric analysis of dialog transcripts from films of eight contemporary English-language writer-directors in two parallel corpora

dc.abstract.enThe primary goal of the present dissertation was to investigate the possibility of the application of Burrows’s Delta and Zeta procedures in stylometric research of film dialogs. The corpus for the analysis was composed of seventy-five subtitle files corresponding to films written and directed by eight popular English-speaking filmmakers: Woody Allen, Wes Anderson, Francis Ford Coppola, Stanley Kubrick, Christopher Nolan, Robert Rodriguez, Martin Scorsese and Quentin Tarantino. Most of the tests were conducted on two parallel corpora: the original texts in English and their corresponding Polish translations. The first chapter outlines the current methodology applied in computational stylistics and introduces stylo R package as the tool used to provide analysis results. Primary limitations to the method dependable on sample parameters, such as size and specific linguistic features, are briefly discussed. The second chapter presents the results of a Delta test performed on the original corpus with the use of two visualization methods: R’s Bootstrap Consensus Tree diagram and Gephi’s consensus network. The interpretation of the connections observed in the diagram is followed by their comparison with the results obtained for the parallel Polish corpus in the third chapter. The last chapter introduces the Zeta procedure and describes the results of several tests performed on the keywords for defined set of films, divided according to chronology-related criteria. The study concludes that while the method has a higher rate of success in case of original texts, film subtitles can be a resourceful material for stylometric research related to both authorship concerns and chronological trends, and potentially subtitle translations.pl
dc.abstract.plGłównym celem niniejszej pracy było zbadanie możliwych zastosowań Delty oraz Zety Burrowsa w analizie stylometrycznej dialogów filmowych. Do badań wykorzystano korpus złożony z siedemdziesięciu pięciu plików napisów do filmów ośmiu popularnych twórców filmowych: Woody’ego Allena, Wesa Andersona, Francisa Forda Coppoli, Stanleya Kubricka, Christophera Nolana, Roberta Rodrigueza, Martina Scorsese i Quentina Tarantino. Większość badań przeprowadzono na oryginalnym korpusie w języku angielskim oraz korpusie równoległym złożonym z tłumaczeń na język polski. Rozdział pierwszy zawiera zarys metodologii stosowanej we współczesnych badaniach stylometrycznych oraz opis wykorzystanych w pracy narzędzi wchodzących w skład pakietu stylo. Rozdział wymienia również kilka możliwych ograniczeń metody uzależnionych od cech korpusu, takich jak długość oraz cechy języka szczególne dla danego typu tekstów. Rozdział drugi prezentuje wyniki analizy Deltą napisów w języku angielskim z wykorzystaniem dwóch metod wizualizacji oraz podejmuje próbę interpretacji zaobserwowanych podobieństw. Rozdział trzeci zawiera porównanie wyników uzyskanych dla obu korpusów równoległych. W ostatnim rozdziale zaprezentowano wyniki kilku testów przeprowadzonych z użyciem Zety Burrowsa, w których zdefiniowane zostały słowa kluczowe dla wybranych podkorpusów złożonych z filmów podzielonych chronologicznie na kilka różych sposobów. Badania przeprowadzone w ramach pracy wykazały, że choć przedstawione metody mają wyższą skuteczność w przypadku tekstów w języku angielskim, napisy filmowe stanowią cenny materiał do badań stylometrycznych zajmujących się atrybucją autorską oraz tendencjami uwarunkowanymi chronologicznie, a być może również przekładem filmowym.pl
dc.affiliationWydział Filologicznypl
dc.areaobszar nauk humanistycznychpl
dc.contributor.advisorRybicki, Janpl
dc.contributor.authorGąbka, Aleksandrapl
dc.contributor.reviewerGórski, Rafał - 199117 pl
dc.contributor.reviewerRybicki, Janpl
dc.identifier.projectAPD / Opl
dc.subject.enstylometry, computer-assisted analysis, film dialogue, subtitle translationpl
dc.subject.plstylometria, komputerowa analiza tekstów, dialogi filmowe, tłumaczenie list dialogowychpl
dc.titleA stylometric analysis of dialog transcripts from films of eight contemporary English-language writer-directors in two parallel corporapl
dc.title.alternativeAnaliza stylometryczna list dialogowych filmów ośmiu anglojęzycznych twórców filmowych zawartych w dwóch korpusach równoległychpl

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views per month

No access

No Thumbnail Available