Thou shalt not conduct research on software? : text and data mining of computer programs in the current EU copyright framework

2025
journal article
article
dc.abstract.enThe proliferation of generative AI has steered the discussion about text and data mining (TDM) in copyright law towards the problem of generative models. However, generative AI is not the only case for TDM. Mining data from computer programs can improve defect detection, discover design patterns, facilitate maintenance, summarize code in natural language or identify security vulnerabilities. The potential of such research, and the risk of skewing its results due to inadequate data justifies a venture into the scope of permitted TDM activities in relation to software. This article explores the intersection of TDM and the protection of computer programs in EU copyright law, focusing on the reproduction and alteration rights under the Software Directive. It argues that although among the new TDM exceptions and limitations in the Directive on Copyright in the Digital Single Market only the general one explicitly mentions computer programs, the research exception can also be applied if implemented carefully. This article also shows that computer programs can be reproduced in a way relevant to copyright law during TDM activities aimed at extracting data from traditional literary or artistic works. It offers an interpretation of Art. 5(1) of the Software Directive that prevents the misusing of copyright to thwart TDM in such scenarios. Finally, it analyses the diverging implementation strategies of TDM provisions adopted by EU Member States in the context of computer programs. By examining these issues, this article aims to clarify the scope of permissible TDM activities and advocate for policies that support research.
dc.abstract.plRozwój generatywnej sztucznej inteligencji sprawił, że dyskusja na temat eksploracji tekstów i danych (TDM) w prawie autorskim skupiła się na problemie modeli generatywnych. Generatywna sztuczna inteligencja nie jest jednak jedynym przypadkiem TDM. Eksploracja danych z programów komputerowych może poprawić wykrywanie błędów, odkrywać wzorce projektowe, ułatwiać konserwację, podsumowywać kod w języku naturalnym lub odkrywać luki w zabezpieczeniach. Potencjał takich badań i ryzyko wypaczenia ich wyników z powodu niewystarczających danych uzasadnia próbę zbadania zakresu dozwolonych działań TDM w odniesieniu do oprogramowania. Artykuł przedstawia wyniki analizy problemów powstających na styku TDM i prawnoautorskiej ochrony programów komputerowych w UE. Nacisk położono na wyłącznych prawach zwielokrotniania i wprowadzania zmian przewidzianych w dyrektywie 2009/24/WE. Chociaż wśród nowych wyjątków i ograniczeń TDM w dyrektywie o prawie autorskim na jednolitym rynku cyfrowym tylko wyjątek ogólny wyraźnie wspomina o programach komputerowych, wyjątek badawczy może być również stosowany, jeśli zostanie starannie wdrożony przez państwa członkowskie. W artykule wykazano również, że programy komputerowe mogą być zwielokrotniane w sposób istotny z punktu widzenia prawa autorskiego także podczas działań TDM mających na celu wyodrębnienie danych z tradycyjnych dzieł literackich lub artystycznych. W artykule przedstawiono interpretację art. 5 ust. 1 dyrektywy 2009/24/WE, która zapobiega nadużywaniu praw autorskich w celu udaremnienia TDM w takich scenariuszach. Przeanalizowano też rozbieżne strategie wdrażania przepisów dotyczących TDM przyjętych przez państwa członkowskie UE w kontekście programów komputerowych.
dc.affiliationWydział Prawa i Administracji : Zakład Prawa Autorskiego
dc.contributor.authorWidła, Bohdan - 109183
dc.date.accession2025-01-29
dc.date.accessioned2025-02-01T06:44:47Z
dc.date.available2025-02-01T06:44:47Z
dc.date.createdat2025-02-01T06:44:47Zen
dc.date.issued2025
dc.date.openaccess0
dc.description.accesstimew momencie opublikowania
dc.description.additionalStreszcz. ang. s. 3. Bibliogr. w przypisach
dc.description.number1
dc.description.physical3-18
dc.description.versionostateczna wersja wydawcy
dc.description.volume74
dc.identifier.doi10.1093/grurint/ikae147
dc.identifier.eissn2632-8550
dc.identifier.issn2632-8623
dc.identifier.project2019/35/B/HS5/03671
dc.identifier.urihttps://ruj.uj.edu.pl/handle/item/546722
dc.identifier.weblinkhttps://academic.oup.com/grurint/article/74/1/3/7927566
dc.languageeng
dc.language.containereng
dc.rightsUdzielam licencji. Uznanie autorstwa 4.0 Międzynarodowa
dc.rights.licenceCC-BY
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/legalcode.pl
dc.share.typeinne
dc.subject.encopyright
dc.subject.ensoftware
dc.subject.encomputer programs
dc.subject.entext and data mining
dc.subject.enmachine learning
dc.subject.enAI
dc.subject.enTDM
dc.subject.entokenization
dc.subject.enreverse engineering
dc.subject.plprawo autorskie
dc.subject.plprogramy komputerowe
dc.subject.pleksploracja tekstów i danych
dc.subject.plTDM
dc.subject.pluczenie maszynowe
dc.subject.plsztuczna inteligencja
dc.subject.pltokenizacja
dc.subject.plinżynieria wsteczna
dc.subtypeArticle
dc.titleThou shalt not conduct research on software? : text and data mining of computer programs in the current EU copyright framework
dc.title.journalGRUR International
dc.typeJournalArticle
dspace.entity.typePublicationen
dc.abstract.en
The proliferation of generative AI has steered the discussion about text and data mining (TDM) in copyright law towards the problem of generative models. However, generative AI is not the only case for TDM. Mining data from computer programs can improve defect detection, discover design patterns, facilitate maintenance, summarize code in natural language or identify security vulnerabilities. The potential of such research, and the risk of skewing its results due to inadequate data justifies a venture into the scope of permitted TDM activities in relation to software. This article explores the intersection of TDM and the protection of computer programs in EU copyright law, focusing on the reproduction and alteration rights under the Software Directive. It argues that although among the new TDM exceptions and limitations in the Directive on Copyright in the Digital Single Market only the general one explicitly mentions computer programs, the research exception can also be applied if implemented carefully. This article also shows that computer programs can be reproduced in a way relevant to copyright law during TDM activities aimed at extracting data from traditional literary or artistic works. It offers an interpretation of Art. 5(1) of the Software Directive that prevents the misusing of copyright to thwart TDM in such scenarios. Finally, it analyses the diverging implementation strategies of TDM provisions adopted by EU Member States in the context of computer programs. By examining these issues, this article aims to clarify the scope of permissible TDM activities and advocate for policies that support research.
dc.abstract.pl
Rozwój generatywnej sztucznej inteligencji sprawił, że dyskusja na temat eksploracji tekstów i danych (TDM) w prawie autorskim skupiła się na problemie modeli generatywnych. Generatywna sztuczna inteligencja nie jest jednak jedynym przypadkiem TDM. Eksploracja danych z programów komputerowych może poprawić wykrywanie błędów, odkrywać wzorce projektowe, ułatwiać konserwację, podsumowywać kod w języku naturalnym lub odkrywać luki w zabezpieczeniach. Potencjał takich badań i ryzyko wypaczenia ich wyników z powodu niewystarczających danych uzasadnia próbę zbadania zakresu dozwolonych działań TDM w odniesieniu do oprogramowania. Artykuł przedstawia wyniki analizy problemów powstających na styku TDM i prawnoautorskiej ochrony programów komputerowych w UE. Nacisk położono na wyłącznych prawach zwielokrotniania i wprowadzania zmian przewidzianych w dyrektywie 2009/24/WE. Chociaż wśród nowych wyjątków i ograniczeń TDM w dyrektywie o prawie autorskim na jednolitym rynku cyfrowym tylko wyjątek ogólny wyraźnie wspomina o programach komputerowych, wyjątek badawczy może być również stosowany, jeśli zostanie starannie wdrożony przez państwa członkowskie. W artykule wykazano również, że programy komputerowe mogą być zwielokrotniane w sposób istotny z punktu widzenia prawa autorskiego także podczas działań TDM mających na celu wyodrębnienie danych z tradycyjnych dzieł literackich lub artystycznych. W artykule przedstawiono interpretację art. 5 ust. 1 dyrektywy 2009/24/WE, która zapobiega nadużywaniu praw autorskich w celu udaremnienia TDM w takich scenariuszach. Przeanalizowano też rozbieżne strategie wdrażania przepisów dotyczących TDM przyjętych przez państwa członkowskie UE w kontekście programów komputerowych.
dc.affiliation
Wydział Prawa i Administracji : Zakład Prawa Autorskiego
dc.contributor.author
Widła, Bohdan - 109183
dc.date.accession
2025-01-29
dc.date.accessioned
2025-02-01T06:44:47Z
dc.date.available
2025-02-01T06:44:47Z
dc.date.createdaten
2025-02-01T06:44:47Z
dc.date.issued
2025
dc.date.openaccess
0
dc.description.accesstime
w momencie opublikowania
dc.description.additional
Streszcz. ang. s. 3. Bibliogr. w przypisach
dc.description.number
1
dc.description.physical
3-18
dc.description.version
ostateczna wersja wydawcy
dc.description.volume
74
dc.identifier.doi
10.1093/grurint/ikae147
dc.identifier.eissn
2632-8550
dc.identifier.issn
2632-8623
dc.identifier.project
2019/35/B/HS5/03671
dc.identifier.uri
https://ruj.uj.edu.pl/handle/item/546722
dc.identifier.weblink
https://academic.oup.com/grurint/article/74/1/3/7927566
dc.language
eng
dc.language.container
eng
dc.rights
Udzielam licencji. Uznanie autorstwa 4.0 Międzynarodowa
dc.rights.licence
CC-BY
dc.rights.uri
http://creativecommons.org/licenses/by/4.0/legalcode.pl
dc.share.type
inne
dc.subject.en
copyright
dc.subject.en
software
dc.subject.en
computer programs
dc.subject.en
text and data mining
dc.subject.en
machine learning
dc.subject.en
AI
dc.subject.en
TDM
dc.subject.en
tokenization
dc.subject.en
reverse engineering
dc.subject.pl
prawo autorskie
dc.subject.pl
programy komputerowe
dc.subject.pl
eksploracja tekstów i danych
dc.subject.pl
TDM
dc.subject.pl
uczenie maszynowe
dc.subject.pl
sztuczna inteligencja
dc.subject.pl
tokenizacja
dc.subject.pl
inżynieria wsteczna
dc.subtype
Article
dc.title
Thou shalt not conduct research on software? : text and data mining of computer programs in the current EU copyright framework
dc.title.journal
GRUR International
dc.type
JournalArticle
dspace.entity.typeen
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
29
Views per month
Views per city
Krakow
6
Katowice
3
Warsaw
2
Wroclaw
1
Zabrze
1
Downloads
widla_thou_shalt_not_conduct_research_2025.pdf
21
B_Widla_Thou Shalt Not Conduct Research on Software_GRUR_ISSUE_1_2025.pdf
3