From words to themes : AI-powered qualitative data coding and analysis

2024
book section
article
5
dc.abstract.enThis article presents a qualitative research methodology that uses advanced artificial intelligence-based linguistic models in free-text interview coding and thematic analysis. The authors describe two strategies for inductive coding of interview transcriptions: generative coding and lexico-semantic coding. Both approaches use bottom-up logic, employing language models like ChatGPT and natural language processing techniques to automate building the codebook structure. This innovative coding technique enhances the precision and efficiency of qualitative data analysis and reasoning within thematic analysis. On the other hand, it improves the fit of the analytical model (the structure of the codebook or dictionary) to the linguistic data of the interviews, thereby increasing its effectiveness and interpretability. The article presents a semi-supervised qualitative data coding methodology using artificial intelligence algorithms. This method can potentially automate routine qualitative data coding procedures in computer-assisted data analysis, freeing the qualitative researcher’s time to focus on interpretation and theorising. Additionally, it is a step towards the development of digital qualitative sociology.
dc.abstract.plW artykule przedstawiono metodologię badań jakościowych, która wykorzystuje zaawansowane modele lingwistyczne oparte na sztucznej inteligencji w kodowaniu wywiadów swobodnych i analizie tematycznej. Autorzy opisują dwie strategie indukcyjnego kodowania transkrypcji wywiadów: kodowanie generatywne i kodowanie leksykalno-semantyczne. Oba podejścia wykorzystują logikę oddolną, wykorzystując modele językowe, takie jak ChatGPT i techniki przetwarzania języka naturalnego, aby zautomatyzować budowanie struktury książki kodowej. Ta innowacyjna technika kodowania zwiększa precyzję i wydajność analizy danych jakościowych oraz wnioskowania w ramach analizy tematycznej. Z drugiej strony poprawia dopasowanie modelu analitycznego (struktury książki kodowej lub słownika) do danych językowych wywiadów, zwiększając tym samym jego skuteczność i interpretowalność. W artykule przedstawiono półnadzorowaną metodologię kodowania danych jakościowych z wykorzystaniem algorytmów sztucznej inteligencji. Metoda ta może potencjalnie zautomatyzować rutynowe procedury kodowania danych jakościowych w analizie danych wspomaganej komputerowo, uwalniając czas badacza jakościowego na skupienie się na interpretacji i teoretyzowaniu. Dodatkowo, jest to krok w kierunku rozwoju cyfrowej socjologii jakościowej.
dc.affiliationWydział Filozoficzny : Instytut Socjologii
dc.affiliationSzkoła Doktorska Nauk Ścisłych i Przyrodniczych
dc.contributor.authorBryda, Grzegorz - 100967
dc.contributor.authorSadowski, Damian - 150540
dc.contributor.editorRibeiro, Jaime
dc.contributor.editorBrandão, Catarina
dc.contributor.editorNtsobi, Mfanelo
dc.contributor.editorKasperiuniene, Judita
dc.contributor.editorCosta, António Pedro
dc.date.accessioned2025-06-18T08:22:47Z
dc.date.available2025-06-18T08:22:47Z
dc.date.createdat2025-04-09T13:52:16Zen
dc.date.issued2024
dc.description.additionalBibliogr. str. 343-345
dc.description.physical309-345
dc.description.seriesLecture Notes in Networks and Systems
dc.description.seriesnumber1061
dc.identifier.doi10.1007/978-3-031-65735-1_19
dc.identifier.eisbn978-3-031-65735-1
dc.identifier.isbn978-3-031-65734-4
dc.identifier.serieseissn2367-3389
dc.identifier.seriesissn2367-3370
dc.identifier.urihttps://ruj.uj.edu.pl/handle/item/553474
dc.languageeng
dc.language.containereng
dc.placeCham
dc.publisherSpringer Nature
dc.publisher.ministerialSpringer
dc.rightsDodaję tylko opis bibliograficzny
dc.rights.licenceBez licencji otwartego dostępu
dc.subject.eninductive coding
dc.subject.enthematic analysis
dc.subject.encodebook development
dc.subject.ennatural language processing (NLP)
dc.subject.enlarge language models (LLM)
dc.subject.enChatGPT
dc.subject.enartificial intelligence (AI)
dc.subject.plkodowanie indukcyjne
dc.subject.planaliza tematyczna
dc.subject.plrozwój książek kodowych
dc.subject.plprzetwarzanie języka naturalnego (NLP)
dc.subject.plduże modele językowe (LLM)
dc.subject.plChatGPT
dc.subject.plsztuczna inteligencja (AI)
dc.subtypeArticle
dc.titleFrom words to themes : AI-powered qualitative data coding and analysis
dc.title.containerComputer supported qualitative research : new trends in qualitative research (WCQR2024)
dc.typeBookSection
dspace.entity.typePublicationen
dc.abstract.en
This article presents a qualitative research methodology that uses advanced artificial intelligence-based linguistic models in free-text interview coding and thematic analysis. The authors describe two strategies for inductive coding of interview transcriptions: generative coding and lexico-semantic coding. Both approaches use bottom-up logic, employing language models like ChatGPT and natural language processing techniques to automate building the codebook structure. This innovative coding technique enhances the precision and efficiency of qualitative data analysis and reasoning within thematic analysis. On the other hand, it improves the fit of the analytical model (the structure of the codebook or dictionary) to the linguistic data of the interviews, thereby increasing its effectiveness and interpretability. The article presents a semi-supervised qualitative data coding methodology using artificial intelligence algorithms. This method can potentially automate routine qualitative data coding procedures in computer-assisted data analysis, freeing the qualitative researcher’s time to focus on interpretation and theorising. Additionally, it is a step towards the development of digital qualitative sociology.
dc.abstract.pl
W artykule przedstawiono metodologię badań jakościowych, która wykorzystuje zaawansowane modele lingwistyczne oparte na sztucznej inteligencji w kodowaniu wywiadów swobodnych i analizie tematycznej. Autorzy opisują dwie strategie indukcyjnego kodowania transkrypcji wywiadów: kodowanie generatywne i kodowanie leksykalno-semantyczne. Oba podejścia wykorzystują logikę oddolną, wykorzystując modele językowe, takie jak ChatGPT i techniki przetwarzania języka naturalnego, aby zautomatyzować budowanie struktury książki kodowej. Ta innowacyjna technika kodowania zwiększa precyzję i wydajność analizy danych jakościowych oraz wnioskowania w ramach analizy tematycznej. Z drugiej strony poprawia dopasowanie modelu analitycznego (struktury książki kodowej lub słownika) do danych językowych wywiadów, zwiększając tym samym jego skuteczność i interpretowalność. W artykule przedstawiono półnadzorowaną metodologię kodowania danych jakościowych z wykorzystaniem algorytmów sztucznej inteligencji. Metoda ta może potencjalnie zautomatyzować rutynowe procedury kodowania danych jakościowych w analizie danych wspomaganej komputerowo, uwalniając czas badacza jakościowego na skupienie się na interpretacji i teoretyzowaniu. Dodatkowo, jest to krok w kierunku rozwoju cyfrowej socjologii jakościowej.
dc.affiliation
Wydział Filozoficzny : Instytut Socjologii
dc.affiliation
Szkoła Doktorska Nauk Ścisłych i Przyrodniczych
dc.contributor.author
Bryda, Grzegorz - 100967
dc.contributor.author
Sadowski, Damian - 150540
dc.contributor.editor
Ribeiro, Jaime
dc.contributor.editor
Brandão, Catarina
dc.contributor.editor
Ntsobi, Mfanelo
dc.contributor.editor
Kasperiuniene, Judita
dc.contributor.editor
Costa, António Pedro
dc.date.accessioned
2025-06-18T08:22:47Z
dc.date.available
2025-06-18T08:22:47Z
dc.date.createdaten
2025-04-09T13:52:16Z
dc.date.issued
2024
dc.description.additional
Bibliogr. str. 343-345
dc.description.physical
309-345
dc.description.series
Lecture Notes in Networks and Systems
dc.description.seriesnumber
1061
dc.identifier.doi
10.1007/978-3-031-65735-1_19
dc.identifier.eisbn
978-3-031-65735-1
dc.identifier.isbn
978-3-031-65734-4
dc.identifier.serieseissn
2367-3389
dc.identifier.seriesissn
2367-3370
dc.identifier.uri
https://ruj.uj.edu.pl/handle/item/553474
dc.language
eng
dc.language.container
eng
dc.place
Cham
dc.publisher
Springer Nature
dc.publisher.ministerial
Springer
dc.rights
Dodaję tylko opis bibliograficzny
dc.rights.licence
Bez licencji otwartego dostępu
dc.subject.en
inductive coding
dc.subject.en
thematic analysis
dc.subject.en
codebook development
dc.subject.en
natural language processing (NLP)
dc.subject.en
large language models (LLM)
dc.subject.en
ChatGPT
dc.subject.en
artificial intelligence (AI)
dc.subject.pl
kodowanie indukcyjne
dc.subject.pl
analiza tematyczna
dc.subject.pl
rozwój książek kodowych
dc.subject.pl
przetwarzanie języka naturalnego (NLP)
dc.subject.pl
duże modele językowe (LLM)
dc.subject.pl
ChatGPT
dc.subject.pl
sztuczna inteligencja (AI)
dc.subtype
Article
dc.title
From words to themes : AI-powered qualitative data coding and analysis
dc.title.container
Computer supported qualitative research : new trends in qualitative research (WCQR2024)
dc.type
BookSection
dspace.entity.typeen
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
99
Views per month
Views per city
Melbourne
7
Sydney
4
Berlin
3
Krakow
3
Limassol
3
Brno
2
Columbia
2
Dar es Salaam
2
Durham
2
Enschede
2
Downloads
Bryda_Sadowski_FromwordstothemesAIpowereddatacodingandqda.pdf
2

No access

No Thumbnail Available