Simple view
Full metadata view
Authors
Statistics
Model for pre-sequencing quality control of the ATAC-seq libraries
Model do oceny jakości bibliotek ATAC-seq przed sekwencjonowaniem
kontrola jakości ATAC-seq, Sekwencjonowanie Nowej Generacji, Bioanalizator, epigenetyka
ATAC-seq quality control, Next-generation sequencing, NGS, Bioanalyzer, epigenetics
ATAC-seq (ang. Assay for Transposase-Accessible Chromatin followed by sequencing) to protokół wykorzystywany do badania regionów otwartej chromatyny. Dzięki prostocie wykonania zyskuje on coraz większą popularność. Wysoka jakość przygotowanych bibliotek ma kluczowe znacznie w uzyskaniu rzetelnych wyników po przeprowadzonym eksperymencie. Obecnie można to jednoznacznie stwierdzić jedynie po sekwencjonowaniu, ponieważ kontrola jakości przed opiera się na subiektywnej ocenie elektroferogramów z Bioanalizatora przez laboranta. Celem niniejszej pracy jest przygotowanie narzędzia, które pozwoli w sposób jednoznaczny, ocenić jakość bibliotek ATAC-seq przed sekwencjonowaniem. Przygotowano 132 biblioteki ATAC-seq na ludzkich limfocytach T regulatorowych i zgromadzono zarówno dane sekwencyjne jak i elektroferogramy. Następnie opracowano model logistycznej regresji, który z powodzeniem został wykorzystany do oceny jakości bibliotek dla tych komórek. Dodatkowo model niezależnie przetestowano na 284 bibliotekach dostarczonych przez niezależne grupy badawcze. Biblioteki te zostały sporządzone z wykorzystaniem oryginalnego protokołu ATAC-seq oraz Fast-ATAC-seq. Model zweryfikowano korzystając z bibliotek przygotowanych dla 100 z linii komórkowych pochodzących z limfoblastów, 11 z konwencjonalnych limfocytów T i 173 z makrofagów. Dokładność opracowanego modelu wyniosła 90% dla limfoblastów oraz 100% dla konwencjonalnych limfocytów T i makrofagów. Wyniki wykazały lepszą dokładność modelu w porównaniu z klasyfikacją laboranta niezależnie od zastosowanego typu komórek i protokołów. Model może pomóc naukowcom w ocenie własnych eksperymentów i zapobiec sekwencjonowaniu bibliotek ATAC-seq o niskiej jakości.
Assay for Transposase Accessible Chromatin followed by sequencing (ATAC-seq) is used for the detection of chromatin accessibility genome-wide. It is an increasingly popular protocol due to its relative simplicity. The overall quality of the libraries is of paramount importance for experimental success. However, currently this can only be reliably assessed after sequencing since the pre-sequencing quality control relies on subjective human interpretation of the Agilent 2100 Bioanalyzer electropherograms. The aim of this study is to provide a tool for the quality assessment of ATAC-seq libraries prior to the sequencing. Collection of 132 ATAC-seq sequencing data and electrophoretic traces of human regulatory T cells (Tregs) were gathered, and a logistic regression model was introduced. The model has been successfully used for assessing the quality of ATAC-seq libraries of Tregs. Additionally, it was independently tested on 284 samples provided by different research groups, that generated the libraries using original ATAC-seq and Fast-ATAC-seq protocol. The accuracy of the model for 100 lymphoblastoid cell lines, 11 conventional T cells, and 173 macrophages was 90%, 100%, and 100%, respectively. Notably, the results showed better accuracy of the model over the human interpretation and its applicability across different cell types and protocols. The model can help researchers to evaluate their own experiments to avoid sequencing low-quality ATAC-seq libraries.
dc.abstract.en | Assay for Transposase Accessible Chromatin followed by sequencing (ATAC-seq) is used for the detection of chromatin accessibility genome-wide. It is an increasingly popular protocol due to its relative simplicity. The overall quality of the libraries is of paramount importance for experimental success. However, currently this can only be reliably assessed after sequencing since the pre-sequencing quality control relies on subjective human interpretation of the Agilent 2100 Bioanalyzer electropherograms. The aim of this study is to provide a tool for the quality assessment of ATAC-seq libraries prior to the sequencing. Collection of 132 ATAC-seq sequencing data and electrophoretic traces of human regulatory T cells (Tregs) were gathered, and a logistic regression model was introduced. The model has been successfully used for assessing the quality of ATAC-seq libraries of Tregs. Additionally, it was independently tested on 284 samples provided by different research groups, that generated the libraries using original ATAC-seq and Fast-ATAC-seq protocol. The accuracy of the model for 100 lymphoblastoid cell lines, 11 conventional T cells, and 173 macrophages was 90%, 100%, and 100%, respectively. Notably, the results showed better accuracy of the model over the human interpretation and its applicability across different cell types and protocols. The model can help researchers to evaluate their own experiments to avoid sequencing low-quality ATAC-seq libraries. | pl |
dc.abstract.pl | ATAC-seq (ang. Assay for Transposase-Accessible Chromatin followed by sequencing) to protokół wykorzystywany do badania regionów otwartej chromatyny. Dzięki prostocie wykonania zyskuje on coraz większą popularność. Wysoka jakość przygotowanych bibliotek ma kluczowe znacznie w uzyskaniu rzetelnych wyników po przeprowadzonym eksperymencie. Obecnie można to jednoznacznie stwierdzić jedynie po sekwencjonowaniu, ponieważ kontrola jakości przed opiera się na subiektywnej ocenie elektroferogramów z Bioanalizatora przez laboranta. Celem niniejszej pracy jest przygotowanie narzędzia, które pozwoli w sposób jednoznaczny, ocenić jakość bibliotek ATAC-seq przed sekwencjonowaniem. Przygotowano 132 biblioteki ATAC-seq na ludzkich limfocytach T regulatorowych i zgromadzono zarówno dane sekwencyjne jak i elektroferogramy. Następnie opracowano model logistycznej regresji, który z powodzeniem został wykorzystany do oceny jakości bibliotek dla tych komórek. Dodatkowo model niezależnie przetestowano na 284 bibliotekach dostarczonych przez niezależne grupy badawcze. Biblioteki te zostały sporządzone z wykorzystaniem oryginalnego protokołu ATAC-seq oraz Fast-ATAC-seq. Model zweryfikowano korzystając z bibliotek przygotowanych dla 100 z linii komórkowych pochodzących z limfoblastów, 11 z konwencjonalnych limfocytów T i 173 z makrofagów. Dokładność opracowanego modelu wyniosła 90% dla limfoblastów oraz 100% dla konwencjonalnych limfocytów T i makrofagów. Wyniki wykazały lepszą dokładność modelu w porównaniu z klasyfikacją laboranta niezależnie od zastosowanego typu komórek i protokołów. Model może pomóc naukowcom w ocenie własnych eksperymentów i zapobiec sekwencjonowaniu bibliotek ATAC-seq o niskiej jakości. | pl |
dc.affiliation | Wydział Biochemii, Biofizyki i Biotechnologii | pl |
dc.area | obszar nauk przyrodniczych | pl |
dc.contributor.advisor | Murzyn, Krzysztof - 130817 | pl |
dc.contributor.author | Gołda, Małgorzata | pl |
dc.contributor.departmentbycode | UJK/WBBB | pl |
dc.contributor.reviewer | Murzyn, Krzysztof - 130817 | pl |
dc.contributor.reviewer | Branicki, Wojciech - 185426 | pl |
dc.date.accessioned | 2020-07-28T00:18:16Z | |
dc.date.available | 2020-07-28T00:18:16Z | |
dc.date.submitted | 2019-06-21 | pl |
dc.fieldofstudy | biotechnologia molekularna | pl |
dc.identifier.apd | diploma-133035-242054 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/235410 | |
dc.language | eng | pl |
dc.subject.en | ATAC-seq quality control, Next-generation sequencing, NGS, Bioanalyzer, epigenetics | pl |
dc.subject.pl | kontrola jakości ATAC-seq, Sekwencjonowanie Nowej Generacji, Bioanalizator, epigenetyka | pl |
dc.title | Model for pre-sequencing quality control of the ATAC-seq libraries | pl |
dc.title.alternative | Model do oceny jakości bibliotek ATAC-seq przed sekwencjonowaniem | pl |
dc.type | master | pl |
dspace.entity.type | Publication |