Simple view
Full metadata view
Authors
Statistics
Analiza głównych składowych i analiza korelacji kanonicznych. Omówienie dwóch metod redukcji danych
statystyka, redukcja, analiza, dane, algorytm
statistics, reduction, analysis, data, algorithm
Praca poświęcona jest zagadnieniom statystycznym z dziedziny wielowymiarowej analizy danych. Celem jest omówienie podstawowych metod redukcji wymiaru danych, jakimi są analiza głównych składowych (ang. PCA- Principal Component Analysis) oraz analiza korelacji kanonicznych (ang. CCA - Canonical Correlation Analysis). Metody te pochodzą z analizy czynnikowej, służą wiec do odkrywania ukrytych struktur w zbiorze zmiennych losowych. Ponieważ jednak opierają się one na różnych kryteriach, rezultatem są odmienne wyniki, które przedstawiają zależności miedzy danymi z różnych punktów widzenia.Pierwsza część pracy poświęcona będzie zagadnieniom matematycznym, które wyjaśnią problem redukcji danych z teoretycznego punktu widzenia. W głównej mierze będą to zagadnienia jakie związane są z tego typu analizami, a także dowody podstawowych twierdzeń, na których opierają się obie metody.Kolejnym zagadnieniem jakie zostanie omówione jest algorytmizacja metod, czyli przedstawienie kolejnych kroków stosowanych w praktyce algorytmów, operując na teoretycznych zmiennych.Ostatnia rzeczą jaka zostanie zawarta będzie przeprowadzenie przykładowych analiz konkretnego zbioru danych, za pomocą programów komputerowych i gotowych algorytmów. Analiza zawierać będzie omówienie i ocenę wyników, a także interpretacje rezultatów pod katem zależności między danymi.Postaramy się również sprawdzić czy wyniki otrzymane dla obu metod są istotnie różne. W szczególności, sprawdzimy czy można analizować zbiór danych pod katem jednej z metod nie tracąc przy tym ogólnego obrazu jaki przedstawiała druga z nich.
The thesis is to present two methods for dimension reduction: Principal Component Analysis (PCA) and Canonical Correlation Analysis (CCA). Both methods are related to the Factor Analysis, however they are based on different assumptions which leads to the distinct purposes and results. The first part will show mathematical definitions, which are crucial for the analysis. After that, we will present proofs of basic theorems which are origins of the two methods.The thesis includes also description of PCA and CCA algorithms with mathematical calculations based on dummy variables. In the last part, we will take real data from the base of R package and use them to present and interpret results of the two analysis, calculated by the computer program.
dc.abstract.en | The thesis is to present two methods for dimension reduction: Principal Component Analysis (PCA) and Canonical Correlation Analysis (CCA). Both methods are related to the Factor Analysis, however they are based on different assumptions which leads to the distinct purposes and results. The first part will show mathematical definitions, which are crucial for the analysis. After that, we will present proofs of basic theorems which are origins of the two methods.The thesis includes also description of PCA and CCA algorithms with mathematical calculations based on dummy variables. In the last part, we will take real data from the base of R package and use them to present and interpret results of the two analysis, calculated by the computer program. | pl |
dc.abstract.pl | Praca poświęcona jest zagadnieniom statystycznym z dziedziny wielowymiarowej analizy danych. Celem jest omówienie podstawowych metod redukcji wymiaru danych, jakimi są analiza głównych składowych (ang. PCA- Principal Component Analysis) oraz analiza korelacji kanonicznych (ang. CCA - Canonical Correlation Analysis). Metody te pochodzą z analizy czynnikowej, służą wiec do odkrywania ukrytych struktur w zbiorze zmiennych losowych. Ponieważ jednak opierają się one na różnych kryteriach, rezultatem są odmienne wyniki, które przedstawiają zależności miedzy danymi z różnych punktów widzenia.Pierwsza część pracy poświęcona będzie zagadnieniom matematycznym, które wyjaśnią problem redukcji danych z teoretycznego punktu widzenia. W głównej mierze będą to zagadnienia jakie związane są z tego typu analizami, a także dowody podstawowych twierdzeń, na których opierają się obie metody.Kolejnym zagadnieniem jakie zostanie omówione jest algorytmizacja metod, czyli przedstawienie kolejnych kroków stosowanych w praktyce algorytmów, operując na teoretycznych zmiennych.Ostatnia rzeczą jaka zostanie zawarta będzie przeprowadzenie przykładowych analiz konkretnego zbioru danych, za pomocą programów komputerowych i gotowych algorytmów. Analiza zawierać będzie omówienie i ocenę wyników, a także interpretacje rezultatów pod katem zależności między danymi.Postaramy się również sprawdzić czy wyniki otrzymane dla obu metod są istotnie różne. W szczególności, sprawdzimy czy można analizować zbiór danych pod katem jednej z metod nie tracąc przy tym ogólnego obrazu jaki przedstawiała druga z nich. | pl |
dc.affiliation | Wydział Matematyki i Informatyki | pl |
dc.area | obszar nauk ścisłych | pl |
dc.contributor.advisor | Kościelniak, Piotr - 129220 | pl |
dc.contributor.advisor | Mazur, Marcin - 130444 | pl |
dc.contributor.author | Sobczyk, Aneta | pl |
dc.contributor.departmentbycode | UJK/WMI2 | pl |
dc.contributor.reviewer | Kościelniak, Piotr - 129220 | pl |
dc.contributor.reviewer | Mazur, Marcin - 130444 | pl |
dc.date.accessioned | 2020-07-25T04:38:04Z | |
dc.date.available | 2020-07-25T04:38:04Z | |
dc.date.submitted | 2014-10-20 | pl |
dc.fieldofstudy | matematyka stosowana | pl |
dc.identifier.apd | diploma-90956-115040 | pl |
dc.identifier.project | APD / O | pl |
dc.identifier.uri | https://ruj.uj.edu.pl/xmlui/handle/item/199185 | |
dc.language | pol | pl |
dc.subject.en | statistics, reduction, analysis, data, algorithm | pl |
dc.subject.pl | statystyka, redukcja, analiza, dane, algorytm | pl |
dc.title | Analiza głównych składowych i analiza korelacji kanonicznych. Omówienie dwóch metod redukcji danych | pl |
dc.title.alternative | Principal Component Analysis and Canonical Correlation Analysis. Presentation of two methods for dimension reduction. | pl |
dc.type | master | pl |
dspace.entity.type | Publication |