총 5개
-
PCA & SVD2025.01.131. PCA (주성분 분석) PCA는 데이터의 분산(variance)을 최대한 보존하면서 서로 직교하는 새 기저(축)를 찾아, 고 차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 기법입니다. 데이터의 분산을 최대로하는 새로운 기저를 찾기 위해서는 데이터 행렬 A의 공분산 행렬을 구해야 합니다. 공분산 행렬의 고유분해(Eigendecomposition)를 통해 가장 큰 고유값 몇 개를 고르고, 그에 해당하는 고유벡터를 새로운 기저로 하여 데이터 벡터들을 정사영시키면 PCA 작업이 완료됩니다. 2. SVD (특이값 분...2025.01.13
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
한국방송통신대학교 통계데이터과학과 다변량분석 2022년 출석과제(만점)2025.01.251. 주성분 분석 데이터의 요약 통계량을 확인하고 Boxplot으로 데이터의 분포를 확인하였다. 상관계수행렬과 산점도 행렬을 보고 변수들 간의 상관관계를 분석하였다. 주성분 분석을 실시하여 제 1주성분과 제 2주성분이 전체 정보의 86.4%를 설명하는 것을 확인하였다. 주성분 계수를 통해 각 변수들의 주성분에 대한 기여도를 파악하였다. 2. 인자분석 Bartlett의 구형성 검정과 KMO 검정을 통해 인자분석의 적합성을 확인하였다. 주성분 인자법을 이용한 인자분석 결과, 2개의 유의한 인자가 도출되었다. 직교회전 방식인 varima...2025.01.25
-
30점 만점 방통대 다변량분석 2024-1학기2025.01.261. t-분포 난수 생성 및 분석 R과 파이썬을 이용하여 자유도가 5인 t-분포를 따르는 난수 100개를 생성하고 히스토그램, 상자그림, 줄기-잎 그림을 그려 분석하였다. 난수 생성 시 학번 뒤 4자리로 seed를 설정하였으며, R에서는 rt() 함수, 파이썬에서는 np.random.standard_t() 함수를 사용하였다. 히스토그램 결과 -4부터 4 이상 범위에 분포하며 오른쪽 꼬리가 긴 모양이었고, 상자그림 결과 중앙값이 0에 가깝고 제1사분위수와 제3사분위수가 각각 -2보다 크고 2보다 작았다. 줄기-잎 그림 결과 -1과 1...2025.01.26
-
방통대 [다변량분석] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 다변량분석 이 과제물은 방송통신대학교 다변량분석 교과목의 2024년 출석과제물입니다. 과제물에는 R과 Python을 사용한 다양한 다변량분석 기법들이 포함되어 있습니다. 주요 내용으로는 산점도 분석, 주성분분석, 표준화, 계층적 군집분석, K-평균 군집분석 등이 있습니다. 각 분석 기법에 대한 코드와 해설이 자세히 제공되어 있어 다변량분석 학습에 도움이 될 것입니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계를 보다 정확하게 이해하고 예측하는 데 도...2025.01.25