
총 15개
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
한국방송통신대학교 통계데이터과학과 다변량분석 2022년 출석과제(만점)2025.01.251. 주성분 분석 데이터의 요약 통계량을 확인하고 Boxplot으로 데이터의 분포를 확인하였다. 상관계수행렬과 산점도 행렬을 보고 변수들 간의 상관관계를 분석하였다. 주성분 분석을 실시하여 제 1주성분과 제 2주성분이 전체 정보의 86.4%를 설명하는 것을 확인하였다. 주성분 계수를 통해 각 변수들의 주성분에 대한 기여도를 파악하였다. 2. 인자분석 Bartlett의 구형성 검정과 KMO 검정을 통해 인자분석의 적합성을 확인하였다. 주성분 인자법을 이용한 인자분석 결과, 2개의 유의한 인자가 도출되었다. 직교회전 방식인 varima...2025.01.25
-
2023년 2학기 파이썬과R 출석수업 중간과제 리포트 30점 만점2025.01.251. 파이썬 파이썬은 현재 가장 널리 사용되는 프로그래밍 언어 중 하나로, 다양한 분야에서 활용되고 있습니다. 파이썬은 간단한 문법과 강력한 기능으로 인해 초보자들도 쉽게 배울 수 있으며, 데이터 분석, 머신러닝, 웹 개발 등 다양한 용도로 사용됩니다. 2. R R은 통계 분석과 데이터 시각화에 특화된 프로그래밍 언어입니다. R은 다양한 통계 패키지와 라이브러리를 제공하여 복잡한 데이터 분석을 쉽게 수행할 수 있습니다. 또한 ggplot2와 같은 강력한 시각화 도구를 통해 데이터를 효과적으로 표현할 수 있습니다. 3. 중간과제 중간...2025.01.25
-
서울시 공공자전거 이용현황 분석 및 활성화 방안(R을 이용한 빅데이터 분석)2025.05.021. 서울시 공공자전거 이용현황 분석 서울시 공공자전거 이용정보 데이터를 분석하여 이용 현황을 파악하고 문제점을 발견했습니다. 주요 이용자는 직장인이며 출퇴근 목적으로 이용하는 것으로 나타났습니다. 서울 중심부보다 외곽지역에서 많이 이용하며, 특히 한강을 따라 동서 지역에서 이용이 집중되어 있습니다. 2. 서울시 공공자전거 활성화 방안 분석 결과를 바탕으로 다음과 같은 활성화 및 개선방안을 제안했습니다. 1) 평일 낮 시간대 이용 장려를 위한 시간별 할인요금 적용, 2) 출퇴근 시간 집중지역으로 자전거 반납 시 쿠폰 지급, 3) 기...2025.05.02
-
2023년 1학년 1학기 방통대 데이터정보처리입문 출석수업 중간과제(만점)2025.01.251. 출생성비 출생성비는 여아 100명당 남아의 수를 나타내는 지표로, 1990년부터 2021년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 경향을 설명하였다. 1990년부터 1997년까지 다소 급격한 하락을, 이후로는 완만한 하락세를 보이고 있다. 또한 서울과 부산의 총출생성비를 비교하여 설명하였는데, 1990년부터 1998년까지 부산이 서울보다 높았으나 이후 점진적으로 감소내지 약화되다가 2002년부터 서울이 부산보다 높아지는 역전현상이 발생하였다. 2. 합계출산율 합계출산율은 한 여자가 가임기간 동안 낳을 것으로 예상되...2025.01.25
-
R데이터분석 2024년 2학기 방송통신대 출석수업대체과제물)R ggplot2 패키지에 내장된 mtcars 데이터셋은 32개의 차종에 대한 정보를 담고 있다2025.01.261. 변속기 종류에 따른 연비 차이 검정 변속기의 종류(am)에 따라 연비(mpg)의 평균이 달라지는지 검정한 결과, p-value가 0.001374로 유의수준 0.05보다 작으므로 변속기 종류에 따라 연비가 차이가 있다는 것을 확인하였다. 2. 실린더 수에 따른 연비 분포 차이 실린더 수(cyl)에 따른 연비(mpg)의 분포 차이를 상자그림으로 나타내었다. 실린더 수가 증가할수록 연비가 감소하는 경향을 확인할 수 있다. 3. 실린더 수에 따른 연비 평균 차이 검정 실린더 수(cyl)에 따라 연비(mpg)의 평균이 달라지는지 검정한...2025.01.26
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
방통대 [다변량분석] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 다변량분석 이 과제물은 방송통신대학교 다변량분석 교과목의 2024년 출석과제물입니다. 과제물에는 R과 Python을 사용한 다양한 다변량분석 기법들이 포함되어 있습니다. 주요 내용으로는 산점도 분석, 주성분분석, 표준화, 계층적 군집분석, K-평균 군집분석 등이 있습니다. 각 분석 기법에 대한 코드와 해설이 자세히 제공되어 있어 다변량분석 학습에 도움이 될 것입니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계를 보다 정확하게 이해하고 예측하는 데 도...2025.01.25
-
30점 만점 방통대 다변량분석 2024-1학기2025.01.261. t-분포 난수 생성 및 분석 R과 파이썬을 이용하여 자유도가 5인 t-분포를 따르는 난수 100개를 생성하고 히스토그램, 상자그림, 줄기-잎 그림을 그려 분석하였다. 난수 생성 시 학번 뒤 4자리로 seed를 설정하였으며, R에서는 rt() 함수, 파이썬에서는 np.random.standard_t() 함수를 사용하였다. 히스토그램 결과 -4부터 4 이상 범위에 분포하며 오른쪽 꼬리가 긴 모양이었고, 상자그림 결과 중앙값이 0에 가깝고 제1사분위수와 제3사분위수가 각각 -2보다 크고 2보다 작았다. 줄기-잎 그림 결과 -1과 1...2025.01.26