총 13개
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
데이터 시각화, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 데이터 시각화의 사례 1970년부터 2022년까지 발생한 학교 총기 사건의 피해자 데이터를 시각화한 사례는 효율적이며 명료하다. 많은 데이터를 하나의 지도에 나타내어 어느 지역에서 어떤 규모의 사고가 났는지를 한눈에 볼 수 있다. 2. 데이터 시각화의 역할 한스 로슬링의 TED 강의에서는 다양한 지표들을 활용한 동적 데이터 시각화를 통해 잘 된 데이터 시각화가 방대하고 복잡한 자료를 한눈에 명료하게 볼 수 있게 하며 데이터를 잘 인지할 수 있게 도와준다는 것을 확인할 수 있었다. 3. 포유동물의 몸무게와 뇌 무게 msleep ...2025.01.25
-
2023년 1학년 1학기 방통대 데이터정보처리입문 출석수업 중간과제(만점)2025.01.251. 출생성비 출생성비는 여아 100명당 남아의 수를 나타내는 지표로, 1990년부터 2021년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 경향을 설명하였다. 1990년부터 1997년까지 다소 급격한 하락을, 이후로는 완만한 하락세를 보이고 있다. 또한 서울과 부산의 총출생성비를 비교하여 설명하였는데, 1990년부터 1998년까지 부산이 서울보다 높았으나 이후 점진적으로 감소내지 약화되다가 2002년부터 서울이 부산보다 높아지는 역전현상이 발생하였다. 2. 합계출산율 합계출산율은 한 여자가 가임기간 동안 낳을 것으로 예상되...2025.01.25
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
2023년 2학기 파이썬과R 출석수업 중간과제 리포트 30점 만점2025.01.251. 파이썬 파이썬은 현재 가장 널리 사용되는 프로그래밍 언어 중 하나로, 다양한 분야에서 활용되고 있습니다. 파이썬은 간단한 문법과 강력한 기능으로 인해 초보자들도 쉽게 배울 수 있으며, 데이터 분석, 머신러닝, 웹 개발 등 다양한 용도로 사용됩니다. 2. R R은 통계 분석과 데이터 시각화에 특화된 프로그래밍 언어입니다. R은 다양한 통계 패키지와 라이브러리를 제공하여 복잡한 데이터 분석을 쉽게 수행할 수 있습니다. 또한 ggplot2와 같은 강력한 시각화 도구를 통해 데이터를 효과적으로 표현할 수 있습니다. 3. 중간과제 중간...2025.01.25
-
2024년 1학기 방송통신대 출석수업대체과제물 다변량분석) R과 파이썬을 각각 이용하여 작성하시오. 교재 연습문제 1장 3번, 4번 2장 3번 4장 3번 (1)-(3)2025.01.251. t-분포 난수 생성 및 분석 자유도가 5인 t-분포를 따르는 난수 100개를 R과 파이썬을 이용하여 생성하고, 히스토그램, 상자그림, 줄기-잎 그림을 그려 t-분포의 특성을 분석하였다. 히스토그램에서는 0을 중심으로 대칭의 모습을 보이지만 완전한 대칭은 아니며, 상자그림에서는 평균값이 0보다 약간 작은 것으로 나타났다. 줄기-잎 그림에서도 0점대를 중심으로 대칭의 구조를 보이고 있으나 일부 이상치가 확인되었다. 2. Longley 데이터 분석 R에 내장된 Longley 데이터를 이용하여 산점도행렬, 별그림, 얼굴그림을 그려 변...2025.01.25
-
방통대 [다변량분석] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 다변량분석 이 과제물은 방송통신대학교 다변량분석 교과목의 2024년 출석과제물입니다. 과제물에는 R과 Python을 사용한 다양한 다변량분석 기법들이 포함되어 있습니다. 주요 내용으로는 산점도 분석, 주성분분석, 표준화, 계층적 군집분석, K-평균 군집분석 등이 있습니다. 각 분석 기법에 대한 코드와 해설이 자세히 제공되어 있어 다변량분석 학습에 도움이 될 것입니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계를 보다 정확하게 이해하고 예측하는 데 도...2025.01.25
-
한국방송통신대학교 통계데이터과학과 다변량분석 2022년 출석과제(만점)2025.01.251. 주성분 분석 데이터의 요약 통계량을 확인하고 Boxplot으로 데이터의 분포를 확인하였다. 상관계수행렬과 산점도 행렬을 보고 변수들 간의 상관관계를 분석하였다. 주성분 분석을 실시하여 제 1주성분과 제 2주성분이 전체 정보의 86.4%를 설명하는 것을 확인하였다. 주성분 계수를 통해 각 변수들의 주성분에 대한 기여도를 파악하였다. 2. 인자분석 Bartlett의 구형성 검정과 KMO 검정을 통해 인자분석의 적합성을 확인하였다. 주성분 인자법을 이용한 인자분석 결과, 2개의 유의한 인자가 도출되었다. 직교회전 방식인 varima...2025.01.25
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26
-
R데이터분석 2024년 2학기 방송통신대 출석수업대체과제물)R ggplot2 패키지에 내장된 mtcars 데이터셋은 32개의 차종에 대한 정보를 담고 있다2025.01.261. 변속기 종류에 따른 연비 차이 검정 변속기의 종류(am)에 따라 연비(mpg)의 평균이 달라지는지 검정한 결과, p-value가 0.001374로 유의수준 0.05보다 작으므로 변속기 종류에 따라 연비가 차이가 있다는 것을 확인하였다. 2. 실린더 수에 따른 연비 분포 차이 실린더 수(cyl)에 따른 연비(mpg)의 분포 차이를 상자그림으로 나타내었다. 실린더 수가 증가할수록 연비가 감소하는 경향을 확인할 수 있다. 3. 실린더 수에 따른 연비 평균 차이 검정 실린더 수(cyl)에 따라 연비(mpg)의 평균이 달라지는지 검정한...2025.01.26