총 13개
-
출석수업에서 다룬 데이터 분석 과정과 빅데이터 분석에 대한 이해2025.01.241. 데이터 분석 과정 출석수업에서는 R 프로그래밍 언어를 이용하여 'The Billion Prices Project'의 공개 데이터 'Our Public Data'를 분석했습니다. 데이터의 구성을 살펴보고, 국가별 가격 데이터 개수의 히스토그램을 그렸습니다. 또한 온라인과 오프라인 가격 차이를 비교하고, 국가 간 가격 차이의 표준편차를 구해 히스토그램으로 나타냈습니다. 2. 빅데이터 분석의 특징 빅데이터는 volume, variety, velocity, variability, veracity의 5가지 특징을 가집니다. 데이터의 규...2025.01.24
-
방통대 통계데이터학과 R컴퓨팅 A+2025.01.241. R 프로그래밍 이 프레젠테이션은 R 프로그래밍 언어를 사용하여 다양한 통계 작업을 수행하는 방법을 다룹니다. 주요 내용으로는 벡터 생성, 통계 함수 사용, 결측치 처리, 데이터 추출 및 조작, 성적 등급 부여, 반복문 활용 등이 포함됩니다. 2. 통계 데이터 분석 이 프레젠테이션은 R 프로그래밍을 통해 통계 데이터를 분석하는 방법을 소개합니다. 주요 내용으로는 USArrests 데이터셋을 활용한 데이터 추출 및 통계량 계산, 모의시험 점수 데이터를 이용한 성적 등급 부여 등이 포함됩니다. 3. 반복문 활용 이 프레젠테이션은 f...2025.01.24
-
(방송대) 다변량분석, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 다변량분석 이 자료는 R 프로그래밍을 사용하여 다변량 분석을 수행하는 방법을 설명합니다. 다변량 분석은 여러 개의 변수를 동시에 분석하는 통계 기법으로, 변수들 간의 관계를 파악하고 이해하는 데 유용합니다. 이 자료에서는 R에 내장된 'longley' 데이터셋을 사용하여 산점도 행렬, 별그림, 얼굴그림 등의 시각화 기법을 통해 변수 간 상관관계를 분석하고 해석하는 과정을 보여줍니다. 1. 다변량분석 다변량분석은 여러 개의 변수들 간의 관계를 동시에 분석하는 통계 기법입니다. 이 기법은 복잡한 현실 세계의 문제를 이해하고 해결하...2025.01.25
-
2023년 1학기 방통대 R컴퓨팅 출석수업 중간과2025.01.251. R 프로그래밍 R은 약 20년 전 어문계 사범대학을 졸업하고 이후 제약회사의 국내외 업무를 하다가 금년도 이렇게 방송통신대학교 통계-데이터과학과에 편입하고서야 처음 접하게 되는 프로그래밍 언어입니다. 이전까지는 R의 R자도 들어보지 못하였고, 첫학기(한학기)의 중반이 넘어가고 있는 지금에도 아직 생경한 것이 사실입니다. 다행인 것은 이 R컴퓨팅 과목뿐만 아니라 함께 수강하고 있는 몇 과목들, 예를 들어 통계학개론이나 정보처리입문과 같은 과목에서 R에 대해 부분적으로 반복적으로 배울 수 있어 학습-습득에 도움이 되고 있습니다. ...2025.01.25
-
데이터 정보처리 입문 이 교수님은 원래 만점 안주심 그래서 29점짜리 과제임 하지만 완벽함2025.01.251. 전국 총출생성비 추이 1994년도부터 1997년즈음까지 특히 수직하락하는 모습을 보인다. 1999년즈음부터 조금 높아졌고 전체적으로는 계속 낮아지는 경향을 보인다. 90년대초반까지는 출생성비가 116을 넘기도 했으나, 현대에 들어 점차 남아 선호사상이 위측되는 등의 이유로 남아 출산의 비율이 꾸준히 떨어지고 있으며, 2020년에는 10.8까지 낮아졌다. 2. 서울과 경상북도의 총출생성비 비교 서울과 경북의 총 출생성비는 2007년 기점부터는 크게 차이가 없다. 그 전에는 대도시인 서울보다 경상북도의 출생성비가 더 높은 모습을 ...2025.01.25
-
1990년부터 2022년까지의 연도별 전국 총출생성비 시계열 분석2025.01.251. 총출생성비 시계열 분석 1990년부터 2022년까지의 전국 총출생성비 데이터를 시계열도표로 나타내고 경향을 설명하였습니다. 데이터 분석을 위해 R 프로그래밍 언어를 사용하여 줄기-잎 그림, 히스토그램, 상자그림 등의 시각화 기법을 적용하였습니다. 이를 통해 데이터의 분포와 특성을 파악할 수 있었습니다. 1. 총출생성비 시계열 분석 총출생성비는 한 여성이 가임기 동안 낳을 것으로 예상되는 평균 출생아 수를 나타내는 지표입니다. 이 지표는 인구 변화와 관련된 중요한 정보를 제공합니다. 시계열 분석을 통해 총출생성비의 추이와 변화 ...2025.01.25
-
방통대 [데이터시각화] 2024 출석과제물 (30점 만점 인증 / 표지제외 29페이지 분량 / 코드 및 해설 포함)2025.01.251. 워드 클라우드 워드 클라우드는 텍스트 데이터에서 단어의 빈도 수가 높을수록 큰 글씨로 표현하는 시각화 기법이다. 주제나 핵심 키워드를 쉽고 효과적으로 전달할 수 있다는 장점이 있다. SNS 데이터에서 인기 키워드를 찾거나 연설문에서 핵심 내용과 주제를 찾는데 유용하게 사용될 수 있다. 또한 온라인 게시글에서 여론을 찾아내기도 하며 고객 리뷰에 대한 요약을 제공하기도 한다. 특히나 미국 대선 때 사용되는 워드 클라우드에서는 각 후보자의 핵심 공약이나 정책 방향, 이슈, 유권자들이 중요하게 생각하는 가치관을 직관적으로 확인할 수 ...2025.01.25
-
방송통신대학교 통계데이터학과)바이오통계학 중간과제물 (30점 만점 A+)2025.01.261. 모집단, 표본, 모수, 통계량 모집단은 우리가 알고 싶은 대상 전체를 의미하며, 표본은 모집단의 일부를 실제로 관측한 것을 말한다. 모수는 모집단 전체의 특성을 나타내는 값이고, 통계량은 표본의 특성을 나타내는 값이다. 이 문제에서 모집된 만 7세 아동 100명은 표본에 해당한다. 2. 히스토그램 그리기 R 프로그래밍을 이용하여 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그렸다. 이를 통해 데이터의 분포 특성을 시각적으로 확인할 수 있다. 3. 중앙값 구하기 R 프로그래밍을 이용하여 이 데이터에 포함된 156명 전체의...2025.01.26
-
방송통신대학교 통계데이터학과) R컴퓨팅 출석과제물 (30점 만점 A+)2025.01.261. R 프로그래밍 제출된 자료에는 R 프로그래밍을 활용한 다양한 작업이 포함되어 있습니다. 이를 통해 R 언어의 기본 문법과 통계 함수 사용법, 데이터 처리 및 분석 기법 등을 익힐 수 있습니다. 특히 학번을 이용한 벡터 생성, 결측치 처리, airquality 데이터셋 활용 등의 내용이 포함되어 있습니다. 2. 통계 데이터 분석 제출된 자료에는 통계 데이터 분석과 관련된 내용이 포함되어 있습니다. 벡터 데이터의 평균, 분산, 중앙값 계산, airquality 데이터셋의 결측치 확인 및 분석 등을 통해 통계 데이터 처리 및 분석 ...2025.01.26
-
방송통신대학교 통계데이터학과) 데이터시각화 기말과제물 (50점 만점 A+)2025.01.261. 데이터 시각화 사례 뉴스제목: 씨 마른 서울 중저가 아파트…6억원 미만 거래 '역대 최저' 날짜: 2024/05/08 게재된 매체 이름: 아시아타임즈(기업과 경제 코너) 데이터 시각화는 2006년부터 2024년 1분기까지의 서울 금액대별 아파트 거래비중을 나타낸 자료로, 고금리 등의 영향으로 집값이 상승하면서 서울 내 6억원 이하 단지의 거래가 많이 줄어든 반면 '똘똘한 한 채' 선호 현상이 지속되는 가운데 9억원 이상~15억원 미만 아파트 거래가 증가하는 경향을 보여주고 있다. 데이터 시각화 방식은 백분율 누적 막대그래프로...2025.01.26