
총 24개
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26
-
방통대 통계데이터과학과 R데이터분석 A+2025.01.241. 성과점수 분석 1. 연구 종료 시점에서의 성과점수(t2)의 상자그림을 성별로 나란히 그렸습니다. 그래프의 제목으로 본인의 학번을 넣었습니다. 2. 성별에 따라 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 성별에 따른 성과점수의 평균에 차이가 있는 것으로 나타났습니다(p-value = 0.04677<0.05). 3. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균을 구했습니다. 4. 스트레스 그룹 별로 연구 종료 시점에서의 성과점수(t2)의 평균에 차이가 있는지 검정한 결과, 스트레...2025.01.24
-
모집단과 표본의 관계 설명2025.01.101. 모집단과 표본의 관계 모집단은 특정한 정보를 얻고자 하는 전체 대상 혹은 집합을 의미하며, 표본은 연구자가 측정하거나 관찰한 결과들의 집합입니다. 모집단 전체를 대상으로 전수조사를 하는 것은 비효율적이므로, 연구자들은 표본을 측정하거나 관찰하여 모집단을 추정하게 됩니다. 모집단의 특성으로는 모평균, 모분산, 모표준편차 등이 있고, 표본집단의 특성으로는 표본평균, 표본분산, 표본표준편차 등이 있습니다. 2. 도수분포표와 히스토그램 도수분포표는 자료의 분포를 몇 개의 구간으로 분할하고, 각 구간에 포함되는 자료의 개수를 정리한 표...2025.01.10
-
경영통계학 ) (a) 영화 30개를 무작위로 골라 영화 제목과 상영시간(분)을 기록하시오. (b) 빈포분포표와 히스토그램을 작성하고, 히스토그램을 설명하시오. (c) 평균, 중앙값, 최빈값을 계산하고, 이 중 가장 좋은 중2025.05.071. 경영통계학 경영은 일반적인 사람의 기준에서 봤을 때 기업을 대상으로 하므로 계량화하거나 지표로 나타내는 것에는 한계가 있다. 경영 성과에 대해서는 수익률이나 상장기업은 주가로 그 수치를 나타낼 수 있지만 마케팅적 측면에서 소비자의 선호나 인적 자원 관리 측면에서 직원의 성과 정도를 수치화하는 것은 쉽지 않다. 그리고 기업 내부에서 조사하는 것이기 때문에 객관적인 답이 도출되지 않을 수도 있다. 이러한 이유로 통계학이 경영에서 관심 받고 있는 이유이다. 통계학은 경영의 다양한 분야에서 활용할 수 있다. 먼저 생산하는 기업이라면 ...2025.05.07
-
2024년 1학기 방송통신대 통계학개론 출석대체과제물2025.01.251. 히스토그램 히스토그램은 데이터의 분포를 시각적으로 나타내는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 히스토그램을 그릴 수 있습니다. 2. 상자그림 상자그림은 데이터의 중앙값, 사분위수, 최솟값, 최댓값 등을 한눈에 볼 수 있는 그래프입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 상자그림을 그릴 수 있습니다. 3. 다섯수치요약 다섯수치요약은 데이터의 최솟값, 제1사분위수, 중앙값, 평균값, 제3사분위수, 최댓값을 나타내는 통계량입니다. 제시된 코드와 결과를 통해 16명의 데이터에 대한 다섯수치...2025.01.25
-
방송통신대학교 통계데이터학과) 파이썬과 R 출석수업과제물 (30점 만점 A+)2025.01.261. R 데이터프레임 생성 R을 사용하여 name, height, weight 3개의 열을 갖는 데이터프레임을 생성하고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 2. 파이썬 딕셔너리 생성 x1, x2, x3 리스트를 사용하여 name, height, weight 키를 가진 파이썬 딕셔너리를 생성하였습니다. 3. 파이썬 데이터프레임 생성 파이썬에서 생성한 딕셔너리를 사용하여 데이터프레임을 만들고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 4. 파이썬 함수...2025.01.26
-
데이터를 가지고 정규분포 근사하기2025.05.111. 정규분포 근사 데이터의 분포를 정규분포에 근사시키는 과정은 데이터 분석에서 중요한 부분을 차지합니다. 데이터의 정규성을 평가하는 첫 번째 단계로 시각적 확인이 필요하며, 히스토그램과 QQ 플롯을 통해 데이터와 정규분포의 일치 정도를 확인할 수 있습니다. 또한 샤피로-위크스 검정과 같은 수치적 정규성 검증 방법을 통해 데이터가 정규분포를 따르는지 통계적으로 평가할 수 있습니다. 정규성 검정은 통계적 분석의 기반이 되며, 적절한 모델링 선택과 데이터 변환 등의 조치를 취하는데 도움을 줍니다. 2. 정규분포 가정의 중요성 많은 통계...2025.05.11
-
경영통계학 ) 최근 1년간 개봉한 영화 30개 분석2025.01.291. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간 데이터를 수집하여 분석하였습니다. 빈도분포표와 히스토그램을 작성하여 데이터의 분포를 확인하였고, 평균, 중앙값, 최빈값을 계산하여 중심 경향성을 분석하였습니다. 중앙값이 가장 좋은 중심 측정치라고 판단하였는데, 그 이유는 중앙값이 특이값의 영향을 받지 않고 데이터의 중심을 잘 나타내기 때문입니다. 또한 데이터를 표준화하여 특이값을 확인한 결과, 1개의 특이값이 발견되었습니다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 부분입니다...2025.01.29
-
통계적품질관리 ) 도수분포표와 히스토그램 작성2025.05.131. 도수분포표 작성 제공된 데이터를 바탕으로 적절한 계급의 수를 정하여 도수분포표를 작성하였습니다. 계급의 수는 8개로 정하였고, 계급 폭은 0.14cm로 설정하였습니다. 도수분포표에는 계급, 도수, 누적도수, 상대도수, 누적상대도수 등의 정보가 포함되어 있습니다. 2. 히스토그램 작성 도수분포표를 바탕으로 히스토그램을 작성하였습니다. 세로 막대형 그래프를 선택하고, 데이터 레이블을 추가하여 각 계급의 도수를 표시하였습니다. 또한 축 서식을 수정하여 계급 간격을 조정하였습니다. 3. 통계량 계산 도수분포표를 활용하여 평균, 중앙값...2025.05.13