
총 24개
-
경영통계학 ) (a) 영화 30개를 무작위로 골라 영화 제목과 상영시간(분)을 기록하시오. (b) 빈포분포표와 히스토그램을 작성하고, 히스토그램을 설명하시오. (c) 평균, 중앙값, 최빈값을 계산하고, 이 중 가장 좋은 중2025.05.071. 경영통계학 경영은 일반적인 사람의 기준에서 봤을 때 기업을 대상으로 하므로 계량화하거나 지표로 나타내는 것에는 한계가 있다. 경영 성과에 대해서는 수익률이나 상장기업은 주가로 그 수치를 나타낼 수 있지만 마케팅적 측면에서 소비자의 선호나 인적 자원 관리 측면에서 직원의 성과 정도를 수치화하는 것은 쉽지 않다. 그리고 기업 내부에서 조사하는 것이기 때문에 객관적인 답이 도출되지 않을 수도 있다. 이러한 이유로 통계학이 경영에서 관심 받고 있는 이유이다. 통계학은 경영의 다양한 분야에서 활용할 수 있다. 먼저 생산하는 기업이라면 ...2025.05.07
-
경영통계학 ) 최근 1년간 개봉한 영화 30개 분석2025.01.291. 영화 상영 시간 분석 최근 1년간 개봉한 영화 30개의 상영 시간 데이터를 수집하여 분석하였습니다. 빈도분포표와 히스토그램을 작성하여 데이터의 분포를 확인하였고, 평균, 중앙값, 최빈값을 계산하여 중심 경향성을 분석하였습니다. 중앙값이 가장 좋은 중심 측정치라고 판단하였는데, 그 이유는 중앙값이 특이값의 영향을 받지 않고 데이터의 중심을 잘 나타내기 때문입니다. 또한 데이터를 표준화하여 특이값을 확인한 결과, 1개의 특이값이 발견되었습니다. 1. 영화 상영 시간 분석 영화 상영 시간 분석은 영화 산업에서 매우 중요한 부분입니다...2025.01.29
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26
-
방송통신대학교 통계데이터학과) 파이썬과 R 출석수업과제물 (30점 만점 A+)2025.01.261. R 데이터프레임 생성 R을 사용하여 name, height, weight 3개의 열을 갖는 데이터프레임을 생성하고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 2. 파이썬 딕셔너리 생성 x1, x2, x3 리스트를 사용하여 name, height, weight 키를 가진 파이썬 딕셔너리를 생성하였습니다. 3. 파이썬 데이터프레임 생성 파이썬에서 생성한 딕셔너리를 사용하여 데이터프레임을 만들고, 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)을 배열로 추출하였습니다. 4. 파이썬 함수...2025.01.26
-
데이터를 가지고 정규분포 근사하기2025.05.111. 정규분포 근사 데이터의 분포를 정규분포에 근사시키는 과정은 데이터 분석에서 중요한 부분을 차지합니다. 데이터의 정규성을 평가하는 첫 번째 단계로 시각적 확인이 필요하며, 히스토그램과 QQ 플롯을 통해 데이터와 정규분포의 일치 정도를 확인할 수 있습니다. 또한 샤피로-위크스 검정과 같은 수치적 정규성 검증 방법을 통해 데이터가 정규분포를 따르는지 통계적으로 평가할 수 있습니다. 정규성 검정은 통계적 분석의 기반이 되며, 적절한 모델링 선택과 데이터 변환 등의 조치를 취하는데 도움을 줍니다. 2. 정규분포 가정의 중요성 많은 통계...2025.05.11
-
통계적품질관리 ) 도수분포표와 히스토그램 작성2025.05.131. 도수분포표 작성 제공된 데이터를 바탕으로 적절한 계급의 수를 정하여 도수분포표를 작성하였습니다. 계급의 수는 8개로 정하였고, 계급 폭은 0.14cm로 설정하였습니다. 도수분포표에는 계급, 도수, 누적도수, 상대도수, 누적상대도수 등의 정보가 포함되어 있습니다. 2. 히스토그램 작성 도수분포표를 바탕으로 히스토그램을 작성하였습니다. 세로 막대형 그래프를 선택하고, 데이터 레이블을 추가하여 각 계급의 도수를 표시하였습니다. 또한 축 서식을 수정하여 계급 간격을 조정하였습니다. 3. 통계량 계산 도수분포표를 활용하여 평균, 중앙값...2025.05.13
-
통계처리와 측정오차 보정 결과보고서2025.04.261. 통계 처리 실험에서 얻은 데이터를 통계학적으로 분석하여 유의미한 정보를 얻어내고 데이터의 오차를 보정하는 방법을 알아보았다. 산술평균, 표준편차, 도수분포표, 히스토그램 등의 통계 기법을 사용하여 데이터를 분석하였다. 하지만 데이터의 수가 충분하지 않고 연령별 특성을 고려하지 않아 정규분포 모양이 나타나지 않았다. 향후 더 많은 데이터와 연령별 분석이 필요할 것으로 보인다. 2. 측정 오차 보정 최소자승법을 이용하여 임의의 입력값과 출력값 간의 관계식을 구하고 상관계수를 계산하였다. 그 결과 실험 자료를 잘 근사시킨 것으로 나...2025.04.26
-
주사위 던지기 시뮬레이션과 질병 진단 확률 분석2025.01.251. 주사위 던지기 시뮬레이션 R 프로그램을 활용하여 주사위 던지기를 20번, 200번, 2000번, 20000번 실행하고 그 결과를 히스토그램으로 나타냈습니다. 주사위 던지기는 독립 시행이며 각 숫자가 나올 확률이 동일합니다. 시행 횟수가 많아질수록 그래프가 균일해지는 것을 확인할 수 있습니다. 2. 질병 진단 확률 계산 전체 인구의 3%가 질병을 앓고 있으며, 진단 키트 검사 결과가 양성일 때 이 사람이 질병에 걸렸을 확률을 계산했습니다. 질병에 걸렸을 때 진단 키트가 양성을 보일 확률과 질병에 걸렸을 확률을 곱한 뒤 진단 키트...2025.01.25
-
R데이터분석 출석수업 과제물 (2023, 만점)2025.01.241. R datarium 패키지 내 jobsatisfaction 데이터셋 분석 1) 직업만족도점수의 상자그림을 성별로 나란히 그렸고, 상자그림을 통해 남성의 직업만족도점수의 중앙값은 여성보다 낮으며, 분포는 여성보다 넓게 퍼진 모습을 확인할 수 있었다. 2) 남성의 직업만족도점수 평균은 7.06, 여성의 직업만족도점수 평균은 6.87이었다. 3) 성별에 따른 직업만족도점수 평균의 차이는 없다고 할 수 있었다. 4) 교육수준에 따른 직업만족도점수 평균에서 적어도 하나 이상은 교육수준에 따라 유의미한 차이가 있다고 결론 내릴 수 있었다...2025.01.24
-
1990년부터 2022년까지의 연도별 전국 총출생성비 시계열 분석2025.01.251. 총출생성비 시계열 분석 1990년부터 2022년까지의 전국 총출생성비 데이터를 시계열도표로 나타내고 경향을 설명하였습니다. 데이터 분석을 위해 R 프로그래밍 언어를 사용하여 줄기-잎 그림, 히스토그램, 상자그림 등의 시각화 기법을 적용하였습니다. 이를 통해 데이터의 분포와 특성을 파악할 수 있었습니다. 1. 총출생성비 시계열 분석 총출생성비는 한 여성이 가임기 동안 낳을 것으로 예상되는 평균 출생아 수를 나타내는 지표입니다. 이 지표는 인구 변화와 관련된 중요한 정보를 제공합니다. 시계열 분석을 통해 총출생성비의 추이와 변화 ...2025.01.25