
총 121개
-
최대 우도 추정을 통한 확률 모델의 매개변수 추정2025.05.081. 최대 우도 추정(Maximum Likelihood Estimation, MLE) 최대 우도 추정은 주어진 데이터를 가장 잘 설명하는 모델의 매개변수 값을 찾는 과정으로, 우도 함수를 최대화하는 매개변수 값을 추정합니다. 이 방법은 데이터가 주어진 상황에서 가장 가능성이 높은 모델의 매개변수를 선택함으로써 최적의 예측을 수행하는데 도움을 줍니다. 2. 확률 모델링 확률 모델링은 다양한 분야에서 데이터 분석과 예측에 핵심적인 역할을 하고 있습니다. 데이터로부터 모델의 매개변수를 추정하는 과정은 모델의 정확성과 신뢰성을 높이는 데 ...2025.05.08
-
학생들의 IQ와 대학 합격률 분석2025.05.031. 임의의 한 학생이 대학에 합격할 확률 학생들의 IQ를 고려하지 않고 추가 정보가 주어지지 않은 경우, 임의의 한 학생이 대학에 합격할 확률은 520/1000 = 0.52, 즉 52%이다. 2. 임의의 한 학생이 IQ 125 이상일 확률 전체 학생 중 IQ가 125를 넘는 학생 수는 440명이고, 전체 학생 수는 1000명이다. 따라서, 임의로 한 학생을 택했을 때, 그 학생의 IQ가 125를 넘을 확률은 440/1000 = 0.44, 즉 44%이다. 3. 임의의 한 학생이 대학에 합격하면서 IQ도 125 이상일 확률 대학 합격...2025.05.03
-
통계실무 ) 1. 통계는 일상 속에서 많이 활용하고 있는데, 어느 분야에서 어떻게 활용되고 있는 설명하시오. 2. 우리가 모집단(population)에 대해 알아보기 위해 표본(Sample)을 조사하는데 그 이유가 무엇이라고 생각하는지 설명하시오.2025.04.261. 통계 활용 분야 통계는 제품의 기능개선 효과 여부를 설명하는데 많이 활용된다. 홈쇼핑방송의 화장품 광고에서 주름개선 화장품을 예로 들면, 50~60대 시험군을 30명을 대상으로 한달간 실험해본 결과, 제품 사용 전과 4주 사용 후, 주름, 피부수분, 광채, 피부 치밀도, 탄력의 개선율을 %로 제시하는 것을 볼 수 있다. 2. 표본 조사의 이유 모집단은 우리가 측정하고자 하는 집단 전체를 의미하지만, 모집단 전체를 조사하기에는 물리적 한계가 존재하므로 조사가 불가능에 가깝다. 이에 측정가능하며, 모집단을 대표할 수 있는 표본을 ...2025.04.26
-
신뢰도와 타당도는 측정도구의 우수함을 판별하기 위한 중요한 두 가지 기준2025.05.101. 타당도 타당도(validity)란 조사자가 "측정하고자 하는 개념이나 속성을 측정하기 위하여 개발된 측정도구를 통해 그 개념과 속성을 얼마나 정확히 측정하는가."를 말한다. 타당도는 측정한 값과 측정대상과의 진정한 값과의 일치 정도, 즉 측정하려는 개념(변수)에 대한 의미를 측정도구가 충분히 잘 반영하고 있는 정도를 의미한다. 2. 신뢰도 측정도구의 신뢰도란 측정도구에 의해 도출되는 측정값들이 얼마나 일정하게 산출되는지를 나타내는 측정의 일관성을 말한다. 즉, 측정도구를 동일한 응답자에게 반복해서 적용했을 때 어느 정도 일관된...2025.05.10
-
2024년 1학기 방송통신대 출석수업대체과제물 데이터정보처리입문2025.01.251. 연도별 전국 총출생성비 분석 1990년부터 2022년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하였다. 총출생성비는 여아 100명당 남아의 수를 나타내는 것으로, 1990년 이후 지속적으로 감소하는 추세를 보이고 있다. 다만 1990년대 중후반 이후에는 하락 속도가 다소 완화되고 있는 것으로 나타났다. 2. 서울과 부산의 총출생성비 비교 1990년부터 2022년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하였다. 대체로 2005년 이전에는 부산이 서울보다 총출생성비가 ...2025.01.25
-
2023년 2학기 파이썬과R 출석수업 중간과제 리포트 30점 만점2025.01.251. 파이썬 파이썬은 현재 가장 널리 사용되는 프로그래밍 언어 중 하나로, 다양한 분야에서 활용되고 있습니다. 파이썬은 간단한 문법과 강력한 기능으로 인해 초보자들도 쉽게 배울 수 있으며, 데이터 분석, 머신러닝, 웹 개발 등 다양한 용도로 사용됩니다. 2. R R은 통계 분석과 데이터 시각화에 특화된 프로그래밍 언어입니다. R은 다양한 통계 패키지와 라이브러리를 제공하여 복잡한 데이터 분석을 쉽게 수행할 수 있습니다. 또한 ggplot2와 같은 강력한 시각화 도구를 통해 데이터를 효과적으로 표현할 수 있습니다. 3. 중간과제 중간...2025.01.25
-
데이터 과학자2025.01.201. 데이터 과학 데이터 과학은 통계학과 컴퓨터 과학의 융합 이후 응용 분야인 의학, 공학, 유전학, 경영, 금융 등 각 분야의 지식과 연결되어, 새로운 지식을 창출하는 새로운 융합학문이다. 데이터 과학자는 주로 데이터를 수집하고 분석하여 비즈니스 의사결정을 내리는 역할을 한다. 2. 빅데이터 빅데이터는 크게 '구조화 데이터' 및 '비구조화 데이터' 2종으로 분류할 수 있다. 구조화 데이터는 컴퓨터가 쉽게 자동으로 분류, 판독, 조직화할 수 있는 범주로 체계화되어 있는 데이터이며, 비구조화 데이터는 기업이 데이터과학자가 처리하도록 ...2025.01.20
-
사회조사방법론 ) 표본의 크기와 표본 오차에 관해 설명하시오.2025.04.271. 표본의 크기 표본의 크기는 정확하고 믿을 만한 조사 결과를 얻기 위해 필요한 조사 단위의 수를 의미합니다. 표본의 크기가 작으면 한 사람의 의견이 지나치게 중요시될 수 있어 연구의 신뢰도가 떨어질 수 있습니다. 일반적으로 표본의 크기를 크게 잡으면 모집단에 근접하게 되어 모집단과 표본 간의 차이가 줄어들어 모집단에 대한 추정을 보다 확실하게 할 수 있습니다. 하지만 표본의 크기를 늘리는 데에는 시간과 비용의 제약이 있으므로 적절한 표본의 크기를 결정하는 것이 중요합니다. 2. 표본 오차 표본 오차(sampling error)는...2025.04.27
-
미국, 영국, 일본과 한국의 최근 3년(2019년~2021년)간 사고통계(교통사고, 자살, 산업재해(사망만인율))2025.01.161. 미국의 2019~2021년 교통사고, 자살, 산업재해 통계와 특징 미국의 교통사고 사고건수는 코로나19 펜데믹 동안 크게 증가하지 않았지만, 사고 발생 시 사망자는 상승하고 있다. 전문가들은 운전 행태가 더 위험해지고 당국의 교통법 집행이 감소했기 때문이라고 보고 있다. 자살률은 2019년과 2020년 2년 연속 감소한 후 2021년 전년 대비 4% 증가했는데, 특히 젊은 남성의 자살률이 급등한 것으로 나타났다. 산업재해 사망만인율은 2018년 기준 5.3 수준이었다. 2. 영국의 2019~2021년 교통사고, 자살, 산업재해...2025.01.16
-
학생들의 IQ와 대학입시 합격률 간의 관계 분석2025.01.021. 단순 확률 학생들의 IQ를 고려하지 않고 별다른 추가 정보가 없을 때, 임의의 한 학생을 선정했을 때 대학에 합격할 확률은 52%이며, 1000명 중 임의로 선정한 한 학생의 IQ가 125를 넘을 확률은 44%입니다. 2. 결합 확률 임의의 한 학생을 선정했을 때 대학에 합격하고 IQ도 125를 넘을 확률은 28%이며, 대학에 합격했지만 IQ가 125를 넘지 않을 확률은 24%입니다. 3. 조건부 확률 무작위로 선정된 한 학생의 IQ가 125 미만이라는 정보가 주어졌을 때, 이 학생이 대학에 입학할 확률은 43%입니다. 또한 ...2025.01.02