
총 121개
-
선형회귀(Linear Regression)는 통계인가 머신 러닝인가?2025.05.081. 선형회귀 선형 회귀는 연속 값을 예측하는 데 사용되는 통계 방법입니다. 선형 회귀 모델은 두 변수 간의 관계를 설명하는 선형 방정식을 찾는 통계적 방법입니다. 선형 회귀 모델은 통계, 공학, 마케팅, 금융, 제조를 포함한 다양한 분야에서 사용됩니다. 선형 회귀는 데이터를 설명하고 미래를 예측하는 데 사용할 수 있는 가장 널리 사용되는 방법입니다. 2. 통계와 머신러닝 머신러닝의 등장으로 선형회귀는 주로 '지도 학습' 문제에서 사용됩니다. 선형회귀는 입력 변수와 출력 변수 사이의 선형적인 관계를 모델링하여 새로운 입력에 대한 출...2025.05.08
-
싱가포르 현황(관광객수, 투자비율 등)2025.01.121. 싱가포르 관광객 현황 싱가포르의 관광객 수는 코로나19 이후 급감했지만, 2024년까지 코로나 이전 수준으로 회복할 것으로 전망됩니다. 중국과의 30일 비자 면제 협정 추진으로 중국인 관광객 유입이 증가할 것으로 보이며, 미국 관광객의 경우 코로나19 이후 유럽 여행이 증가했으나 2024년과 2025년에는 아시아로의 여행이 확대될 것으로 예상됩니다. 2. 싱가포르 외국인 투자 현황 싱가포르의 외국인 직접투자(FDI) 누적액은 지속적으로 증가하여 2020년 기준 2,460조 원을 기록했습니다. 금융보험업이 전체 FDI의 55.5...2025.01.12
-
측정의 신뢰도와 타당도2025.01.151. 신뢰도 신뢰도란 어떤 데이터가 동일한 측정대상을 측정하였을 때 일관성 있는 측정결과를 산출하는 정도를 의미한다. 일관되고 재현이 가능한 측정이 존재하는지 평가하는 기준이다. 신뢰도를 높이기 위해서는 측정방법을 명확히 하고 표준화하는 것이 제안되어 있으며, 측정의 각 문항이나 검사의 수를 늘리는 것도 도움이 된다. 그러나 단순히 표본의 수를 늘리는 것은 신뢰도에 큰 영향을 주지 않으며, 단지 타당도의 개선에만 기여한다고 알려져 있다. 2. 타당도 타당도는 어떤 측정으로 얻어진 데이터가 가리키는 대상이 조사자가 알고자 하던 것과 ...2025.01.15
-
미국, 영국, 일본과 한국의 최근 3년(2019년~2021년)간 사고통계(교통사고, 자살, 산업재해(사망만인율))2025.01.161. 미국의 2019~2021년 교통사고, 자살, 산업재해 통계와 특징 미국의 교통사고 사고건수는 코로나19 펜데믹 동안 크게 증가하지 않았지만, 사고 발생 시 사망자는 상승하고 있다. 전문가들은 운전 행태가 더 위험해지고 당국의 교통법 집행이 감소했기 때문이라고 보고 있다. 자살률은 2019년과 2020년 2년 연속 감소한 후 2021년 전년 대비 4% 증가했는데, 특히 젊은 남성의 자살률이 급등한 것으로 나타났다. 산업재해 사망만인율은 2018년 기준 5.3 수준이었다. 2. 영국의 2019~2021년 교통사고, 자살, 산업재해...2025.01.16
-
식민지 시기 조선인 결핵 실태 통계 자료의 오류 탐색2025.01.121. 통계와 식민의학 식민지 시기 조선인 결핵 실태를 조사한 통계 자료의 오류를 탐색하고 비판하는 내용입니다. 통계가 근대 만능주의가 퍼져나가던 20세기에 대중을 속이고 식민지배를 정당화하는 도구로 사용되었다는 점을 지적하고 있습니다. 측정과 비교 과정에 반영된 인종주의적 해석이 '객관적' 사실로 여겨졌고, 이를 통해 조선인의 열등성과 후진성을 보여주는 '과학적' 증거로 활용되었다고 설명합니다. 2. 통계 자료의 오류 원인 조선인의 발병 비율이 적은 것은 식민통치에 대한 저항, 서양 의학에 대한 무지, 의료 시스템의 마비 등 다양한...2025.01.12
-
확률과 통계 보고서 (표본분산의 증명과 자유도의 직관적 이해)2025.01.151. 표본분산의 증명 표본분산을 구할 때 편차 제곱의 합을 'n-1'로 나누는 이유에 대해 설명합니다. 표본의 크기가 작은 경우 분산 값이 모분산과 일치하지 않는 bias가 발생하게 되어 이를 줄이기 위해 자유도 개념이 도입되었음을 설명합니다. 2. 자유도의 직관적 이해 4개의 숫자 [6, 5, 4, 5]에서 평균이 5로 구해진 후 마지막 한 개의 수는 자유롭게 관측될 수 없게 되어 자유도가 4가 아닌 3이 된다는 직관적 이해를 제시합니다. 이를 표본분산 공식에 적용하여 자유도가 n-1이 되는 이유를 설명합니다. 3. 불편추정량 표...2025.01.15
-
확률과 통계2025.01.291. 확률분포함수 확률분포함수(probability distribution function)는 관심 모집단의 분포에 대한 정보로 확률을 사용할 때, 확률변수의 모든 가능한 실현치에 어떤 조건을 만족하는 실수값을 대응시키는 규칙을 정의한 것이다. 이산형과 연속형 확률분포함수로 나뉘며, 확률질량함수와 확률밀도함수가 있다. 확률분포함수와 누적분포함수는 일대일 대응관계에 있다. 2. 확률의 이용 확률은 불확실한 상황에 대한 판단의 기준으로 사용된다. 도박, 스포츠, 일상생활 등 다양한 분야에서 확률이 활용되며, 확률을 고려하여 과학적인 판...2025.01.29
-
신뢰도와 타당도는 측정도구의 우수함을 판별하기 위한 중요한 두 가지 기준2025.05.101. 타당도 타당도(validity)란 조사자가 "측정하고자 하는 개념이나 속성을 측정하기 위하여 개발된 측정도구를 통해 그 개념과 속성을 얼마나 정확히 측정하는가."를 말한다. 타당도는 측정한 값과 측정대상과의 진정한 값과의 일치 정도, 즉 측정하려는 개념(변수)에 대한 의미를 측정도구가 충분히 잘 반영하고 있는 정도를 의미한다. 2. 신뢰도 측정도구의 신뢰도란 측정도구에 의해 도출되는 측정값들이 얼마나 일정하게 산출되는지를 나타내는 측정의 일관성을 말한다. 즉, 측정도구를 동일한 응답자에게 반복해서 적용했을 때 어느 정도 일관된...2025.05.10
-
베이비부머 세대의 기대수명은 99.9세라 합니다 이 기대수명은 평균값 중앙값이 아닌 최빈값으로 정한다고 하는데 이에 대한 의견은2025.05.101. 베이비부머 세대의 기대수명 베이비부머 세대의 기대수명은 99.9세라고 합니다. 이 기대수명은 평균값, 중앙값이 아닌 최빈값으로 정한다고 하는데, 이에 대한 의견은 다음과 같습니다. 기대수명을 결정하는 데에는 평균값, 중앙값, 최빈값이라는 세 가지 주요 통계적 지표가 있습니다. 평균값은 모든 데이터를 균등하게 반영하지만 이상치에 민감할 수 있고, 중앙값은 이상치에 덜 민감하지만 데이터 분포에 대한 정보를 상실할 수 있습니다. 최빈값은 데이터의 '일반적인' 상황을 가장 잘 반영할 수 있지만, 데이터가 균일하게 분포하지 않을 경우 ...2025.05.10
-
최대 우도 추정을 통한 확률 모델의 매개변수 추정2025.05.081. 최대 우도 추정(Maximum Likelihood Estimation, MLE) 최대 우도 추정은 주어진 데이터를 가장 잘 설명하는 모델의 매개변수 값을 찾는 과정으로, 우도 함수를 최대화하는 매개변수 값을 추정합니다. 이 방법은 데이터가 주어진 상황에서 가장 가능성이 높은 모델의 매개변수를 선택함으로써 최적의 예측을 수행하는데 도움을 줍니다. 2. 확률 모델링 확률 모델링은 다양한 분야에서 데이터 분석과 예측에 핵심적인 역할을 하고 있습니다. 데이터로부터 모델의 매개변수를 추정하는 과정은 모델의 정확성과 신뢰성을 높이는 데 ...2025.05.08