총 2개
-
산술평균, 분산, 표준편차의 개념 및 의의, 특징 및 장단점, 산출방법2025.01.251. 산술평균 산술평균은 데이터 집합의 중심 경향성을 나타내는 대표값으로 활용된다. 이는 주어진 데이터 집합의 모든 값들을 더한 후 데이터의 개수로 나누어 계산된다. 이 값은 데이터의 분포와 집중되어 있는 위치를 파악하는 데에 유용하다. 그러나 산술평균은 이상값의 존재로 인해 왜곡될 수 있으며, 특히 데이터가 정규분포를 따르지 않을 때 문제가 될 수 있다. 2. 분산 분산은 데이터의 흩어진 정도를 나타내는 측도로, 각 데이터 값과 평균의 차이를 제곱하여 모두 합한 후 데이터의 개수로 나눈 값이다. 이는 주어진 데이터가 얼마나 평균 ...2025.01.25
-
2024 방송통신대 머신러닝 출석수업 만점 과제물2025.01.261. k-최근접 이웃 알고리즘 k 값은 k-최근접 이웃 알고리즘에서 최근접 이웃 수를 나타낸다. k 값이 작을수록 모델이 훈련 데이터에 민감해져서 과적합 문제가 발생할 수 있다. 반대로 k 값이 지나치게 크면 너무 많은 이웃을 고려하게 되어 모델이 단순화되어 데이터의 세부적인 패턴을 잘 잡지 못하여 성능이 떨어지게 된다. 2. 거리 계산 방식 기존 knn에 적용된 거리 계산식은 유클리드 거리 방식에서 맨하탄 거리 계산 방식으로 변경하였다. 유클리드 거리는 두 점 간의 직선적 거리를 측정하고, 맨하탄 거리는 각 차원에서 거리를 단순히...2025.01.26