1. 데이터 사이언티스트 인터뷰 준비
1.1. 핵심 개념과 기법
1.1.1. 데이터 전처리
1.1.1.1. 결측값 처리
결측값 처리는 데이터 전처리 과정에서 매우 중요한 단계이다. 데이터셋에는 종종 값이 누락된 부분이 있는데, 이를 결측값이라 한다. 결측값을 그대로 두면 분석 결과가 왜곡될 수 있다.
결측값 처리를 위한 대표적인 방법은 다음과 같다. 첫째, 평균이나 중앙값으로 결측값을 채우는 방법이다. 이는 데이터의 완전성을 보장하여 모델의 성능을 향상시킨다. 둘째, 결측값이 있는 데이터를 제거하는 방법이다. 이 방법은 데...
2024.12.02