
총 2개
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
머신 러닝 학습을 위한 데이터 증량하기2025.05.081. 데이터 증강 데이터 증강(Data Augmentation)은 현대 머신러닝과 딥러닝 분야에서 핵심 개념이 되었습니다. 데이터의 양과 질은 모델의 성능과 일반화 능력에 큰 영향을 미치지만, 현실적인 제약으로 인해 충분한 양의 고품질 데이터를 수집하기 어려운 문제를 해결하기 위해 데이터 증강이 등장하였습니다. 데이터 증강은 기존의 데이터를 변형하여 새로운 데이터를 생성하는 과정으로, 모델의 학습과 예측 능력을 향상시킬 수 있습니다. 2. 데이터 증강 기법 다양한 데이터 증강 기법이 개발되어 있으며, 이를 통해 다양한 유형의 데이터...2025.05.08