총 4개
-
성공적인 머신러닝 모델링을 위한 프로세스2025.01.151. 결정 트리 알고리즘 결정 트리(Decision Tree)는 지도 학습(Supervised Learning)에서 사용되는 머신러닝 알고리즘 중 하나입니다. 이 알고리즘은 데이터를 분석하고 특정 기준에 따라 여러 개의 의사 결정 규칙을 만들어내는 방식으로 동작합니다. 이러한 의사 결정 규칙들을 트리 구조로 나타내기 때문에 '결정 트리'라는 이름이 붙었습니다. 의사 결정 트리는 금융, 의료, NLP, 추천 시스템 및 프로세스 최적화 내에서 주로 사용되며, 다양한 도메인에 걸친 의사결정 트리의 다양성을 보여주고 많은 산업에서 실제 문...2025.01.15
-
인공지능 머신러닝 지도학습, 비지도학습, 강화학습의 실사례2025.01.161. 지도학습(Supervised Learning) 지도학습은 입력한 데이터와 출력한 데이터를 각각 공급하여 작동하는 유형으로, 훈련을 통해 알고리즘이 입력값을 바탕으로 내용을 처리하고 모델을 수정하며 원하는 출력에 근접하는 결과물을 산출하게 됩니다. 이는 분류와 예측 문제에 유용한 학습 방법으로, 스팸 이메일 탐지 기능은 대표적인 사례입니다. 해당 모델은 '스팸 메일'과 '비스팸 메일'로 레이블이 지정된 이메일 데이터 집합을 통해 학습되며, 키워드, 발신자 정보, 이메일 구조 및 내용과 같은 특징을 사용하여 새로운 수신 이메일을 ...2025.01.16
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
머신러닝의 3가지 학습 방법: 지도학습, 비지도 학습, 강화학습2025.01.041. 지도학습 지도학습은 입력과 출력 간의 관계를 학습하는 방식으로, 정답과 사례를 연결시켜주는 방식으로 이루어집니다. 데이터 집합을 통해 입력과 출력 간의 함수관계를 기계가 배우게 되며, 이렇게 얻어진 함수를 모델이라고 합니다. 지도학습으로 만들 수 있는 대표적인 것은 패턴 분류와 회귀분석입니다. 2. 비지도 학습 비지도학습은 입력 데이터 세트에 레이블을 달아주지 않고, 기계가 데이터를 묶을 수 있는 특징을 스스로 찾아내게 합니다. 비지도 학습은 데이터 집합 속에서 숨겨진 패턴을 배우며, 군집화를 이용해 서로 유사한 데이터를 묶습...2025.01.04