
총 12개
-
Regression with an Abalone Dataset 코드2025.01.271. 데이터 로딩 및 전처리 train.csv와 test.csv 파일을 pandas 라이브러리를 사용하여 로드했습니다. LabelEncoder를 사용하여 범주형 변수(sex)를 숫자 값으로 인코딩했습니다. 새로운 특성인 size(length x diameter x height)를 만들기 위해 특성 엔지니어링을 수행했습니다. 높이 값이 0인 행을 제거하여 데이터를 정리했습니다. 2. 데이터 변환 대부분의 특성에 대해 np.log1p 함수를 적용하여 로그 변환을 수행했습니다. 이 변환은 데이터 분포를 정규 분포에 가깝게 만들어 모델 성...2025.01.27
-
태풍의 상관관계와 데이터 분석(A+ 레포트)2025.01.211. 태풍 데이터 분석 이 보고서는 다양한 태풍 간의 상관관계를 분석하여 태풍의 발생, 발달, 이동경로, 소멸 등의 특성을 이해하고자 하는 목적으로 수행되었습니다. 데이터 전처리 과정을 거쳐 태풍의 초기 위도, 경도, 중심기압과 소멸 시 위도, 경도, 중심기압, 그리고 태풍이 꺾이는 지점의 위도, 경도, 중심기압 등을 추출하였습니다. 이를 바탕으로 상관관계 분석을 수행하여 태풍의 특성을 파악하였습니다. 2. 태풍 발생 위도 분포 태풍은 주로 북위 10도~30도, 특히 20도 부근에서 많이 발생하는 것으로 나타났습니다. 이 지역은 태...2025.01.21