총 9개
-
Chat GPT의 장단점2025.01.041. Chat GPT의 정의와 특징 Chat GPT는 Generative Pretrained Transformer의 약자로, 인공지능 분야에서 사용되는 언어 모델 중 하나입니다. 이 모델은 OpenAI에서 개발한 것으로, 대규모의 데이터셋으로 사전학습된 후 다양한 자연어 처리 태스크에 사용될 수 있습니다. 2. Chat GPT의 장점 Chat GPT의 장점으로는 다양한 자연어 처리 태스크에 적용 가능, 대용량 모델, 맞춤형 모델 학습 가능, 유연한 문장 생성 기능, 다양한 데이터셋 사용 가능, 지속적인 업데이트와 발전 등이 있습니다...2025.01.04
-
Data Preparation2025.01.131. Feature Extraction and Portability Feature extraction은 다양한 출처(센서, 이미지, 웹 기록, 침입감지, 문서 등)에서 데이터를 얻는 것을 말한다. Portability는 다른 유형으로 데이터를 변환하는 것을 말한다. 포터빌리티의 예로는 이산화, 이진화, LSA, SAX, DWT, DFT 등이 있다. 이러한 변환 방법들은 데이터의 크기를 줄이거나 다른 형태로 표현하는 데 사용된다. 2. Data Cleaning 데이터 클리닝은 누락되거나 오류가 있는 데이터를 제거하는 것을 말한다. 누...2025.01.13
-
태풍의 상관관계와 데이터 분석(A+ 레포트)2025.01.211. 태풍 데이터 분석 이 보고서는 다양한 태풍 간의 상관관계를 분석하여 태풍의 발생, 발달, 이동경로, 소멸 등의 특성을 이해하고자 하는 목적으로 수행되었습니다. 데이터 전처리 과정을 거쳐 태풍의 초기 위도, 경도, 중심기압과 소멸 시 위도, 경도, 중심기압, 그리고 태풍이 꺾이는 지점의 위도, 경도, 중심기압 등을 추출하였습니다. 이를 바탕으로 상관관계 분석을 수행하여 태풍의 특성을 파악하였습니다. 2. 태풍 발생 위도 분포 태풍은 주로 북위 10도~30도, 특히 20도 부근에서 많이 발생하는 것으로 나타났습니다. 이 지역은 태...2025.01.21
-
데이터 사이언티스트 인터뷰 준비2025.01.201. 데이터 전처리 데이터셋에 존재할 수 있는 결측값과 이상치를 처리하는 것이 중요하다. 결측값은 평균, 중앙값 등으로 대체하거나 제거할 수 있으며, 이상치는 상자 그림이나 Z-점수를 사용해 식별하고 제거하거나 대체할 수 있다. 또한 데이터의 스케일을 맞추기 위해 정규화 작업이 필요하다. 2. 머신러닝 모델 과적합 방지 과적합을 방지하기 위해 교차 검증, 정규화 기법(L1, L2), 조기 종료 등의 방법을 사용할 수 있다. 교차 검증을 통해 데이터를 최대한 활용하고 모델의 일반화 성능을 평가할 수 있으며, 정규화 기법은 모델의 복잡...2025.01.20
-
Regression with an Abalone Dataset 코드2025.01.271. 데이터 로딩 및 전처리 train.csv와 test.csv 파일을 pandas 라이브러리를 사용하여 로드했습니다. LabelEncoder를 사용하여 범주형 변수(sex)를 숫자 값으로 인코딩했습니다. 새로운 특성인 size(length x diameter x height)를 만들기 위해 특성 엔지니어링을 수행했습니다. 높이 값이 0인 행을 제거하여 데이터를 정리했습니다. 2. 데이터 변환 대부분의 특성에 대해 np.log1p 함수를 적용하여 로그 변환을 수행했습니다. 이 변환은 데이터 분포를 정규 분포에 가깝게 만들어 모델 성...2025.01.27
-
모방학습 4단계 상세 설명 및 개인 경험 공유2025.01.291. 모방학습의 4단계 모방학습은 데이터 수집, 데이터 전처리, 정책 학습, 평가 및 개선의 4단계로 구성됩니다. 데이터 수집 단계에서는 전문가나 시범자의 작업을 기록하여 학습에 필요한 데이터를 확보합니다. 데이터 전처리 단계에서는 수집된 데이터를 정제하고 구조화하는 과정이 필요합니다. 정책 학습 단계에서는 전처리된 데이터를 바탕으로 모델이 최적의 행동 정책을 학습하게 됩니다. 마지막으로 평가 및 개선 단계에서는 학습된 모델의 성능을 평가하고, 필요에 따라 모델을 개선하는 과정이 이루어집니다. 2. 모방학습 적용 사례 및 경험 프로...2025.01.29
-
미래사회와 소프트웨어 과제2025.01.291. 데이터 분석의 역사 데이터는 인류 역사 속에서 오래전부터 분석되어 왔다. 이집트의 토지조사, 바빌로니아의 진흙판 숫자, 중국의 인구조사, 그리스의 조세조사, 민수기의 인구조사, 로마의 생명표 등 다양한 데이터 분석 사례가 있었다. 우리나라에서도 조선시대에 호적 제도를 통해 인구통계를 내었다. 이처럼 통계학은 과거부터 국가 통치를 위해 사용되어 왔다. 2. 데이터의 진화 산업혁명 이후 데이터는 국가 데이터에서 민간 데이터로 진화했다. 데이터 저장 기술의 발전으로 소셜 네트워크 서비스 데이터가 등장했고, 데이터베이스 시대가 열렸다...2025.01.29
-
머신러닝 2024년 2학기 방송통신대 출석수업과제물 과제 슬라이드 1~7의 코드 및 설명을 참조하여 신경망 구성 및 test accuracy 출력2025.01.261. Fashion MNIST 데이터셋 Fashion MNIST 데이터셋은 옷 이미지 데이터셋으로, 10개의 클래스(T-shirt/top, Trouser, Pullover, Dress, Coat, Sandal, Shirt, Sneaker, Bag, Ankle boot)로 구성되어 있습니다. 이 데이터셋을 사용하여 신경망 모델을 구축하고 학습을 진행합니다. 2. 데이터 전처리 데이터 시각화를 통해 이미지 데이터를 확인하고, 픽셀 값을 0~1 사이의 실수로 정규화하여 모델 학습에 사용합니다. 이미지 데이터를 1차원 벡터로 변환하는 과정...2025.01.26
-
방통대 [데이터마이닝] 2024 출석과제물 (30점 만점 인증 / 표지제외 12페이지 분량 / 코드 및 해설 포함)2025.01.251. 모수적 모형 접근법 모수적 모형 접근법은 통계를 사용하여 데이터의 특징과 의미를 해석할 수 있는 분석 모델을 만드는 전통적인 방법입니다. 주로 사용하는 모형으로는 선형 회귀분석, 로지스틱 회귀모형이 있으며 모델 내에서 a 또는 b 같은 모수를 최소제곱법 또는 최대우도추정법을 사용하여 추정합니다. 모수적 모형 접근법으로 만들어진 분석 모델은 원인과 결과에 대한 설명이 용이하다는 장점이 있지만, 분석 모델을 만드는데 사용했던 데이터가 아닌 다른 데이터를 사용할 경우 정확도가 낮아지거나 적용 자체가 불가능할 수 있다는 단점이 있습니...2025.01.25