총 40개
-
데이터마이닝 ) 나무 형태를 이용한 지식 표현 사례2025.01.031. 의사결정나무 의사결정나무는 예측모형에서 가장 많이 사용되며 의사결정 규칙을 도표화하여 대상 집단을 분류하거나 예측하는 분석 방법입니다. 의사결정나무의 장점은 나무구조에 의해 모형이 표현되어 사용자의 이해가 쉽고, 유용한 예측변수나 비선형성을 자동으로 찾아낼 수 있으며, 선형성이나 정규성, 등분산성과 같은 가정을 필요로 하지 않는 비모수적인 방법이라는 것입니다. 하지만 의사결정나무 모형은 연속형 변수를 비연속적인 값으로 취급하여 분리의 경계점에서 예측오류가 큰 가능성이 있고, 선형성과 주 효과를 가지지 못한다는 단점이 있습니다....2025.01.03
-
자료에 극단값이 포함된 경우 극단값 처리에 대한 논의2025.01.281. 극단값의 정의와 특성 극단값은 데이터 집합에서 다른 값들과 큰 차이를 보이는 값으로, 일반적으로 데이터 분포의 상하위 1% 또는 3 표준편차를 벗어난 값을 극단값으로 간주한다. 극단값은 오류로 인해 발생하거나 데이터의 본질적 특징을 반영할 수 있다. 2. 극단값이 분석에 미치는 영향 극단값은 평균, 표준편차와 같은 주요 통계값에 큰 영향을 미칠 수 있다. 극단값으로 인해 데이터의 분포가 왜곡되어 정책 결정이나 연구 결과 해석에 오류를 초래할 수 있다. 3. 극단값의 처리 방법 극단값 처리 방법에는 극단값 제거, 다른 값으로 대...2025.01.28
-
빅데이터 리포트2025.01.191. 빅데이터 빅데이터는 기존의 데이터에 비해 방대한 양의 정형 또는 비정형 데이터로, 대량의 데이터와 복잡성이 큰 데이터를 의미한다. 3V(Volume, Velocity, Variety)와 5V(Volume, Velocity, Variety, Veracity, Value)로 특징지어진다. 빅데이터 분석은 필요한 정보를 수집하는 것에서 가능한 많은 데이터와 숨은 정보를 찾아내는 방식으로 변화하고 있으며, 표본조사에서 전수조사로, 질에서 양으로, 상관관계에서 인과관계로 변화하고 있다. 데이터마이닝은 많은 데이터에서 유용한 정보를 발견...2025.01.19
-
데이터 마이닝의 기술적 동인2025.01.251. 데이터 마이닝의 기술적 동인 데이터 마이닝의 기술적 동인은 컴퓨터 기술의 발전, 인터넷과 월드 와이드 웹의 등장, 하드웨어 기술의 발전, 소프트웨어 기술의 발전, 인공지능과 기계 학습의 발전, 빅데이터의 등장, 데이터의 중요성에 대한 인식 증가, 개인정보 보호와 윤리적 문제에 대한 관심 증가, 다양한 응용 분야의 확장 등으로 요약될 수 있다. 이러한 동인들이 결합되어 데이터 마이닝 기술은 지속적으로 발전하고 있으며, 앞으로도 그 중요성과 활용 범위는 더욱 확대될 것으로 예상된다. 1. 데이터 마이닝의 기술적 동인 데이터 마이닝...2025.01.25
-
Big Data Data Mining 데이터 마이닝2025.01.121. Data Mining 데이터 마이닝은 방대한 데이터 속에서 유용한 상관관계를 발견하고 추출하여 의사결정에 이용하는 과정입니다. 정보기술의 발달과 비즈니스 요구에 의해 등장했으며, 과열된 기업경쟁과 다양한 고객 요구에 효과적이고 빠른 기업경쟁력을 제공합니다. 데이터 마이닝 이전에는 한정된 자료와 전공 서적 중심의 연역적 방법을 사용했지만, 데이터 마이닝 시대에는 대용량 자료와 실무 중심의 귀납적 방법을 사용합니다. 2. Data Mining 기법 데이터 마이닝 기법에는 의사결정나무, 신경망 네트워크, K-평균 군집화, OLAP ...2025.01.12
-
데이터마이닝의 정의와 활용 분야2025.01.181. 데이터마이닝의 정의 데이터마이닝은 대규모 데이터 세트에서 통계적이고 수학적인 기법을 활용하여 유용한 정보와 패턴을 추출하는 과정을 말한다. 이는 데이터베이스, 데이터 웨어하우스 또는 다양한 데이터 소스로부터 데이터를 수집하고 분석함으로써 이루어진다. 데이터마이닝은 기계 학습, 통계 분석, 패턴 인식, 인공지능 등의 다양한 분야의 기법과 원칙을 포괄하는 다중 학문적인 접근 방법을 사용한다. 2. 데이터마이닝 활용 분야: 상업 분야 온라인 소매업체는 고객의 구매 이력, 검색 기록, 선호도 등을 분석하여 개별 고객에게 맞춤형 제안을...2025.01.18
-
[R & E 활동 대회] 다중 연결 리스트(Multi-Linked List)를 이용한 자연어 처리 방법론 연구2025.05.121. 다중 연결 리스트(Multi-Linked List) 다중 연결 리스트(Multi-Linked List)는 단일 연결 리스트와 비슷한 구조이나 동적 할당(Dynamic allocation)과 노드 구조체를 이용하여 각 노드 간 연결이 다중으로 이루어지도록 한 자료 구조입니다. 여러 종류의 단어가 한 특성을 공유하여 다음 문장으로 연결되어야 하는 처리 구조를 이루어야 하므로 본 연구에서 이용한 자료 구조입니다. 2. 자연어 처리 본 연구에서는 신문 기사를 활용한 빅 데이터를 C언어로 구조화하여 단어 간의 상관관계를 파악하여 새로운...2025.05.12
-
스포티파이 데이터 마이닝2025.01.131. 음악 선호에 미치는 영향 요인 분석 이 프레젠테이션은 K-POP 시장의 지속적인 성장에 따른 글로벌 전략 수립을 위해 스포티파이 데이터를 활용하여 음악 선호에 영향을 미치는 요인을 분석하고 있습니다. 데이터 수집, 전처리, 상관관계 분석, 회귀 분석 등을 통해 아티스트 인기도, 댄스성, 에너지 등의 요인이 트랙 인기도에 미치는 영향을 확인하고 있습니다. 이를 바탕으로 아티스트 협업, 브랜드 페이지 운영 등의 마케팅 전략을 제안하고 있습니다. 1. 음악 선호에 미치는 영향 요인 분석 음악 선호에는 다양한 요인들이 영향을 미칩니다...2025.01.13
-
고객관계관리(CRM)의 정의와 국내 기업의 활용 사례2025.01.171. CRM의 정의 고객관계관리란 고객정보를 종합적으로 수집해 해당 정보를 활용해 개별 고객의 특성이나 요구를 파악한 뒤 개별 고객에 맞춘 마케팅 활동을 수행하는 것을 말한다. CRM은 크게 '프론트오피스 CRM 시스템'과 'E-CRM 시스템'으로 구분할 수 있다. 2. CRM 구성요소 CRM을 구성할 때 가장 중요한 정보 기술은 데이터베이스와 데이터 웨어하우스이다. 데이터웨어하우스는 개별 사업정보시스템에 흩어져 있는 고객 관련 데이터를 통합해 고객 중심 데이터를 정리하는 개념으로 분석정보와 보고서 계산이 용이하다. OLAP 기술은...2025.01.17
-
빅데이터의 기술 요건 네 단계에 대해 설명하세요2025.01.181. 데이터 수집 이 단계는 기업 내부와 외부에서 발생하는 엄청난 양의 데이터를 모으는 과정을 말한다. 이 과정에서는 다양한 데이터 소스로부터 필요한 정보를 수동이나 자동으로 수집하는 기술이 필요하다. 예를 들어, 기업 내부 데이터는 ETL(Extraction, Transformation, Load) 솔루션을 통해 추출, 변환, 적재하는 방식으로 확보할 수 있으며, EII(Enterprise Information Integration)를 활용하여 데이터를 통합하고 분석할 수 있다. 외부 데이터의 경우, 웹 크롤링 엔진을 사용하여 인...2025.01.18