
총 38개
-
데이터마이닝 ) 나무 형태를 이용한 지식 표현 사례2025.01.031. 의사결정나무 의사결정나무는 예측모형에서 가장 많이 사용되며 의사결정 규칙을 도표화하여 대상 집단을 분류하거나 예측하는 분석 방법입니다. 의사결정나무의 장점은 나무구조에 의해 모형이 표현되어 사용자의 이해가 쉽고, 유용한 예측변수나 비선형성을 자동으로 찾아낼 수 있으며, 선형성이나 정규성, 등분산성과 같은 가정을 필요로 하지 않는 비모수적인 방법이라는 것입니다. 하지만 의사결정나무 모형은 연속형 변수를 비연속적인 값으로 취급하여 분리의 경계점에서 예측오류가 큰 가능성이 있고, 선형성과 주 효과를 가지지 못한다는 단점이 있습니다....2025.01.03
-
데이터마이닝의 정의와 활용 분야2025.01.181. 데이터마이닝의 정의 데이터마이닝은 대규모 데이터 세트에서 통계적이고 수학적인 기법을 활용하여 유용한 정보와 패턴을 추출하는 과정을 말한다. 이는 데이터베이스, 데이터 웨어하우스 또는 다양한 데이터 소스로부터 데이터를 수집하고 분석함으로써 이루어진다. 데이터마이닝은 기계 학습, 통계 분석, 패턴 인식, 인공지능 등의 다양한 분야의 기법과 원칙을 포괄하는 다중 학문적인 접근 방법을 사용한다. 2. 데이터마이닝 활용 분야: 상업 분야 온라인 소매업체는 고객의 구매 이력, 검색 기록, 선호도 등을 분석하여 개별 고객에게 맞춤형 제안을...2025.01.18
-
스포티파이 데이터 마이닝2025.01.131. 음악 선호에 미치는 영향 요인 분석 이 프레젠테이션은 K-POP 시장의 지속적인 성장에 따른 글로벌 전략 수립을 위해 스포티파이 데이터를 활용하여 음악 선호에 영향을 미치는 요인을 분석하고 있습니다. 데이터 수집, 전처리, 상관관계 분석, 회귀 분석 등을 통해 아티스트 인기도, 댄스성, 에너지 등의 요인이 트랙 인기도에 미치는 영향을 확인하고 있습니다. 이를 바탕으로 아티스트 협업, 브랜드 페이지 운영 등의 마케팅 전략을 제안하고 있습니다. 1. 음악 선호에 미치는 영향 요인 분석 음악 선호에는 다양한 요인들이 영향을 미칩니다...2025.01.13
-
데이터마이닝의 정의와 활용 분야2025.01.071. 데이터마이닝 정의 및 필요성 데이터마이닝은 대용량의 데이터에서 유용한 지식을 효과적으로 찾아내는 기술로, 기업의 경쟁력 확보에 중요한 역할을 합니다. 데이터마이닝은 통계학, 인공지능, 데이터베이스 등 다양한 분야를 아우르는 융합 분야이며, 비계획적으로 수집된 대용량 데이터를 다루고 일반화와 예측이 중요한 특징을 가지고 있습니다. 2. 데이터마이닝의 활용 분야 데이터마이닝은 데이터베이스 마케팅, 신용평가, 의료 분야 등에서 다양하게 활용되고 있습니다. 데이터베이스 마케팅에서는 타겟 마케팅, 고객 세분화, 이탈 고객 분석 등에 활...2025.01.07
-
[경영정보시스템] 4차 산업혁명과 관련된 정보기술인 빅데이터에 대한 개념과 특성, 빅데이터를 활용한 기술을 조사하고, 기업에서 빅데이터를 어떻게 활용하고 있는지를 서술하시오. 또한 빅데이터 기술로 인해 발생할 문제점을 예측하고 이에 개인과 기업이 각각 어떻게 대응할 수 있을지를 서술하세요.2025.01.231. 빅데이터의 개념과 특성 빅데이터는 전통적인 데이터 처리 방식으로는 감당하기 어려운 방대한 양의 데이터 집합을 의미한다. 이러한 데이터는 양(Volume), 속도(Velocity), 다양성(Variety), 정확성(Veracity), 가치(Value)의 5가지 특성을 가지고 있으며, 이를 효율적으로 처리하고 분석하여 유의미한 정보를 도출하는 것이 빅데이터 기술의 핵심이다. 빅데이터는 기업의 의사결정에 필요한 근거를 제공하고, 새로운 비즈니스 기회를 발굴하며, 고객의 행동을 예측하는 등 다양한 활용 가능성을 가지고 있다. 2. 빅...2025.01.23
-
방통대 [데이터마이닝] 2024 출석과제물 (30점 만점 인증 / 표지제외 12페이지 분량 / 코드 및 해설 포함)2025.01.251. 모수적 모형 접근법 모수적 모형 접근법은 통계를 사용하여 데이터의 특징과 의미를 해석할 수 있는 분석 모델을 만드는 전통적인 방법입니다. 주로 사용하는 모형으로는 선형 회귀분석, 로지스틱 회귀모형이 있으며 모델 내에서 a 또는 b 같은 모수를 최소제곱법 또는 최대우도추정법을 사용하여 추정합니다. 모수적 모형 접근법으로 만들어진 분석 모델은 원인과 결과에 대한 설명이 용이하다는 장점이 있지만, 분석 모델을 만드는데 사용했던 데이터가 아닌 다른 데이터를 사용할 경우 정확도가 낮아지거나 적용 자체가 불가능할 수 있다는 단점이 있습니...2025.01.25
-
데이터 마이닝의 기술적 동인2025.01.251. 데이터 마이닝의 기술적 동인 데이터 마이닝의 기술적 동인은 컴퓨터 기술의 발전, 인터넷과 월드 와이드 웹의 등장, 하드웨어 기술의 발전, 소프트웨어 기술의 발전, 인공지능과 기계 학습의 발전, 빅데이터의 등장, 데이터의 중요성에 대한 인식 증가, 개인정보 보호와 윤리적 문제에 대한 관심 증가, 다양한 응용 분야의 확장 등으로 요약될 수 있다. 이러한 동인들이 결합되어 데이터 마이닝 기술은 지속적으로 발전하고 있으며, 앞으로도 그 중요성과 활용 범위는 더욱 확대될 것으로 예상된다. 1. 데이터 마이닝의 기술적 동인 데이터 마이닝...2025.01.25
-
Kernel PCA & Spectral Clustering2025.01.131. Kernel PCA Kernel PCA는 편향이 큰 실세계의 데이터를 분석하는데 어려움이 있고, outlier data에 매우 민감한 linear PCA의 단점을 보완하기 위해 kernel trick을 수행한다. 하지만 분산이 가장 큰 축으로 데이터들을 정사영 시킬 뿐, clustering algorithm을 적용하지는 않는다. 2. Spectral Clustering Spectral Clustering은 군집화를 더 쉽게 하기 위해서 유사도 행렬 A를 통해 데이터들을 변형된 공간에 넣고, 후에 clustering algori...2025.01.13
-
의사결정의 구성요소와 계량적 방법2025.01.171. 의사결정의 구성요소 의사결정에는 '무엇을', '언제', '어디서', '어떻게', '누가'와 같은 주요 구성요소가 있다. 이러한 요소들을 고려하여 의사결정을 내리는 것이 중요하다. 2. 의사결정나무 의사결정나무는 분류와 예측을 위해 널리 사용되는 방법으로, 결과에 대한 설명이 쉽고 이해하기 쉬운 장점이 있다. 의사결정나무 알고리즘에는 CART, CHAID, C4.5, C5.0 등이 있으며, 이들은 공통적인 구조를 가지고 있다. 3. 의사결정나무의 고려사항 의사결정나무 알고리즘에서는 독립변수의 수, 최적 분리 방법, 종료 규칙 등...2025.01.17
-
자료에 극단값이 포함된 경우 극단값 처리에 대한 논의2025.01.281. 극단값의 정의와 특성 극단값은 데이터 집합에서 다른 값들과 큰 차이를 보이는 값으로, 일반적으로 데이터 분포의 상하위 1% 또는 3 표준편차를 벗어난 값을 극단값으로 간주한다. 극단값은 오류로 인해 발생하거나 데이터의 본질적 특징을 반영할 수 있다. 2. 극단값이 분석에 미치는 영향 극단값은 평균, 표준편차와 같은 주요 통계값에 큰 영향을 미칠 수 있다. 극단값으로 인해 데이터의 분포가 왜곡되어 정책 결정이나 연구 결과 해석에 오류를 초래할 수 있다. 3. 극단값의 처리 방법 극단값 처리 방법에는 극단값 제거, 다른 값으로 대...2025.01.28