총 29개
-
자료에 극단값이 포함된 경우 극단값 처리에 대한 논의2025.01.281. 극단값의 정의와 특성 극단값은 데이터 집합에서 다른 값들과 큰 차이를 보이는 값으로, 일반적으로 데이터 분포의 상하위 1% 또는 3 표준편차를 벗어난 값을 극단값으로 간주한다. 극단값은 오류로 인해 발생하거나 데이터의 본질적 특징을 반영할 수 있다. 2. 극단값이 분석에 미치는 영향 극단값은 평균, 표준편차와 같은 주요 통계값에 큰 영향을 미칠 수 있다. 극단값으로 인해 데이터의 분포가 왜곡되어 정책 결정이나 연구 결과 해석에 오류를 초래할 수 있다. 3. 극단값의 처리 방법 극단값 처리 방법에는 극단값 제거, 다른 값으로 대...2025.01.28
-
미래사회와 소프트웨어 과제2025.01.291. 데이터 분석의 역사 데이터는 인류 역사 속에서 오래전부터 분석되어 왔다. 이집트의 토지조사, 바빌로니아의 진흙판 숫자, 중국의 인구조사, 그리스의 조세조사, 민수기의 인구조사, 로마의 생명표 등 다양한 데이터 분석 사례가 있었다. 우리나라에서도 조선시대에 호적 제도를 통해 인구통계를 내었다. 이처럼 통계학은 과거부터 국가 통치를 위해 사용되어 왔다. 2. 데이터의 진화 산업혁명 이후 데이터는 국가 데이터에서 민간 데이터로 진화했다. 데이터 저장 기술의 발전으로 소셜 네트워크 서비스 데이터가 등장했고, 데이터베이스 시대가 열렸다...2025.01.29
-
30점 만점 방통대 데이터마이닝 2024-1학기2025.01.261. 데이터마이닝 방법론 데이터마이닝의 방법은 크게 모수적 모형 접근 방법과 알고리즘 접근 방법으로 나뉜다. 모수적 모형 접근법은 기존 데이터를 기반으로 모수를 추정하는 방법이며, 알고리즘 접근방법은 정해진 알고리즘에 따라 데이터를 학습하는 방법이다. 각각의 장단점이 있으며, 상황에 따라 적절한 방법을 선택해야 한다. 2. 모수적 모형 접근법 모수적 모형 접근법은 단순 선형 회귀분석, 로지스틱 회귀모형 등이 해당된다. 기본 모형 식이 존재하며, 모수를 추정하는 방식으로 결과가 복잡하지 않고 해석이 용이하다. 그러나 데이터가 가정한 ...2025.01.26
-
빅데이터와 통계학_탐구보고서_확통(세특)2025.01.111. 빅데이터와 통계학 빅데이터는 기존의 데이터 베이스 관리도구의 데이터 수집, 저장, 관리, 분석의 역량을 넘어서는 대량의 정형 또는 비정형의 데이터 세트 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 정보 통신 기술의 발달, 빅데이터에 대한 효율적인 저장 및 분석의 가능, 국가간 기술 격차 감소로 인해 빅데이터에 대한 관심이 높아지고 있다. 의료산업, 맞춤형 마케팅, 제조업 등 다양한 분야에서 빅데이터가 응용되고 있다. 따라서 빅데이터 시대에 가치를 추출하고 결과를 분석하는 분야와 밀접한 관련이 있는 ...2025.01.11
-
CRM 관리에서 신규고객 유치전략과 기존고객 유치전략2025.01.171. CRM 기술적 구성요소 CRM을 구성할 때 가장 중요한 정보 기술은 데이터베이스와 데이터 웨어하우스이다. 데이터웨어하우스는 개별 사업정보시스템에 흩어져 있는 고객 관련 데이터를 통합해 고객 중심 데이터를 정리하는 개념으로 분석정보와 보고서 계산이 용이하다. OLAP 기술은 고객, 제품, 구매 행동, 서비스 이력 등 다양한 측면을 분석할 수 있으며, 데이터마이닝은 CRM 관련 프로젝트의 필수적인 부분이다. 2. 신규고객 유치전략 CRM은 이미 내부에서 가지고 있는 데이터베이스를 기준으로 의사결정을 내린다. 그러므로 신규고객을 유...2025.01.17
-
고객관계관리(CRM)의 정의와 국내 기업의 활용 사례2025.01.171. CRM의 정의 고객관계관리란 고객정보를 종합적으로 수집해 해당 정보를 활용해 개별 고객의 특성이나 요구를 파악한 뒤 개별 고객에 맞춘 마케팅 활동을 수행하는 것을 말한다. CRM은 크게 '프론트오피스 CRM 시스템'과 'E-CRM 시스템'으로 구분할 수 있다. 2. CRM 구성요소 CRM을 구성할 때 가장 중요한 정보 기술은 데이터베이스와 데이터 웨어하우스이다. 데이터웨어하우스는 개별 사업정보시스템에 흩어져 있는 고객 관련 데이터를 통합해 고객 중심 데이터를 정리하는 개념으로 분석정보와 보고서 계산이 용이하다. OLAP 기술은...2025.01.17
-
데이터마이닝의 정의와 활용 분야2025.01.181. 데이터마이닝의 정의 데이터마이닝은 대규모 데이터 세트에서 통계적이고 수학적인 기법을 활용하여 유용한 정보와 패턴을 추출하는 과정을 말한다. 이는 데이터베이스, 데이터 웨어하우스 또는 다양한 데이터 소스로부터 데이터를 수집하고 분석함으로써 이루어진다. 데이터마이닝은 기계 학습, 통계 분석, 패턴 인식, 인공지능 등의 다양한 분야의 기법과 원칙을 포괄하는 다중 학문적인 접근 방법을 사용한다. 2. 데이터마이닝 활용 분야: 상업 분야 온라인 소매업체는 고객의 구매 이력, 검색 기록, 선호도 등을 분석하여 개별 고객에게 맞춤형 제안을...2025.01.18
-
방통대 [데이터마이닝] 2024 출석과제물 (30점 만점 인증 / 표지제외 12페이지 분량 / 코드 및 해설 포함)2025.01.251. 모수적 모형 접근법 모수적 모형 접근법은 통계를 사용하여 데이터의 특징과 의미를 해석할 수 있는 분석 모델을 만드는 전통적인 방법입니다. 주로 사용하는 모형으로는 선형 회귀분석, 로지스틱 회귀모형이 있으며 모델 내에서 a 또는 b 같은 모수를 최소제곱법 또는 최대우도추정법을 사용하여 추정합니다. 모수적 모형 접근법으로 만들어진 분석 모델은 원인과 결과에 대한 설명이 용이하다는 장점이 있지만, 분석 모델을 만드는데 사용했던 데이터가 아닌 다른 데이터를 사용할 경우 정확도가 낮아지거나 적용 자체가 불가능할 수 있다는 단점이 있습니...2025.01.25
-
베일에 쌓인 기업 - 팔란티어 테크놀로지2025.01.281. 팔란티어 테크놀로지 개요 팔란티어는 2003년 5월에 설립된 미국의 빅 데이터 프로세싱 기업입니다. 주로 공공 정보 분석을 수행하며, 미국 정보기관들을 주요 고객으로 하고 있습니다. 기술적 기반은 PayPal의 사기 탐지 기술을 가져온 것이며, 다양한 데이터 소스를 처리하고 분석하는 능력이 뛰어납니다. 하지만 상대적으로 비용이 높은 편입니다. 2. 팔란티어 테크놀로지 창업자 팔란티어는 PayPal을 매각한 피터 틸이 대학 동창인 알렉스 카프와 스티브 코헨을 영입하여 설립했습니다. 지배구조는 이사회 중심으로 운영되고 있습니다. ...2025.01.28