
총 38개
-
데이터마이닝 ) 나무 형태를 이용한 지식 표현 사례2025.01.031. 의사결정나무 의사결정나무는 예측모형에서 가장 많이 사용되며 의사결정 규칙을 도표화하여 대상 집단을 분류하거나 예측하는 분석 방법입니다. 의사결정나무의 장점은 나무구조에 의해 모형이 표현되어 사용자의 이해가 쉽고, 유용한 예측변수나 비선형성을 자동으로 찾아낼 수 있으며, 선형성이나 정규성, 등분산성과 같은 가정을 필요로 하지 않는 비모수적인 방법이라는 것입니다. 하지만 의사결정나무 모형은 연속형 변수를 비연속적인 값으로 취급하여 분리의 경계점에서 예측오류가 큰 가능성이 있고, 선형성과 주 효과를 가지지 못한다는 단점이 있습니다....2025.01.03
-
데이터마이닝의 정의와 활용 분야2025.01.181. 데이터마이닝의 정의 데이터마이닝은 대규모 데이터 세트에서 통계적이고 수학적인 기법을 활용하여 유용한 정보와 패턴을 추출하는 과정을 말한다. 이는 데이터베이스, 데이터 웨어하우스 또는 다양한 데이터 소스로부터 데이터를 수집하고 분석함으로써 이루어진다. 데이터마이닝은 기계 학습, 통계 분석, 패턴 인식, 인공지능 등의 다양한 분야의 기법과 원칙을 포괄하는 다중 학문적인 접근 방법을 사용한다. 2. 데이터마이닝 활용 분야: 상업 분야 온라인 소매업체는 고객의 구매 이력, 검색 기록, 선호도 등을 분석하여 개별 고객에게 맞춤형 제안을...2025.01.18
-
Kernel PCA & Spectral Clustering2025.01.131. Kernel PCA Kernel PCA는 편향이 큰 실세계의 데이터를 분석하는데 어려움이 있고, outlier data에 매우 민감한 linear PCA의 단점을 보완하기 위해 kernel trick을 수행한다. 하지만 분산이 가장 큰 축으로 데이터들을 정사영 시킬 뿐, clustering algorithm을 적용하지는 않는다. 2. Spectral Clustering Spectral Clustering은 군집화를 더 쉽게 하기 위해서 유사도 행렬 A를 통해 데이터들을 변형된 공간에 넣고, 후에 clustering algori...2025.01.13
-
인공지능 시대에 데이터베이스의 필요성 및 중요성2025.01.041. 인공지능 인공지능은 4차 산업혁명의 핵심 요소로, 그동안 인간의 고유 능력이었던 학습, 추론, 지각, 탐색 등의 능력을 인공적인 컴퓨터 기술로 구현한 것을 의미합니다. 인공지능은 사물인터넷, 클라우드 컴퓨팅, 빅데이터와 함께 4차 산업혁명의 주요 기술 및 연구 분야로 자리잡고 있으며, 일상생활과 경제 활동을 지원하는 중요한 기술로 인식되고 있습니다. 2. 데이터베이스의 활용 데이터베이스는 정형화된 데이터를 저장하고 관리하는 시스템으로, 데이터 마이닝을 통해 정보를 추출하고 가공할 수 있습니다. 또한 비/반정형 텍스트 데이터에서...2025.01.04
-
베일에 쌓인 기업 - 팔란티어 테크놀로지2025.01.281. 팔란티어 테크놀로지 개요 팔란티어는 2003년 5월에 설립된 미국의 빅 데이터 프로세싱 기업입니다. 주로 공공 정보 분석을 수행하며, 미국 정보기관들을 주요 고객으로 하고 있습니다. 기술적 기반은 PayPal의 사기 탐지 기술을 가져온 것이며, 다양한 데이터 소스를 처리하고 분석하는 능력이 뛰어납니다. 하지만 상대적으로 비용이 높은 편입니다. 2. 팔란티어 테크놀로지 창업자 팔란티어는 PayPal을 매각한 피터 틸이 대학 동창인 알렉스 카프와 스티브 코헨을 영입하여 설립했습니다. 지배구조는 이사회 중심으로 운영되고 있습니다. ...2025.01.28
-
빅 데이터의 의미와 정보기술2025.04.251. 빅 데이터의 의미 빅 데이터는 데이터의 양(Volume), 데이터 생성 속도(Velocity), 형태의 다양성(Variety)이라는 3가지 특성을 가지고 있다. 이러한 빅 데이터는 개인, 단체, 기업, 국가 등에 중요한 자산이 되며 미래 경쟁력을 좌우하는 중요한 자원으로 활용될 것이다. 2. 빅 데이터 분석 기술 빅 데이터 분석 기술에는 기계학습, 데이터마이닝 등이 있다. 기계학습은 컴퓨터가 스스로 학습하여 새로운 규칙을 형성하는 기술이며, 데이터마이닝은 광대한 데이터베이스에서 가치 있는 정보를 찾아내는 기술이다. 이러한 기술...2025.04.25
-
빅데이터 리포트2025.01.191. 빅데이터 빅데이터는 기존의 데이터에 비해 방대한 양의 정형 또는 비정형 데이터로, 대량의 데이터와 복잡성이 큰 데이터를 의미한다. 3V(Volume, Velocity, Variety)와 5V(Volume, Velocity, Variety, Veracity, Value)로 특징지어진다. 빅데이터 분석은 필요한 정보를 수집하는 것에서 가능한 많은 데이터와 숨은 정보를 찾아내는 방식으로 변화하고 있으며, 표본조사에서 전수조사로, 질에서 양으로, 상관관계에서 인과관계로 변화하고 있다. 데이터마이닝은 많은 데이터에서 유용한 정보를 발견...2025.01.19
-
인터넷비즈니스모델의 이해 07주차 주중 과제2025.05.061. 디지털 돈 디지털 돈은 블록체인과 같은 분산원장 기술을 기반으로 발행되는 전자화폐를 의미합니다. 이러한 디지털 돈은 물리적인 화폐의 한계를 극복하며, 금융 거래의 효율성을 높여줍니다. 경영학 전공과 관련하여, 해외 온라인 쇼핑몰에서 상품을 구매하는 소비자들을 대상으로 디지털 돈을 활용한 환전 서비스를 제공하는 비즈니스 모델을 제시할 수 있습니다. 이 모델은 소비자가 해외 쇼핑몰에서 상품을 구매할 때 디지털 돈으로 결제를 할 수 있게 하고, 이후에 이를 현지 화폐로 자동 환전해주는 서비스입니다. 이를 통해 소비자들이 취급 수수료...2025.05.06
-
Big Data Data Mining 데이터 마이닝2025.01.121. Data Mining 데이터 마이닝은 방대한 데이터 속에서 유용한 상관관계를 발견하고 추출하여 의사결정에 이용하는 과정입니다. 정보기술의 발달과 비즈니스 요구에 의해 등장했으며, 과열된 기업경쟁과 다양한 고객 요구에 효과적이고 빠른 기업경쟁력을 제공합니다. 데이터 마이닝 이전에는 한정된 자료와 전공 서적 중심의 연역적 방법을 사용했지만, 데이터 마이닝 시대에는 대용량 자료와 실무 중심의 귀납적 방법을 사용합니다. 2. Data Mining 기법 데이터 마이닝 기법에는 의사결정나무, 신경망 네트워크, K-평균 군집화, OLAP ...2025.01.12
-
[R & E 활동 대회] 다중 연결 리스트(Multi-Linked List)를 이용한 자연어 처리 방법론 연구2025.05.121. 다중 연결 리스트(Multi-Linked List) 다중 연결 리스트(Multi-Linked List)는 단일 연결 리스트와 비슷한 구조이나 동적 할당(Dynamic allocation)과 노드 구조체를 이용하여 각 노드 간 연결이 다중으로 이루어지도록 한 자료 구조입니다. 여러 종류의 단어가 한 특성을 공유하여 다음 문장으로 연결되어야 하는 처리 구조를 이루어야 하므로 본 연구에서 이용한 자료 구조입니다. 2. 자연어 처리 본 연구에서는 신문 기사를 활용한 빅 데이터를 C언어로 구조화하여 단어 간의 상관관계를 파악하여 새로운...2025.05.12