
총 6개
-
빅데이터의이해와활용2024.09.231. 빅데이터 1.1. 빅데이터의 정의와 특성 빅데이터의 정의와 특성은 다음과 같다. 빅데이터란 단순히 많은 양의 데이터를 뜻하는 것이 아니라 기존 데이터베이스 관리 도구로는 수집, 관리, 저장의 역량을 넘어서는 다양하고, 규모가 큰 정형, 비정형 데이터를 의미한다. 이러한 빅데이터는 데이터의 규모, 생성 속도, 형태 측면에서 기존 데이터와 상당한 차이가 있다. 빅데이터의 대표적인 특성인 3V(Volume, Variety, Velocity)는 다음과 같다. 첫째, 데이터의 규모(Volume)가 매우 크다. 둘째, 데이터의 다...2024.09.23
-
상품기획 데이터 시각화2024.10.051. 빅데이터의 이해 1.1. 하둡의 역사와 빅데이터의 장점 하둡은 빅데이터에 있어서 핵심이 되는 기술이라고 할 수 있다. 빅데이터란 기존의 데이터보다 방대하다는 의미에서 big을 붙여서 그 어원이 만들어졌다. 그에 따라서 기존의 방법이나 도구로 수집 및 저장, 분석 등이 어려운 정형 및 비정형 데이터들을 의미한다. 하둡은 이러한 빅데이터와 상당한 관련이 있는 것이다. 하둡은 아파치 루씬의 창시자로 알려져있든 더그 커팅으로부터 시작되었다. 더그 커팅의 소속은 아파치였다. 아파치는 사용자들이 홈페이지에 접속하는, 일명 '웹서버'...2024.10.05
-
빅데이터 이해와 활용2024.10.111. 빅데이터의 이해 1.1. 빅데이터의 정의와 특성 빅데이터란 단순히 많은 양의 데이터를 의미하는 것이 아니다. 빅데이터는 데이터의 규모, 생성속도, 형태의 측면에서 기존의 데이터와 상당한 차이가 있다. 가트너(Gartner)의 레이니(Doung Laney)는 빅데이터의 특성을 규모(Volume), 다양성(Variety), 속도(Velocity)로 구성된 3V로 정의하였다. 규모(Volume)는 빅데이터의 가장 두드러진 특성으로, 엄청난 양의 데이터가 실시간으로 생성되고 있다는 것을 의미한다. 스마트폰과 IoT 기기의 보급으...2024.10.11
-
한국방송통신대 컴퓨터 구조 출석수업 평가과제2024.11.131. 데이터 분석과 기계학습 접근방법 1.1. 데이터 분석에 기계학습 접근방법이 도입된 이유 데이터 분석에 기계학습 접근방법이 도입된 이유는 관측치마다 변수가 급격히 증가하고 통제되지 않은 인간행동에 의해 생산된 데이터라는 복잡성 때문이다. 기존의 모수적 모형 접근방법으로는 좋은 결과를 기대하기 어려웠기 때문에, 알고리즘(algorithm) 접근방법이 도입되었다. 즉, 단순 선형 회귀분석과 같이 모수를 과거 데이터로부터 적합하는 모수적 모형 접근방법과는 달리, 알고리즘에 의해 정해진 방식에 따라 계산된 결과로 데이터를 분석하는 방...2024.11.13
-
AI 알고리즘 선형회귀분석2024.10.201. 데이터 과학의 입문 1.1. 데이터 분석에서 기계학습과 알고리즘 접근방법 1.1.1. 기계학습과 알고리즘 접근방법의 도입 이유 데이터의 복잡성 때문에 기계학습과 같은 알고리즘 접근방법이 도입되었다. 인간은 예측에 벗어나거나 통제불가능한 행동을 보이게 되는데, 이에 따라 생산된 데이터는 매우 복잡한 양상을 띠며, 무수한 변수가 존재하게 된다. 기존의 '모수적 모형 접근방법'으로는 좋은 분석 결과를 기대하기 어려워 인공지능이나 패턴인식 등에서 연구되어 온 기계학습 이론을 데이터 분석에 적용하게 된 것이다. 이처럼 데이터의 복잡...2024.10.20
-
ETL에 대해서 말해줘2024.09.051. 빅데이터의 특징과 발전 1.1. 빅데이터의 개념과 3V 빅데이터는 기존의 데이터베이스 관리도구로는 처리하기 어려울 정도로 방대한 양의 데이터를 의미한다. 데이터의 양(Volume), 생성 속도(Velocity), 그리고 다양성(Variety)이라는 3V 특성으로 정의된다. 첫째, 데이터의 양(Volume)은 기존의 데이터베이스 시스템으로는 처리할 수 없을 정도로 엄청난 규모의 데이터를 의미한다. 오늘날 디지털 데이터는 기하급수적으로 증가하고 있으며, 페타바이트(PB) 단위에서 제타바이트(ZB) 단위로 급성장하고 있다. ...2024.09.05