책소개
빅데이터 플랫폼을 구축하기 위한 요소 기술들, 목적에 맞는 각 데이터 활용 방안, 소셜 분석 도구를 활용한 빅데이터 고급 분석 기법 등 실무자들에게 유용한 정보들이 가득하다.
이 책은 빅데이터가 무엇인지 궁금해 하는 일반 독자부터 빅데이터의 비즈니스 활용과 좀 더 상세한 전문 정보를 원하는 기업 CEO...
전자상거래 수업을 들으면서, 특히 ‘빅데이터’라는 분야에 관심을 두게 되고 더 알고 싶다는 생각에 이 책을 읽게 되었다. 수업을 듣기 전까지는 인터넷으로 하는 쇼핑이나 계좌 이체 등 여러 서비스에 대해서 별다른 생각 없이 당연하게 여기면서 이용했었다. 그러나 강의가 종강을 향하고 학기가 끝나가는 이 시점에서, 교재와 책을 통해 내가 배운 것들이 얼마나 대단한 것인가 하고 새삼 감회에 빠져들었다. 이 독후감이 명목상으로는 과제이지만 내가 느낀 점과 의문점을 적어낼 좋은 기회라는 생각이 들어 기분이 좋다. 현재의 나는 내가 가진 전자상거래에 대해 바라보는 관점이 완전히 달라졌다. 수업을 통해 관심을 가지게 되었기에, 만약 내가 이 과목을 듣지 않았다면 분명히 지금도 기술의 발전에 대한 감흥 없이 사용했을 것이다.
나는 평소에 혁신이라는 말을 쉽게 사용하지만, 정작 그 혁신이 필요한 산업 현장에 있는 기술자와 숙련된 인력들은 이렇게 짧고 간단한 단어를 얻기 위해서 얼마나 많은 땀을 흘렸을까? 전자상거래의 발전 과정을 보더라도, 역시 진보는 하루아침에 이뤄지는 것이 아니다.
오늘 날 우리는 빅 데이터 시대에 살고 있다고 해도 과언이 아니다. 스마트 단말이 보급이 되기 시작하면서 데이터 홍수 시대에 살기 시작 하였고 많은 기업체나 국가적 차원으로도 이제는 고작 작은 데이터 하나라도 전혀 무시할 수 없는 시대에 살게 되었다. 그 작은 데이터 하나가 엄청난 영향력을 발휘할 수 있기 때문이다. 크고 빠르고 다양한 데이터들이 넘치는 시대에 본인이 생각하는 가치 있는 데이터를 찾기 위하여 시간을 투자하게 되었고 그 데이터들로 미래를 예측까지 할 수 있는 시대까지 오게 되었다. 또한 앞에서 말을 했듯이 이제는 누구나 스마트 폰을 갖고 있기 때문에 개인이 원하는 서비스를 소비할 뿐만 아니라 그 과정에서 습득한 지식으로 재생산 또 재생산을 하기 시작하면서 새로운 지식 생태계를 조성할 수 있게 되었다. 그리고 지인과 정보를 소통할 수 있도록 지원하는 다양한 SNS의 등장은 개인이 빅 데이터를 생산하는 스마트 프로슈머로 변화하는 촉매제가 되었다.
빅 데이터가 뭐길래 이토록 많은 이야기가 있는가도 중요하겠다. 빅데이터는 속성상 기존과 다른 다양성, 속도, 볼륨을 가진다. 우리가 하는 SQL을 기반으로 하는 데이터베이스와 다른 것을 빅데이터라 생각하면 될 것이다.
(1) '다양성'이란 비정형 데이터를 말한다. 과거에는 그냥 버려버렸던 데이터를 모아서 인사이트를 찾는다. 다크(dark) 데이터라는 말이 있다. 저장공간이 없어서 버려야 했던 것, 아니면 저장만 되어 있는 데이터를 말한다. 이런 것들이 빅데이터 안에 들어간다. 저자는 정형과 비정형을 재미있게 풀어낸다. 104쪽이다.
<데이터의 종류가 무척 다양해졌다. 한때 많은 인기를 누렸던 싸이월드와 페이스북의 차이가 바로 이 부분이다. 싸이월드 같은 경우, 우리는 소식을 전하고 싶으면 글을 남기는 곳으로 사진을 올리고 싶으면 사진 관리하는 곳으로 동영상을 올리고 싶으면 동영상 관리부분에서 다루곤 했다.
하지만 페이스북은 이러한 경계가 없다.