책소개
우리가 ‘모르는’ 데이터는
왜 ‘아는’ 데이터보다 치명적인가?
“‘주어진 것’을 당연하게 받아들이는 위험에 눈을 뜨게 해주는 책.
‘가짜 뉴스’와 데이터의 폭발적 증가가 불가분의 관계인 이 시대에 모든 사람의 필독서다.”
_에이드리언 스미스, 앨런튜링연구소 소장
“데이비드 핸드는 통계라는...
현대는 빅데이터 시대이다. 정보가 넘쳐나는 환경에서 살고 있는 우리는 의사결정을 잘하는 데 필요한 정보는 다 가지고 있다고 생각하기 쉽다. 하지만 <다크 데이터>의 저자에 따르면 사실 우리가 가진 데이터가 ‘온전했던’ 적은 없었다고 한다. 우리가 손에 쥔 데이터는 빙산의 일각일지도 모른다. 우주의 상당 부분이 보이지는 않아도 엄연히 존재하는 암흑물질로 이루어져 있듯이, 정보의 우주 역시 우리가 위험천만하게 간과할 수 있는 ‘다크 데이터’로 가득하다.
우리에게 없거나 우리가 모르는 데이터를 저자는 물리학의 ‘암흑물질(dark matter)’에 빗대어 ‘다크 데이터’라 부른다고 한다. 다크 데이터는 우리가 갖고 있지 않은 데이터다. 다크 데이터는 어디서든 생겨나며 모든 곳에 있다. 그리고 다크 데이터의 가장 큰 위험은 우리가 그 존재를 모를 수 있다는 점이다. 많은 데이터들로 인해서 세상이 빅데이터로 돌아가고 있는 것 같은 느낌이 들지만 실상은 아직 숨겨지고, 사용되지 않는 데이터가 많다. 그 다크 데이터로 인해 올바른 의사결정이 이뤄지지 않을 수도 있고, 혹은 이 숨겨진 데이터를 사용하는 누군가가 권력을 쥐게 될 수도 있다
이 책은 우리가 ‘갖고 있지 않은’ 데이터를 다룬다. 그러니까 우리가 지금 갖고 싶거나, 이전에 가지고 싶었거나, 또는 가진 줄 알지만 실제로는 갖고 있지 ‘않은’ 데이터에 관한 책이다.
<다크 데이터>는 우리가 누락된 데이터를 알아차리지 못하게 되는 과정들, 그리고 그로 인해 우리가 어떻게 잘못되고 위험하고 심지어 파국에 이를 수도 있는 결론과 행위에 이르게 되는지 다각도에서 탐사한다. 저자는 우주왕복선 챌린저호 폭발사고부터 복잡한 금융사기와 AI 알고리즘까지, 현실에서 만날 수 있는 다양한 사례를 면밀하게 파고든다.