다크 데이터

통계 분석을 한 번이라도 해 본 사람은 누구나 데이터 조작의 유혹을 느꼈을 것이다. 그렇지 않더라도 어디서 오류가 생길 수 있는지는 알 수 있다. 그리고 데이터 분석을 많이 해보기 시작하면 잘못된 통계 결과를 야기할 수 있는 부분이 어떠한 곳에 있는지 보다 더 잘 알게 된다.

저자가 말하는 다크 데이터는 천문학의 암흑 물질에서 따왔다고 말하고 있다. 천문학에서 암흑 물질이나 암흑 에너지는 있는 것은 분명한데 현재 우리 기술로는 그 존재 여부를 확인할 수 없는 그런 것을 말한다.

다크 데이터는 그와 유사한 개념으로 받아들이면 된다. 통계 결과를 왜곡할 수 있는 수 많은 부분들을 통칭하고 있기 때문에 측정할 수 없는 데이터만을 이야기하지 않는다.

통계 분석을 어느 정도 해보면 알 수 있는 개념을 소개하고 있기 때문에 이 책을 읽기에 적합한 사람은 통계 분석을 해본 적이 없거나 조금 해 본 사람들에게 적합하다. 통계 분석을 어느 정도 해 본 사람들은 가볍게 읽을 수 있다.