데이터를 올바로 해석하고 적용하는 것은 정보화 시대에 무엇보다 중요한 선택지를 제공할 것으로 믿는다. 저자는 이 책을 통하여 수많은 정보를 제대로 해석하고 분석하는 통찰의 힘을 제공하고 있다. 데이터를 이해할 때는 데이터가, 정보, 잡음으로 구성되어 있고 정확한 데이터를 이해하기 위해서는 잡음에 대한 이해가 필요하다고 저자는 말하고 있다. 뉴턴의 만유인력 이후 과학의 시대에서 고학적 가설을 검증하려면 측정이 필수이지만, 측정을 하면 가설과 상관없는 잡음이 있기 때문에 잡음을 제대로 이해하!!970!는 것이 중요하다. 정규분포의 발견에서는 대부분의 잡음은 정규분포를 하지만 주식가격 변동과 같이 정규분포하지 않는 잡음도 있기 때문에 주식시장에서 가격이 급등하거나 급락하는 사건이 정상 상태보다 휠씬 자주 발생하며 주식가격의 폭락과 폭등도 정규분포로는 설명할 수 없다는 것도 말하고 있다. 아울러, 정규분포를 따르지 않는 잡음에는 이상치가 많이 존재하는데 예를 들면 우리나라의 1인당 국민소득의 경우 2019년에 3만 달러 정도 였는데 이는 엄청나게 소득이 많은 가구 또는 회사가 있어서 평균을 높이 올리는 것에 기인한다. 이렇게 이상치가 있으면 평균은 전혀 의미가 없어지고 정규분포가 아닌 데이터를 의미 있게 분석하는 것은 매우 복잡하고 어려워지게 된다. 저자가 1장에서 언급한 런던 콜레라 발생 사건은 데이터에 기반한 합리적 의사결정의 좋은 예를 보여주고 있다. 19세기 런던은 급속한 산업화로 인하여 오물을 정상적으로 처리할 수 없을 많큼 많은 인구가 유입되었다. 그로 인해 콜레라가 창궐하였는데 그 당시 대부분의 사람들은 콜레라가 물이 아닌 공기를 통해 전염된다고 믿었기 때문에 콜레라에 대해 효과적으로 대응하지 못하였다. 그러던중 존 스노라는 과학자가 콜로라 환자가 창궐하는 지역의 맵을 그렸고 그 지역에 탬즈강으로부터 수도를 가져다 쓴 지역으로 수도물을 먹는 사람들이 콜레라에 걸렸다는 사실을 과학적으로 제시하였다. 이는 데이터에 기반한 현대 역학조사의 시초이며 이를 통해 정확한 데이터에 기초한 합리적인 선택은 수많은 사람의 생명을 살릴 수 있을 만큼 값지 것임을 보여준다. 저자는 아마존의 사례를 통해 아마존이 어떻게 고객으로부터 추가 구매를 이끌어 내고 있는지도 언급하고 있다. 구매자의 과거 구매 사례를 통해 구매자가 앞으로 관심을 기울릴만한 제품을 보여주어 구매자의 구매를 이끌어 내고 있는 것이다. 우리도 현재 기존 고객을 바탕으로 앞으로 우리 은행과 거래를 할 만한 고객을 미리 선점하거나 아니면 기존 고객의 니즈에 맞은 최선의 금융상품을 미리 고객에게 제시함으로써 새로운 고객 발굴과 새로운 딜을 만들어 갈 수 있을 것이라 생각한다. 내가 중국에 있을때 징동이라는 온라인 앱을 많이 이용한 적이 있다. 징동에서 물건을 구입하면 놀랍도록 빠른 시간안에 물건이 배달된다. 중국이라는 광활한 땅에서 주문한 물건이 이틀만에 배달되는 경우도 다반사다. 나중에 알고 보니 징동은 과거의 구매 데이터를 기반으로 특정지역의 사람들이 미래에 주문할 가능성이 높은 제품을 미리 그 지역 인근에 위치한 물류창고에 비치함으로써 구매가가 제품을 구매할 때 인근 물류창고의 물건을 배달하여 고객의 니즈를 빠르게 충족시키고 있다는 사실을 알았다. 데이터에 기초한 영업이 얼마나 큰 고객 만족을 낳고 기업의 성공적인 영업활동에 큰 도움이 되는 지 절실히 이해하게 되었다. 우리는 정보의 홍수에 살고 있다. 일부 데이터는 지나치게 많지만 우리가 그 데이터에 대한 통찰력이 없이 그 데이터를 단순히 사용한다면 우리에게는 큰 해결책을 제시할 수 없을 것이다. 나는 이 책을 통하여 미국의 서브프라임 사태처럼 금융인들이 꼭 알아야 하는 상식을 넘어선 지혜를 얻게 되었다. 데이터를 성격에 따라 구분하고 그것을 선택적으로 활용함으로써 올바른 선택을 할 수 있는 인사이트를 얻게 되는 것이다. 나는 은행에서 데이터를 분석하는 정보팀에서 일하고 있다. 수많은 데이터를 잘 선택하고 가공함으써서 내가 일하는 분야에서 보다 많은 올바를 결정을 하고 싶다. 이 책을 많은 사람들에게 권하고 싶다.