모두 거짓말을 한다
구글 트렌드로 밝혀낸 충격적인 인간의 욕망
Everybody Lies
Big Data, New Data, and What the Internet Reveals About Who We Really Are
Seth Stephens-Davidowitz | 2017
저자 세스 스티븐스 다비도위츠는 데이터 과학자입니다. 구글 트렌드를 사용해 빅데이터 연구를 수행하여 구글 검색에 남겨진 인간 심리와 행동을 분석했습니다. 그래서 저자도 ‘인터넷 데이터 전문가’라고 말하며 ‘디지털 발자국’을 쫓는다는 말을 합니다.
아무도 보는 이 없을 때 나
작고 네모난 빈칸에 단어나 문구를 입력하는
일상적인 행동은 작은 진실의 자취를 남기며
이 자취 수백만 개가 모이면
결국 심오한 현실이 드러난다.
서문: 빅데이터 혁명의 개요
사람들은 설문조사나 인터뷰 처럼 다른 이를 인식하게 될 때는 사회적으로 용인될 만한 답변을 하게 되지만, 혼자인게 분명한 경우인 인터넷 검색창에서는 훨씬 솔직한 모습이 나옵니다. 이를 기반으로 정치, 인종차별, 성, 건강, 경제 등 다양한 주제에서 사람들이 어떤 생각을 하는지 분석합니다.
내 성기가 얼마나 큰가요?
구글에는 대화를 하지 않으려는 남편(또는 부인)에 대한 불만보다
성관계를 원하지 않는 배우자에 대한 불만이 열여섯 배 많다.
미혼의 애인들 사이에서는 문자메시지에 답이 안 온다는 불만보다
성관계를 원하지 않는다는 불만이 5.5배 많다.
4. 디지털 자백약
이 책을 처음 접했을 때 제일 궁금하기도 했고, 제일 자극적인 주제이기도 합니다. 심지어 저자도 제일 관심있게 찾은 주제라고 합니다. 그래서 제목을 성기 크기로 하려고 했다가 출판사에 제지 당했다고 합니다.
성에 대한 주제는 또 다시 세분화해서 이야기 합니다. 그 중에 남성과 여성으로 나뉘는 각자의 걱정거리(크기와 냄새)에 대해서 구글은 걱정할 건 아니라고 알려준다는 대목이 기억에 남습니다. 사실 우리는 자기 몸을 평가하느라 너무 바쁘다는 겁니다. 다른 사람 몸까지 평가할 여지가 없다는 겁니다.
빅데이터
새로운 빅데이터 소스를 이용해서
주식이 어떤 방향으로 움직일지 예측하는 것이 가능할까?
한마디로 답하면 불가능하다.
7. 빅데이터로도 할 수 없는 일
AI 가 나오면서 나왔던 주제와 동일합니다. ‘주가를 예측할 수 있을까?’ 이 책이 기반한 지식이 빅데이터이기 때문에 본 내용 앞뒤에 기술 설명을 합니다. IT 지식이 없다 하더라도 별 문제는 없습니다. 특히 후자에는 인용구처럼 빅데이터로 할 수 없는 것과 하지 말아야 할 것도 짚고 넘어갑니다. 그렇다고 길진 않으니 걱정은 안해도 됩니다.
結
이 책을 통해 기존 데이터 분석 방식이 불완전하다는 것을 알게 되었습니다. 설문조사에 대해 저도 의구심이 많았기 때문에 이 부분이 좀 해소되었습니다. 빅데이터가 정말 많은 것을 바꾸었고, 심지어는 AI 까지 나오는 배경이 되었는데, 인간까지 더 명확하게 이해하는 도구가 될 수 있다는 점이 참 흥미롭습니다.
