총선이 한 달 남짓 남은 상태에서 우리나라 국민은 진보와 보수를 어떻게 보고 있을까? TV 뉴스나 인터넷 포털만 보고 있으면 도대체 어디가 유리한지 알 수가 없다. 그래서 빅 데이터의 힘을 빌려 보기로 했다. 본인이 예전에 썼던 빅데이터는 선거 당선자를 알고 있다?라는 글에서는 구글의 검색 데이터가 설문조사보다 더 정확했다고 이야기했던 적 있다.
구글 트렌드를 이용한 분석도 재미있겠지만 국내 서비스를 이용해 보기로 했다. (주)다음소프트는 SomeTrend라는 서비스를 제공하고 있다. 일정 기간 동안 인터넷에 올라온 글들을 키워드로 검색해 최근 우리나라 사람들의 생각을 엿볼 수 있도록 도와준다.
선거를 앞 두고 지난 한 달간 '진보', '보수'라는 단어로 트렌드 검색을 해봤다. '여당', '야당', '민주당', '통합당' 등 다양한 단어로 총선 관련 키워드를 설정할 수 있었겠지만, 이들을 가장 잘 대변할 수 있는 두 단어를 선택했다. 더 정확한 결과를 위해서는 다양한 키워드를 추가로 선정해서 교차 분석을 해봐야 겠지만 이 글에서는 맛보기 의미에서 두 단어만 검색했다.
언급량은 2배가량 차이
지난 한 달간 인터넷에서는 보수에 대한 언급이 더 많았다. 정치는 인지도가 생명이라는데 노출도도 중요한 부분 중 하나다. 진보 측에서는 보수 측의 부정적 콘텐츠가 노출이 많았을 것이라고 항변할 수 있을 수 있겠으나 다음 그래프를 보면 그것도 아닌 것 같다.
진보와 보수는 양측 다 부정 이미지가 월등히 높지만 진보 쪽 부정적 이미지가 더 높은 걸 볼 수 있다
부정적 이미지는 오히려 진보가 1% 높다. 긍정 이미지는 2%가 낮다. 결국 진보는 노출과 긍정도 모두 보수에게 뒤지고 있는 셈이다. 이러한 결과는 진보 측에서 선거 전략을 세울 때 참고해야 할 부분 중 하나일 것이다.
연관어도 중요한 부분 중 하나다. 진보는 민주당이라는 당명이 가장 많은 연관어로 설정돼 있으나 보수 쪽은 야당으로 뭉쳐있다. 자칫하면 민주당 vs 야당 구조가 되는 분위기가 되는 형편이 될 수 있다. 나머지 진보 진영이 민주당에 힘을 실어 주거나 뭉치는 모습을 보여야할 필요성이 보인다. 보수 쪽은 연관어로 '코로나'와 '박근혜'가 높은 순위에 올라와 있는 것이 아킬레스건일 수 있다.
앞으로 빅 데이터는 정치에도 엄청난 영향을 미칠 것이다. 어쩌면 이미 영향을 미치고 있을지도. 특히 우리나라처럼 국민 거의가 인터넷을 이용하는 나라에서 인터넷 트렌드는 전화 설문조사와 비교 불가다. 전화 응답으로는 거짓말을 할 수 있지만 빅 데이터는 분석 방식에 따라 이러한 거짓말을 충분히 걸러낼 수 있다.
앞으로 한 달 여 남은 선거 기간 동안 각 정당과 후보들 중 이러한 데이터를 더 잘 활용하는 쪽이 승리의 여신의 키스를 받을 가능성이 커 보인다.
'블로그 > 일상 속 끄적끄적' 카테고리의 다른 글
기성용 때문에 FC 서울이 욕먹어야 할까? (0) | 2020.04.04 |
---|---|
바이러스는 지구의 면역 체계 아닐까? (0) | 2020.03.18 |
욕먹을 각오로 쓰는 페미 까기 (1) | 2020.03.09 |
코로나-19도 '노무현' 때문이냐? (0) | 2020.03.04 |
저출산 문제, 정말 '돈' 때문일까? (0) | 2019.12.18 |