빅데이터는 4·29 선거 결과를 알고 있다?
스크롤 이동 상태바
빅데이터는 4·29 선거 결과를 알고 있다?
  • 홍세미 기자
  • 승인 2015.04.22 09:25
  • 댓글 0
이 기사를 공유합니다

'버즈량' 분석 결과 '정동영·천정배' 압도적
'부정 언급' 많으면 승리와 멀어질수도

(시사오늘, 시사ON, 시사온=홍세미 기자)

빅데이터(Bigdata)시대다. 빅데이터란 '기존의 분석도구 및 관리체계로는 감당할 수 없는 엄청난 양의 데이터'라는 의미다. SNS, 인터넷 검색 등 온라인 상에서 거론되는 모든 것들을 분석하는 기법을 뜻한다.  

빅데이터 분석 기법은 정치 선거판에서도 중요하게 떠올랐다. 지난 2012년 버락 오바마는 대선 승리를 통해 ‘빅데이터 전략’을 입증했다. 이후 빅데이터 선거 전략은 유명세를 탔다.

오바마는 대선2년 전부터 SNS을 활용한 선거 기법을 준비했다. 오바마 선거캠프는 △통계학자 △수학자 △언어분석학자 △심리학자 등을 초빙해 세 개의 분석팀을 만들었다. 이들은 SNS에서 유권자들의 비(非)정형데이터(수치로 환산할 수 없는)를 모두 모아 표심을 분석해 승리로 이끌었다.

빅데이터를 통한 분석은 보통 ‘버즈량’으로 분석된다. 버즈량은 SNS에서 '언급되는 횟수'를 의미한다. 버즈량 분석기법은 SNS에서 많이 거론되는 후보는 여론의 중심에 있고, 승리에도 근접해 있다고 보는 시각이다.

우리나라도 미숙하지만 빅데이터 기법으로 선거판을 예측하려는 시도를 하는 움직임이 보인다. 사실상 응답률 10%가 되지 않는 여론조사보다 빅데이터 분석이 현 시대에 더 맞는다는 의견이 나오고 있다.

지난해 7·30 재보선의 경우 빅데이터 분석 기법을 이용했다면, 손학규 전 상임고문과 김두관 전 경남도지사의 패배를 미리 예상할 수 있었을 것이라는 의견이 있다.

디지털 커뮤니케이션 회사인 <스토리닷> 자료에 따르면 경기 수원병(팔달)에 출마한 새누리당 김용남 의원이 SNS에 언급된 횟수는 2만 3210건, 손 전 상임고문은 1만 9345건 기록했다고 밝혔다.

또 경기 김포을의 경우 새누리당 홍철호 후보가 1만 5723건을, 김두관 전 경남도지사가 1만3951건을 기록했다.

정치 거물인 이들이 신인과 다름없는 상대에게 SNS 언급 횟수가 적었다는 대목에서 패배를 예상할 수 있었다.

또 지난해 6·4 지방선거를 앞두고 박원순 서울시장은 9만 1309건을 기록한 반면, 새누리당 정몽준 전 의원은 8만 1904를 기록하는데 그쳤다. 

하지만 SNS에 언급된 횟수만으로 선거 결과를 판단하는 것은 섣부르다고 보는 시선도 있다. 후보의 SNS 이용도와 온라인상에서 인기의 척도 등이 변수로 작용할 수 있기 때문.

지난해 7·30 재보선을 앞두고 7월 17~29일까지 노회찬 정의당 대표가 트위터에서 15만 773건 언급된 것에 비해 새누리당 나경원 의원은 11만 6951건을 기록했다. 나 의원은 언급된 횟수는 적었지만 재보선에서 승리를 거머쥐었다.

그렇다면 오는 4.29 재보선에선 빅데이터 기법은 어느정도 맞을 수 있을까. <시사오늘>이 소셜미디어 탑시(Topsi)를 이용해 선거 여론을 분석해봤다.

▲ 서울 관악을 후보자들의 SNS 언급 횟수 ⓒ 탑시 캡처 화면

서울 관악을, 정동영>정태호>오신환 순

서울 관악 후보들 중 정동영 후보가 SNS에서 가장 많이 언급된 것으로 나타났다. 정 후보는 3월 22일부터 4월 20일까지 한 달 간 총 122,940건 언급됐다.

새정치연합 정태호 후보는 19,259건, 새누리당 오신환 후보는 9,023건 언급돼 정 후보를 뒤따랐다.

특히 정동영 후보가 서울 관악을에 출마한다는 설이 본격적으로 돌았던 3월 28일부터 SNS 언급 횟수가 2 천 건을 돌파, 출마를 선언한 30일 트위터 언급 횟수는 1 만 건을 기록하며 최고치를 달성했다.

이후 정 후보는 언급 횟수는 하락세를 보이다가 12일 정의당 이동영 예비후보와 노동당 나경채 예비후보가 후보 등록을 포기하고 정 후보와 사실상 단일화를 이룬다는 보도가 발표하자, 정 후보에 대한 언급 횟수는 2 천 건에서 약 8 천 건으로 상승했다.

또 지난 18일 공식 정 후보가 '여당도 야당도 못 믿겠다 국민이 심판하자'는 타이틀로 공식 선거 운동을 시작한 이후 언급 횟수가 4 천 건에서 1 만 건으로 다시 상승했다.

새정치연합 정 후보와 새누리당 오 후보는 하루 평균 1 천 건 안팎으로 나타났다. 정 후보는 공식 선거가 시작된 18일 이후 오르고 있다. 4월 20일 2 천 건을 돌파했다.

▲ 인천 강화을 후보자들의 SNS 언급 횟수 ⓒ 탑시 캡처 화면

인천 강화을, 신동근>안상수>박종현 순

인천 강화을의 경우 새정치연합 신동근 후보가 4,701건으로 가장 많이 거론됐다. 새누리당 안상수 후보가 2,759건을, 정의당 박종현 후보가 224건을 기록했다.

새누리당 안상수 후보의 경우 공천이 확정된 3월 25일 약 80건에서 250건으로 언급 횟수가 늘었다.

3월까지 안 후보와 신 후보의 언급 횟수는 200건이 넘지 않으며 비등비등한 모습을 보였다.

그러다 4월 7일 신 후보의 언급량이 약 150건에서 약 350건으로 급등했다. 4월 8일엔 약 400건 가량을 기록했다. 문재인 새정치연합 대표의 부인이 강화을을 찾아 "제가 강화도의 딸입니다"를 외치며 신 후보를 도왔기 때문으로 분석된다. 이후 신 후보의 언급량은 다른 후보들보다 우위에 있는 것을 볼 수 있다.

안 후보의 경우 4월 17일 언급이 100건에서 300건으로 늘어났는데, 이날 안 후보는 김무성 새누리당 대표와 처음으로 접경지역 교동도를 방문해 화제를 모아 오른 것으로 보인다.

▲ 광주 서구을 후보자들의 SNS 언급 횟수 ⓒ 탑시 캡처 화면

광주 서구을, 천정배>조영택>정승 순

광주 서구을의 경우 천정배 후보가 가장 많이 거론된 것으로 나타났다.

천 후보는 43,623건을, 새정치연합 조영택 후보는 7,525건을, 새누리당 정승 후보는 232건을 각각 기록했다.

3월 초부터 광주 서구을 출마를 선언한 천 후보는 3월 28일부터 4월 1일까지 언급량이 500건에서 2 천 건을 돌파하며 급등했다. 이는 정동영 후보의 출마 선언이 겹치면서 천 후보까지 엮어 거론 됐기 때문인 것으로 보인다.

천 후보와 정 후보는 새정치연합을 탈당, 무소속으로 출마해 새정치연합 측과 동교동계 권노갑 상임고문의 비판을 받은 바 있다.

천 후보에 대한 언급은 4월 12일 1 천 건에서 2 천 건 이상으로 급등했는데, 이날 천 후보가 이른바 '성완종 파문'에 대한 특검을 즉각 실시하라고 주장했기 때문으로 보인다.

조 후보는 4월 16일부터 점차 언급량이 올라가고 있는 추세다. 본격적인 선거 유세를 펼치자 19일 500건을 돌파했다.

▲ 경기 성남중원 후보자들의 SNS 언급 횟수 ⓒ 탑시 캡처 화면

경기 성남을, 정환석>김미희>신상진 순

경기 성남을의 경우 새정치연합 정환석 후보가 4,877건을 기록, 1위를 차지했다. 그 뒤를 무소속 김미희 후보가 2,558건을, 새누리당 신상진 후보가 1,511건을 기록했다.

세 후보는 선거 초반 언급 횟수가 200건이 되지 않았다. 정 후보의 언급량이 4월 2일 세 후보 중 처음으로 200건을 돌파했다. 이날 한국노총 출신인 정 후보가 문재인 대표와 함께 한국노총과 정책협약을 맺어 언급량이 오른 것으로 보인다.

정 후보와 김 후보의 경우 지난 17일부터 20일까지 200건을 밑돌던 언급 횟수가 급등했다. 이는 17일 방송된 토론회 때문인 것으로 보인다. 또 이들은 본격적인 선거 유세를 앞두고 SNS 활동도 활발하게 하는 듯 보인다.

정 후보의 경우는 20일 1 천 건을 넘기며 최고치를 달성했다. 이날 안철수 의원이 성남을 방문해 지원 유세를 펼친 것과 무관해 보이지 않는다.

전문가, "언급 횟수 많을 수록 승리와 가깝다, 다만 '긍정적 언급'이어야"

이와 관련, 〈R&B 리서치〉 정호성 대표는 22일 <시사오늘>과의 통화에서 "빅데이터를 이용한 분석기법은 SNS상에서 누가, 언제, 어떤 단어를 쓰는지 취합해 선거 판을 예측하는 것"이라며 "대체적으로 언급이 많이 될수록 인지도가 높다는 이야기니까, 선거 국면에서 유리하다고 볼 수 있다"고 말했다.

다만 정 대표는 "같은 사안이라도 언급되는 단어들이 부정적인지, 긍정적인지를 봐야한다"며 "정동영 후보같은 경우는 특이한 경우다. 대선 주자까지 지낸 분이니까 인지도는 새누리당 오신환 후보나 새정치연합 정태호 후보에 비해 전국적으로 높다. 또 정 후보의 경우 출마 자체가 이슈가 됐다. 인지도가 높은데다가 이슈중심에 서있기 때문에 언급 횟수는 많을 것으로 보여진다"고 언급했다.

그는 "정 후보의 경우엔 부정적 언급도 많았다. 야권 지지자들이 정동영 출마에 대해서 '야권 분열'이라는 시각이 많았다"고 덧붙였다.

정 대표는 "선거에선 A와 B의 대결 구도와 A or not의 구도로 나뉠 수 있다. 전자 A와 B의 대결 구도의 경우 지난 대선처럼 박근혜 대통령 대 문재인 새정치민주연합 대표와 같이 선호도에 따라서 선택할 수 있는 구도다"라며 "후자 A or not의 경우엔 이슈의 중심에 있는 사람이 당선 되느냐 또는 그렇지 않느냐다. 정동영 후보의 경우 빅데이터 분석 결과 언급 횟수가 10만이 넘은 것을 보면 이슈의 중심에 있다고 볼 수 있다. 정동영이냐 정동영이 아니냐로 굳어진 것이다. 그렇다면 다른 라이벌 후보들이 잘 하는지, 못 하는지는 그다지 중요하지 않다"고 분석했다.

담당업무 : 국회 및 새누리당 출입합니다.
좌우명 : 행복하기로 마음먹은 만큼 행복하다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.