네이버, 다음 등 포털 사이트에서 맛집을 검색하다 연관검색어로 ‘오빠랑’이라는 단어가 뜨는 걸 본 적 있으신가요?
소소한 일상을 올리거나 정보를 교류하는 장이었던 블로그가 어느새 광고, 홍보 매체가 돼 버린 요즘입니다. 블로그에서 추천하는 맛집을 찾아가 보면 맛도 없고, 서비스도 별로인 경우가 허다하죠.
네티즌들이 이런 광고성 글을 걸러내고 진정한 맛집만 검색할 수 있는 방법을 찾아냈다는데 그것이 바로 ‘오빠랑’입니다. 찾고 싶은 지역명과 함께 ‘오빠랑’이라는 단어를 넣어 검색하면, 광고성 글은 걸러지고 순수한 맛집만 검색된다고 합니다.
음식에 관한 포스팅을 하는 사람은 주로 20~30대 여성들이고, 그 여성들의 남자친구들은 ‘오빠’(?)들이 많기 때문에 꽤나 신뢰성 있는 접근법입니다.
실제로 검색해 보면 ‘오빠랑 토요일에 갔던 곳’ 혹은 ‘오빠랑 꼭 다시 와야지!’ 이런 문구가 함께 검색됩니다. 이 방법은 SNS를 통해 널리 퍼져 포털 연관검색어로 뜨는 것은 물론이고 ‘오빠랑’이라는 맛집 추천 페이스북 페이지까지 생겼습니다.
이런 검색 방법은 빅데이터 분석 원리 중 ‘텍스트 마이닝’ 기법의 기초 원리와도 같습니다. 텍스트 마이닝이란 대규모 문서에서 의미 있는 정보를 추출하는 것을 말합니다. 인터넷 블로그의 수많은 텍스트도 일종의 빅데이터입니다.
빅데이터에서 의미 있는 정보를 뽑아내려면 정보의 속성을 잘 파악해 접근해야 합니다. ‘오빠랑’이라는 검색 방법을 맨처음 찾아낸 사람은 어떻게 해야 자신이 원하는 의미 있는 정보를 찾아낼 수 있는지를 잘 이해하고 있는 듯 합니다.
이런 식으로 직접 관련된 단어 대신 그 단어의 속성과 연관된 단어를 검색하면 오히려 더 정확한 정보를 찾을 수도 있습니다. 예를 하나만 더 들면, 기업에서 사내 커플을 찾으려고 사내 메신저를 분석할 때 검색하는 단어는 ‘사랑해’나 ‘자기야’와 같은 직접적인 단어가 아니고 ‘어젯밤’이라고 합니다. “김대리, 우리 어젯밤에…”. 재밌죠? (끝)