요즘 집콕이 강제되는 시국이다 보니까, 인터넷만 깔려 있으면 손쉽게 접근할 수 있는 블로그나 유튜브 등에 눈길을 돌리는 분들이 많아졌다는데요. 이런 개인미디어를 운용하다 보면, 다른사람들로부터의 관심을 향한 염원에서 자유롭기 어렵습니다. 솔직히 저도 제 블로그 유입의 절대다수를 구글검색이 차지하는 관계로, 구글 검색노출 및 트래픽에 상당히 신경이 많이 쓰이거든요. 물론 원론적으로는 정확하면서도 방문자들의 니즈를 충족시켜주는 컨텐츠가 필요하고 이것이 근본적인 답입니다.
한편 검색엔진최적화 (SEO) 관련 블로그나 칼럼 등을 보면, 특정 페이지에 나오는 컨텐츠가 고퀄인지의 여부를 가늠하는 척도로서 이탈률 (bounce rate)과 세션시간 (session duration) 등을 제시하고 있습니다. 다시 말해서 낮은 이탈률과 긴 세션시간으로 대표되는 몰입도가 바로 컨텐츠의 퀄리티와 높은 상관관계를 갖는 척도라는 것인데요. 엄밀히 말하자면, 높은 몰입도가 포착되는 것은 고퀄의 필요조건이지, 충분조건이 아니라 하겠습니다. 명쾌하고도 조리있게 질문에 대한 답을 주는 글이라면 읽는 사람이 끝까지 관심있게 읽겠지만, 그 역이 성립된다는 보장은 없습니다. 다른 블로그나 유튜브의 내용이 이뭐병이라도 더 잘 까기 위해 끝까지 보는 등의 예외적인 상황도 있거든요. 제가 바로 그렇습니다.
그럼에도 컨텐츠의 질적 측면을 몰입도와 결부지어 바라보는 시각은, 독자/시청자들의 수준이 기본 이상은 된다는 가정하에 합리적이라고 생각합니다. 그렇게 구글, 네이버, 다음 등의 검색엔진이 웹 상에 있는 컨텐츠의 퀄리티를 가늠하는데 있어 몰입도라는 요소가 부분적으로 영항을 미친다고 생각했을 때, 이 포스팅의 계기가 된 질문이 하나 떠올랐습니다.
그렇다면 검색엔진은 몰입도를 수치화하는 데 중요한 요소인 이탈률 및 세션시간 혹은 체류시간을 어떻게 알아낼 수 있을까?
일단 구글 아날리틱스 등의 웹 분석 툴들이 떠오르지만, 여기에 집계되는 값들은 100% 정확하지가 않습니다. 예를 들어 누군가가 검색 등으로 제 블로그 포스팅 중의 하나를 방문한뒤에, 다른 포스팅으로 가는 링크를 누르지 않고 브라우저의 탭을 닫거나 검색결과 페이지로 가기 위해 뒤로가기를 누르는 상황을 상정해 보죠. 이런 경우 구글 아날리틱스에서는 이탈률 100% 및 체류시간 0초가 집계될텐데요. 이탈율은 정확하겠지만 체류시간 0초는 그렇지가 못합니다. 페이지를 방문한 시각은 기록 되지만 언제 해당 페이지를 이탈했는지를 알 수 없는 관계로, 체류시간을 계산할 수 없어서 0초라는 값을 대신 내놓은 것이죠. 그래서 답을 구하기 위해 인터넷을 돌아다니다가, 우연히 아티클을 하나 발견했습니다.
구글의 공식 웹사이트는 아니지만, 내용 전개가 설득력이 있다고 판단되어 한번 소개해 봅니다. 이 아티클에 따르면, 구글은 웹사이트의 몰입도를 수치화하는데 있어 아날리틱스의 자료에 의존하지는 않는다고 합니다. 위에 언급된 집계 방식상의 결함과 더불어 많은 수의 웹사이트들이 구글 아날리틱스를 사용하지 않기 때문이라고 하는데요.
그 대신에 구글의 검색결과 페이지 (search engine result page, 줄여서 SERP)에서 얻을 수 있는 정보를 토대로 포고스틱 알고리즘 (pogo-sticking algorithm)이라는 걸 적용한다고 합니다. 즉 특정 사용자가 검색결과에 나열된 페이지들을 어떠한 순서로, 얼마나 오랫동안 방문하는지를 측정하고 각 웹페이지들의 몰입도를 비교하겠다는 것이죠. 여기서의 체류시간 (dwell time)은 검색결과에 나온 링크를 클릭하여 웹페이지에 방문했을때부터, 뒤로가기 등을 눌러서 검색결과 페이지가 다시 로드될때까지의 시간으로 정의되는데요. 구글 아날리틱스에 집계되는 세션 시간이나, 사전적인 의미에서 특정 페이지에서 머문 시간과는 다른 개념이라 할 수 있겠습니다.
정보를 찾기 위한 검색으로부터 들어간 페이지가 하필 네이버 블로그이고, 라인프렌즈 이모티콘 따위가 보인다면? 바로 빡쳐서 뒤로가기를 누를 것이고 체류시간은 짧을 것이며, 이는 블로그를 평가하는데 나쁜 요소로 작용합니다. 왜냐하면, 빠른 시간 안에 검색결과 페이지로 다시 돌아온다는 것은 포스팅의 퀄리티가 떨어지거나, 방문자의 검색 목적에 부합하지 않는다는 의미로 해석될 수 있거든요.
이 포고스틱 알고리즘에는 상대평가의 요소도 있습니다. 예를 들어 제 블로그 포스팅이 다른 사람의 구글 검색에 떠서 방문을 하는 경우, 그 사람이 제 블로그를 방문하기 전후로 방문한 페이지들과 체류시간을 종합적으로 따져서 제 블로그의 몰입도를 판단하게 된다고 합니다. 제 블로그를 방문한 이후 검색결과에 같이 뜬 다른 웹사이트를 방문하고 더 오랜시간동안 체류한다면, 구글 검색엔진은 제 블로그의 몰입도를 상대적으로 낮게 평가하고 이는 검색노출에 있어서 않좋은 영항을 끼칠 수 있다고 하는군요. 반면에 다른 웹사이트들을 방문하고 검색결과 페이지로 돌아오기를 반복하던 사람이 제 블로그 포스팅에 방문하여 오랜 시간 머문다면, 긍정적인 요소로 작용할 것입니다.
포고스틱 알고리즘은 검색엔진이 수집할 수 있는 정보를 토대로 방문자가 얼마나 몰입해서 웹페이지에 머무는지를 유추하는 데 있어서 상당히 합리적인 방법이라고 생각이 됩니다만, 이를 악용하여 트래픽 공격을 할 수 있는 소지도 있어 보입니다. 물론 구글도 이걸 모를리 없으므로 다른 변수들도 함께 고려해서 검색노출 순위를 결정하겠죠. 다른 어떤 변수들이 있는지는 계속 공부해서 포스팅 해 볼 예정입니다. 그러니까 stay tuned. 마지막으로 체류시간에 대해 잘 정리된 글을 링크로 걸어봅니다.