히트, 세션 그리고 사용자

 

 

 

오늘은 질문으로 포스팅을 시작해 볼까 합니다. 아래는 구글 애널리틱스를 통해 확인한 한 쇼핑몰의 채널별 유입 현황인데요, 여기서 웹사이트 총 방문자 수는 얼마나 될까요?

 

 

엄밀히 말해 세션수는 방문수를 의미하므로 세션수를 토대로 방문자수를 알기는 어렵겠네요. 하지만 세션수와 방문자 수를 구분하지 못해서 혹은 구분하더라도 편의를 위해 세션수를 토대로 총 몇 명이 방문했다고 표현하는 것을 종종 보게 됩니다. 그럼 화면을 하나 더 보시죠.

 

 

동일 사이트 동일 기간의 잠재고객 > 개요 보고서입니다. 첫 번째 화면과 동일한 1,002,775회의 세션수 바로 옆에 578,627명이라는 사용자 수가 친절하게 표시되어 있습니다.

그럼 이제 이 사용자 수를 총 방문자 수로 보면 되는 것일까요?

 

결론부터 말씀드리면, 아닙니다. 여기서 말하는 사용자는 우리가 일반적으로 생각하는 방문자와는 그 개념이 다르기 때문입니다.

 

웹분석을 함에 있어 특정한 지표는 중요한 지표라 하더라도 그 자체로는 크게 유용하지 않습니다. 지표의 변화 추이에 맥락을 더하고 이를 세그먼트별로 살펴볼 때 유의미한 인사이트를 도출할 수 있습니다. 하지만 특정 지표가 갖는 비즈니스적 의미 이전에 이러한 지표가 어떤 원리, 기준으로 생성되는지를 이해하는 것도 매우 중요합니다.

 

 

그럼 사용자와 방문자의 차이는 어디에서 오는지 그리고 좀 더 넓은 의미에서 구글 애널리틱스의 데이터가 어떻게 구성되는지를 명확하게 이해할 수 있도록 지금부터 GA 데이터의 근간이 되는 히트, 세션, 사용자 개념을 알아보도록 하겠습니다.

참조1: Justin Cutroni, http://cutroni.com/blog/2014/02/05/understanding-digital-analytics-data/

참조2: Avinash Kaushik, https://www.kaushik.net/avinash/google-analytics-visitor-segmentation-users-sequences-cohorts/

 

 

구글 애널리틱스 데이터

 

 

구글 애널리틱스의 모든 데이터는 히트, 세션, 사용자 세 가지 요소를 포함하는 위계형 구조로 되어 있습니다. 가장 작은 단위가 히트고, 히트가 모여 하나의 세션을 구성하며, 또 여러 세션이 모여 하나의 사용자를 구성합니다.

 

 

히트 (Hits)

 

참조(구글 도움말): https://support.google.com/analytics/answer/6086082?hl=ko

 

웹분석 툴에서 가장 작은 데이터 단위로 웹사이트 방문자가 웹사이트에서 행하는 모든 개별적 상호작용을 ‘히트’라고 하며 (구글 공식) 웹로그 분석 고객센터에서는 ‘조회’로 번역됩니다. 히트의 대표적인 예로는 ‘페이지뷰(pageview)’를 들 수 있으며 이밖에 이벤트(event)나 거래(transaction)도 히트 레벨에 해당합니다. 쉽게 말해, 방문자가 하나하나의 페이지를 열어보는 것(페이지뷰), 하나하나의 버튼/링크를 클릭하거나 동영상을 재생하거나 마우스 커서를 움직이는 것(이벤트), 구매를 하는 것(거래) 등 사용자가 우리 웹사이트를 방문해서 취하는 모든 각각의 상호작용이 바로 히트에 속합니다.

이러한 상호작용 중 ‘페이지뷰’의 경우 구글 애널리틱스 추적코드(GATC, Google Analytics Tracking Code)가 자동으로 그 데이터를 수집하는 반면 ‘이벤트’와 ‘전자상거래’ 정보는 추가 설정(tagging)을 통해 별도로 데이터를 전송해 주어야 수집이 가능합니다.

 

 

세션 (Sessions)

 

참조(구글 도움말): https://support.google.com/analytics/answer/2731565?hl=ko

 

세션은 동일한 사용자가 1회 방문 동안 발생시킨 히트의 집합을 의미합니다. GA에서는 활동성을 토대로 히트를 하나의 세션으로 그룹화하며 30분 동안 활동이 없는 경우 해당 세션이 종료됩니다. 즉 방문자가 취한 각각의 액션(히트)이 모여 하나의 세션을 구성함에 있어 30분이란 비활동 기간을 그 기준으로 삼는다는 뜻입니다.

 

물론 예외의 경우도 존재하는데요, 아래는 세션 산정에 있어 이러한 30분 세션 시간이 적용되지 않는 경우에 속합니다.

 

1. 날짜가 바뀔 때

날짜가 바뀌는 경우 30분이 경과되지 않았더라도 새로운 세션으로 카운팅합니다. 예를 들어 오후 11시 50분에 방문해서 12시 10분에 웹사이트를 떠난다고 가정할 경우 첫 번째 세션은 11시 59분 59초에 완료되고 오전 12시 정각에 두 번째 세션이 시작됩니다.

 

2. 캠페인이 변경될 때

 

 

위 예시와 같이 ‘자연 검색(organic)’ 캠페인으로 유입된 후 사이트를 이탈했다가 다시 ‘유료 검색(cpc)’ 캠페인으로 유입되는 등 유입 캠페인/채널이 달라지는 경우 30분이 경과되지 않았더라도 별도의 세션으로 산정됩니다.

 

3. 브라우저가 달라질 때

브라우저 단위에서 쿠키가 생성되며, 이 때 만들어진 고유한 쿠키 아이디 값으로 사용자를 식별합니다.  세션은 사용자 하위 개념으로 브라우저가 달라져 사용자가 달라지면 세션 또한 자동으로 달라집니다. (아래 사용자 개념 참조)

 

세션은 구글 애널리틱스에서 매우 중요한 개념으로 정확하게 이해할 필요가 있습니다. 웹사이트를 방문하는 우리 고객과 고객행동을 이해하고 이를 토대로 비즈니스를 개선하는 것이 웹분석의 궁극적인 목적이라면 GA에서는 이 목적을 달성하기 위해 사용자 수치가 아닌 주로 세션에 기반한 데이터를 제공합니다. 실제로 행동 또는 전환 카테고리 내 일부 보고서를 제외하고 구글 애널리틱스 내 거의 모든 표준보고서는 세션 데이터를 중심으로 구성되어 있습니다.

 

 

사용자 (Users)

 

참조(구글 도움말): https://support.google.com/analytics/answer/1012034?hl=ko&ref_topic=6157800

 

익명의 사용자를 하나의 사용자로 인식하는 단위를 말합니다. 거의 대다수의 웹분석 툴은 사용자 측정에 1사 쿠키를 사용합니다. 쿠키는 작은 텍스트 파일로 익명의 식별자(고유 ID)를 포함하고 있으며 웹사이트 최초 방문 시 브라우저 단위로 생성되어 2년간 유지됩니다. 이후 해당 브라우저에서 웹분석 서버로 히트 데이터가 전송될 때마다 쿠키에 포함된 고유 ID가 함께 전송되어 이를 하나의 사용자로 인식하게 됩니다.

 

데이터 수집에 쿠키를 사용하고 이를 토대로 사용자 수를 산정함에 따라, 아래와 같은 문제가 발생합니다.

1. 사용자가 다양한 브라우저, 기기를 사용할 경우 한 방문자를 여러 방문자로 인식합니다.
2. 사용자가 주기적으로 쿠키를 삭제할 경우, 실제로는 재방문임에도 재방문이 아닌 신규 방문으로 인식합니다.

 

 

여기까지 GA 데이터의 근간을 이루는 히트, 세션, 사용자 개념을 알아봤는데요, 이제 다시 첫 질문으로 되돌아가 보겠습니다. 총 방문자 수는 얼마일까요?

결론은 여전히 ‘알 수 없다’입니다. 하지만 방문자란 표현에서 말그대로 우리 웹사이트를 방문하는 개개인의 사용자를 떠올렸다면 적어도 이제는 GA에서의 세션이나 사용자 수와 실제 방문자 수는 다르다라는 걸 이해했을 것으로 생각합니다.

 

개개인의 웹사이트 방문자는 GA에서의 사용자보다 상위 개념입니다. 저만 하더라도 회사 홈페이지를 방문함에 있어 사무실과 집에 있는 각각의 데스크탑, 모바일폰, 그리고 간혹 태블릿을 이용합니다. 주로 크롬 브라우저를 이용하지만 인터넷 익스플로러 등 다른 브라우저를 사용하기도 하며, 간혹 앱을 통해 방문하기도 합니다. 다시 말해 실제 방문자는 한 명이지만 GA에서는 최소 4명 이상의 사용자로 표시된다는 것을 의미합니다.

이제 차이점이 이해가 되나요?  앞으로 세션, 사용자 수를 볼 때 이 수치가 어떻게 나왔는지를 떠올릴 수 있기를 기대합니다.

 

 

P.S. 그렇다면 GA에서는 쿠키 값이 아닌 실제 사용자를 구분하지 못하는가? 꼭 그렇지는 않습니다. 회원 정보 등 웹사이트 방문자 개개인을 식별할 수 있는 고유 식별자가 있는 경우 User-ID 설정(참조: https://support.google.com/analytics/answer/3123662?hl=ko)을 통해 다양한 기기와 브라우저를 통해 유입되는 방문자 식별이 가능합니다. (User-ID에 대한 자세한 내용은 추후 기회가 되면 다루도록 하겠습니다)

 

 

* 표시가 있는 항목은 필수 입력란입니다.

 

국내 대표적인 온라인마케팅 커뮤니티/매체인 아이보스에서 구글 애널리틱스(GA) 강의를 진행하고 있습니다. 커리큘럼 등 자세한 사항은 아래 링크를 참조하세요.

– GA 실무과정(평일): http://www.i-boss.co.kr/ab-goods-236
– GA 실무과정(주말): http://www.i-boss.co.kr/ab-goods-267
– GTM(구글태그관리자): http://www.i-boss.co.kr/ab-goods-237
– GA 유료스터디: https://www.i-boss.co.kr/ab-7009

 

[Google Analytics] 구글 애널리틱스 핵심 데이터 지표(히트, 세션, 사용자) 이해하기
태그:                                 

[Google Analytics] 구글 애널리틱스 핵심 데이터 지표(히트, 세션, 사용자) 이해하기”에 대한 4개의 생각

  • 2018년 12월 7일 1:49 오후
    고유주소

    안녕하세요. 글 재미있게 읽고 있습니다.

    궁금한점이 있는데 요즘 사용자들은 주기적으로 쿠키를 삭제하는데, GA를 이용하여서 이러한 부분까지 확인해주기 위해 어떠한 방법을 사용하나요???
    (데이터로는 다른사용자인데 데이터를 통해 같은 사용자임을 확인하기 위해 사용하는 방법?)

    응답
    • 2018년 12월 7일 3:31 오후
      고유주소

      안녕하세요. USER ID 설정을 통해 동일한 사용자에 대한 정보를 추적할 수 있습니다. 하지만 별도의 설정이 필요하며 설정한다 하더라도 통상적으로 로그인된 경우에만 추적이 가능하다는 점 등 정확한 추적에 어려움이 있습니다.

      참조: https://support.google.com/analytics/answer/3123662?hl=ko#

      응답
  • 2019년 5월 30일 10:10 오전
    고유주소

    알기 쉬운 설명과 예시까지 초보자들도 쉽게 이해할 수 있어서 너무 좋았습니다.
    USER-ID 설정관련해서는 언제 포스팅 해주실까요

    응답
    • 2019년 5월 31일 1:38 오전
      고유주소

      안녕하세요. 우선 칭찬의 말씀 고맙습니다. 또한 향후 포스팅에도 관심을 가져 주셔서 너무나 감사합니다. 하지만 User-ID 설정과 관련한 글은… 음… 현재 업데이트 중인 구글 태그관리자 시리즈가 어느 정도 정리된 이후가 될 것 같습니다.^^

      응답

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다