히트, 세션 그리고 사용자

 

 

 

오늘은 질문으로 포스팅을 시작해 볼까 합니다. 아래는 구글 애널리틱스를 통해 확인한 한 쇼핑몰의 채널별 유입 현황인데요, 여기서 웹사이트 총 방문자 수는 얼마나 될까요?

 

 

엄밀히 말해 세션수는 방문수를 의미하므로 세션수를 토대로 방문자수를 알기는 어렵겠네요. 하지만 세션수와 방문자 수를 구분하지 못해서 혹은 구분하더라도 편의를 위해 세션수를 토대로 총 몇 명이 방문했다고 표현하는 것을 종종 보게 됩니다. 그럼 화면을 하나 더 보시죠.

 

 

동일 사이트 동일 기간의 잠재고객 > 개요 보고서입니다. 첫 번째 화면과 동일한 1,002,775회의 세션수 바로 옆에 578,627명이라는 사용자 수가 친절하게 표시되어 있습니다.

그럼 이제 이 사용자 수를 총 방문자 수로 보면 되는 것일까요?

 

결론부터 말씀드리면, 아닙니다. 여기서 말하는 사용자는 우리가 일반적으로 생각하는 방문자와는 그 개념이 다르기 때문입니다.

 

웹분석을 함에 있어 특정한 지표는 중요한 지표라 하더라도 그 자체로는 크게 유용하지 않습니다. 지표의 변화 추이에 맥락을 더하고 이를 세그먼트별로 살펴볼 때 유의미한 인사이트를 도출할 수 있습니다. 하지만 특정 지표가 갖는 비즈니스적 의미 이전에 이러한 지표가 어떤 원리, 기준으로 생성되는지를 이해하는 것도 매우 중요합니다.

 

 

그럼 사용자와 방문자의 차이는 어디에서 오는지 그리고 좀 더 넓은 의미에서 구글 애널리틱스의 데이터가 어떻게 구성되는지를 명확하게 이해할 수 있도록 지금부터 GA 데이터의 근간이 되는 히트, 세션, 사용자 개념을 알아보도록 하겠습니다.

참조1: Justin Cutroni, http://cutroni.com/blog/2014/02/05/understanding-digital-analytics-data/

참조2: Avinash Kaushik, https://www.kaushik.net/avinash/google-analytics-visitor-segmentation-users-sequences-cohorts/

 

 

구글 애널리틱스 데이터

 

 

구글 애널리틱스의 모든 데이터는 히트, 세션, 사용자 세 가지 요소를 포함하는 위계형 구조로 되어 있습니다. 가장 작은 단위가 히트고, 히트가 모여 하나의 세션을 구성하며, 또 여러 세션이 모여 하나의 사용자를 구성합니다.

 

 

히트 (Hits)

 

참조(구글 도움말): https://support.google.com/analytics/answer/6086082?hl=ko

 

웹분석 툴에서 가장 작은 데이터 단위로 웹사이트 방문자가 웹사이트에서 행하는 모든 개별적 상호작용을 ‘히트’라고 하며 (구글 공식) 웹로그 분석 고객센터에서는 ‘조회’로 번역됩니다. 히트의 대표적인 예로는 ‘페이지뷰(pageview)’를 들 수 있으며 이밖에 이벤트(event)나 거래(transaction)도 히트 레벨에 해당합니다. 쉽게 말해, 방문자가 하나하나의 페이지를 열어보는 것(페이지뷰), 하나하나의 버튼/링크를 클릭하거나 동영상을 재생하거나 마우스 커서를 움직이는 것(이벤트), 구매를 하는 것(거래) 등 사용자가 우리 웹사이트를 방문해서 취하는 모든 각각의 상호작용이 바로 히트에 속합니다.

이러한 상호작용 중 ‘페이지뷰’의 경우 구글 애널리틱스 추적코드(GATC, Google Analytics Tracking Code)가 자동으로 그 데이터를 수집하는 반면 ‘이벤트’와 ‘전자상거래’ 정보는 추가 설정(tagging)을 통해 별도로 데이터를 전송해 주어야 수집이 가능합니다.

 

 

세션 (Sessions)

 

참조(구글 도움말): https://support.google.com/analytics/answer/2731565?hl=ko

 

세션은 동일한 사용자가 1회 방문 동안 발생시킨 히트의 집합을 의미합니다. GA에서는 활동성을 토대로 히트를 하나의 세션으로 그룹화하며 30분 동안 활동이 없는 경우 해당 세션이 종료됩니다. 즉 방문자가 취한 각각의 액션(히트)이 모여 하나의 세션을 구성함에 있어 30분이란 비활동 기간을 그 기준으로 삼는다는 뜻입니다.

 

물론 예외의 경우도 존재하는데요, 아래는 세션 산정에 있어 이러한 30분 세션 시간이 적용되지 않는 경우에 속합니다.

 

1. 날짜가 바뀔 때

날짜가 바뀌는 경우 30분이 경과되지 않았더라도 새로운 세션으로 카운팅합니다. 예를 들어 오후 11시 50분에 방문해서 12시 10분에 웹사이트를 떠난다고 가정할 경우 첫 번째 세션은 11시 59분 59초에 완료되고 오전 12시 정각에 두 번째 세션이 시작됩니다.

 

2. 캠페인이 변경될 때

 

 

위 예시와 같이 ‘자연 검색(organic)’ 캠페인으로 유입된 후 사이트를 이탈했다가 다시 ‘유료 검색(cpc)’ 캠페인으로 유입되는 등 유입 캠페인/채널이 달라지는 경우 30분이 경과되지 않았더라도 별도의 세션으로 산정됩니다.

 

3. 브라우저가 달라질 때

브라우저 단위에서 쿠키가 생성되며, 이 때 만들어진 고유한 쿠키 아이디 값으로 사용자를 식별합니다.  세션은 사용자 하위 개념으로 브라우저가 달라져 사용자가 달라지면 세션 또한 자동으로 달라집니다. (아래 사용자 개념 참조)

 

세션은 구글 애널리틱스에서 매우 중요한 개념으로 정확하게 이해할 필요가 있습니다. 웹사이트를 방문하는 우리 고객과 고객행동을 이해하고 이를 토대로 비즈니스를 개선하는 것이 웹분석의 궁극적인 목적이라면 GA에서는 이 목적을 달성하기 위해 사용자 수치가 아닌 주로 세션에 기반한 데이터를 제공합니다. 실제로 행동 또는 전환 카테고리 내 일부 보고서를 제외하고 구글 애널리틱스 내 거의 모든 표준보고서는 세션 데이터를 중심으로 구성되어 있습니다.

 

 

사용자 (Users)

 

참조(구글 도움말): https://support.google.com/analytics/answer/1012034?hl=ko&ref_topic=6157800

 

익명의 사용자를 하나의 사용자로 인식하는 단위를 말합니다. 거의 대다수의 웹분석 툴은 사용자 측정에 1사 쿠키를 사용합니다. 쿠키는 작은 텍스트 파일로 익명의 식별자(고유 ID)를 포함하고 있으며 웹사이트 최초 방문 시 브라우저 단위로 생성되어 2년간 유지됩니다. 이후 해당 브라우저에서 웹분석 서버로 히트 데이터가 전송될 때마다 쿠키에 포함된 고유 ID가 함께 전송되어 이를 하나의 사용자로 인식하게 됩니다.

 

데이터 수집에 쿠키를 사용하고 이를 토대로 사용자 수를 산정함에 따라, 아래와 같은 문제가 발생합니다.

1. 사용자가 다양한 브라우저, 기기를 사용할 경우 한 방문자를 여러 방문자로 인식합니다.
2. 사용자가 주기적으로 쿠키를 삭제할 경우, 실제로는 재방문임에도 재방문이 아닌 신규 방문으로 인식합니다.

 

 

여기까지 GA 데이터의 근간을 이루는 히트, 세션, 사용자 개념을 알아봤는데요, 이제 다시 첫 질문으로 되돌아가 보겠습니다. 총 방문자 수는 얼마일까요?

결론은 여전히 ‘알 수 없다’입니다. 하지만 방문자란 표현에서 말그대로 우리 웹사이트를 방문하는 개개인의 사용자를 떠올렸다면 적어도 이제는 GA에서의 세션이나 사용자 수와 실제 방문자 수는 다르다라는 걸 이해했을 것으로 생각합니다.

 

개개인의 웹사이트 방문자는 GA에서의 사용자보다 상위 개념입니다. 저만 하더라도 회사 홈페이지를 방문함에 있어 사무실과 집에 있는 각각의 데스크탑, 모바일폰, 그리고 간혹 태블릿을 이용합니다. 주로 크롬 브라우저를 이용하지만 인터넷 익스플로러 등 다른 브라우저를 사용하기도 하며, 간혹 앱을 통해 방문하기도 합니다. 다시 말해 실제 방문자는 한 명이지만 GA에서는 최소 4명 이상의 사용자로 표시된다는 것을 의미합니다.

이제 차이점이 이해가 되나요?  앞으로 세션, 사용자 수를 볼 때 이 수치가 어떻게 나왔는지를 떠올릴 수 있기를 기대합니다.

 

 

P.S. 그렇다면 GA에서는 쿠키 값이 아닌 실제 사용자를 구분하지 못하는가? 꼭 그렇지는 않습니다. 회원 정보 등 웹사이트 방문자 개개인을 식별할 수 있는 고유 식별자가 있는 경우 User-ID 설정(참조: https://support.google.com/analytics/answer/3123662?hl=ko)을 통해 다양한 기기와 브라우저를 통해 유입되는 방문자 식별이 가능합니다. (User-ID에 대한 자세한 내용은 추후 기회가 되면 다루도록 하겠습니다)

 

 

—————————————————————————

국내 대표적인 온라인마케팅 커뮤니티/매체인 아이보스에서 구글 애널리틱스 4(GA4) 강의를 진행하고 있습니다. 커리큘럼 등 자세한 사항은 아래 링크를 참조하세요.

GA4 실무과정: https://www.ibossedu.co.kr/edu-goods-380

 

GA4 구축 문의하기(오컴데이터)
GA4 기업교육  문의하기(오컴데이터)

 

 

* 표시가 있는 항목은 필수 입력란입니다.

 

 

[Google Analytics] 구글 애널리틱스 핵심 데이터 지표(히트, 세션, 사용자) 이해하기
태그:                                 

[Google Analytics] 구글 애널리틱스 핵심 데이터 지표(히트, 세션, 사용자) 이해하기”에 대한 10개의 생각

  • 2018년 12월 7일 1:49 오후
    고유주소

    안녕하세요. 글 재미있게 읽고 있습니다.

    궁금한점이 있는데 요즘 사용자들은 주기적으로 쿠키를 삭제하는데, GA를 이용하여서 이러한 부분까지 확인해주기 위해 어떠한 방법을 사용하나요???
    (데이터로는 다른사용자인데 데이터를 통해 같은 사용자임을 확인하기 위해 사용하는 방법?)

    응답
    • 2018년 12월 7일 3:31 오후
      고유주소

      안녕하세요. USER ID 설정을 통해 동일한 사용자에 대한 정보를 추적할 수 있습니다. 하지만 별도의 설정이 필요하며 설정한다 하더라도 통상적으로 로그인된 경우에만 추적이 가능하다는 점 등 정확한 추적에 어려움이 있습니다.

      참조: https://support.google.com/analytics/answer/3123662?hl=ko#

      응답
  • 2019년 5월 30일 10:10 오전
    고유주소

    알기 쉬운 설명과 예시까지 초보자들도 쉽게 이해할 수 있어서 너무 좋았습니다.
    USER-ID 설정관련해서는 언제 포스팅 해주실까요

    응답
    • 2019년 5월 31일 1:38 오전
      고유주소

      안녕하세요. 우선 칭찬의 말씀 고맙습니다. 또한 향후 포스팅에도 관심을 가져 주셔서 너무나 감사합니다. 하지만 User-ID 설정과 관련한 글은… 음… 현재 업데이트 중인 구글 태그관리자 시리즈가 어느 정도 정리된 이후가 될 것 같습니다.^^

      응답
  • 2020년 7월 29일 6:10 오후
    고유주소

    안녕하세요 선생님, NEW USER 데이터 관련 궁금한 점이 있습니다.

    지난 3년간의 네이버를 통해서 들어온 모든 신규 유저(CPC+ORGANIC)의 비중 추이가 궁금하여 획득 > 소스/매체에서 naver/cpc와 naber/organic 의 3년 간의 session과 new user 수치를 한 번에 추출하였습니다.

    쿠키가 유지 기간이 있다해도.. 오래전의 new user 데이터와 현재 추출한 데이터는 변동이 없지요? GA 기록 되는 시점을 토대로 데이터를 산출하니까요. 과거 데이터를 추출하는 과정에서 주의해야할 점이 있다면 무엇일까요?

    응답
    • 2020년 7월 30일 5:21 오후
      고유주소

      안녕하세요. 이전 데이터라 하더라도 이미 수집된 데이터이기 때문에 차이가 발생하지는 않습니다. 데이터 추출 과정에서 주의해야 할 점은 저도 잘 모르겠네요.

      응답
  • 2020년 7월 29일 6:23 오후
    고유주소

    안녕하세요. 선생님,
    USERS와 SESSION의 의미가 다르니
    신규 방문자 % 를 분석할때 NEW USER / SESSION 으로 계산하면 오류가 있겠네요?
    NEW USER/ NEW USER+USER 로 계산하는게 더 정확하겠지요?

    응답
    • 2020년 7월 30일 5:27 오후
      고유주소

      안녕하세요. 기본적으로는 문의글에서 언급하신 내용이 맞습니다. 사용자와 세션 개념이 다르므로 전사 사용자에서 신규 방문자가 차지하는 비중을 구하는 게 맞겠네요. 근데 예시로 든 NEW USER / NEW USER+USER 수식은 좀 이상한 것 같습니다. NEW USER / USER 로 계산해야 하지 않을까요?

      응답
  • 2021년 1월 20일 5:02 오후
    고유주소

    안녕하세요 🙂 최근 Ga4를 쓰면서 궁금한 점이 있어 문의드립니다 ㅠㅠ
    혹시 ga4에서 유지>개요로 들어가면 재사용자/새사용자가 나오는데
    이 재사용자 안에 새사용자도 포함이 되는걸까요? 매일매일 dau를 구하여 신규설치/재방문자를 발라내어 구해야하는데 재사용자+새사용자 = dau 인건지, 아니면 재사용자=dau이라서 재사용자-새사용자 = 재방문자 이런 수식이 되는건지 궁금합니다 !

    응답
    • 2021년 1월 23일 1:42 오후
      고유주소

      안녕하세요. 선택한 기간에 특정 사용자가 첫 방문 후 재방문까지 하는 경우 새사용자 및 재사용자에 모두 포함됩니다. 총사용자 = 새사용자 + 재사용자 – (새사용자&재사용자) 이렇게 계산해 주어야 중복 카운팅된 사용자 수를 제외시킬 수 있습니다.

      그리고 사용자 수를 일별, 주별, 월별 이런 식으로 각각 계산하여 합산을 하면 기간 선택에 따라 그 합계가 맞지 않습니다. 예를 들어 A 사용자가 일주일 동안 매일 1회 방문했다고 가정하면 GA DAU에서 매일 1명이 추가되어 합산하면 총 7명이 됩니다. 하지만 1주일 기간을 선택하여 사용자 수를 보면 동일한 사용자이기 때문에 사용자 수는 1명이 됩니다. 보고서 생성 시 이 점도 함께 고려하시기 바랍니다.

      응답

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다