기본(default) 설정에 의한 GA 데이터 처리
<디폴트 설정에 따른 GA 데이터 처리>
구글 애널리틱스는 추적코드를 통해 수집된 데이터를 사전에 정의된 규칙에 따라 처리하여 데이터베이스에 저장한 후 이를 다양한 보고서를 통해 제공합니다.
<구글 애널리틱스 데이터 처리 순서>
GA에서 데이터를 처리하는 과정입니다. 먼저, 애널리틱스에서 신규 사용자와 재사용자를 구분합니다. 그런 다음 히트를 세션(사용자가 사이트에 참여한 시간)으로 분류합니다. 마지막으로, 추적 코드의 데이터를 다른 데이터 소스와 결합합니다.
사용자 분류 (신규 방문자 및 재방문자)
<GA 사용자 분류 – 신규 방문자>
첫 번째 단계에서 구글 애널리틱스는 신규 방문자와 재방문자를 구분합니다. 추적코드가 삽입된 페이지를 사용자가 방문하면 GA는 사용자의 브라우저에 쿠키를 심게 되며, 이 쿠키에는 임의의 고유 ID가 부여됩니다. 애널리틱스에서는 각각의 고유 ID를 고유 사용자로 간주합니다.
<GA 사용자 분류 – 재방문자>
사용자가 웹사이트를 방문했을 때 쿠키가 존재하지 않으면 ‘신규 방문자(New Visitor)’로 집계하고 이를 히트와 함께 전송합니다. 애널리틱스에서 기존의 ID를 감지하면 히트와 함께 ‘재방문자(Returning Visitor)’ 값으로 전송합니다.
세션 정의
구글 애널리틱스에서는 웹사이트에서의 사용자 참여 수준을 파악하기 위해 히트의 생성 시간에 기초해 사용자 히트를 분류하며, 이러한 시간을 측정할 때 ‘세션수’라는 측정항목을 사용합니다.
<세션 분류하기 – 새로운 세션>
<세션 분류하기 – 기존 세션 유지>
웹사이트에서 사용자가 GA 추적코드가 있는 페이지로 이동할 때 세션이 시작되고 ‘페이지뷰’ 히트가 생성됩니다. 이 히트는 다른 히트가 기록되지 않으면 30분 후에 종료됩니다. 세션이 종료한 후에 사용자가 페이지를 새로 조회하게 되면 새 세션이 시작됩니다.
기본 설정에서는 비활동 시간이 30분을 넘으면 세션의 제한시간이 초과되지만, 사이트에서의 사용자 행동을 반영하여 구성에서 이 설정을 변경할 수 있습니다.
GA에서 세션을 기준으로 데이터를 구성하면 보고서에 표시되는 다양한 측정항목(예: 세션수, 세션당 페이지 수, 평균 세션 시간, 이탈률)을 계산할 수 있습니다.
구글 애널리틱스 데이터와 다른 소스 연결
그 다음 처리 과정에서 구글 애널리틱스는 추적코드를 통해 수집한 데이터를 지정된 다른 소스와 연결합니다. 측정 프로토콜을 이용하고 다른 구글 계정에 연결하여 외부 시스템의 데이터를 추가하는 두 가지 방법이 있습니다.
<GA와 외부 데이터 소스와의 연결>
측정 프로토콜 (Measurement Protocol)
측정 프로토콜을 이용하면 POS(Point of Sale)단말기, 웹 연결 키오스크와 같은 웹 연결 기기의 데이터를 구글 애널리틱스로 전송할 수 있습니다. 자동으로 히트를 전송하는 추적코드와는 달리 구글 이외의 시스템으로부터 데이터를 수집하려면 URL 문자열을 통해 히트를 직접 전송해야 합니다.
측정 프로토콜은 맞춤 추적 ID를 이용해 히트를 구성하는 방법과 이들 히트를 지정된 GA 계정으로 전송하는 방법을 정의합니다.
다른 구글 계정
구글 애널리틱스에서는 애드워즈, 애드센스, 구글 서치콘솔(Google Search Console) 등 다른 마케팅 도구의 데이터도 연결할 수 있습니다. 이렇게 하면 애드워즈 클릭수, 노출수, 비용 데이터를 애널리틱스 계정에서 조회할 수 있습니다.
지금까지 데이터 처리 순서에 따라 구글 애널리틱스가 사용자를 구분하고, 세션을 구분하고, 기타 데이터를 결합하는 방법에 대해 간략하게 알아보았습니다. 하지만, 사용자와 세션은 지난 포스팅에서 다룬 히트와 더불어 GA에서 가장 기본적인 측정항목(metrics)이자, 정확한 이해가 필요한 중요한 개념입니다. 좀 더 자세한 내용은 아래 포스팅 참조 바랍니다.
참조: http://analyticsmarketing.co.kr/digital-analytics/google-analytics/1626/
사용자 설정(Configuration)에 의한 데이터 처리
<사용자 설정에 의한 GA 데이터 처리>
GA에서는 내재적으로 적용되는 처리 규칙 이외에도 위와 같이 사용자가 데이터의 처리 방식을 결정하는 데이터 구성 규칙을 설정할 수 있습니다.
<GA 데이터 처리 – 사용자 설정 유형>
데이터 필터, 목표, 데이터 분류, 맞춤 측정기준, 맞춤 측정항목, 데이터 가져오기 등 사용자가 정의한 기능을 구현하여 보고서에서 데이터를 더욱 세밀하게 정의하고 분석할 수 있습니다.
데이터 필터 적용
<GA 데이터 필터>
구글 애널리틱스 보기(View)에서 특정 데이터를 제외하거나, 특정 데이터만 포함하거나, 처리 중인 데이터를 수정하는 필터를 설정할 수 있습니다. 이를 통해 비즈니스 니즈와 관련이 있는 데이터를 보고서에서 확인할 수 있습니다. 기본적으로 필터란 GA에서 처리 중인 데이터에 적용하는 ‘규칙’을 말합니다. ‘필터 유형’과 일치하면 GA에서 해당 필터가 데이터에 적용되고, 필터 유형과 일치하지 않으면 필터가 적용되지 않습니다.
고객 데이터에 대한 보기에서 내부 직원 트래픽을 제외시키는 필터는 실무에서 꼭 적용해야 하는 가장 일반적인 필터에 해당하며, 모바일, PC 등 접속 ‘기기 카테고리’ 조건을 통해 각 기기별 데이터만을 모아서 분석할 수도 있습니다.
이밖에도 다양한 조건을 토대로 필터를 구현할 수 있으며, 어떤 필터를 구현할지는 웹사이트별 구체적인 측정 목표에 따라 달라집니다. 따라서 필터를 설정하기 전에 어떤 데이터를 수집할지를 계획하는 것이 중요합니다.(실무적으로 많이 사용되는 필터에 대해서는 나중에 자세히 살펴보겠습니다.)
참조: 계정구조의 이해와 필터의 적용
목표 설정
목표 또한 사용자가 데이터 처리 과정에 관여하는 대표적인 구성 설정에 해당합니다. 구글 애널리틱스에는 4개 유형의 목표가 있습니다.
<구글 애널리틱스 목표 유형>
- 도착(Destination): 웹사이트에서 사용자가 특정 페이지를 조회하는 것이 목적인 경우
- 이벤트(Event): 이벤트로 정의된 특정 행동이 실행되는 것이 목적인 경우
- 시간(Duration): 세션이 일정 시간 이어지는 것이 목적인 경우
- 세션당 페이지수(Pages per session): 사용자가 한 세션에서 일정 수 이상의 페이지를 조회하는 것이 목적인 경우
데이터를 처리하는 과정에서 애널리틱스가 목표 데이터를 감지하면 목표 달성 횟수(Goal Completions), 목표값(Goal Value/지정한 경우), 목표 전환율(Goal Conversion Rate)을 계산하며, 이들 통계가 보고서에 포함됩니다.
참조: 목표 전환 설정하기
채널 및 콘텐츠 분류
수집한 데이터를 표준 GA 보고서가 아닌 다른 방식으로 구성하고 싶은 경우가 있습니다. 채널 그룹을 이용하면 데이터를 맞춤 채널로 분류할 수 있으며, 콘텐츠 그룹을 이용하면 웹사이트의 구성에 따라 보고서에서 측정항목을 통합할 수 있습니다.
1) 채널 그룹 설정 (Channel Grouping)
<채널 그룹 설정 (Channel Grouping)>
구글 애널리틱스는 특정 마케팅 채널이나 트래픽 소스 혹은 이들 그룹의 성과를 빠르고 쉽게 파악할 수 있도록, 트래픽의 소스와 매체에 기반한 내부 규칙에 따라 채널을 분류합니다. 이를 기본 채널 그룹(Default Channel Grouping)이라 하며 직접(Direct), 추천(Referral), 자연검색(Organic Search), 유료검색(Paid Search), 디스플레이(Display), 소셜(Social), 이메일(Email), 제휴(Affiliates), 기타 광고(Other Advertising) 총 9개로 구성됩니다. 채널 그룹 설정을 통해 채널의 분류 방식을 변경함으로써 좀 더 맞춤화 된 분석을 할 수도 있습니다.
2) 콘텐츠 그룹 설정 (Content Grouping)
<콘텐츠 그룹 설정 (Content Grouping)>
콘텐츠 그룹은 동일하거나 유사한 주제에 기반한 웹페이지 콘텐츠 집합을 말합니다. 콘텐츠 그룹핑을 사용하면 개별 웹사이트의 고유한 구성을 반영하여 콘텐츠를 논리적인 구조로 그룹화한 후 개별 URL, 페이지 제목 또는 화면 이름별로 세부적으로 조회할 수 있을 뿐만 아니라, 그룹 이름별로 통합된 측정항목을 조회하고 비교할 수 있습니다.
맞춤 측정기준 및 측정항목
구글 애널리틱스에서는 ‘맞춤 측정기준(custom dimensions)’, ‘맞춤 측정항목(custom metrics)’ 기능 설정을 통해 측정기준과 측정항목을 직접 생성할 수도 있습니다.
구글 애널리틱스의 모든 보고서는 측정기준 및 측정항목으로 구성되어 있습니다. 측정기준은 데이터의 속성을 나타내며, 사용자의 연령이나 성별, 지역, 유입 채널, 방문페이지 등에 이에 해당합니다. 측정항목은 정량적 측정 요소를 말하며, 사용자 세션, 이탈률, 평균 세션 시간, 수익, 목표/전자상거래 전환율 등의 항목에 이에 해당합니다.
GA에서는 수백 개에 달하는 측정기준과 측정항목 데이터를 기본적으로 수집합니다. 하지만 기업의 웹사이트 운영 목적이나 그 유형에 따라 분석에 필요한 데이터가 워낙 다양하기에 기본적으로 제공되는 측정기준과 측정항목 이외에 추가적인 데이터가 필요할 수도 있습니다.
맞춤 측정기준이나 맞춤 측정항목을 이용하면 분석에 도움이 되는 추가적인 데이터 수집이 가능합니다. 예를 들어 사용자가 방문한 콘텐츠 카테고리나 저작자 이름(예: 미디어 사이트) 혹은 고객의 등급(예: 전자상거래 쇼핑몰) 데이터를 맞춤 측정기준으로 지정한 후 이를 보고서 전체에 걸쳐 적용할 수 있습니다. 맞춤 측정기준은 맞춤 보고서에서 기본 측정기준으로 제공됩니다. 또한 표준 보고서에서 세그먼트 및 두 번째 측정기준 사용할 수 있습니다.
데이터 가져오기
<데이터 가져오기 (Imported data)>
자체 데이터를 구글 애널리틱스에 업로드할 수 있습니다. 이러한 자체 데이터에는 히트 데이터, 맞춤 측정기준이나 맞춤 측정항목에 저장된 확장 데이터(extended data), 그리고 업로드된 측정항목을 요약할 수 있는 요약 데이터 등이 있습니다. 일반적으로 이 정보는 오프라인 비즈니스 도구(예: 콘텐츠관리 시스템, 고객관계관리 시스템)에서 텍스트 파일로 내보냅니다.
데이터 가져오기를 이용하면 GA가 웹사이트에서 수집한 히트 데이터와 오프라인 데이터를 결합할 수 있습니다. 이와 같이 개별적으로 수집한 자체 비즈니스 데이터를 포함시키면 보고서에서 더욱 풍부하고 통찰력 있는 정보를 얻을 수 있습니다.
지금까지 구글 애널리틱스가 수집된 데이터를 처리하는 과정에서 필터의 적용, 목표 설정, 채널/콘텐츠 그룹핑, 맞춤 측정기준/측정항목 생성 등의 방법으로 구성 설정(Configuration)을 적용하는 방법을 알아보았습니다. 간략하게 설명을 했습니다만, 각각의 설정 항목들은 GA를 제대로 활용하는 데 있어 중요한 기능들로 추후 자세하게 다룰 예정입니다.
마지막으로 설정과 관련하여 주의할 점은 1) 데이터 처리가 완료된 후에는 해당 데이터의 구성 설정을 소급해서 적용할 수 없으며, 2) 같은 맥락에서 설정한 이후부터 해당 보기에 적용된다는 것입니다. 따라서 설정을 구현할 때는 해당 설정의 목적이나 그 결과를 충분히 이해하고 신중하게 판단한 후 적용해야 합니다.
—————————————————————————
국내 대표적인 온라인마케팅 커뮤니티/매체인 아이보스에서 구글 애널리틱스 4(GA4) 강의를 진행하고 있습니다. 커리큘럼 등 자세한 사항은 아래 링크를 참조하세요.
GA4 실무과정: https://www.ibossedu.co.kr/edu-goods-380
GA4 구축 문의하기(오컴데이터)
GA4 기업교육 문의하기(오컴데이터)
세션 설명부분에서 30분 후에 자동으로 종료되고 종료 된 후에 사용자가 페이지를 새로 조회하게 되면 새 세션이 부여된다고 설명되어있습니다.
Q1. 그렇다면, 30분 전에 다른 페이지로 이동하게 될 경우 히트가 생성되고 세션은 어떻게 되는건가요? 이 경우에도 새 세션이 시작되는건가요?
Q2. 세션 이미지를 봤을 때, 하나의 세션에서 홈 – 상품 – 장바구니 – 구매 등 여러가지의 과정이 거쳐지는데 30분 이상 활동하게 될 경우 어떻게 사용자에 대한 분석을 진행하나요?
블로그 글 이해하기 쉽게 적어주셔서 항상 재밌게 보고 있습니다 😀
안녕하세요. 질문 1, 2번이 같은 맥락으로 볼 수 있는데요, 페이지 조회(또는 설정된 이벤트 행위)에 의한 히트가 생성될 때마나 30분의 세션 시간이 새롭게 시작된다고 이해하시면 됩니다. 다시 말해 방문 시점부터 30분 간격이 아닌 마지막 히트가 발행한 후 30분 이상의 비활동 기간이 있었느냐가 세션을 구분하는 기준이 됩니다. 딱딱한 글 재밌게 봐주셔서 감사합니다.^^
시스템내에서 서비스 사용자명수를 확인할수 있는데, 확인한 사용자수보다 해당페이지 구글 순페이지뷰수 수치가 더 작습니다. 논리적으로 말이 안되는데 어떤 이유가 있을 수 있을까요?
안녕하세요. 문의 내용상의 설명만 갖고는 판단하기가 어렵네요. 데이터가 정상적으로 수집되었다면 말씀하신대로 사용자수가 순페이지뷰수보다 많아야 하고, 따라서 GA 데이더 수집에 누락이 발생했다 정도로 추정해 볼 수 있을 것 같습니다만, 데이터 정합성 문제와 관련해서는 워낙 다양한 요인의 영향을 받기 때문에 대략적으로라도 이유를 짐작하기가 어렵습니다.
안녕하세요 유용한 정보 잘 보고 갑니다. GA가 PC에서 팝업창을 잡아내지 못하고, 모바일 신규방문의 경우 기기와 OS에 따라 쿠키가 매번 재설정되는 경우가 있을 수 있어 모바일웹페이지의 방문이 정확하지 않다는 주장이 있는데요, 혹시 관련해서 알고계시는 것이 있을까요? 추적쿠키는 페이지 헤더에 심어둔 상황입니다.
안녕하세요. 팝업창 유형에 따라 달라질 수는 있겠으나, 대체로 팝업창내 추적코드를 추가할 수 있고 따라서 GA에서 데이터 수집이 가능합니다. iOS 운영체제의 경우 광고 서비스에서 많이 사용하는 3사 쿠키가 자동으로 삭제되도록 하고 있으나, GA에서 사용되는 1사 쿠키는 특별한 제한이 없는 걸로 알고 있습니다.
하이브리드 앱 iOS 유입의 경우는 말씀하신대로 매 세션마다 쿠키가 재설정되는 것으로 보입니다만, 이 부분은 확인을 해 본 후 추가적으로 의견을 남기도록 하겠습니다.