쿠키, 고객 ID & 사용자 ID

 

 

 

 

쿠키 (Cookie)

 

쿠키(참조: 네이버 지식백과)는 사용자가 웹사이트를 방문할 때 웹 브라우저를 통해 전송되어 사용자의 컴퓨터 하드디스크에 저장되는 작은 텍스트 파일을 말하며 주요 역할은 다음과 같습니다.

  • 사용자 인증 정보를 기억함으로써 웹사이트 내 특정 페이지에 접속할 때마다 로그인을 새로 해야 하는 수고를 덜어줌
  • 쇼핑정보, 관심사, 지역 등 사용자에 관한 다양한 정보를 저장함
  • 사용자에게 개인화 된 광고를 보여주거나 리마케팅 등을 통해 보다 효과적인 광고 운영이 가능하도록 함
  • 구글 애널리틱스와 같은 웹분석 데이터 수집 혹은 정보 추적 용도에 사용됨
  • 브라우저 단위로 생성. 크롬, IE와 같이 서로 다른 브라우저는 상호간에 생성된 쿠키를 볼 수 없음
  • 웹사이트 단위로 생성. 웹사이트 A(예: 네이버)는 웹사이트 B(예: 구글)에서 생성한 쿠키에 접근할 수 없음
  • HTTP 쿠키, 웹 쿠키, 인터넷 쿠키 또는 브라우저 쿠키라고도 함

 

 

쿠키의 유형

 

쿠키는 크게 1사 쿠키와 3사 쿠키 두 가지 유형으로 구분할 수 있습니다.

  • 1사 쿠키: 사용자가 방문한 웹사이트에 의해 생성된 쿠키로서 이 1사 쿠키를 발급한 웹사이트만 이들 쿠키를 읽을 수 있음
  • 3사 쿠키: 사용자가 방문한 웹사이트가 아닌 제3의 웹사이트에 의해 생성된 쿠키

 

또한 모든 쿠키(1사 및 3사 쿠키 포함)는 만료 날짜 존재 여부에 따라 임시 쿠키와 지속 쿠키로 구분됩니다.

  • 임시 쿠키(temporary cookie): 만료 날짜가 정해지지 않은 쿠키로서 사용자가 웹 세션을 종료하거나 브라우저 창을 닫으면 삭제됨
  • 지속 쿠키(persistent cookie): 만료 날짜가 정해져 있는 쿠키로서 한 번 생성되면 인위적으로 삭제하기 전에는 만료일까지 컴퓨터에 남아 있음

 

 

구글 애널리틱스 쿠키 (_ga)

 

구글 애널리틱스는 고유한 사용자를 식별하고 이들 사용자의 세션과 캠페인 정보를 저장하는 데 쿠키를 사용합니다.

현재 우리가 주로 사용하는 유니버설 애널리틱스(Universal Analytics)는 ‘_ga’라는 단일 쿠키를 사용합니다. 사용자가 웹사이트를 방문하면 구글 애널리틱스 추적코드(GATC, Google Analytics Tracking Code)가 실행되며 ‘_ga’ 쿠키가 존재하는지를 먼저 파악합니다. 기존 쿠키가 존재하면 이 쿠키를 갱신하여 사용하며, 존재하지 않는다면 새로운 쿠키를 생성합니다.

‘_ga’ 쿠키는 사용자가 방문한 웹사이트에 의해 생성되는 1사 쿠키이자, 세션이 종료되더라도 유지되는 지속 쿠키(persistent cookie)에 해당합니다. 이 쿠키는 아래와 같이 네 개의 숫자 세트로 구성되며 ‘고객ID(client ID)’라는 사용자 개개인을 구분하는 데 사용되는 매우 중요한 정보를 담고 있습니다.

 

 

구글 애널리틱스 쿠키의 구성요소

 

‘_ga’ 쿠키는 각각의 의미를 갖는 네 개의 문자/숫자 세트로 구성됩니다.

 

 

1. 첫 번째 세트 GA1은 사용되고 있는 쿠키 포맷의 버전을 나타내며 현재는 GA1로 고정됨. 향후 쿠키 포맷이 변경되면 이와 함께 달라질 수도 있음

2. 두 번째 세트는 점(dot)으로 구분되는 도메인 구성요소의 수를 의미함 (예: example.com = 2, example.co.kr = 3, sub.example.co.kr = 4)

3. 세 번째 세트는 무작위로 생성된 숫자 세트로 고유의 사용자를 식별하는 데 사용됨

4. 네 번째 세트는 사용자가 웹사이트에 처음 방문한 때의 타임스탬프(timestamp)를 나타냄

 

세 번째 및 네 번째 필드값이 합쳐서 고객 ID를 구성합니다.

 

 

 

쿠키와 고객 ID(client ID)

 

구글 애널리틱스는 고객 ID를 통해 여러 GA 세션에 걸쳐서 고유의 사용자를 식별합니다.

사용자 웹사이트를 처음 방문하면 GA 쿠키가 생성되며 여기에는 고객 ID가 저장됩니다. 이후 사용자가 웹사이트에 방문해서 보인 행동으로부터 수집되는 모든 히트(페이지뷰, 이벤트 및 거래) 정보에는 고객ID가 포함되며, 구글 애널리틱스는 이 고객ID를 토대로 웹사이트를 방문한 사용자의 히스토리를 통합해서 보여주게 됩니다.

구글 애널리틱스는 사용자가 실제로 누군인지를 알 필요는 없기 때문에 웹분석 목적으로 이처럼 쿠키를 통해 사용자들을 상호 구분합니다. 같은 맥락에서 GA는 개인 식별 정보(personally identifiable information)를 쿠키에 저장하지 않습니다.

GA쿠키(client ID)는 쿠키가 생성된 기기 및 브라우저에서만 존재합니다. 사용자가 한 컴퓨터 내에서 서로 다른 두 개의 브라우저를 사용한다면 서로 다른 두 개의 고객 ID가 생성됩니다. GA쿠키는 또한 기기간 상호 공유되지 않습니다. 따라서 서로 다른 기기에서는 서로 다른 쿠키가 생성되고 서로 다른 사용자로 인식됩니다.

이러한 이유로 GA는 기본 값으로 다양한 기기와 브라우저를 사용해서 방문하는 고유의 사용자를 식별할 수 없습니다. 하지만 회원 로그인 등 개별 사용자를 식별할 수 있는 정보가 있다면 사용자 ID 설정(참조: 구글 도움말)을 통해 하나의 사용자로 인식(교차 기기 추적, cross device tracking)할 수 있습니다.

 

고객 ID는 지난 번 포스팅(히트, 세션, 사용자 이해하기)에서도 설명했듯이 GA의 사용자 지표에 해당합니다.

 

고객 ID는 또한 구글 애널리틱스의 표준보고서인 “잠재고객” > “사용자 탐색기” 항목에서도 확인 가능합니다. 사용자 탐색기 보고서(참조: 구글 도움말)를 활용하면 전체 사용자 행동이 아닌 개별 사용자 행동을 분리하여 분석할 수 있습니다.

 

 

쿠키와 사용자 ID(User ID)

 

사용자 ID는 다양한 웹 브라우저와 기기를 통해 방문하는 고유의 사용자를 식별하는 데 사용되는 고유의 ID를 말합니다.

구글 애널리틱스가 직접 생성, 운영하는 고객 ID와 달리, 사용자 ID는 웹사이트의 사용자 인증 시스템을 통해 생성하고 사용자가 로그인할 때 별로의 설정을 통해 구글 애널리틱스에 전송되는 방식으로 운영됩니다.

구글의 서비스 약관에 따르면 사용자 ID는 사용자의 이름, 이메일 주소와 같은 개인 식별 정보를 포함해서는 안됩니다.

 

 

기타 쿠키에 관한 정보

쿠키는 얼마 동안 유지되는가?

GA 쿠키는 기본 값으로 2년 동안 유지됩니다. 사용자가 웹사이트에 방문할 때마다 마지막 방문일로부터 2년 기간으로 만료 시점이 연장됩니다.

 

쿠키와 캠페인 유지기간?

GA 쿠키는 캠페인 정보(참조: 구글 도움말) 또한 저장하고 있습니다. 사용자의 유입 캠페인은 직접 유입을 제외한 새로운 유입채널을 이용할 때마나 변경됩니다. 그리고 마지막으로 갱신된 캠페인은 새로운 캠페인으로 유입되기 전까지 6개월 동안 유지됩니다.

 

쿠키를 삭제한다면?

쿠키 사용의 단점 중 하나는 사용자가 언제든 쿠키를 삭제할 수 있다는 점입니다. 사용자가 웹사이트에 방문하면 해당 트래픽 정보는 고객ID와 함께 구글 애널리틱스로 전송됩니다. 이 사용자가 쿠키를 삭제한 후 다시 방문하게되면 새로운 고객ID가 발급되어 전송되며, 따라서 구글 애널리틱스는 이 사용자를 신규 사용자로 인식하게 됩니다.

 

크롬 로그인 및 동기화

크롬에서 사용자 프로필을 생성하여 로그인하면 서로 다른 기기에서 북마크 등을 공유할 수 있는 한편 하나의 기기 내에서 다수의 사용자를 만들어 사용하는 것도 가능합니다. 하지만 이들 사용자간 쿠키는 전송/공유되지 않습니다.

 

서브도메인과 교차도메인 이슈

쿠키는 사이트 단위로 생성됩니다. 구글 애널리틱스는 서브도메인(예: “example.com”과 “sub.example.com”)간 자동으로 작동되도록 고안되었습니다. 따라서 한 사용자가 이들 두 사이트를 번갈아가며 방문했을 때도 동일한 쿠키가 유지됩니다.

교차도메인(예: “example.com”과 “exampleblog.com”)은 서브도메인과는 아주 다릅니다. 이 두 사이트는 비즈니스 관점에서는 연관되어 있을지 모르나 웹사이트 관점에서는 전혀 다른 사이트로 간주됩니다. 따라서 쿠키가 상호 공유되지 않습니다.

쿠키와 고객ID를 정확하게 이해하면 서브도메인 및 교차도메인 추적 과정에서 부딫치는 문제들을 해결하는 데도 큰 도움이 될 수 있습니다.

 

 

참조글:

www.lunametrics.com/blog/2017/08/17/how-google-analytics-cookies-identify-users/

www.optimizesmart.com/google-analytics-cookies-ultimate-guide/

 

 

—————————————————————————

국내 대표적인 온라인마케팅 커뮤니티/매체인 아이보스에서 구글 애널리틱스 4(GA4) 강의를 진행하고 있습니다. 커리큘럼 등 자세한 사항은 아래 링크를 참조하세요.

GA4 실무과정: https://www.ibossedu.co.kr/edu-goods-380

 

GA4 구축 문의하기(오컴데이터)
GA4 기업교육  문의하기(오컴데이터)

 

 

* 표시가 있는 항목은 필수 입력란입니다.

 

 

[Google Analytics] 쿠키와 사용자(고객ID) 이해하기

[Google Analytics] 쿠키와 사용자(고객ID) 이해하기”에 대한 11개의 생각

  • 2017년 10월 23일 7:07 오후
    고유주소

    저는 사용자 입장이 아니라 분석 당하는 입장에서 공부를 하고 있어요. 굉장히 개인적인 이유로 예전 친구를 검색했다가 얼마 후 갑자기 연락이 오는 바람에 관심을 가지게 된 경우인데요
    특정 사이트나 블로그가 아니라 포털의 카페 게시물 같은 것에도 개인 회원이 추적코드를 넣을 수 있는지 궁금합니다. 그런 경우 헛점을 이용하는 거고 cid 를 특정하기 힘들다고는 다른 블로그 글에수 읽었는데 만약 기존 cis값을 가지고 있다면 어떤 특정 유저를 추적하려면 가능할 수도 있는건가요?

    응답
    • 2017년 10월 25일 11:06 오전
      고유주소

      안녕하세요. 웹상에서 개인 정보를 수집할 수 있는 기술적 방법이나 헛점에 대해서는 저는 잘 모릅니다.^^ 다만 GA 추적코드의 경우 네이버나 다음의 블로그, 카페에는 심을 수가 없습니다.(이들 사이트에서는 GA 코드와 같은 자바스크립트가 작동하지 않습니다. 물론 티스토리, 워드프레스 등 설치형 블로그에는 심을 수가 있습니다.) 또한 GA 설치가 가능한 사이트라 하더라도 관리자편집 기능이나 FTP를 통한 소스코드 접근 권한이 없다면 즉 관리자가 아니라 단순한 회원이라면 GA를 설치하기 어렵습니다.

      응답
      • 2018년 2월 13일 6:42 오후
        고유주소

        고객 id는 1사쿠키이기 때문에 다른 어떤사이트를 방문 했는지는 알수가 없는게 맞죠?
        혹시 id별로 다른 어떤 사이트들을 이동했었는지 추적 가능한 방법이 있는지 알수있을까요?

        응답
        • 2018년 2월 14일 4:23 오후
          고유주소

          안녕하세요. 1사 쿠키는 이를 발급한 웹사이트만 읽을 수 있습니다. 각 아이디별로 방문한 이력이 있는 다양한 사이트 이동경로를 파악하는 방법이 있는지는 잘 모르겠네요.

          응답
  • 2018년 9월 28일 10:54 오전
    고유주소

    안녕하세요. 교차 도메인 관련해서 궁금한 부분이 있어 이렇게 글을 남깁니다.
    일단 저희 상황은 다음과 같습니다.

    1. main.com 사이트가 있고 회원가입 페이지는 potal.amain.com으로 되어 있습니다.
    2. main.com 사이트는 프로토콜이 http이고 potal.amain.com 사이트는 프로토콜이 https입니다.
    3. 현재 ga 스크립트는 글로벌(gtag) 버전 스크립트를 사용중입니다.

    위와 같은 상황인데 유입경로 별 회원가입완료수를 트래킹하기 위해서 아래와 같이 각 페이지에 교차도메인 설정을 했습니다.

    교차 도메인 분석을 위한 ga 스크립트

    window.dataLayer = window.dataLayer || [];
    function gtag(){dataLayer.push(arguments);}
    gtag(‘js’, new Date());

    gtag(‘config’, ‘UA-xxxxxxxx-y’, {
    ‘linker’: {
    ‘accept_incoming’: true,
    ‘domains’: [‘main.com’, ‘portal.amain.com’]
    }
    });

    그리고 추천 제외 목록에 위의 도메인을 모두 등록해 두었는데요.
    실제 확인 결과 회원가입을 하면 레퍼러값으로 “main.com”이 수집되면서 리포트에서는 direct로 수집되는데요.

    뭐가 문제인지를 모르겠네요….
    의심이 가는건 두 사이트의 프로토콜이 서로 달라서 그런게 아닌가 추측만 하고 있는 상태입니다.

    혹시 가능하시다면 확인 부탁드립니다.

    응답
    • 2018년 10월 2일 1:57 오후
      고유주소

      안녕하세요. 설명을 자세히 해주셨으나 저도 그 이유를 잘 모르겠네요. 우선 회원가입 사이트가 서브도메인이 아닌 아예 다른 도메인의 사이트가 맞나요? 그리고 교차 도메인 분석 스크립트 적용시 각각 다른 추적코드(아이디)에 상호 도메인을 연결(linker)한 게 맞는지요? (참조: https://developers.google.com/analytics/devguides/collection/gtagjs/cross-domain / 물론 이 페이지를 보면서 세팅 하셨을 걸로 생각됩니다만..)

      그리고 리퍼러 정보가 없는 경우에 유입경로가 direct로 분류되는데, 레퍼러값으로 “main.com”이 수집된다는 것도 잘 이해가 안가네요. 암튼 전반적으로 사이트를 직접 보고 테스트를 해봐야 좀 더 정확하게 판단할 수 있을 듯합니다.

      응답
  • 핑백:[페이스북] 픽셀 업데이트 안내 e메일 받으셨나요? | 최규문의 소셜코칭

  • 2019년 6월 14일 2:45 오후
    고유주소

    안녕하세요

    본 포스팅이 제가 궁금해하는 랜딩url의 utm 설정과 관련이 있는 듯하여 문의드려요.

    utm을 설정한 url로 랜딩페이지를 이동한 뒤에, 다른 페이지로 이동을 하면서 utm 들이 유실되던데요.

    제 생각에 이 utm 정보들이 GA 쿠키에 반영되기 때문에, 페이지 이동 간 utm이 유실되더라도, 어떤 소스/매체로 유입된 이용자가 어떤 웹사이트 내 활동을 발생시키는지 추적할 수 있는 걸까요?

    기술적인 확인이 필요하여 문의드리며,
    괜찮으시다면 메일주소로 안내주시면 감사하겠습니다.

    응답
    • 2019년 6월 17일 9:39 오후
      고유주소

      안녕하세요. utm 파라미터는 유입채널을 파악하기 위함이며, 웹사이트 도착 시 한 번 데이터를 수집하는 것으로 충분합니다. 데이터를 수집해서 저장하는 것은 맞지만 캠페인 정보가 쿠키에 반영된다기 보다는 웹사이트 도착 페이지에서 추적코드가 실행될 때 해당 캠페인 정보를 GA서버로 바로 전송한다고 이해하시면 좋을 듯합니다.

      응답
  • 2020년 6월 24일 2:56 오후
    고유주소

    안녕하세요 본 사이트 통해 많은 도움을 받으며 공부하고 있습니다.
    포스팅 하신 거 쭉 다 봤는데 다시 처음으로 돌아와 공부하고 있네요. ㅠㅠ (넘 어렵..)

    헷갈리는 부분이 있는데요.
    user-id를 통해 멀티 디바이스로 유입된 고객을 여러 명이 아닌 한명(동일인)으로 본다는 건
    저희 사이트에 로그인 여부로 측정된다는 의미인가요?

    맞다면,
    user-id로 본다는 건 쿠키(고객 id)로 본다는 게 아니고
    로그인 하지 않은 고객의 정보는 수집되지 않는다는건가요?

    응답
    • 2020년 6월 26일 1:31 오전
      고유주소

      안녕하세요. USER-ID는 말씀하신대로 로그인 여부로 측정합니다. 사용자가 로그인할 때 사용자 정보(USER-ID)를 수집합니다. 사용자가 다양한 브라우저 또는 기기를 통해서 방문하더라도 동일한 USER-ID로 로그인하기 때문에 이 정보를 수집하면 동일 사용자의 교차 기기, 교차 브라우저 유입 현황을 파악할 수 있습니다.

      USER-ID를 수집한다고 해서 로그인 하지 않은 사용자의 정보(고객ID)를 수집하지 않는 것은 아닙니다. 물론 유저ID 설정을 할 때는 별도의 유저ID 보기를 생성하게 됩니다. 이 별도의 유저ID 보기에는 로그인을 해서 유저ID가 확인된 사용자 데이터만 수집이 되며, 로그인하지 않은 사용자 정보는 포함되지 않습니다.

      하지만 원래 사용하던 메인 보기에는 여전히 로그인한 사용자와 로그인하지 않은 사용자가 데이터가 모두 수집되며, USER-ID가 확인된 사용자를 포함하여 모든 사용자를 고객ID(=쿠키ID)로 식별합니다. 이러한 이유로 메인 보기에서도 USER-ID를 기준으로 사용자를 식별할 수 있도록 하기 위해, 통상적으로 USER-ID 수집 시 동일한 정보를 맞춤 측정기준(custom dimension)으로 함께 수집하여 사용합니다.

      응답

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다