고객지원 > 지식/노하우

지식/노하우

지식/노하우

구글 빅쿼리의 원시 데이터 가치

페이지 정보

작성일2020-08-13

본문


 

구글 빅쿼리의 원시 데이터 가치

 
(주)넷스루 전략기획실


Google Analytics 360을 이용하면 웹 로그 데이터를 BigQuery로 내보낼 수 있고, BigQuery는 외부 데이터와 마케팅 분석 데이터를 연결하는 링크가 될 수 있습니다. Google Analytics 360과 BigQuery의 통합은 원시 데이터를 쿼리하고 , 다른 데이터 소스와 연결 , 시각화를 위한 데이터 내보내기의 세 가지를 기본 목적으로 사용됩니다. 여기에서는 원시 데이터를 쿼리함으로써 얻는 가치에 대해서 이야기하려고 합니다.
원시 데이터 쿼리
BigQuery는 구글 클라우드에서 호스팅되는 데이터베이스입니다. Google Analytics 360에 가입하면 SQL 데이터베이스처럼 쿼리 할 수 ​​있도록 분석 데이터가 히트 단위로 BigQuery로 내보내집니다. 이에 반해 Google Analytics 보고서에서 표시되는 데이터는 세션 기반으로 집계 됩니다. 예를 들어 Google Analytics에서는 휴대 기기에서 발생한 세션수를 쉽게 계산할 수 있습니다. 그러나 세션에서 특정 사용자의 비디오 재생 이벤트 수를 계산하려면 Google Analytics로는 대답하기 힘들 것입니다. 왜 Google Analytics로는 힘든지, 그리고 BigQuery에서는 왜 가능한지 설명해 보려고 합니다.
850fa0dd6e41ea420bd44e591abb92b3_1597306
1. 샘플링이 아닌 전수 데이터 분석
Google Analytics의 제약사항 중 하나는 '샘플링'으로 연산이 복잡하거나 사용자 정의된 보고서 또는 긴 기간을 실행하려고 할 때 샘플링 방식으로 계산됩니다. 이 경우 Google은 일부 데이터 포인트만 계산하고 나머지는 모델링하여 표시되는 데이터를 추정합니다. 그래서 보고서의 데이터는 경우에 따라 근사치 일뿐입니다.
850fa0dd6e41ea420bd44e591abb92b3_1597306
무료 버전에서 Google 애널리틱스 360으로 전환하면 샘플링이 개선됩니다. Google Analytics 무료 버전에서는 속성 수준에서 50만 개가 넘는 세션이 있는 경우에 샘플링이 발생합니다. 반면에 Google Analytics 360은 보기 수준에서 1억 세션까지는 샘플링이 발생하지 않습니다. BigQuery를 사용하면 샘플링을 피할 수 있습니다. BigQuery에서는 모든 원시 데이터를 가지고 있으므로 어떤 방식으로든 쿼리하고 나누어 볼 수 있으며 100% 실제 데이터를 보유할 수 있습니다.

 

 

2. 세션 대신 사용자 중심의 분석
Google Analytics에서 목표 유입 경로 분석은 세션 기반입니다. 즉, 사용자가 목표를 완료하기 위해 여러 번 방문하는 경우 Google Analytics의 목표 유입 경로에서 이전 세션의 행동은 볼 수 없습니다.
850fa0dd6e41ea420bd44e591abb92b3_1597306
이 경우 전자상거래 중심의 분석에는 큰 영향을 미칩니다. Google Analytics에서 향상된 전자상거래 보고서를 사용하는 경우 해당 보고서는 세션 기반입니다. 그러나 실제 시나리오에서 사람들이 한 번의 방문(세션)에서 장바구니에 항목을 추가하고 바로 구매하는 경우는 많지 않습니다. BigQuery를 사용하면 두 개 이상의 세션을 사용하는 사용자의 구매 행동을 볼 수 있습니다.
물론 Google Analytics에서는 사용자 세그먼트를 사용해 볼 수도 있습니다. 하지만 사용자 기반 세그먼트는 최대 90일까지로 제한됩니다. 만약 기간이 90일 이상으로 설정된 상태이면 사용자 기반 세그먼트를 만들 때 기간이 자동으로 시작일부터 90일로 재설정됩니다. 반면에 BigQuery의 데이터는 사라지지 않습니다. 복잡한 세분화 규칙을 만들거나 원하는 만큼 시간을 거슬러 올라가거나 특정 동작이 다른 동작에 필요한 동적 세그먼트를 만들 수도 있습니다.
3. 차원을 결합하여 분석
Google Analytics의 데이터 모델은 나란히 볼 수있는 측정 기준의 수에는 제한이 있습니다. '소스/매체' 보고서처럼 세션 기반 측정기준을 사용자 또는 페이지 레벨의 측정 기준 및 측정 항목과 결합 될 때 제대로 작동하지 않도록 구성되어 있습니다.
850fa0dd6e41ea420bd44e591abb92b3_1597306
일반적으로 2개의 측정 기준으로 제한되어 있고, 맞춤 보고서에서 5개, API로는 7개의 측정 기준을 허용합니다. 예를 들면, 소셜 미디어에서 제품 페이지를 본 다음 동일한 제품을 전자상거래 사이트에서 구매한 사용자 수 통계를 가져 오는 데 어려움을 겪을 수 있습니다. 하지만 BigQuery에는 이러한 제한이 없고, 단일 쿼리로 처리할 수 ​​있습니다.
4. 과거 데이터로 목표 설정과 재분석
Google Analytics는 목표 및 필터와 같이 데이터 구성을 적용하면, 그 이후의 날짜 부터 변경된 데이터를 저장합니다. 즉 과거의 데이터에는 적용할 수 없습니다. 그러나 BigQuery를 사용하면 본질적으로 데이터 구성을 다시 적용해 볼 수 있습니다. 과거에 목표 설정 오류를 범했거나 과거 데이터(페이지 경로, 이벤트, 전체 세션)를 필터링하고 수정하려는 경우, BigQuery에서는 이러한 문제를 처리하도록 쿼리를 동적으로 조정할 수 있습니다.
850fa0dd6e41ea420bd44e591abb92b3_1597306
사후에 사이트에서 주요 작업에 대한 목표를 설정하기로 결정했거나 과거의 목표 설정에서 실수를 발견하더라도 과거 데이터를 기반으로 새로운 목표 달성을 계산하는 쿼리를 작성할 수 있습니다. 또한 여려 세션에 걸쳐 확장 할 수있는 복잡한 유입 경로를 목표로 추가 할 수 있습니다.
5. 데이터 사이언스 기반의 예측 통찰력
BigQuery의 원시 데이터를 R 또는 Python과 같은 다른 프로그래밍 언어를 사용하여 요즘 핫하게 이야기하는 데이터 사이언스를 수행 할 수 있습니다. 예를 들어, 통계 모델을 사용하여 다음 달의 구매량을 예측하고, 새로운 이메일 마케팅으로 발생할 수있는 리드수를 추정하거나, 광고 지출에 대한 예상 수익을 살펴 보는 등의 예측을 할 수 있습니다.
850fa0dd6e41ea420bd44e591abb92b3_1597306
또한 머신 러닝 알고리즘을 사용하여 BigQuery에서 데이터를 살펴보고 새로운 것을 발견하거나 이미 알고있는 것을 검증 할 수 있습니다. 팀에 데이터 과학자가있는 경우 BigQuery를 활용하면 이러한 흥미로운 데이터 과학 기술을 수행해 볼 수 있습니다.
넷스루는 Google Analytics 360의 판매와 구축, 그리고 BigQuery 연동으로 데이터 과학 기반의 예측 인사이트 도출까지 웹분석과 컨설팅 서비스를 제공합니다.
 
  • 트위터로 보내기
  • 페이스북으로 보내기

모바일 페이지로 이동