Close
Type at least 1 character to search
Back to top

5개의 사례로 확인한 GA4와 GA UA(GA3)의 데이터 수 차이

스튜디오엠엑스는 다양한 클라이언트의 광고 매체 데이터와 GA4 데이터를 결합하여 데이터를 해석한다.

그래서 GA4가 본격적으로 쓰이기 시작한 뒤로 GA UA(Universal Analytics, GA3) 와의 데이터 차이에 대해 많은 궁금증이 있었고

같은 구글 애널리틱스 프로덕트이니 둘이 비슷한 데이터 결과가 나올지 아니면 이전의 데이터를 참고하기 어려울 정도일지 확인할 필요가 있었다.

 

이번에 시간을 내서 5개 클라이언트의 자료를 비교했고 결론을 잠정적으로 낼 수 있었다.

결론은 아래와 같다.

 

  1. 사용자와 세션 데이터는 GA UA(GA3)와 GA4 가 1% 정도 차이만 발생한다. 
  2. 고객의 주요 행동을 측정하기 위해 GA UA(GA3)의 ‘목표 완료수(Goal Completion)’와 GA4의 ‘이벤트수’를 비교하긴 매우 어렵다. 업종에 따라 다른데 GA4가 훨씬 많이 잡는다. 

 

위 결론들에 대한 구체적 내용을 데이터와 함께 설명하겠다.

 


 

들어가며, GA4 는 과도기에 있고 부족하거나 다양한 오류들이 많다. 

다들 GA4 로의 변화에서 기대감을 갖고 있지만 우리(스튜디오엠엑스)는 혼란과 두려움으로 GA4를 마주하고 있다.

GA4는 과도기에서 혼란을 겪고 있고 이유를 알 수 없는 에러들이 많다.

 

 

1. 제일 처음 접했던 에러는 보고서 대시보드가 작동하지 않는 에러였다. 

 

보고서를 생성할 때 보고서에서 사용할 기준과 항목들을 가져오는 절차가 있다.

여기서 선택하고 불러오기를 눌러도 아무리 해도 불러와지지 않는 것이다.

그런데 예전에 다른 곳 작업했을 때는 분명히 됐다.

다른 사람이 작업하는 것도 분명히 됐는데 이상하게 그 컴퓨터로 내가 작업하니 안되는 것이다.

똑같은 컴퓨터를 가지고 A가 하면 되는데 바로 다음에 내가 하면 안되니 미칠 노릇이었다.

 

구글애널리틱스에 상황과 OS 정보, 크롬 확장프로그램, 네트워크 환경 들을 모조리 캡쳐해서 보내고 작업하는 방식을 영상 녹화해서 보냈다.

 

그랬더니 자기들도 모르겠어서 상위 부서로 이관한다 하더라.

 

그러고 수일 뒤 돌아온 답변이 항목들 가져올 때 체크박스 네모칸 안을 안 집고 텍스트를 클릭하거나 한 경우 체크는 되는데

불러와지지 않는 에러였다는 것이다.

체크박스 안의 네모를 누르지 않고 옆의 공간이나 텍스트를 클릭해도 체크는 되었으니 당연히 불러와질 것으로 생각되었고

그렇기 때문에 체크박스를 누르는 습관이 있는 A가 작업하면 되고
아무거나 마우스 빨리 도착하는데로 클릭하는 내가 작업하면 안되는 것이었다.

 

지금은 이 문제가 개발팀에게 전달되어 해결되었다.

 

 

 

2. 그 다음 접한 에러는 API 와 대시보드 상의 스펙 차이 문제다. 

 

앱 분석환경의 구축과 앱 마케팅 등의 활용에 아주 유용하게 쓰이는 파이어베이스의 데이터를 구글애널리틱스의 GA4 에서 연동하여 확인 가능함에 따라

GA4는 세션에 대해 집중하기 보다는 사용자와 사용자가 한 행동(이벤트)에 집중하기 시작했다.

소개팅 앱에서 한 페이지에서 이성을 고르는 화면에 있다거나 채팅을 한다고 한시간 동안 한 페이지에 가만히 있는 사람을

GA UA(GA3) 기준에서는 이탈 했다고 잘못 판단할 것이다.

 

GA4는 앱 환경 분석에 포커스가 맞춰지며 세션시간이나 이탈에 대해 집중하지 않기로 했다.

 

그 중 지금 논할 것은 세션시간에 대한 것인데 GA4의 API 스펙엔 ‘averageSessionDuration’ 이라는 세션시간 항목이 존재한다.

그런데 GA4 대시보드엔 해당 항목이 없으며, 유사한 개념이 ‘Average engagement time per session(세션당 평균 참여 시간)’이다.

 

averageSessionDuration은 세션당 평균 참여 시간과는 전혀 다른 개념이고

averageSessionDuration을 GA UA(GA3) 의 데이터와 비교한다면 averageSessionDuration 의 값이 2배 가까이 나오며

데이터의 신뢰도와 사용 가능성에 대해 큰 문제가 생겼다.

 

세션시간을 기준으로 데이터를 분석하는 템플릿을 만들고 있던 나로서는 대혼란이었다.

 

 

 

3. 그리고 가장 큰 에러는 현시점에서 판단한 과거의 데이터가 어제 다르고 오늘 다른 문제다. 

 

 

 

 

 

 

 

 

 

 

 

댓글달기