고객지원 > 지식/노하우

지식/노하우

지식/노하우

방문자의 브라우저와 운영체제 패턴분석 방법

페이지 정보

작성일2016-10-31

본문


방문자의 브라우저와 운영체제 패턴분석 방법

 

​넷스루  연구 1팀

   

웹분석 보고서를 살펴보면 웹사이트에 접속한 방문자의 브라우저와 운영체제 정보를 제공하는 보고서가 있습니다. 이것은 웹스트리밍 데이터, 즉 로그파일에 담긴 에이전트(User-Agent) 문자열을 이용해서 운영체제와 브라우저 정보를 찾아내 분석을 합니다.


방문자가 브라우저를 이용해서 웹 페이지(또는 모바일 페이지)를 보게되면, 이때 브라우저는 방문자의 여러 정보를 담아서 서버(웹 서버나 모바일 서버)로 보내고 페이지를 요청하게 됩니다.

 

브라우저가 서버로 보내는 HTTP 헤더(HTTP request header) 정보에는 아래와 같은 에이전트(User-Agent) 문자열이 포함되어 있습니다. 이 정보를 이용하여 운영체제 및 브라우저 정보 등 여러가지 정보를 식별할 수 있게 됩니다. 


 HTTP request header sample  ​

GET / HTTP/1.1

Accept: text/html, application/xhtml+xml, image/jxr, */*

Accept-Language: ko, ja; q=0.5

User-Agent: Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko

Accept-Encoding: gzip, deflate

Proxy-Connection: Keep-Alive

Host: www.nethru.co.kr

HTTP요청을 받은 서버에서는 방문자 에이전트 정보 뿐만 아니라 클라이언트 IP, 시간, 요청된 파일 등과 함께 아래와 같은 형식으로 정보가 남게 되고 이것을 웹서버 로그파일이라고 부릅니다.

 

 Web server log file sample​ 

1.1.1.1 [01/Jun/2016:00:00:00 +0900] "GET http://www.nethru.co.kr/ HTTP/1.1" "-" 200 0 "Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; Touch; rv:11.0) like Gecko" ""

에이전트 정보에는 요청을 하는 주체에 대한 설명을 담고 있습니다. 예를 들면 웹브라우저, 로봇, 스파이더 같은 것이 있습니다. 위의 정보로는 방문자의 웹브라우저 종류와 버전 등을 알 수 있지만 최근에는 에이전트 종류가 너무나도 많아지고, 호환을 비슷하게 표시하는 경우가 많아져서, 제대로 된 분석이 쉽지 않습니다.


넷스루의 웹분석 도구, 디지털 분석도구인 WiseLog와 DataStory는 위의 웹서버 로그파일에서 Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko 에이전트 정보를 분석하여 방문자의 운영체제와 브라우저 정보를 보고서로 제공합니다.


 DataStory 운영체제 보고서 화면 

e37be05ff3dae033231dbee6ecc6c7b5_1477965


 DataStory 브라우저 보고서 화면 

e37be05ff3dae033231dbee6ecc6c7b5_1477965

위의 운영체제와 브라우저 보고서는 다음과 같이 에이전트 사전을 통해 에이전트의 문자열 정보가 이해하기 쉬운 표현 정보로 매핑 되어 보고서가 만들어집니다. 이 에이전트 사전은 새로운 브라우저나 OS가 꾸준히 등장하고 있기 때문에 계속 조사하며 업데이트 되어야 하는 정보입니다.

 

 에이전트 문자열

브라우저 정보

 Trident/7.0

Internet Explorer 11.0

 Trident/6.0

Internet Explorer 10.0

 Trident/5.0

Internet Explorer 9.0

 

 에이전트 문자열

OS 정보

 Windows NT 6.3

Windows 8.1

 Windows NT 6.2

Windows 8

 Windows NT 6.1

Windows 7

 

에이전트 정보 문자열에서 모바일 관련 정보로 4가지 값을 추출하고, 데스크탑은 3가지 값을 추출하게 됩니다. 모바일 관련 정보에는 데스크탑 관련 정보에 디바이스 정보가 추가로 들어갑니다.


• 모바일 : os(운영체제), device(단말기명), browser(브라우저), browserver(브라우저버전)

• 데스크탑 : os(운영체제), browser(브라우저), browserver(브라우저버전)


모바일 디바이스의 경우 하나의 디바이스 마다 1개 이상의 패턴이 사용되고 있습니다. 예를 들면, Galaxy Note 7의 경우 6개의 패턴이 사용되고, Galaxy S7 Edge의 경우 16개의 패턴이 사용되고 있습니다. 이것은 이동통신사 마다 로그를 남기는 패턴이 다르고, 디바이스의 세부 스펙에 따라 패턴이 바뀌기 때문입니다. 


Galaxy Note 2의 경우 30개의 패턴이 사용되고 있기 때문에, 로그파일에는 다양한 30개의 패턴중에 하나가 기록되어 있습니다. Galaxy Note 2에서 접속한 에이전트 로그 문자열은 다음과 같습니다.


Mozilla/5.0 (Linux; U; Android 4.4.2; ko-kr; GT-N7100 Build/KOT49H) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30)

 

 에이전트 문자열

브라우저 정보

 GT-N7100, GT-N7102, GT-N7105, GT-N7105T,  GT-N7108 등​

Galaxy Note2

 SM-N930S, SM-N930K, SM-N930L 등

Galaxy Note7

 SC-02H, SCV33, SM-G935S 등

Galaxy S7 Edge


 DataStory 모바일 단말기 보고서 화면​ 

e37be05ff3dae033231dbee6ecc6c7b5_1477965

이 외에도 별도의 스크립트 태깅을 추가하면 브라우저와 운영체제, 디바이스 정보 뿐만 아니라 방문자가 사용한 단말기의 해상도 정보도 함께 분석할 수 있습니다.

 

 DataStory 모바일 단말기 보고서 화면 모바일 단말기 보고서 화면

e37be05ff3dae033231dbee6ecc6c7b5_1477965

방문자의 에이전트 정보 분석에 정확도를 높이기 위해서 넷스루의 연구1팀은 수많은 에이전트 정보를 조사하고 정제하여 관리하고 있으며, 고객이 보고서를 이해하는데 어려움이 없도록 주기적으로 에이전트 정보 업데이트를 진행하고 있습니다.​

34105d05eeb817a50c26d4edcc32a642_1436174 

 

 

  • 트위터로 보내기
  • 페이스북으로 보내기

모바일 페이지로 이동