고객지원 > 지식/노하우

지식/노하우

지식/노하우

개인화 추천 엔진의 역사

페이지 정보

작성일2019-02-08

본문

 

 

개인화 추천 엔진의 역사
(주)넷스루 전략기획실

우리가 뭔가를 사는 이유는 매우 복잡합니다. 상품을 구매하는 이유는 계절적 요인도 있고 큰 할인율이 원인일 수 있으며, 또는 정말 실용적으로 필요해서 구매했을 수도 있습니다.

이렇게 구매원인에 대한 상황별 단서는 고전적인 비즈니스 인텔리전스나 일반적인 비즈니스 규칙만으로는 포착할 수 없습니다. 이 외에 인간의 행동 패턴도 살펴봐야 합니다. 미국의 아마존은 이런 상황에 적합한 물건을 추천하는 시스템을 만들기 위해 데이터 과학자와 엔지니어를 양성하고 있습니다.
8ef70237a3d7bc702d43287ee44a4670_1549604
 
아마존을 보면 여러 개의 추천 영역이 있으며 각 추천 영역은 각각 다른 KPI를 목표로 잡고 서로 다른 용도로 사용됩니다. 그 중 하나는 "이전에 검색한 것" 또는 "이전에 구입한 것"을 기반으로 방문자가 선호하는 상품을 제공합니다. 아마존은 추천영역의 내용을 잘 설명하기 때문에, 왜 이런 상품을 나에게 추천하는지 정확히 알 수 있습니다.
8ef70237a3d7bc702d43287ee44a4670_1549604
 
추천 역사를 보면 이전에 구입한 상품을 보여주고 다시 구매하게 하는 매우 단순한 비즈니스 규칙을 사용합니다. 다시 말하면, 상품을 추천하기 전에 누군가가 구입한 것을 보고 유사 상품을 추천하기 때문에 어떤 특별한 지능을 요구하지 않습니다.
8ef70237a3d7bc702d43287ee44a4670_1549605
 
놀랍게도 아마존이 이러한 Buy-It-Again 모듈을 구현했을 때 다들 대단하다고 했습니다. 하지만 이 모듈은 어떤 고객이 애완 동물 사료와 다양한 뷰티 상품을 같이 구매하는 것처럼 불규칙성이 있는 상품에 대해서는 효과적일 수 있지만, 패션과 같은 단일 품목의 경우에는 제대로 동작하지 않는 경향이 있습니다. 셔츠를 하나 사면 똑같은 셔츠를 다시 사지 않을 것입니다. 이러한 점이 상품 추천 시스템의 진화를 만들었습니다. 동일한 것을 구매하도록 하거나 비슷한 것을 구매하도록 하려면, 이를 바탕으로 알고리즘을 맞춰 설정해야 합니다.
8ef70237a3d7bc702d43287ee44a4670_1549605
 
교차 판매를 위한 간단한 비즈니스 규칙 알고리즘에는 연관규칙 마이닝(association rule mining)이 있습니다. 이것은 동일한 장바구니에서 구매하는 경향이 있는 상품을 살펴보는 것입니다. 식료품점에는 마진이 높은 우유, 빵, 계란이 있을 수 있기 때문에 교차 판매되는 경우가 많습니다. 누군가는 우유를 사러 식료품 점에 들어가고, 자연스럽게 그 다음에 살 수 있는 것은 빵입니다. 이는 예측 분석을 필요로 하지 않습니다. 실제로 구매패턴을 표시하기 위해서 데이터를 마이닝하는 것입니다.
8ef70237a3d7bc702d43287ee44a4670_1549605
 
협업 필터링으로도 이런 작업을 수행할 수 있습니다. 이런 것들은 시대에 뒤 떨어진 것은 아니지만 비교적 간단한 접근 방법입니다. 이 아이디어는 거래에서 구매자와 비슷한 사람들을 살펴보는 것입니다. 유사성은 여러 가지가 될 수 있기 때문에 그렇게 간단하지 않습니다. 나와 같은 유형은 A라는 사람의 10%이고 어떤 사람의 10%와 다른 사람의 80%일 수 있으며, 그것은 다른 사람들과 선형적으로 결합될 수 있습니다. 나를 위한 각 상품에서 추출되는 점수는 다른 사람들 가중치의 조합입니다.
8ef70237a3d7bc702d43287ee44a4670_1549604
 
협업 필터링은 변수를 통합해서 나와 A가 유사하다는 것을 알 수 있습니다. 아니면 둘 다 같은 도시에 살고, 두 사람이 같은 인구 통계를 가지고 있기 때문에 비슷할 수도 있습니다. 하여튼 변수가 없는 기존 협업 필터링의 단점은 제거되었습니다.

신경망의 개념도 있습니다. 신경망을 사용하면 거래, 상품 정보, 고객 정보를 처리할 수 있으며, 새로운 변수를 만들 필요도 없습니다. 그리고 신경망은 구매하려는 상품의 순위도 파악합니다. 신경망은 수 만개의 노드를 가지고 있지만, 백프로파게이션(back-propagation) 및 모든 새로운 추론 기술의 발전으로 이제는 과거보다 심도있게 신경망을 학습하는 것이 더 쉬워졌습니다.
8ef70237a3d7bc702d43287ee44a4670_1549605
 
특히 딥러닝은 원시 트랜잭션을 처리할 수 있으므로 훨씬 많은 정보를 통합할 수 있습니다. 딥러닝의 가장 일반적인 형태는 다층 피드 포워드 신경망입니다. 이것은 고밀도 레이어라고 하는 여러 레이어를 만들 수 있으며, 변수를 나타내는 각 노드가 다음 계층의 다른 노드에 연결되므로 밀도가 높습니다. 노드는 구매하려는 상품의 유형이거나 고객이 될 수 있습니다.
8ef70237a3d7bc702d43287ee44a4670_1549605
 
개인화 추천 엔진은 배치 프로세스로 데이터 기반의 작업을 합니다. 백엔드에서 모델을 훈련하고, 모델은 과거의 거래 데이터를 보거나, 인구 통계 데이터를 보거나, 상품의 메타 데이터 자체를 볼 수도 있습니다. USB 스틱, TV, 또는 장난감의 차이점 등 이런 모든 정보를 가져와서 관련성이 있다고 생각되는 모든 상품에 대한 고객 ID 목록을 추천 엔진으로 전달합니다. 그리고 상품을 클릭하면 신호를 보내고, 즉시 다음 접점에서 다시 통합하는 실시간 프로세스도 있습니다.

지금까지 개인화 추천 엔진의 전반적인 역사를 살펴보았습니다. 이처럼 개인화 추천 엔진은 고객이 구매하려는 상품에 따라 평범하지 않은 상황을 이해하면서 다른 상황도 고려하도록 발전하고 있습니다.

참고 : Jack Chua 인터뷰 내용
  • 트위터로 보내기
  • 페이스북으로 보내기

모바일 페이지로 이동