GBDT Learning-to-Rank 모델의 실제 동작 원리, 검색 의도 분류, 그리고 전환율 중심 패러다임 전환
전통적 검색 엔진은 TF-IDF 등 고정 수식으로 순위를 매겼습니다. 현대 쇼핑 검색은 다릅니다. 과거 사용자 행동 데이터(클릭, 구매, 체류시간)를 정답 레이블로 삼아, 기계학습 모델이 최적의 순위를 스스로 학습합니다.
Liu, T.-Y. (2009). "Learning to Rank for Information Retrieval." Foundations and Trends in IR, 3(3), 225-331.
네이버는 쇼핑 검색에 GBDT 기반 모델을 도입했습니다. GBDT는 수백 개의 약한 의사결정 트리(decision tree)를 순차적으로 쌓아, 이전 트리가 틀린 부분을 다음 트리가 보정하는 앙상블 기법입니다.
| 특성 | 선형 모델 (기존) | GBDT (현재) |
|---|---|---|
| 피처 간 관계 | 가중합 (피처 A × 0.3 + 피처 B × 0.5) | 비선형 조합 (A가 높고 B가 낮으면 → 다른 경로) |
| "비중"의 의미 | 고정된 가중치 (적합도 35%, 인기도 50%...) | 검색어와 상품 맥락에 따라 동적 변화 |
| 핵심 장점 | 해석이 쉬움 | 적합도가 낮으면 인기도가 아무리 높아도 상위 노출 불가 |
| 업계 사용 | 레거시 시스템 | Airbnb, Expedia, JD.com, 네이버 |
네이버 쇼핑검색 GBDT 모델 발표 — 인터애드 분석 | ACM RecSys 2025: "Industry Insights from Comparing Deep Learning and GBDT Models for E-Commerce LTR"
GBDT 모델에 입력되는 피처(feature)들은 여전히 3축으로 분류됩니다. 다만 각 축 내에 수십 개의 세부 피처가 있고, 이들의 상호작용이 순위를 결정합니다.
"이 상품이 이 검색어에 맞는가?" — 검색 결과 진입의 관문(gate) 역할.
| 피처 | 설명 | GBDT에서의 역할 |
|---|---|---|
| 상품명-쿼리 매칭 | 검색어 토큰이 상품명에 포함되는 정도 | 1차 분기 조건 — 매칭 0이면 트리 진행 자체가 차단됨 |
| 카테고리 매칭 | 검색어 선호 카테고리와 상품 카테고리 일치도 | 매칭 시 적합도 점수 부스트, 불일치 시 패널티 |
| 속성 태그 | 소재, 색상, 사이즈 등 구조화 속성 | 롱테일 쿼리(예: "그레이 울 코트 95")에서 결정적 |
| 브랜드 필드 | "나이키" 검색 시 브랜드 등록 상품 우선 | 네비게이셔널 쿼리에서 강력한 분기 조건 |
| 의미적 유사도 | BERT 등 임베딩 기반 시맨틱 매칭 | "텀블러"와 "보온병"의 의미 연결 — 2025년부터 반영 강화 |
"이 상품이 시장에서 얼마나 검증되었는가?" — 상위 순위 경쟁에서 승부를 가르는 축.
| 피처 | 측정 윈도우 | GBDT 기여도 |
|---|---|---|
| 판매 건수 | 최근 2일 / 7일 / 30일 (가중 합산) | 가장 강력한 인기도 시그널. 최근 2일에 가중치 높음 |
| 클릭수 | 최근 7일 | 중요하지만 2025년부터 "클릭 후 전환"이 더 중요해짐 |
| 전환율 (CVR) | 최근 7일 / 30일 | 2025년 알고리즘 개편의 핵심. 클릭 대비 구매 비율 |
| 리뷰 수·품질 | 누적 (최신 가중) | 포토리뷰가 텍스트 리뷰보다 높은 가중치 |
| 찜(위시리스트) | 누적 | 중간 수준 기여. 구매 의도의 간접 시그널 |
| 최신성 | 등록 후 7~14일 | 신상품 일시 부스트 — 이 기간에 전환율 쌓기가 관건 |
"이 상품/셀러가 규정을 지키고 있는가?" — 감점 방식. 가점은 없고, 위반 시 페널티.
| 페널티 사유 | 감지 방식 | 제재 수준 |
|---|---|---|
| 리뷰 어뷰징 | AI 패턴 분석 (2025~ 정교화) | 상품 삭제 → 스토어 정지 |
| 판매실적 조작 | 구매자 IP/결제패턴 분석 | 상품/몰 단위 페널티 |
| 상품명 SEO 스팸 | 키워드 반복·특수문자 룰 | 적합도 점수 대폭 하락 |
| 상품정보 허위 | 가격/할인율/속성 검증 (2026 강화) | 상품 삭제 |
| 카테고리 오분류 | 카테고리-상품명 불일치 감지 | 적합도 점수 하락 |
정보검색 연구에서 검색 쿼리는 사용자 의도(intent)에 따라 분류됩니다. 이 분류는 Broder(2002)가 제안하고, Jansen et al.(2008)이 실증적으로 검증한 프레임워크입니다.
| 의도 유형 | 비율 | 쇼핑 검색 예시 | 전환율 경향 |
|---|---|---|---|
| 정보 탐색 (Informational) | ~55-70% | "에어프라이어 추천", "텀블러 종류" | 낮음 (0.5~1%) — 아직 구매 결정 전 |
| 상업적 조사 (Commercial) | ~15-20% | "써모스 vs 스탠리 텀블러", "에어프라이어 비교" | 중간 (1~3%) — 비교 쇼핑 단계 |
| 거래 의도 (Transactional) | ~10-15% | "써모스 JNL-504 최저가", "에어프라이어 쿠폰" | 높음 (3~8%) — 구매 직전 |
| 탐색 (Navigational) | ~5-10% | "쿠팡 에어프라이어", "다이슨 공식" | 가변적 — 특정 브랜드/사이트 목적 |
Broder, A. (2002). "A taxonomy of web search." ACM SIGIR Forum, 36(2). | Jansen, B.J. et al. (2008). "Determining the informational, navigational, and transactional intent of Web queries." Information Processing & Management, 44(3), 1251-1266. [PDF]
네이버 쇼핑 검색의 가장 큰 구조적 변화입니다. 왜 이 변화가 일어났는가를 이해하면, 앞으로의 방향도 예측할 수 있습니다.
네이버의 AI 개인화 추천 시스템 AiTEMS는 "이 사용자가 이 상품을 클릭한 뒤 구매할 확률"을 예측합니다. 전환율이 높은 상품은 더 많이 추천되고, 더 많이 추천되면 더 많이 팔리는 양의 피드백 루프(positive feedback loop)가 형성됩니다.
위의 메커니즘을 이해하면, 신규 셀러의 진입 전략이 자연스럽게 도출됩니다.
| 단계 | 목표 | 근거 | 행동 |
|---|---|---|---|
| 1단계 적합도 확보 |
GBDT 트리에서 "탈락하지 않기" |
적합도가 낮으면 인기도 노드에 도달 불가 (트리 구조의 게이트 효과) | 정확한 카테고리 + 키워드 포함 상품명 + 구조화 속성 100% 입력 |
| 2단계 거래 의도 키워드 공략 |
전환율 높은 쿼리에서 시작 |
거래 의도 키워드의 CVR이 정보 탐색 대비 3~8배 (Jansen et al., 2008) | 롱테일 거래 의도 키워드 → 상품명·속성에 반영 |
| 3단계 전환율 최적화 |
AiTEMS 선순환 진입 |
전환율 → 추천 → 판매 → 인기도의 양의 피드백 루프 | 상세페이지 품질 + 적정 가격 + 빠른 배송 → CVR 극대화 |
| 4단계 신상품 골든타임 활용 |
최신성 부스트 기간 내 실적 축적 |
등록 후 7~14일 일시적 순위 상승. 이 기간의 전환 데이터가 이후 순위를 결정 | 등록 즉시 집중 홍보 + 지인 첫 구매 + 리뷰 확보 |