안녕하세요, 무신사 타겟팅ML팀의 방효석, 조준형입니다. 저희 팀은 다양한 AI/ML 기술을 활용해 무신사의 모든 상품과 비즈니스 접점에서 개인화된 고객 경험을 제공하는 것을 목표로 하고 있습니다. 지난 1분기 동안 디스플레이 지면의 CTR(Click on-trhough Fee; 클릭률)을 더욱 개선하기 위해, 무신사 및 6개 전문관 스토어 홈 지면의 개인화된 배너 노출 로직을 개발하는 프로젝트를 진행했습니다. 이번 글에서는 프로젝트를 수행하며 마주했던 여러 가지 문제들을 어떻게 해결했는지, 그리고 그 과정에서 얻은 인사이트들을 함께 공유하고자 합니다.
무신사를 이용하는 고객들의 취향과 니즈는 과거보다 훨씬 다양해졌으며, 노출 가능한 콘텐츠 수도 꾸준히 늘고 있습니다. 하지만 이러한 복잡한 상황과 세분화된 니즈를 충분히 반영하지 못한 채 일괄적으로 노출되는 배너는 고객 경험을 저해할 수 있다는 문제 제기가 있었습니다. 이에 분명한 개선의 여지가 있다고 판단했고, ‘디스플레이 최적화’라는 이름으로 각 스토어 홈 상단 빅배너의 노출 방식을 개인화하여 CTR을 극대화하는 프로젝트를 진행하게 되었습니다.
스토어 홈 빅배너는 무신사 앱과 웹을 열었을 때 가장 먼저 마주치는 화면 맨 위 배너입니다. 웹사이트의 ‘간판’ 같은 존재라 무신사가 전하고 싶은 브랜드 감성과 콘텐츠를 첫눈에 보여 주죠. 슬라이드 형식으로 총 35장이 돌아가며 노출되고, 앱에서는 한 번에 1장, 웹에서는 3장이 함께 보입니다.
무신사에 접속한 고객 가운데 약 97 %는 메인 화면에 도착하자마자 홈 배너를 가장 먼저 만납니다. 이 배너는 무신사 스토어뿐 아니라 뷰티·플레이어 등 6개 전문관 홈에도 같은 자리에 노출되며, 무신사 서비스의 첫인상을 책임지고 있습니다.
무신사에는 여러 전시 지면이 있지만, 홈 배너를 먼저 최적화하기로 한 이유는 분명합니다. 홈 배너는 고객이 무신사에 접속해 가장 먼저 마주치는 ‘서비스의 얼굴’로, 하루 수십만 명에게 노출되기 때문입니다. 또한 메인 화면에 위치한 여러 디스플레이 영역 중에서도 홈 배너는 특히 고객의 관심도가 높습니다. 실제로 전체 클릭 수의 약 35%, 클릭이 발생한 세션의 약 37%가 홈 배너에서 발생하고 있습니다. 이러한 지표를 근거로, 전환 효과가 가장 큰 홈 배너부터 개선을 시작하기로 결정했습니다.
기존에도 홈 배너의 노출 순서는 모델 기반으로 최적화되고 있었지만, 완전한 수준의 초개인화 추천 시스템은 아니었습니다. 과거에는 MAB(Multi-Armed Bandit) 알고리즘을 활용해 배너 추천을 진행해 왔습니다.
MAB 알고리즘은 제한된 시도 안에서 여러 선택지(배너) 중 가장 높은 보상(클릭률)을 얻기 위해, ‘탐험(Exploration)’과 ‘활용(Exploitation)’ 사이의 균형을 조절하는 전략입니다. 여기서 ‘탐험’은 새로운 배너의 가능성을 시험하는 과정이고, ‘활용’은 성과가 입증된 배너에 집중하는 것을 의미합니다. MAB는 이 두 과정을 조율하며, 시간이 지남에 따라 성과가 좋은 배너를 더 자주 노출하는 방식으로 학습합니다.
하지만 이 방식에는 세 가지 뚜렷한 한계가 있었습니다.
- 단일 지표 의존 → 클릭률 하나만 바라보니 고객 취향, 선호, 배너 자체의 특성 같은 다층적 요인이 반영되지 않았습니다.
- 연관성 미반영 → MAB가 각 배너를 서로 독립적으로 간주해, 사용자가 예전에 관심을 보인 배너와의 유사성을 고려하지 못했습니다.
- 콜드 스타트(Chilly Begin) 문제→ 새 배너가 투입되면 클릭 데이터가 쌓일 때까지 성능이 저조했습니다. 결국 고객 경험이 크게 좌우되는 홈 배너 영역에서 클릭률만으로는 섬세한 니즈를 채우기 어렵고, 빠르게 변하는 환경에도 기민하게 대응하기 힘들었습니다.
이러한 문제들을 해결하고 사용자에게 더 정교한 개인화 추천을 제공하기 위해서는 기존과 다른 새로운 접근 방식이 필요했습니다. 다음 장에서는 이러한 고민을 바탕으로 새롭게 설계한 추천 시스템의 전체 파이프라인 구조에 대해 자세히 소개드리겠습니다.
무신사 홈 배너 추천 시스템은 여러 단계로 이루어진 정교한 파이프라인을 통해 각 사용자에게 가장 알맞은 배너를 실시간으로 보여 줍니다. 그림 2는 이러한 배너 추천 시스템의 전체적인 구조를 설명하고 있습니다. 각 주요 단계 별 구체적인 내용은 아래와 같습니다.
1. 추천할 배너를 더 잘 이해하기
“GIGO(Rubbish In, Rubbish Out)”라는 말처럼, 좋은 모델을 학습하기 위해서는 양질의 표현(Illustration)을 추출하는 것이 매우 중요합니다. 기존에도 배너 타이틀, 연관 카테고리, 브랜드, 라벨 등 다양한 메타 데이터가 DB에 저장되어 있으나, 이 정보들은 운영 목적에 따라 적재된 데이터이기 때문에, 추천 모델 관점에서 일관된 기준을 유지하기 어렵다는 한계가 있었습니다.
이러한 문제를 극복하기 위해, 저희는 사용자 행동 로그를 활용한 표현(Illustration) 학습 방식으로 접근했습니다. 일정 기간 동안 수집된 유저의 배너 및 상품 클릭 이력을 기반으로 이종 그래프(Heterogeneous Graph)를 구성하고, 이를 GraphSAGE 알고리즘에 적용했습니다. 이 과정을 통해 사용자 탐색 패턴을 반영한 배너 및 상품 임베딩(Embedding)을 생성할 수 있었으며, 이렇게 추출된 임베딩은 모든 노출 가능 배너 후보군에 대해 계산되어 이후 모델 학습의 입력 피처(Enter Function)로 활용됩니다.
2. 클릭 확률을 계산하기 위한 모델 학습하기
배너 추천 시스템의 핵심은 “각 사용자에게 적합한 배너를 찾아주는 것”입니다. 저희는 이 문제를 많은 추천 시스템에서 채택하는 방식처럼 CTR(Click on-Via Fee) 예측 문제로 정의했고, 이를 해결하기 위해 DeepFM과 Two-Tower 모델을 활용했습니다.
앞선 단계에서 HGNN을 통해 학습된 고품질의 배너, 상품, 사용자 임베딩과, 피처 스토어(Function retailer)에 저장된 다양한 피처들을 조합해 두 모델을 각각 학습합니다. DeepFM은 다양한 피처 간의 복잡한 상호작용을 효과적으로 포착하며, Two-Tower는 사용자와 배너 임베딩을 따로 계산해 유사도로 클릭 확률을 추정합니다. 이렇게 학습된 모델은 실시간·배치 추론 모두에서 재사용돼 각 유저에게 가장 알맞은 배너를 빠르게 찾아 줍니다.
3. 학습된 모델 기반으로 배너 스코어링
다음으로, 현재 노출 가능한 모든 배너에 대해 학습된 모델을 활용하여 사용자별 점수를 추론하는 배치 파이프라인을 구성했습니다. 이 파이프라인을 통해 개인별 모든 배너에 대한 스코어를 계산하고 저장합니다.
무신사 홈 배너 추천은 이 결과를 두 가지 방식으로 활용합니다. ① 행동 데이터가 풍부한 헤비 유저에게는 점수를 그대로 반영한 개인화 추천을 적용합니다. ② 클릭·뷰 기록이 적은 콜드 유저에게는 세그먼트 기반 추천을 사용해, 비슷한 특성을 지닌 그룹에서 성과가 좋은 배너를 보여 줍니다.
이러한 전략을 통해, 데이터가 충분한 사용자에게는 정교한 맞춤형 추천을 제공하고, 그렇지 않은 경우에도 적절한 수준의 추천 경험을 보장합니다.
4. 비즈니스 정책과 스코어링 기반으로 배너 순서 정하기
사용자별로 예측된 CTR을 기반으로 배너를 정렬한 뒤, 비즈니스 정책을 반영해 최종 노출 순서를 재정렬합니다. 예를 들어, 전사 캠페인 배너를 우선 노출하거나, 특정 사용자 그룹에 가중치를 부여하는 방식이 적용됩니다.
또한 스트리밍 데이터 기반의 온라인 피처 스토어를 활용해, 배치 결과에 포함되지 못한 신규 배너나 긴급 변경 사항에도 실시간으로 대응할 수 있습니다. 이 단계에서는 단순한 클릭률 최적화를 넘어, 운영 이슈, 회사의 전략적 목표, 프로모션 방향성까지 통합적으로 고려합니다.
아울러 자체 구축한 A/B 테스트 API를 통해, 트래픽이나 사용자 기반으로 온라인 실험을 수행하며, 필요 시 특정 사용자 그룹을 대상으로 한 정밀 타겟팅 실험과 서빙도 가능합니다.
5. 최종 추천할 배너 보여주기
최종적으로 선정된 High-N 개의 빅배너가 사용자에게 노출됩니다. 사용자는 이 과정을 통해 개인화된 배너를 시각적으로 확인할 수 있으며, 원하는 정보를 클릭해 빠르게 얻을 수 있습니다.
이처럼 무신사의 빅배너 추천 시스템은 사용자의 선호도와 행동 패턴은 물론, 비즈니스 목표까지 함께 고려하여 정교하게 운영되고 있습니다. 이러한 과정을 통해 사용자 만족도를 높이고, 서비스 효율성 또한 극대화하고 있습니다.
앞서 소개한 추천 시스템 구조에서 살펴보았듯, 무신사 홈 배너 추천 시스템은 여러 단계를 거쳐 사용자에게 최적의 배너를 제공합니다. 이 과정에서 핵심적인 역할을 하는 것은 바로 사용자의 클릭 행동을 예측하고, 사용자에게 노출될 배너의 순서를 결정하는 추천 모델입니다. 저희는 이 중요한 기능을 수행할 모델로, 업계에서 널리 검증된 DeepFM 모델과 Two-Tower 모델을 선택했습니다. 또한 무신사 홈 배너의 서비스 환경과 데이터 특성을 반영하여 두 모델을 최적화함으로써, 더욱 정교한 추천이 가능하도록 개선했습니다.
이제부터 두 모델의 구조와 주요 특징, 그리고 전체 추천 파이프라인 내에서 어떻게 활용되고 있는지에 대해 자세히 설명드리겠습니다.
1. DeepFM
DeepFM은 추천 시스템에서 널리 사용되는 하이브리드 모델로, Factorization Machine(FM)과 Deep Neural Community(DNN)을 결합하여 사용자와 아이템 간의 복잡한 상호작용을 효과적으로 학습합니다. FM 레이어는 희소한 특징들 간의 2차 상호작용을 모델링하는 데 특화되어 있으며, DNN 레이어는 고차원적인 비선형 특징 상호작용을 학습하는 데 사용됩니다. 두 레이어를 병렬로 결합함으로써 다양한 범위의 특징 상호작용을 포착하고, 예측 성능을 향상시킬 수 있습니다. 모델의 출력은 시그모이드 함수를 통해 배너 클릭 확률로 변환되며, 이 확률을 기준으로 배너를 정렬한 뒤, 비즈니스 정책을 반영해 최종 노출 순서를 결정합니다.
DeepFM 모델은 여러 가지 장점을 가지고 있습니다.
- FM 레이어를 통해 2차 특징 상호작용을 명시적으로 학습하고, DNN 레이어를 통해 고차원의 암묵적인 특징 상호작용을 동시에 학습함으로써 보다 정교한 추천이 가능합니다.
- DeepFM은 희소한 데이터에 대해 강한 성능을 보입니다. FM 레이어는 희소한 특징 간의 조합을 효과적으로 다루며, DNN 레이어는 임베딩을 통해 이러한 특징들을 효율적으로 표현할 수 있습니다.
- DeepFM은 Finish-to-Finish 방식으로 학습이 가능하기 때문에, FM과 DNN 레이어를 동시에 학습시켜 모델의 전체 성능을 일관되게 최적화할 수 있습니다. 이러한 특성 덕분에 DeepFM은 예측 성능이 뛰어난 모델로 평가받고 있습니다.
무신사의 홈 배너 추천 시스템에서는 DeepFM 모델을 통해 각 배너의 클릭률(CTR)을 예측하고, 이 값을 바탕으로 사용자에게 노출할 배너를 정렬합니다. 모델의 입력 피처는 크게 세 가지로 구성됩니다.
- 사용자 관련 정보로, 예를 들어 사용자가 선호하는 브랜드 등의 속성 정보를 포함합니다.
- 배너 관련 정보로, 배너의 타입, 연결된 브랜드나 카테고리 등의 정보를 담고 있습니다.
- HGNN(Heterogeneous Graph Neural Community)을 통해 사전에 학습된 사용자 및 배너의 임베딩 정보가 사용됩니다. 이 임베딩은 각각 64차원 벡터로 표현되며, 모델에서는 이를 하나의 밀집 특징(Dense Function)로 처리합니다. 다시 말해, 64개의 값을 각각의 독립적인 피처로 나누기보다는, 하나의 의미 단위로 묶어 학습에 활용합니다.
이러한 설계에는 몇 가지 이유가 있습니다. 첫째, 임베딩 벡터를 개별 피처로 분리하게 되면 전체 피처 공간이 과도하게 커져 학습 속도 저하와 메모리 사용 증가 등의 문제가 발생할 수 있습니다. 둘째, DNN 레이어에서 임베딩 벡터를 하나의 블록으로 처리하면 학습이 보다 안정적으로 진행되고 수렴 속도도 빨라지는 경향이 있습니다. 셋째, 모델을 지속적으로 업데이트하는 환경에서 임베딩을 하나의 피처 단위로 관리하면, 피처 중요도나 가중치 업데이트를 더 일관되고 체계적으로 수행할 수 있습니다.
2. Two-Tower
Two-Tower 모델은 사용자(Person)와 아이템(Merchandise)의 정보를 각각 독립적인 신경망(DNN, 일명 타워)을 통해 처리한 뒤, 이로부터 생성된 임베딩 벡터 간의 유사도를 기반으로 추천 점수를 예측하는 구조로, 대규모 추천 시스템에서 널리 활용되는 아키텍처입니다. 각 타워는 해당 엔티티(Entity)의 고유한 특징을 학습하여 고차원 임베딩 공간에서 효과적으로 표현하는 역할을 하며, 이를 통해 사용자와 아이템 간의 내재된 선호 관계를 포착할 수 있습니다.
Two-Tower의 가장 큰 매력은 ‘확장성’입니다.
- 분리 학습 — 사용자 타워와 배너 타워를 독립적으로 학습하므로, 수억 건 규모 데이터에도 가볍게 스케일링 대응할 수 있습니다.
- 낮은 지연 — 두 임베딩을 미리 계산해 두면, 온라인 서비스처럼 호출이 잦은 환경에서도 밀리초 단위 응답이 가능합니다.
- 구조의 유연성 — 각 타워를 자유롭게 설계할 수 있어 이미지·텍스트·카테고리 등 다양한 피처를 손쉽게 통합할 수 있습니다.
- 병렬 처리 — 타워가 분리돼 있어 병렬 학습이 가능하고, 전체 학습 시간이 크게 줄어듭니다.
각 타워는 다음과 같은 정보를 입력으로 받아 학습을 진행합니다.
- 사용자 타워 ― 사용자 ID, 인구통계, 과거 클릭 기록 등
- 배너 타워 ― 배너 ID, 카테고리, 텍스트·이미지 메타데이터 등
- 각 타워는 입력을 압축해 고차원 임베딩 벡터 생성
이어서 두 임베딩의 유사도를 계산해 선호 점수를 얻고, 이 점수를 기준으로 배너를 정렬해 사용자에게 가장 연관성 높은 순서로 보여 줍니다.
이러한 구조로 구성된 Two-Tower 모델은 사용자와 배너 각각의 고유한 특성을 임베딩 벡터로 효과적으로 표현하고, 이 두 벡터 간의 유사도를 계산하여 추천 점수를 도출합니다. 이를 통해 각 사용자에게 가장 적합한 배너를 빠르게 찾아내어 노출할 수 있도록 하며, 무신사의 홈 배너 추천 시스템에서 개인화된 사용자 경험을 제공하는 핵심 구성 요소로 작동하고 있습니다.
앞서 설명한 대로, 무신사 홈 배너 추천 시스템은 정교한 모델과 아키텍처를 통해 개인화된 추천을 제공하고 있습니다. 그러나 아무리 이론적으로 잘 설계된 시스템이라 해도, 실제 서비스 환경에서는 다양한 현실적인 제약과 문제에 직면하게 됩니다. 특히 ‘무신사 홈 배너’라는 특수한 도메인에서는 일반적인 상품 추천 시스템으로는 해결하기 어려운 고유한 도전 과제들이 존재합니다. 이번 섹션에서는 모델 고도화 과정에서 드러난 홈 배너만의 특수성과, 그 과정에서 직면한 문제를 하나씩 살펴보겠습니다.
1. 금방 바뀌는 배너, 짧은 생명주기
홈 배너는 일반적인 상품에 비해 생명주기가 매우 짧다는 특징이 있습니다. 대부분의 배너는 2~3일 이내에 사라지며, 경우에 따라서는 몇 시간만 노출되고 바로 교체되는 경우도 있습니다. 따라서 모델은 신규 배너를 실시간에 가깝게 학습·반영해야 하며, 하루 전 데이터만으로 학습한 모델도 바로 효용이 떨어질 수 있습니다. 결국 모델 최신성을 어떻게 유지할지가 핵심 과제라고 할 수 있습니다.
2. ‘클릭’ 정보만으로는 부족한 피드백
홈 배너 추천에서는 유일한 피드백 신호가 ‘클릭’이라는 점에서 어려움이 존재합니다. 일반적인 상품 추천 시스템에서는 장바구니 추가, 구매, 좋아요 등 비교적 명확한 긍정적 행동을 피드백으로 활용할 수 있지만, 배너 클릭은 단순한 호기심이나 실수, 또는 콘텐츠에 대한 관심 등 다양한 이유로 발생할 수 있습니다. 이처럼 클릭은 노이즈가 많은 신호이기 때문에, 사용자 선호를 정확히 반영하기 어렵고 피드백의 유효 기간도 짧은 편입니다. 그래서 저희는 ① 짧은 주기로 최신 클릭 로그를 수집하고, ② 모델이 이를 즉시 재학습할 수 있는 구조를 마련해 클릭 신호의 한계를 보완해야 했습니다.
3. 배너 특징을 잘 담아내기 어려움
배너는 정형 데이터가 거의 없다는 점이 가장 큰 난관입니다. 상품처럼 카테고리·가격·브랜드 같은 구조화된 속성이 부족하고, 목적(상품 목록·기획전·이벤트)도 제각각이며 배너 이미지에 포함된 시각적 요소도 고려해야 합니다. 그동안 저희는 ‘배너와 연결된 상품 정보’를 대신 쓰는 임시 방편을 택했지만, 이것만으로는 배너 고유 맥락을 설명하기에 한계가 있었습니다. 결국 배너 자체를 잘 표현할 Illustration 학습이 핵심 과제로 부상했습니다.
4. 스토어 별 극심한 데이터 불균형
무신사는 다양한 전문관(스토어)을 운영하고 있는데, 이들 간의 트래픽 불균형이 매우 크다는 문제가 있었습니다. 예를 들어, 메인 무신사 스토어에 비해 일부 전문관은 노출 수나 클릭 수가 상대적으로 매우 적습니다. 이러한 데이터 불균형은 통합 모델 학습 시 트래픽이 많은 스토어에 모델이 편향되어 학습되는 결과를 낳았고, 이는 곧 일부 스토어에서 추천 품질이 떨어지는 문제로 이어졌습니다. 따라서 이러한 불균형을 어떻게 해소할지, 각 도메인의 특성을 어떻게 공정하게 반영할지에 대한 고민이 필요했습니다.
요약하자면, 빅배너 추천 고도화를 위해서는 [모델 최신성 유지], [짧고 부정확한 피드백 기반 선호도 예측], [배너 특성 표현력 강화], [스토어 간 데이터 불균형 문제 해소]라는 문제를 해결해야 했고, 이를 중심으로 시스템을 재정비하고 개선해나가고자 했습니다.
앞서 언급한 다양한 도전 과제들을 해결하기 위해, 세 가지 기술 축을 중심으로 시스템을 다시 설계했습니다. 모든 접근은 ① 배너 표현력 강화, ② 모델 최신성 유지, ③ 데이터 불균형 완화 — 이 세 가지 과제를 효과적으로 해결하는 데 초점을 맞추었습니다.
1. 배너 특성 추출 개선: 배너를 더 잘 표현하는 방법은?
배너 추천 성능 향상을 위해서는 다양한 맥락 정보(Contextual Function)의 확보가 중요했지만, 실제로 활용 가능한 정보는 매우 제한적이었습니다. 이에 따라, 사용자 행동 데이터를 활용해 배너의 특성을 더 정교하게 벡터로 표현하는 데 집중하게 되었습니다.
초기에는 PinSAGE 기반의 상품/브랜드 임베딩 평균을 배너 표현으로 활용했으나 정보가 부족한 배너는 표현이 불가능했고, 복합 기획전의 의미를 포착하지 못하며, 신규 배너 추천이 어려운 등의 명확한 한계가 있어 성능 개선 효과는 크지 않았습니다.
이러한 표현력 한계를 극복하기 위해 HGNN을 도입했습니다.
- 그래프 구성 — 확장성을 높이려 사용자 노드를 제외하고 배너·상품 두 타입으로 이종 그래프를 만들었습니다. 이렇게 복잡도를 줄여 행동 기반 관계 학습에 집중할 수 있었습니다.
- 초기 피처 — LLM으로 텍스트·이미지를 각각 임베딩한 뒤 Textual content + Picture 벡터를 조합해 고품질 노드 피처를 생성했습니다.
- 그래프 학습 — GraphSAGE 기반 대조 학습을 통해 배너 특징을 학습하여 관련 배너는 가깝게, 무관한 노드는 멀어지도록 학습해 배너-상품 관계가 임베딩에 잘 반영되도록 하였습니다.
학습이 끝난 배너·상품 임베딩은 CTR 예측 모델의 핵심 입력으로 들어가 정확도를 높입니다.
- 실시간 관심사 반영 — 사용자가 최근 클릭한 아이템 임베딩을 모아 동적 사용자 임베딩을 생성합니다.
- 효율적 갱신 주기 — 초기 7일 로그로 학습한 뒤, 매일 최근 3일 로그만 반영해 임베딩을 빠르게 업데이트합니다.
- Continuous Studying — 이 주기적 갱신으로 최신 행동을 꾸준히 학습해 모델 노후화를 막습니다.
Heterogeneous GraphSAGE 기반 배너 임베딩을 적용한 결과, 기존 PinSAGE 방식(상품 임베딩 평균) 대비 CTR이 8.3% 향상되었습니다. 이는 추천 대상인 배너를 직접 표현하고 학습하는 접근이 CTR 향상에 효과적임을 입증하는 결과였습니다.
2. Continuous Studying 도입: 모델을 계속 새롭게 유지하기
빠 홈 배너 환경에 민첩하게 대응하기 위해 Continuous Studying을 도입했습니다. 이는 과거의 중요한 정보를 보존하면서도 새로운 정보를 효과적으로 통합해 모델을 점진적으로 발전시키는 것을 목표로 한 시도였습니다. 기존에는 전체 데이터를 다시 학습하는 방식으로 인해 신규 배너의 초기 반응이 모델에 빠르게 반영되지 못하고, 예측 지연이 발생하는 문제가 있었습니다. Continuous Learning은 이러한 단점을 극복하고자 도입되었으며, 새로운 콘텐츠에 대한 빠른 적응과 동시에 기존 정보의 유지, 학습 효율성 향상을 핵심 방향으로 삼았습니다.
생명주기가 짧고 사용자 선호 변화가 빠르게 변하는 홈 배너 환경에 대응하고자 Continuous Studying을 도입했습니다. 목표는 ① 과거 지식은 유지하면서 ② 새 정보는 즉시 흡수해 모델을 점진적으로 업그레이드하는 것입니다. 이전까지는 전체 데이터를 다시 학습해야 해서 신규 배너 반응이 늦게 반영되고 예측 지연이 잦았습니다. Continuous Learning은 이런 문제를 없애고 빠른 적응·지식 보존·학습 효율 세 가지를 동시에 잡는 전략입니다.
모델 학습 과정에서는 시간대별 사용자 활동량에 따라 학습률을 조정했습니다. 낮에는 최대 5배, 밤에는 2배로 설정하여 사용자 반응이 활발한 시간대일수록 모델이 더 빠르게 변화에 적응할 수 있도록 했습니다. 또한, 초기 학습 대비 Epoch 수를 줄여 학습 시간을 단축하면서도 충분한 성능을 확보했고, 1시간 단위로 모델을 업데이트할 때는 최근 3시간 로그만을 포함해 과적합 위험을 줄이고 일반화된 패턴 학습을 유도했습니다. 추가로 Weight Decay 값을 피처 특성에 따라 다르게 적용해, 사용자 임베딩은 안정성을 유지하도록 하고, 배너 임베딩은 새로운 트렌드에 민감하게 반응할 수 있도록 설계했습니다.
Continuous Studying 적용을 통해 얻은 효과는 다음과 같습니다.
- 빠른 적응 — 신규 배너 반응을 즉시 흡수해 예측 정확도와 추천 품질이 전반적으로 상승했습니다.
- 운영 효율 — 전량 재학습 방식 대비 계산 비용이 크게 줄고, Catastrophic Forgetting 현상도 완화되었습니다.
- CTR +24 % — 일 단위 배치 모델과 비교해 클릭률이 24 % 높아졌습니다.
생성·소멸 주기가 짧은 배너 도메인에서는 고빈도 업데이트가 가장 효과적임을 실험으로 확인한 셈입니다.
3. 전략적 모델 선택: 데이터 불균형 문제 해결
여러 전문관(스토어)의 트래픽 격차 때문에 통합 모델은 메인 스토어 쪽으로 편향될 위험이 있었습니다. 저희는 이를 완화하고자 ① 통합 모델, ② 스토어별 개별 모델 — 두 가지 전략을 세워 A/B 테스트를 진행했습니다.
통합 모델과 개별 모델의 차이는 다음과 같습니다.
- 통합 모델: 모든 스토어 데이터를 함께 학습해 공통 사용자·배너 임베딩을 공유합니다. 덕분에 메인 스토어의 지식이 전문관으로 전파될 수 있습니다.
- 개별 모델: 각 전문관 데이터를 별도 임베딩으로 학습해 고유 특성을 더 정밀하게 반영하고, 메인 스토어에서 발생하는 노이즈 영향을 최소화합니다.
테스트 결과를 바탕으로, 다음과 같이 스토어별 최적 모델링 전략을 확정했습니다.
- 메인 스토어 ― 사용자 로그가 풍부하므로 Continuous Studying + DeepFM으로 최신 상호작용을 즉시 반영합니다.
- 전문관(뷰티·키즈 등) ― 로그가 적고 과적합 위험이 있어 Two-Tower 개별 모델로 스토어 고유 특성을 살려 안정적인 추천 품질을 확보했습니다.
이러한 전략적 모델 선택 결과, 스토어 데이터를 통합하여 학습한 모델 대비 개별 모델은 CTR 기준으로 19% 높은 성과를 기록했습니다. 통합 모델은 유저와 배너를 하나의 임베딩 공간에 표현함으로써 데이터 활용 효율성 측면에서는 이점이 있었지만, 전문관 고유의 사용자 행동과 콘텐츠 맥락을 충분히 반영하지 못하는 한계가 있었습니다. 반면 스토어별 개별 모델은 각 도메인의 특화된 선호도와 상호작용 패턴을 정교하게 학습하며, 특히 뷰티/키즈 등 전문관에서의 추천 성능을 효과적으로 끌어올릴 수 있었습니다.
최종 결과
최종 실험 결과, 기존에 운영되던 MAB(Multi-Armed Bandit) 알고리즘과 비교했을 때, Two-Tower 모델은 CTR 기준 11.2% 향상되었고, Continuous Studying 기반의 DeepFM 모델은 16.1%의 성능 향상을 기록했습니다. 이러한 결과를 바탕으로, 현재 무신사 홈에서는 배너 추천 모델로 Continuous Studying 기반 DeepFM 모델을 운영하고 있습니다. 반면, 사용자 로그가 적고 과적합 위험이 높은 뷰티, 키즈, 아울렛 등 전문관 스토어에서는 여전히 Two-Tower 기반의 개별 모델을 활용해 안정적인 추천 품질을 유지하고 있습니다.
이번 프로젝트의 목표는 “새 배너에 즉시 적응하는 똑똑한 추천”이었습니다. 저희는 ① Continuous Studying, ② 배너 임베딩 고도화, ③ 노출 전략 최적화 세 축으로 문제를 풀었고,추천 시스템 전반의 성능을 대폭 개선할 수 있었습니다.
이러한 성과들은 무신사 빅배너 추천 시스템이 빠르게 변화하는 운영 환경에 효과적으로 대응하며, 사용자에게 최적화된 배너를 제공할 수 있는 탄탄한 기반을 마련했다는 점에서 큰 의미가 있습니다.
지금까지 무신사 홈 배너 추천 시스템 고도화 과정에서 저희가 마주한 여러 도전 과제와 이를 해결하기 위한 다양한 기술적 시도 및 성과를 공유드렸습니다. 배너의 짧은 생명주기, 제한적인 피드백, Contextual Function 부족, 그리고 스토어 간 데이터 불균형 같은 문제들을 극복하기 위한 노력들이 실제 A/B 테스트에서 CTR 향상이라는 의미 있는 결과로 이어지며, 사용자에게 보다 시의적절하고 만족도 높은 추천을 제공할 수 있는 중요한 기반을 마련했습니다.
하지만 저희는 이러한 성과에 만족하지 않고, 무신사 홈 배너 추천 시스템을 지속적으로 발전시켜 사용자 경험을 한층 더 끌어올리고자 합니다. 앞으로 나아갈 주요 개선 방향과 구체적인 계획은 다음과 같습니다.
- 첫째, 실시간 서빙 구조로의 전환입니다. 현재는 배치 파이프라인을 통해 일정 수준 이상의 로그를 보유한 사용자 중심으로 개인화 추천을 제공하고 있지만, 앞으로는 실시간 추론 기반의 서빙 아키텍처를 도입하여 더 많은 사용자에게 즉각적이고 정교한 개인화 추천을 선보일 계획입니다. 이를 통해 최신 사용자 행동이 지체 없이 모델에 반영되어 배너 추천 품질과 사용자 경험을 크게 향상시킬 수 있을 것으로 기대합니다.
- 둘째, Multi-Activity Studying 도입입니다. 현재 모델은 주로 클릭률(CTR) 예측에 집중하고 있지만, 앞으로는 무신사의 핵심 비즈니스 지표인 총 상품 판매액(GGMV) 최적화도 함께 고려하는 다중 목표 학습 구조로 발전시킬 예정입니다. 이를 통해 단순 클릭 유도에서 나아가 실제 구매 전환까지 효과적으로 이끌어내는 보다 종합적인 성과 향상을 목표로 합니다.
- 셋째, 배너 임베딩 품질 고도화입니다. 현재 Heterogeneous GNN(HGNN)을 활용해 효과적인 임베딩을 구성하고 있으나, 앞으로는 그래프 구조를 더욱 정교하게 다듬고, 사용자 배너 노출 및 클릭 순서 등 시퀀스 정보를 적극 활용해 임베딩의 표현력과 품질을 한 단계 더 끌어올릴 계획입니다.
- 마지막으로, 성과 지표의 다각화를 추진할 것입니다. 홈 배너는 상품 리스트 랜딩, 특정 이벤트 홍보, 브랜드 기획전 등 다양한 목적과 형태를 지니고 있어, 단일한 CTR 지표만으로는 성과를 온전히 평가하기 어렵습니다. 따라서 클릭률 외에도 각 배너의 비즈니스 목표 달성도와 사용자 경험의 질적 측면을 반영하는 다각적인 성과 지표를 개발해, 실제 모델 평가와 개선에 적극 적용할 예정입니다.
홈 배너 추천 시스템을 개인화하는 여정은 끊임없는 고민과 실험의 과정이었습니다. 이번 글에서 소개한 다양한 기술적 시도와 경험들이 독자 여러분께 작은 인사이트가 되었기를 바랍니다.
저희 타겟팅ML팀은 앞으로도 사용자와 비즈니스 모두에게 의미 있는 가치를 더할 수 있도록 꾸준히 기술을 발전시키고 새로운 도전을 이어갈 것입니다. 변화하는 이커머스 환경 속에서 더 정교하고 만족스러운 개인화 경험을 만들어갈 무신사의 다음 이야기도 많은 기대 부탁드립니다. 감사합니다.