Кейс для KupiVip
Как персонализированные товарные рекомендации DATA4 повысили конверсию на 4,91%

В этой статье мы расскажем о том, как реализован кейс по разработке алгоритма персонализированных товарных рекомендаций для KupiVip.

Мы - Data4, команда, реализующая заказные разработки в области машинного обучения. К нам обратились коллеги из KupiVip, одного из крупнейших интернет магазинов России с задачей разработать алгоритм рекомендаций товаров, который увеличит конверсию в продажу.

Для решения задачи был разработан алгоритм в основе которого лежит принцип коллаборативной фильтрации.
Решались следующие задачи:
1) Какие товары порекомендовать пользователю, зная предыдущие покупки клиента

2) Какие товары порекомендовать в карточке товара, ориентируясь на схожесть товара по потребительскому поведению.
Пример работы алгоритма определения товаров со схожим потребительским поведением.
Алгоритм коллаборативной фильтрации
В data science эти задачи решаются user base и item base подходами в коллаборативной фильтрации.

Принцип алгоритма коллаборативной фильтрации заключается в том, что похожим по поведению пользователям рекомендуются похожие товары. Если у вашего товарища макбук и айфон, а у вас только макбук, имеет смысл порекомендовать вам еще и айфон.

Первый шаг разработки решения - построение матрицы товарных предпочтений, где строки это пользователи, а столбцы, это товары с которыми они взаимодействовали.
Матрица товарных предпочтений
Дополнительно были сгенерированы признаки пользователей и товаров. Признаками пользователей выбраны пол, возраст, тип устройства, город и т.д., для товаров использовались категории, бренды, цены и еще ряд свойств.

Так как у нашего клиента ассортимент товара содержит десятки тысяч позиций, матрица товарных предпочтений пользователей преимущественно заполнена нулевыми значениями.

Для работы с подобными матрицами наилучшим решением является использование Меры близости Жаккара. Применение меры близости Жаккара дало прирост качества работы алгоритма практически в 2 раза.

Для прогноза тестировались следующие алгоритмы:

1) Most popular. Как показывает практика – оптимальный алгоритм, для использования на новых пользователях.

2) SVD. Алгоритм на основе разложения матриц.

3) Факторизационные машины.

4) 2B-DSSM нейронная сеть

Наилучшие результаты получены с использованием факторизационных машин.

Смысл алгоритма заключается в том, чтобы разложить матрицу товарных предпочтений, на матрицы с латентными признаками пользователя и товара, обогатить латентные признаки, явными признаками, и после перемножения получить новую матрицу. Если значения в новой матрице, где раньше стояли нули принимают большое значение, то можно сделать вывод, что у пользователя есть интерес к данному товару.

Ранжировав полученные значения, получаем список товаров для рекомендации.

Для улучшения работы алгоритма использовались не только информацию о покупках, но и промежуточные взаимодействия, такие как просмотр товара и добавление в корзину.

Учет промежуточных факторов осуществлялся с добавлением значений в матрицу товарных предпочтений с заданными коэффициентами. Самые высокие коэффициенты получили покупка и добавление в корзину, самый низкий – просмотр.

Повышение выкупаемости товаров

Актуальной задачей интернет магазинов является повышение выкупаемости товаров.

Для этого мы построили распределение по выкупаемости, и исключили из обучающей выборки товары, которые не попали в диапазон 2 сигм.

Было сделано предположение, что ряд товаров обладает низкими потребительскими свойствами (нет нужных размеров, плохое качество и т.д.).Такие товары лучше исключить из рекомендаций.

Разнообразие в рекомендациях

Даже если алгоритм говорит, что нужно рекомендовать только норковые шубы, лучше добавить разнообразия. Для этого мы ввели коэффицент разнообразия по категориям и по брендам.

Рекомендация больших размеров обижает женщин

Коллеги из KupiVip заранее предупредили нас, что некоторые рекомендации могут обижать пользователей. Оказалось, что женщин часто обижает, если им рекомендовать одежду для полных людей.

Фильтрация человеческим мозгом

Каким бы не был умным алгоритм, иногда, могут появляться артефакты, такие как рекомендации женщинам мужских товаров, так как есть паттерн, когда женщины выбирают одежду сильной половине человечества. Для этого вручную задаются дополнительные фильтры.

Чтобы не снизить средний чек, желательно рекомендовать товары, которые будут дороже по цене.

Результаты A/B теста

Разработав решение на основе факторизациоонных машин с мерой близости Жаккара. Обогатив матрицу товарных предпочтений признаками пользователя и товара, и задав весовые коэффициенты, решение было внедрено у заказчика.

Что не получилось?

Для новых пользователей наиболее подходящим оказался алгоритм рекомендаций наиболее популярных товаров.

Что получилось?

А/В тест показал рост конверсии в заказ на 4,91% (т.е. в 1,0491 раза) для постоянных клиентов и 4,2% для всех клиентов.

Оставьте Ваши контакты в форме ниже, чтобы мы проконсультировали Вас по кейсу Вашей компании.

Связаться с нами
Напишите контактные данные, чтобы наш менеджер связался с вами.

Персонализированные товарные рекомендации
DATA4 это

5-10%
Увеличение конверсии в покупку
2x +
Увеличение дополнительных продаж
15% +
Повышение уровня лояльности по NPS
120% +
Увеличение доли открытых писем из рассылок
НАШИ КОНТАКТЫ
+7-495-178-07-01
kirill@data4.ru (CEO)
Мы в социальных сетях: