Дополнительно были сгенерированы признаки пользователей и товаров. Признаками пользователей выбраны пол, возраст, тип устройства, город и т.д., для товаров использовались категории, бренды, цены и еще ряд свойств.
Так как у нашего клиента ассортимент товара содержит десятки тысяч позиций, матрица товарных предпочтений пользователей преимущественно заполнена нулевыми значениями.
Для работы с подобными матрицами наилучшим решением является использование Меры близости Жаккара. Применение меры близости Жаккара дало прирост качества работы алгоритма практически в 2 раза.
Для прогноза тестировались следующие алгоритмы:
1) Most popular. Как показывает практика – оптимальный алгоритм, для использования на новых пользователях.
2) SVD. Алгоритм на основе разложения матриц.
3) Факторизационные машины.
4) 2B-DSSM нейронная сеть
Наилучшие результаты получены с использованием факторизационных машин.
Смысл алгоритма заключается в том, чтобы разложить матрицу товарных предпочтений, на матрицы с латентными признаками пользователя и товара, обогатить латентные признаки, явными признаками, и после перемножения получить новую матрицу. Если значения в новой матрице, где раньше стояли нули принимают большое значение, то можно сделать вывод, что у пользователя есть интерес к данному товару.
Ранжировав полученные значения, получаем список товаров для рекомендации.
Для улучшения работы алгоритма использовались не только информацию о покупках, но и промежуточные взаимодействия, такие как просмотр товара и добавление в корзину.
Учет промежуточных факторов осуществлялся с добавлением значений в матрицу товарных предпочтений с заданными коэффициентами. Самые высокие коэффициенты получили покупка и добавление в корзину, самый низкий – просмотр.
Повышение выкупаемости товаров
Актуальной задачей интернет магазинов является повышение выкупаемости товаров.
Для этого мы построили распределение по выкупаемости, и исключили из обучающей выборки товары, которые не попали в диапазон 2 сигм.
Было сделано предположение, что ряд товаров обладает низкими потребительскими свойствами (нет нужных размеров, плохое качество и т.д.).Такие товары лучше исключить из рекомендаций.
Разнообразие в рекомендациях
Даже если алгоритм говорит, что нужно рекомендовать только норковые шубы, лучше добавить разнообразия. Для этого мы ввели коэффицент разнообразия по категориям и по брендам.
Рекомендация больших размеров обижает женщин
Коллеги из KupiVip заранее предупредили нас, что некоторые рекомендации могут обижать пользователей. Оказалось, что женщин часто обижает, если им рекомендовать одежду для полных людей.
Фильтрация человеческим мозгом
Каким бы не был умным алгоритм, иногда, могут появляться артефакты, такие как рекомендации женщинам мужских товаров, так как есть паттерн, когда женщины выбирают одежду сильной половине человечества. Для этого вручную задаются дополнительные фильтры.
Чтобы не снизить средний чек, желательно рекомендовать товары, которые будут дороже по цене.
Результаты A/B теста
Разработав решение на основе факторизациоонных машин с мерой близости Жаккара. Обогатив матрицу товарных предпочтений признаками пользователя и товара, и задав весовые коэффициенты, решение было внедрено у заказчика.
Что не получилось?
Для новых пользователей наиболее подходящим оказался алгоритм рекомендаций наиболее популярных товаров.
Что получилось?
А/В тест показал рост конверсии в заказ на 4,91% (т.е. в 1,0491 раза) для постоянных клиентов и 4,2% для всех клиентов.
Оставьте Ваши контакты в форме ниже, чтобы мы проконсультировали Вас по кейсу Вашей компании.