Временные ряды в прогнозировании спроса, нагрузки на КЦ, товарных рекомендациях и поиске аномалий




Рассмотрим области применения временных рядов, решаемые задачи, и используемые алгоритмы.
Прогнозирование временного ряда используется в таких задачах, как прогнозирование спроса в FMCG, нагрузки на КЦ, дорожного и интернет-трафика, решения задачи холодного старта в рекомендательных системах и поиска аномалий в поведении оборудования и пользователей.

Рассмотрим задачи

1) Прогнозирование спроса.

Цель: снизить складские издержки и оптимизировать график работы персонала.

Как решается: имея прогноз покупкок товаров и количества клиентов, минимизируем количество товара на складе, и оставим на хранение, столько товара, сколько купят в заданный временной диапазон. Зная количество клиентов в каждый момент времени, составим оптимальное рабочее расписание, чтобы с минимумом затрат, было достаточное количество персонала.

2) Прогнозирование нагрузки на службу доставки

Цель: не допустить коллапса логистики при пиковых нагрузках.

Как решается: прогнозируя количество заказов, вывести на линию минимально необходимое количество машин и курьеров.

3) Прогнозирование нагрузки на контактный центр

Цель: при минимуме затрат на фонд оплаты труда обеспечить требуемую доступность контактного центра.

Как решается: прогнозирование количество звонков во времени, составим оптимальное расписание для операторов. Решение применяется в построении WFM систем.

4) Прогнозирование трафика

Цель: спрогнозировать количество вычислительных мощностей и пропускного канала для устойчивой работы. Чтобы ваш сервис не упал в день премьеры популярного сериала или футбольного матча ;)

5) Прогнозирование оптимального времени инкассации банкоматов

Цель: минимизация объема наличности, хранимой в сети АТМ. Наличность в банкоматах равнозначна складским издержкам. Но и допустить ее отсутствие в банкомате нельзя.

6) Решения задачи холодного старта в рекомендательных системах

Цель: рекомендовать актуальные товары новым пользователям.

Если клиент совершил несколько покупок, для рекомендации используется алгоритм коллаборативной фильтрации, но когда информации о пользователе нет, оптимально рекомендовать наиболее популярные товары. Популярность товаров динамически меняется во времени.

Решение: популярность товаров зависит от времени, когда сделана рекомендация. Использование прогнозирование временного ряда детектирует релевантные товары в каждый определенный момент времени.

7) Поиск аномалий

Цель: выявить проблемы в работе промышленного оборудования и нестандартные ситуации в бизнесе.

Решение: если измеряемое значение выбивается из доверительного интервала прогноза, аномалия выявлена. Если это АЭС, пора наращивать квадрат расстояния;)

Алгоритмы для решения задачи

1) Скользящее среднее

Элементарным алгоритмом является скользящее среднее. Давайте посчитаем среднее значение на нескольких последних элементах и сделаем прогноз. В прогнозе погоды больше чем на 7-10 дней, используется данный подход.

Подпишись на рассылку новостей о AI
Только полезные материалы о машинном обучении и искусственном интеллекте. Мы уважительно относимся к нашим читателям и рассылаем письма не чаше 1 раза в неделю!
Когда важно, чтобы последние значения в ряду вносили больший вес, введем коэффициенты в зависимости от удаленности даты, получив взвешенную модель:
Так, можно задать коэффициент W, чтобы максимальный вес приходился на 3 последних дня, будни и праздники.

Учет циклических факторов

На качество рекомендаций могут влияют циклические факторы, такие как совпадение с днем недели, датой, предшествование праздникам и т. д.

Рис. 1. Пример декомпозиции временного ряда на тренд, сезонный компонент и шум

Модели Хольта — Винтерса, Брауна

Экспоненциальное сглаживание – решение учета циклических факторов.

Рассмотрим 3 базовых подхода

1. Простое сглаживание (модель Брауна)
Представляет собой вычисление взвешенного среднего на последних 2-х элементах ряда.

2. Двойное сглаживание (модель Хольта)

Принимает в расчет изменение тренда и колебания значений остатков вокруг этого тренда.

Алгоритм ARIMA и SARIMA

Вычисляем предсказание изменения остатков (r) и тренда (d). Итоговое значение y — сумма этих двух величин.


3. Тройное сглаживание (модель Хольта — Винтерса)

Тройное сглаживание дополнительно учитывает сезонные колебания.

SARIMA – расширение для рядов с сезонной составляющей. SARIMAX – расширение, включающее внешнюю регрессионную составляющую.

Особенностью временных рядов для применения ARIMA заключается в связи прошлых значений связанных с текущими и будущими.

ARIMA-модели позволяют моделировать интегрированные или разностно-стационарные временные ряды

Подход ARIMA к временным рядам заключается в том, что в первую очередь оценивается стационарность ряда.

Далее ряд преобразуется взятием разности соответствующего порядка и уже для преобразованной модели строится некоторая ARMA-модель.

ARMA - линейная модель множественной регрессии.

Важно, чтобы ряд был стационарен, т.е. константным оставалось среднее, и дисперсия. Если ряд нестационарен, его следует привести к стационарному виду.

XGBoost, SVM, RF, Линейная регрессия

Если у ряда нет внутренней выраженной структуры, но есть внешние влияющие факторы (менеджер, погода и т.д.), то можно смело использовать такие модели машинного обучения как бустинг, случайные леса, регрессия, нейронные сети и SVM.

Из опыта работы команды DATA4, решение прогнозирования временных рядов, одна из основных задач для решения оптимизации складских затрат, затрат на персонал, оптимизации обслуживания сетей АТМ, логистики и построения рекомендательных систем. Сложные модели, такие как SARIMA дают качественный результат, но требуют больших затрат времени.

DATA4 объявляет грантовый конкурс

Получите до 50000 руб. на услуги DATA4, заполнив заявку на сайте
http://data4.ru/grant

Польза гранта:
1) Поможем правильно поставить задачи
2) Поможем с выбором технологического стека
3) Разработка MVP

Мы верим, что лучшее сотрудничество начинается с помощи партнерам!

DATA4

Сделаем будущее настоящим!
Связаться с нами
Напишите контактные данные, чтобы мы связались с вами.