0/5

Прогнозирование складских запасов методами машинного обучения

Прогнозирование складских запасов методами машинного обучения
время публикации: 10:00  07 декабря 2018 года
Работа со складскими запасами и товарными остатками является «головной болью» для многих ритейлеров. Нужно сделать так, чтобы на складе было достаточное наличие товара, но при этом исключить затоваренность.
Русаков Константин
На фото: Русаков Константин, аналитик данных компании «Тринити»

Развитие торговли, особенно в интернете, требует от продавцов уделять все больше внимания к работе с ассортиментом товаров и остатками на складе.  

По данным Ассоциации компаний интернет-торговли, в 2017 году оборот российского рынка интернет-торговли достиг 1,04 трлн руб. Это на 13% больше, чем годом ранее. В условиях жесткой конкуренции торговые компании должны обеспечивать устойчивость ассортимента товаров на складе, а делать это «вручную» предприятиям все труднее.  Помимо того, определение оптимальных размеров складских запасов обеспечивает гибкость ценовой политики, а также повышает уровень удовлетворения спроса и лояльности покупателей. 

Принятие решений в управлении товарными запасами непосредственно сказывается на объемах продаж, затратах на логистику, выручке, прибыли и доходности. Прогноз складских запасов – основа бесперебойных продаж и отсутствия затоваривания склада.
Прогнозирование складских запасов методами машинного обучения


Прогноз товарных запасов является необходимой задачей для поддержания их оптимального уровня. Для решения данной задачи применяют современные методы прогнозирования, основанные на технологиях машинного обучения.


Таким способом вполне можно проанализировать динамику продаж тысячи товаров. Однако, разные категории товаров требуют разных подходов. 

Прогнозировать спрос на продукты питания, товары повседневного спроса – легко, для этого подходят простые алгоритмы, но, когда дело касается специализированных товаров с редким спросом, необходимы специальные алгоритмы и подходы. Задача усложняется, если бизнес интересует прогнозирование товарных запасов для каждого «заранее известного» покупателя. 

Допустим, покупатель зарезервировал товар, и продавец хочет знать: когда покупатель выкупит этот товар и выкупит ли он его вообще? 

Подход к решению данной задачи основан на кластеризации всех товаров в общие группы. В каждой компании, безусловно, присутствует своя классификация товаров: по линейкам товаров, по производителям, по типу и т.д. В подавляющем большинстве случаев количество этих «типов» товаров огромное множество. И, безусловно, некоторые товары продаются редко и очень редко, что приводит к трудностям в прогнозировании, однако эти товары учитывать также необходимо. В этих условиях нужно искусственно «увеличить спрос на товары». С этой целью и проводится кластеризация товаров по наиболее важным факторам. 








Методы кластеризации идентифицируют группы (кластеры) схожих записей и присваивают метки записям в соответствии с группами, к которым они принадлежат. Записи назначаются кластерам таким образом, чтобы минимизировать расстояние между записями, принадлежащими одному кластеру. Для решения этой задачи существует довольно обширный ряд методов кластеризации: метод K-средних; метод двухшаговой кластеризации; метод Коонена.

Важно отметить, что для проведения качественной кластеризации необходимо собрать всевозможные характеристики товаров: их покупаемость, частота заказов, продолжительность нахождения на складе, доля возвращаемого товара, доля заказов, среднее/минимальное/максимальное/медианное количество дней на складе и т.д. 

На рисунке 1 представлен результат кластеризации нескольких сотен товаров методом K-средних. Алгоритм выделил 6 общих групп (кластеров) и наиболее важные признаки формирования кластеров.
 
Прогнозирование складских запасов методами машинного обучения
Рисунок 1. Кластеризация товаров

Результаты этой кластеризации и используются для решения задачи: выкупит и когда выкупит покупатель этот специализированный товар. Только от товаров уже происходит переход к предварительно сформированным группам. В данном случае задача формулируется так: когда выкупит и выкупит ли вообще покупатель зарезервированный товар из полученного товарного кластера.

То есть задача сводится к множественной модели классификации. Модели классификации используют значения одного или нескольких входных факторов, чтобы предсказать значения одного или нескольких выходных параметров, или полей назначения. 

Некоторые примеры таких алгоритмов: деревья решений (алгоритмы дерева C&R, QUEST, CHAID и C5.0), регрессии (линейная, логистическая, обобщенная линейная и Кокса), нейронные сети, модели опорных векторов, Байесовские сети. Предварительно периоды выкупа товара могут быть разбиты на интервалы, и решается задача кластеризации покупателей.

Важной особенностью данных методов является получение не просто значения выходной переменной, например, покупатель выкупит зарезервированный товар из соответствующей группы через неделю, но и вероятность этого события. Из доступного набора моделей, выбирается та, которая имеет наименьшую ошибку на тестовой выборке. 

В табл. 1 представлены результаты моделирования с помощью дерева решений типа C5.0, которая в данной задаче показала лучший результат.

Таблица 1. Прогноз времени выкупа из резерва

№ п/п ID покупателя ID группы товара Целевая переменная Прогноз Вероятность
.
46 343 2 Выкупит через 1 день Выкупит через 1 день 0,345
47 4543 3 Не выкупит Не выкупит 0,864
48 454 5 Выкупит через 1 неделю Выкупит через 3 дня 0,489
.

Стоит отметить, что в табл. 1 вероятность 0,345 или 0,489 – это не случайное угадывание. Поскольку решается задача множественной классификации, то вероятности распределяются по всем значениям целевой переменной. Данные методы, в том числе, позволяют определить наиболее важные факторы, влияющие на выкуп товаров. Следовательно, факторы, оказывающие влияние на ускорение выкупа товаров, необходимо учитывать при планировании товарных запасов. Это позволит установить экономически обоснованные уровни товарных запасов, обеспечить их оборачиваемость.

Таким образом, алгоритмы машинного обучения позволяют автоматизировать ежедневные процессы прогнозирования времени выкупа и количества выкупленного товара для оптимизации запасов на складе, минимизирующих издержки на хранение, логистику и увеличивающих обороты и прибыль бизнеса.

Русаков Константин, аналитик данных компании «Тринити»

0
Реклама на New Retail. Медиакит