Дискретная математика для WMS: кластеризация партий товаров на складе / Хабр

В статье рассказывается как при внедрении WMS-системы мы столкнулись с необходимостью решения нестандартной задачи кластеризации и какими алгоритмами мы ее решали. Расскажем, как мы применяли системный, научный подход к решению проблемы, с какими сложностями столкнулись и какие уроки вынесли.

Эта публикация начинает цикл статей, в которых мы делимся своим успешным опытом внедрения алгоритмов оптимизации в складские процессы. Целью цикла статей ставится познакомить аудиторию с видами задач оптимизации складских операций, которые возникают практически на любом среднем и крупном складе, а также рассказать про наш опыт решения таких задач и встречающиеся на этом пути подводные камни. Статьи будут полезны тем, кто работает в отрасли складской логистики, внедряет WMS-системы, а также программистам, которые интересуются приложениями математики в бизнесе и оптимизацией процессов на предприятии.

Узкое место в процессах

В 2018 году мы сделали проект по внедрению WMS-системы на складе компании «Торговый дом «ЛД» в г. Челябинске. Внедрили продукт «1С-Логистика: Управление складом 3» на 20 рабочих мест: операторы WMS, кладовщики, водители погрузчиков. Склад средний около 4 тыс. м2, количество ячеек 5000 и количество SKU 4500. На складе хранятся шаровые краны собственного производства разных размеров от 1 кг до 400 кг. Запасы на складе хранятся в разрезе партий из-за необходимости отбора товара по FIFO и «рядной» специфики укладки продукции (пояснение далее).

При проектировании схем автоматизации складских процессов мы столкнулись с существующей проблемой неоптимального хранения запасов. Укладка и хранения кранов имеет, как мы уже сказали, «рядную» специфику. То есть, продукция в ячейке укладывается рядами один на другой в высоту, а возможность поставить штуку на штуку зачастую отсутствует (просто упадут, а вес не маленький). Из-за этого получается, что в одной ячейке штучного хранения может находиться только номенклатура одной партии, иначе старую номенклатуру не вытащить из под новой без «перелапачивания» целой ячейки.

Продукция приходит на склад ежедневно и каждый приход – это отдельная партия. Итого, в результате 1 месяца работы склада создаются 30 отдельных партий, притом, что каждая должна хранится в отдельной ячейке. Товар зачастую отбирается не целыми палетами, а штуками, и в результате в зоне штучного отбора во многих ячейках наблюдается такая картина: в ячейке объемом более 1м3 лежит несколько штук кранов, которые занимают менее 5-10% от объема ячейки (см. рис. 1).

Рис 1. Фото нескольких штук товара в ячейке

На лицо неоптимальное использование складских мощностей. Чтобы представить масштаб бедствия могу привести цифры: в среднем таких ячеек объемом более 1м3 с «мизерными» остатками в разные периоды работы склада насчитывается от 100 до 300 ячеек. Так как склад относительно небольшой, то в сезоны загрузки склада этот фактор становится «узким горлышком» с сильно тормозит складские процессы.

Идея решения проблемы

Возникла идея: партии остатков с наиболее близкими датами приводить к одной единой партии и такие остатки с унифицированной партией размещать компактно вместе в одной ячейке, или в нескольких, если места в одной не будет хватать на размещение всего количества остатков.

Рис.2. Схема сжатия остатков в ячейках

Это позволяет значительно сократить занимаемые складские площади, которые будут использоваться под новый размещаемый товар. В ситуации с перегрузкой складских мощностей такая мера является крайне необходимой, в противном случае свободного места под размещение нового товара может попросту не хватить, что приведет к стопору складских процессов размещения и подпитки. Раньше до внедрения WMS-системы такую операцию выполняли вручную, что было не эффективно, так как процесс поиска подходящих остатков в ячейках был достаточно долгим. Сейчас с внедрением WMS-системы решили процесс автоматизировать, ускорить и сделать его интеллектуальным.

Процесс решения такой задачи разбивается на 2 этапа:

на первом этапе мы находим близкие по дате группы партий для сжатия;
на втором этапе мы для каждой группы партий вычисляем максимально компактное размещение остатков товара в ячейках.

В текущей статье мы остановимся на первом этапе алгоритма, а освещение второго этапа оставим для следующей статьи.

Поиск математической модели задачи

Перед тем как садиться писать код и изобретать свой велосипед, мы решили подойти к такой задаче научно, а именно: сформулировать ее математически, свести к известной задаче дискретной оптимизации и использовать эффективные существующие алгоритмы для ее решения или взять эти существующие алгоритмы за основу и модифицировать их под специфику решаемой практической задачи.

Так как из бизнес-постановки задачи явно следует, что мы имеем дело с множествами, то сформулируем такую задачу в терминах теории множеств.

Пусть $inline$ – множество всех партий остатков некоторого товара на складе. Пусть $inline$ – заданная константа дней. Пусть $inline$ – подмножество партий, где разница дат для всех пар партий подмножества не превосходит константы $inline$ . Требуется найти минимальное количество непересекающихся подмножеств $inline$ , такое что все подмножества $inline$ в совокупности давали бы множество $inline$ .

Причем, нам нужно найти не просто минимальное количество подмножеств, а, чтобы такие подмножества были бы максимально большие. Это обусловлено тем, что после процедуры кластеризации партий, мы будем «сжимать» остатки найденных партий в ячейках. Поясним на примере. Допустим, имеется множество партий, распределенных на оси времени, как на рисунке 3.

Рис.3. Варианты разбиения множества партий

Из двух вариантов разбиения множества P с одинаковым количеством подмножеств, для нашей задачи наиболее выгодным является первое разбиение (а). Поскольку, чем большее количество партий будет в группах, тем больше комбинаций сжатия появляется, и тем самым больше вероятности найти наиболее компактное сжатие. Конечно, такое правило не более чем эвристика и наше умозрительное предположение. Хотя, как показал вычислительный эксперимент, если учитывать такое условие максимизации, то компактность последующего сжатия остатков становится в среднем на 5-10% больше по сравнению со сжатием, которое было построено без учета такого условия.

Иными словами, если совсем коротко, нам нужно найти группы или кластеры схожих партий, где критерий схожести определяется константой $inline$ . Такая задача напоминает нам хорошо известную всем задачу кластеризации. Важно сказать, что рассматриваемая задача отличается от задачи кластеризации, тем что в нашей задаче есть жестко заданное условие по критерию схожести элементов кластера, определяемое константой $inline$ , а в задаче кластеризации такое условие отсутствует. Постановку задачи кластеризации и информацию по этой задаче можно найти здесь.

Итак, нам удалось сформулировать задачу и найти классическую задачу с похожей постановкой. Теперь необходимо рассмотреть общеизвестные алгоритмы для ее решения, чтобы не изобретать велосипед заново, а взять лучшие практики и применить их. Для решения задачи кластеризации мы рассматривали самые популярные алгоритмы, а именно: $inline$ -means, $inline$ -means, алгоритм выделения связных компонент, алгоритм минимального остовного дерева. Описание и разбор таких алгоритмов можно найти здесь.

Для решения нашей задачи алгоритмы кластеризации $inline$ -means и $inline$ -means не применимы вовсе, так как заранее никогда не известно количество кластеров $inline$ и такие алгоритмы не учитывают ограничение константы дней. Такие алгоритмы были изначально отброшены из рассмотрения.
Для решения нашей задачи алгоритм выделения связных компонент и алгоритм минимального остовного дерева подходят больше, но, как оказалось, их нельзя применить «в лоб» к решаемой задаче и получить хорошее решение. Чтобы пояснить это, рассмотрим логику работы таких алгоритмов применительно к нашей задаче.

Рассмотрим граф $inline$ , в котором вершины – это множество партий $inline$ , а ребро между вершинами $inline$ и $inline$ имеет вес равный разнице дней между партиями $inline$ и $inline$ . В алгоритме выделения связных компонент задается входной параметр $inline$ , где $R\leq C$ , и в графе $inline$ удаляются все ребра, для которых вес больше $inline$ . Соединенными остаются только наиболее близкие пары объектов. Смысл алгоритма заключается в том, чтобы подобрать такое значение $inline$ , при котором граф «развалится» на несколько связных компонент, где партии, принадлежащие этим компонентам, будут удовлетворять нашему критерию схожести, определяемому константой $inline$ . Полученные компоненты и есть кластеры.

Алгоритм минимального покрывающего дерева сначала строит на графе $inline$ минимальное покрывающее дерево, а затем последовательно удаляет ребра с наибольшим весом до тех пор, пока граф не «развалится» на несколько связных компонент, где партии, принадлежащие этим компонентам, будут также удовлетворять нашему критерию схожести. Полученные компоненты и будут кластерами.

При использовании таких алгоритмов для решения рассматриваемой задачи может возникнуть ситуация как на рисунке 4.

Рис 4. Применение алгоритмов кластеризации к решаемой задаче

Допустим у нас константа разницы дней партий равна 20 дней. Граф $inline$ был изображен в пространственном виде для удобства визуального восприятия. Оба алгоритма дали решение с 3-мя кластерами, которое можно легко улучшить, объединив партии, помещенные в отдельные кластеры, между собой! Очевидно, что такие алгоритмы необходимо дорабатывать под специфику решаемой задачи и их применение в чистом виде к решению нашей задачи будет давать плохие результаты.

Итак, прежде чем начинать писать код модифицированных под нашу задачу графовых алгоритмов и изобретать свой велосипед (в силуэтах которого уже угадывались очертания квадратных колес), мы, опять же, решили подойти к такой задаче научно, а именно: попробовать свести ее к другой задаче дискретной оптимизации, в надежде на то, что существующие алгоритмы для ее решения можно будет применить без модификаций.

Очередной поиск похожей классической задачи увенчался успехом! Удалось найти задачу дискретной оптимизации, постановка которой почти что 1 в 1 совпадает с постановкой нашей задачи. Этой задачей оказалась задача о покрытии множества. Приведем постановку задачи применительно к нашей специфике.

Имеется конечное множество $inline$ и семейство $inline$ всех его непересекающихся подмножеств партий, таких что разница дат для всех пар партий каждого подмножества $inline$ из семейства $inline$ не превосходит константы $inline$ . Покрытием называют семейство $inline$ наименьшей мощности, элементы которого принадлежат $inline$ , такое что объединение множеств $inline$ из семейства $inline$ должно давать множество всех партий $inline$ .

Подробный разбор этой задачи можно найти здесь и здесь. Другие варианты практического применения задачи о покрытии и её модификаций можно найти здесь.

Единственное небольшое отличие рассматриваемой задачи от классической задачи покрытия множества — это необходимость максимизации количества элементов в подмножествах. Конечно, можно было бы поискать статьи, в которых рассматривался такой частный случай и, скорее всего, они бы нашлись. Но, от очередного поиска статей нас спас тот факт, что хорошо известный «жадный» алгоритм решения классической задачи покрытия множества строит разбиение как раз с учетом максимизации количества элементов в подмножествах. Так, забежали немного вперёд, а теперь все по порядку.

Алгоритм решения задачи

С математической моделью решаемой задачи определились. Теперь приступим к рассмотрению алгоритма для ее решения. Подмножества $inline$ из семейства $inline$ можно легко найти, например, такой процедурой.

Шаг 0. Упорядочить партии из множества $inline$ в порядке возрастания их дат. Полагаем, что все партии не помечены как просмотренные.
Шаг 1. Найти партию с наименьшей датой из еще не просмотренных партий.
Шаг 2. Для найденной партии двигаясь вправо включаем в подмножество $inline$ все партии, даты которых отличаются от текущей не более чем на $inline$ дней. Все партии, включенные в множество $inline$ помечаем как просмотренные.
Шаг 3. Если при движении вправо очередная партия не может быть включена в $inline$ , то переходим на шаг 1.

Задача о покрытии множества является $inline$ -трудной, а значит для её решения не существует быстрого (с временем работы равному полиному от входных данных) и точного алгоритма. Поэтому для решения задачи о покрытии множества был выбран быстрый жадный алгоритм, который конечно не является точным, но обладает следующими достоинствами:

Для задач небольшой размерности (а это как раз наш случай) вычисляет решения достаточно близкие к оптимуму. С ростом размера задачи качество решения ухудшается, но всё же довольно медленно;
Очень прост в реализации;
Быстр, так как оценка его времени работы равна $inline$ .

Жадный алгоритм выбирает множества руководствуясь следующим правилом: на каждом этапе выбирается множество, покрывающее максимальное число ещё не покрытых элементов. Подробное описание алгоритма и его псевдокод можно найти здесь. Реализация алгоритма на языке 1С в спойлере ниже (о том, почему стали реализовывать на «желтом» языке в следующей главе).

Код алгоритма на 1С

// Разбивает массив партий на кластеры жадным алгоритмом
// Решается задача о покрытии множества
Функция РазбитьПартииНаКластеры(МассивПартийУпорядоченныйПоДате) Экспорт
	
	КластерыПартий = Новый Массив;
	
	Пока МассивПартийУпорядоченныйПоДате.Количество() > 0 Цикл
		Множество = НайтиНаибольшееСмежноеМножество(МассивПартийУпорядоченныйПоДате);
		КластерыПартий.Добавить(Множество);	
		Для каждого Элемент ИЗ Множество Цикл		
			МассивПартийУпорядоченныйПоДате.Удалить(МассивПартийУпорядоченныйПоДате.Найти(Элемент));		
		КонецЦикла;			
	КонецЦикла;	
	Возврат КластерыПартий;		
КонецФункции

Функция НайтиНаибольшееСмежноеМножество(ЗаданныйМассивПартий)
	
	День = 60*60*24;
	ДопустимаяРазницаДней = Константы.бит_ДопустимаяРазницаДнейПартийДляСжатия.Получить();
	
	НаибольшееМножество = Новый Массив;
	РекордноеКоличествоПартий = 0;
	Для Каждого ПартияНачало Из ЗаданныйМассивПартий Цикл
		
		ТекКрайняяДата = ПартияНачало.ДатаПартии + ДопустимаяРазницаДней*День;
		ТекущееКоличествоПартий = 0;
		МножестоПартий = Новый Массив;
		
		// Для заданной начальной партии формируем множество смежных партий
		Для ИндексПартии = ЗаданныйМассивПартий.Найти(ПартияНачало) По ЗаданныйМассивПартий.Количество() - 1 Цикл
			Партия = ЗаданныйМассивПартий.Получить(ИндексПартии); 			
			Если Партия.ДатаПартии <= ТекКрайняяДата Тогда
				МножестоПартий.Добавить(Партия);
				ТекущееКоличествоПартий = ТекущееКоличествоПартий + 1;
			Иначе
				// смысла двигаться вправо нет
				Прервать;
			КонецЕсли;
		КонецЦикла;
		
		// проверка на обновление рекорда
		Если ТекущееКоличествоПартий > РекордноеКоличествоПартий Тогда		
			РекордноеКоличествоПартий = ТекущееКоличествоПартий;
			НаибольшееМножество = Новый Массив;
			Для Каждого Элемент Из МножестоПартий Цикл
				НаибольшееМножество.Добавить(Элемент);		
			КонецЦикла;
		КонецЕсли;	
	КонецЦикла;	
	Возврат НаибольшееМножество;
КонецФункции

Конечно, про оптимальность такого алгоритма не может идти и речи — эвристика, что уж говорить. Можно придумать такие примеры, на которых такой алгоритм будет ошибаться. Такие ошибки возникают, когда на какой-то итерации мы находим несколько множеств с одинаковым количеством элементов и выбираем первый попавшийся, так как стратегия то жадная: взял первое, что попалось на глаза и «жадина» доволен.

Очень может быть, что такой выбор может привести к неоптимальным результатам на последующих итерациях. Но точность такого простого алгоритма все равно довольно неплохая в большинстве случаев. Если требуется получать решения задачи более точно, то нужно использовать более сложные алгоритмы, например, как в работе: вероятностный жадный алгоритм, алгоритм муравьиной колонии и т.д. Результаты сравнения таких алгоритмов на сгенерированных случайных данных можно найти в работе.

Реализация и внедрение алгоритма

Такой алгоритм был реализован на языке 1С и был включен во внешнюю обработку под названием «Сжатие остатков», которая была подключена к WMS-системе. Мы не стали реализовывать алгоритм на языке С++ и использовать его из внешней Native компоненты, что было бы правильней, так как скорость работы кода на C++ в разы и на некоторых примерах даже в десятки раз превосходит скорость работы аналогичного кода на 1С. На языке 1С алгоритм был реализован для экономии времени на разработку и простоты отладки на рабочей базе заказчика. Результат работы алгоритма представлен на рисунке 6.

Рис.6. Обработка по «сжатию» остатков

На рисунке 6 видно, что на указанном складе текущие остатки товаров в ячейках хранения разбились на кластеры, внутри которых даты партий товаров отличаются между собой не более чем на 30 дней. Так как заказчик производит и хранит на складе металлические шаровые краны, у которых срок годности исчисляется годами, то такой разницей дат можно пренебречь. Отметим, что в настоящее время такая обработка используется в продакшене систематически, и операторы WMS подтверждают хорошее качество кластеризации партий.

Выводы и продолжение

Главный опыт, который мы получили от решения такой практической задачи – это подтверждение эффективности использования парадигмы: мат. формулировка задачи $\rightarrow$ известная мат. модель $\rightarrow$ известный алгоритм $\rightarrow$ алгоритм с учетом специфики задачи. Дискретной оптимизации уже насчитывается более 300 лет и за это время люди успели рассмотреть очень много задач и накопить большой опыт по их решению. В первую очередь целесообразнее обратиться к этому опыту, а уж потом начинать изобретать свой велосипед.

Важно так же сказать, что решение задачи кластеризации можно было бы рассматривать не обособленно от решения задачи сжатия остатков партий, а решать такие задачи вместе. То есть подбирать такое разбиение партий на кластеры, которое бы давало наилучшее сжатие. Но решение таких задач решено было разделить по следующим причинам:

Ограниченный бюджет на разработку алгоритмов. Разработка такого общего, а значит и более сложного алгоритма была бы более затратна по времени.
Сложность отладки и тестирования. Общий алгоритм было бы сложнее тестировать и отлаживать на этапе приемки, а баги в нем было бы сложнее и дольше отлаживать в режиме реальной эксплуатации. Например, возникла ошибка и непонятно куда копать: толи в сторону кластеризации, толи в сторону сжатия?
Прозрачность и управляемость. Разделение двух задач делает процесс сжатия более прозрачным, а значит и более управляемым для конечных пользователей — операторов WMS. Они могут некоторые ячейки убирать из сжатия или редактировать сжимаемое количество по каким-то причинам.

В следующей статье мы продолжим рассказ о алгоритмах оптимизации и рассмотрим самое интересное и гораздо более сложное: алгоритм оптимального «сжатия» остатков в ячейках, который использует на входе данные, полученные от алгоритма кластеризации партий.

Статью подготовил
Роман Шангин, программист департамента проектов,
компания Первый БИТ, г. Челябинск