Karbasov7 фев 2025 в 15:11

Экономим месяцы работы: зачем мы научили ИИ актуализировать цены ТМЦ

Средний

5 мин

1.5K

ERP-системы * Искусственный интеллектРазработка под e-commerce *

Кейс

Комментарии 16

akakoychenko 7 фев 2025 в 16:56

Так а в чем основная идея работы ии? Есть отличный пример с кабелями, где, к примеру, мне, как человеку, кто в кабелях не разбирается, непонятно, разные ли кабели 1 и 2.

Предположим, ии получил на вход эту пару артикулов. Какие шаги будет делать ии, и где доберет информацию о значении каждого термина, чтобы понять, что по огнестойкости, материалу, и сертификации кабели идентичны?

Karbasov 7 фев 2025 в 17:04

Система разбирает на атрибуты текстовое именование ТМЦ, при этом не важно, это данные внутренние или внешние, не важно в каком формате они описаны, подробнее, на примере дедубликации написано в предыдущей статье - https://habr.com/ru/articles/862820/
Из внешней информации (прайсы) система извлекает цену
Проверяет ряд условий, выявляет ценовые аномалии

и если все проверки успешно пройдены, рассчитывает рыночную цену

WinLin2 8 фев 2025 в 00:41

Для каждой позиции есть набор обязательных параметров, например для кабеля: гост (2012), сечение и кол-во жил, марка кабеля (ВВГ). Эти параметры должен знать сппциалист и предварительно создать базу знаний.

Найти слово кабель, найти возможную марку, 3x1 или 1x3 где здесь сечение.

Не являюсь крутым электриком, только в пределах домашних работ.

Как определить является ли моя пограмма ИИ? :)

Karbasov 8 фев 2025 в 09:59

Верно, набор обязательных параметров определяет онтология данного класса. Мы научили систему извлекать атрибуты из текстового именования ТМЦ, согласно заданой онтологии и раскладывать атрибуты по ячейкам таблицы, подробный пример был разобран в этой статье - https://habr.com/ru/articles/862820/
Что касается вопроса это ИИ либо не ИИ, тема очень дискуссионная и на результат напрямую не влияет. Проведенные тесты, это описано в первой статье, показали что системы "умнее" человека, люди чаще ошибаются

little-brother 8 фев 2025 в 06:40

Пффф, мелочевка типа кабелей не шибко интересна. А вот ценники на оборудование, особенно заказное (типа пром. кондиционеров, ИБП, электрощитов и т.п.), таким вот "мониторингом" не пробьешь.

Karbasov 8 фев 2025 в 10:02

Верно, система подходит только для ходовых товаров, для заказного оборудования она не подходит. По нашему опыту порядка 70-80% (по количеству) позиций являются ходовым и могу быть идентифицированы по атрибутному составу или каталожному номеру

lazy_val 8 фев 2025 в 06:54

На выборке каких размеров это все обучалось?

Возьмем, к примеру, те же кабели - сколько позиций было в обучающей выборке, и сколько потом прошло через инференс?

Karbasov 8 фев 2025 в 10:08

По технике обучения со временем подготовлю отдельную статью, сейчас могу сказать что мы комбинируем ML, ИИ (глубинные нейросети) и более простые модели. Когда стартовали (ноябрь 2019) опирались на доступные в тот момент нейросети, они быстро показали хороший результат (80-90%), но довести их до точности, близкой к 100% было не возможно, в итоге мы были вынуждены перейти на гибридный вариант.
По тестовой выборке, один из примеров приведен в этой статье - https://habr.com/ru/articles/862820/ , при этом отдельные позиции контролинг проверяет вручную на регулярной основе, их точное количество мы не знаем

lazy_val 9 фев 2025 в 04:00

В статье по ссылке вижу только примеры инференса:

число записей там варьировалось от 500 тысяч до 1,2 млн. При этом количество дублей могло достигать 30%

В каталоге ТМЦ (товарно-материальных ценностей) компании было представлено 115 326 записей ... было выявлено 3567 записей, содержащих дублирующую или схожую информацию

А меня интересует размер выборки, на которой модель обучается. Чтобы во входных данных, содержащих, условно говоря, 100 тысяч записей, найти 3% (или 30%, неважно) дублей, нужно обучить модель на размеченных данных (дубль / не дубль) размером 50 тысяч / 10 тысяч / 1 тысяча записей. Или сколько все-таки?

accsentive 8 фев 2025 в 07:49

Вторая позиция имеет двойной аргумент по огнестойкости ("огнестойкий" + FRLS), у первой позиции 0 таких аргументов. В чем проверка их идентичности?

Karbasov 8 фев 2025 в 10:14

Очень верное замечание!
Согласно правил подбора заказчика этот атрибут не значим, в этой статье (https://habr.com/ru/articles/862820/) так же разбирается Кабель электрический, хотя и с друго проекта, и приведена стратегия сопоставления и атрибутивный состав. Если в будущем для них это будет важно, новый атрибут будет добавлен в онтологию и учтен при подборе

little-brother 9 фев 2025 в 13:13

Для пройдох подрядчиков, такой параметр как FRLS конечно не значим, так как такой тип изоляции существенно удорожает кабель. Но есть нюанс - если проектировщик такой кабель заложил, то скорее всего для средств противопожарной автоматики, согласно требованиям нормативных документов, а не велению левой пятки. С кабелем вообще зачастую беда, тип оболочки это одно и вместо медных жил может попасть омедненный алюминий или сталь. Так что лучше переплатить 20-30% и спать спокойно, чем потом перекладывать.

accsentive 8 фев 2025 в 08:37

Успех автоматизации закупок не определяется присутствием ИИ. Каждая строка в листе заказа - это не просто наименование позиции и цена, но и куча допусловий от поставщика: количество на складе, сроки поставки (один заказ может быть поставлен несколькими партиями с разными сроками), условия оплаты, гарантийные, страна производителя, испытания и сертификации, параметры и составы материалов. По каждому такому "допику" есть под-условия. Например, при оплате "100% предоплата", необходимо сразу знать рассчитанный ранее кредитный лимит поставщика.

Все это настраивается в системах управления закупками (SRM). В торговых сетях такие системы имеют классификацию EDI (электронный обмен данными). В работающих на сегодня инфраструктурах такого класса востребована сигнальная аналитика формата: "отгрузочная цена артикула HF-12GZ у 90% поставщиков превысила пиковое значение сметы" или "в заказе xyz123 рост цены по позиции "огурцы" составил 40% с начала года и выпервые превысил значение позиции "шейка свиная".

А ИИ+парсинг публичных источников - это больше про то, как спросить у ChatGPT "где сейчас самые дешёвые билеты на концерт Басты".

Karbasov 8 фев 2025 в 10:21

По первой части полностью согласен, я это упоминул в статье, но есть нюанс:
1. При загрузке прайсов можно указать базовые условия, и индикативно они будет в диапазоне стат. погрешности
2. Поставщики на ценовых агрегаторах выставляются, как правило, с +/- одинаковыми условиями, их цена не является окончательной, а так же индикативной
3. При обмене данными между корпорациями (такой опыт у нас был), в систему загружается цена со всеми условиями
4. После выборки наиболее релевантных кандидатов работа закупщика значительно упрощается

p.s. ChatGPT и подобные ему рашают данную задачу с достаточно низким уровнем качества, мы проверяли их несколько раз, крайний раз я лично тестировал Deepseek

nixtonixto 8 фев 2025 в 13:49

Если на рынке появится контрагент с более выгодным предложением – система это заметит. При этом система берет только те ценовые источники, которым доверяет компания.

У доверенного контрагента после инвентаризации склада может найтись цементная смесь, у которой срок годности остался 1 месяц. Они поставят на неё цену на рубль дешевле самого выгодного предложения на рынке и ваш ИИ самым первым закупит этот залежавшийся товар? Вместо того, чтобы купить на заводе, который торгует с конвейера.

Karbasov 9 фев 2025 в 13:21

В данном конкретном случае система не пропустит предложение по причине аномально низкой цены, в любом случае, как и писал выше, финальное решение будет за закупщиком.
Обращаю внимание, что данная система не стремится полностью заменить человека, но она может сделать за него 80-90% "грязной работы"

Зарегистрируйтесь на Хабре, чтобы оставить комментарий