Комментарии 16
Так а в чем основная идея работы ии? Есть отличный пример с кабелями, где, к примеру, мне, как человеку, кто в кабелях не разбирается, непонятно, разные ли кабели 1 и 2.
Предположим, ии получил на вход эту пару артикулов. Какие шаги будет делать ии, и где доберет информацию о значении каждого термина, чтобы понять, что по огнестойкости, материалу, и сертификации кабели идентичны?
Система разбирает на атрибуты текстовое именование ТМЦ, при этом не важно, это данные внутренние или внешние, не важно в каком формате они описаны, подробнее, на примере дедубликации написано в предыдущей статье - https://habr.com/ru/articles/862820/
Из внешней информации (прайсы) система извлекает цену
Проверяет ряд условий, выявляет ценовые аномалии
и если все проверки успешно пройдены, рассчитывает рыночную цену
Для каждой позиции есть набор обязательных параметров, например для кабеля: гост (2012), сечение и кол-во жил, марка кабеля (ВВГ). Эти параметры должен знать сппциалист и предварительно создать базу знаний.
Найти слово кабель, найти возможную марку, 3x1 или 1x3 где здесь сечение.
Не являюсь крутым электриком, только в пределах домашних работ.
Как определить является ли моя пограмма ИИ? :)
Верно, набор обязательных параметров определяет онтология данного класса. Мы научили систему извлекать атрибуты из текстового именования ТМЦ, согласно заданой онтологии и раскладывать атрибуты по ячейкам таблицы, подробный пример был разобран в этой статье - https://habr.com/ru/articles/862820/
Что касается вопроса это ИИ либо не ИИ, тема очень дискуссионная и на результат напрямую не влияет. Проведенные тесты, это описано в первой статье, показали что системы "умнее" человека, люди чаще ошибаются
Пффф, мелочевка типа кабелей не шибко интересна. А вот ценники на оборудование, особенно заказное (типа пром. кондиционеров, ИБП, электрощитов и т.п.), таким вот "мониторингом" не пробьешь.
На выборке каких размеров это все обучалось?
Возьмем, к примеру, те же кабели - сколько позиций было в обучающей выборке, и сколько потом прошло через инференс?
По технике обучения со временем подготовлю отдельную статью, сейчас могу сказать что мы комбинируем ML, ИИ (глубинные нейросети) и более простые модели. Когда стартовали (ноябрь 2019) опирались на доступные в тот момент нейросети, они быстро показали хороший результат (80-90%), но довести их до точности, близкой к 100% было не возможно, в итоге мы были вынуждены перейти на гибридный вариант.
По тестовой выборке, один из примеров приведен в этой статье - https://habr.com/ru/articles/862820/ , при этом отдельные позиции контролинг проверяет вручную на регулярной основе, их точное количество мы не знаем
В статье по ссылке вижу только примеры инференса:
число записей там варьировалось от 500 тысяч до 1,2 млн. При этом количество дублей могло достигать 30%
В каталоге ТМЦ (товарно-материальных ценностей) компании было представлено 115 326 записей ... было выявлено 3567 записей, содержащих дублирующую или схожую информацию
А меня интересует размер выборки, на которой модель обучается. Чтобы во входных данных, содержащих, условно говоря, 100 тысяч записей, найти 3% (или 30%, неважно) дублей, нужно обучить модель на размеченных данных (дубль / не дубль) размером 50 тысяч / 10 тысяч / 1 тысяча записей. Или сколько все-таки?
Вторая позиция имеет двойной аргумент по огнестойкости ("огнестойкий" + FRLS), у первой позиции 0 таких аргументов. В чем проверка их идентичности?
Очень верное замечание!
Согласно правил подбора заказчика этот атрибут не значим, в этой статье (https://habr.com/ru/articles/862820/) так же разбирается Кабель электрический, хотя и с друго проекта, и приведена стратегия сопоставления и атрибутивный состав. Если в будущем для них это будет важно, новый атрибут будет добавлен в онтологию и учтен при подборе
Для пройдох подрядчиков, такой параметр как FRLS конечно не значим, так как такой тип изоляции существенно удорожает кабель. Но есть нюанс - если проектировщик такой кабель заложил, то скорее всего для средств противопожарной автоматики, согласно требованиям нормативных документов, а не велению левой пятки. С кабелем вообще зачастую беда, тип оболочки это одно и вместо медных жил может попасть омедненный алюминий или сталь. Так что лучше переплатить 20-30% и спать спокойно, чем потом перекладывать.
Успех автоматизации закупок не определяется присутствием ИИ. Каждая строка в листе заказа - это не просто наименование позиции и цена, но и куча допусловий от поставщика: количество на складе, сроки поставки (один заказ может быть поставлен несколькими партиями с разными сроками), условия оплаты, гарантийные, страна производителя, испытания и сертификации, параметры и составы материалов. По каждому такому "допику" есть под-условия. Например, при оплате "100% предоплата", необходимо сразу знать рассчитанный ранее кредитный лимит поставщика.
Все это настраивается в системах управления закупками (SRM). В торговых сетях такие системы имеют классификацию EDI (электронный обмен данными). В работающих на сегодня инфраструктурах такого класса востребована сигнальная аналитика формата: "отгрузочная цена артикула HF-12GZ у 90% поставщиков превысила пиковое значение сметы" или "в заказе xyz123 рост цены по позиции "огурцы" составил 40% с начала года и выпервые превысил значение позиции "шейка свиная".
А ИИ+парсинг публичных источников - это больше про то, как спросить у ChatGPT "где сейчас самые дешёвые билеты на концерт Басты".
По первой части полностью согласен, я это упоминул в статье, но есть нюанс:
1. При загрузке прайсов можно указать базовые условия, и индикативно они будет в диапазоне стат. погрешности
2. Поставщики на ценовых агрегаторах выставляются, как правило, с +/- одинаковыми условиями, их цена не является окончательной, а так же индикативной
3. При обмене данными между корпорациями (такой опыт у нас был), в систему загружается цена со всеми условиями
4. После выборки наиболее релевантных кандидатов работа закупщика значительно упрощается
p.s. ChatGPT и подобные ему рашают данную задачу с достаточно низким уровнем качества, мы проверяли их несколько раз, крайний раз я лично тестировал Deepseek
Если на рынке появится контрагент с более выгодным предложением – система это заметит. При этом система берет только те ценовые источники, которым доверяет компания.
У доверенного контрагента после инвентаризации склада может найтись цементная смесь, у которой срок годности остался 1 месяц. Они поставят на неё цену на рубль дешевле самого выгодного предложения на рынке и ваш ИИ самым первым закупит этот залежавшийся товар? Вместо того, чтобы купить на заводе, который торгует с конвейера.
В данном конкретном случае система не пропустит предложение по причине аномально низкой цены, в любом случае, как и писал выше, финальное решение будет за закупщиком.
Обращаю внимание, что данная система не стремится полностью заменить человека, но она может сделать за него 80-90% "грязной работы"
Экономим месяцы работы: зачем мы научили ИИ актуализировать цены ТМЦ