Комментарии 13
Перепроверка не занимала много времени или она была частичная? Ведь по сути надо пройти по всем таблицам и перепроверить все данные.
На проверку теперь тратится всего 3-5 минут - это общее время или время работы LLM?
Что-то такое было уже )
А не проще оцифровать все по человечески, занести в базу, сверить и иметь железобетонно надежные данные? А то завтра что-нибудь в модели подкрутят, а потом мост где-нибудь рухнет...
Отличный вопрос — мы как раз с этого и начали. Год назад стартовали оцифровку и упёрлись в объём: сотни документов и таблиц. LLM работает как ускоритель: собирает параметры и всегда даёт ссылку на пункт ГОСТа, по которому технолог может перепроверить цифры. Модель подкрутят? Но правила и ссылки останутся, а модель можно заменить или перетюнить, не ломая саму методику
технолог может перепроверить
Перепроверит ведь? Энакин и Падме.jpg
Почему не оцифровать бумажные страницы как есть, целиком, с помощью той же LLM? Потом уже оцифрованные и проверенные человеком страницы точно так же давать на анализ LLM. Если работаете с графическими сканами, то тратите кучу времени на одни и теже операции - LLM при каждом обращении постоянно оцифровывает изображенние в текст. Если вы работаете с LLM через API, то просто выбрасываете кучу токенов на ветер.
Так-то за 14 дней таблицы из 20 документов можно было не напрягаясь перенести в базу данных и написать достоверно работающие запросы SQL.
Хороший кейс. Вообще есть большая проблема с переводом старой советской документации в электронный вид и обработки с помощью LLM. Хотелось бы иметь сразу такого агента, который напечатает деталь по старой конструкторской документации, которой полно. По моему опыту еще есть проблема с парсером pdf. Как можно быть уверенным, что встроенный в gpt справляется правильно. Не пробовали через внешний парсер? Там хотя бы посмотреть на качество можно
Как можно быть уверенным, что встроенный в gpt справляется правильно.
Только тестированием и сравнением, которые... показали что внешние парсеры делают больше ошибок
Хотелось бы иметь сразу такого агента, который напечатает деталь по старой конструкторской документации
Всё впереди! Пока пробовал обратную задачу. На вход LLM подавал pdf чертеж - на выходе получал параметры детали (внешний диаметр, высоту кольца и тп)

Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут