Как стать автором
Обновить

Комментарии 19

Мне понравилось, спасибо, дам ссылку на вашу статью своей ИИ помощнице и спрошу можем ли мы сделать похожее! Подпишусь на ваш ТГ.

То есть один ИИ генерит формы, другой их заполняет.
А они сами между собой бестолковые договориться?
Обязательно программист нужен?

один ИИ генерит формы, другой их заполняет.

Скрытый текст

*не генерит, сканирует
да, как я написал, способов заполнять word ИИ пока вразумительных нет. Может Microsoft очухается и сделает что то подобное

Вы больше похожи, на копипастера реддита. Макрос для ворда с функционалом шире аналогично состоит из 32 строк. И что важно - все остается внутри, а вы раздаете личные данные в космац. Страшно от таких 2разработчеков2

У вас есть подозрения, что хотя бы для одного человека не Земле эти данные еще не известны облакам? Это что нужно делать вообще? Не пользоваться интернетом, телефоном, не иметь паспорта, ничего не покупать за пластик и не попадать на спутниковые снимки, камеры. Ходить в шапочке из фольги?

Мненечегоскрывателям я предлагаю установить веб‑камеру (с трансляцией в Интернет, конечно же) в туалете (а для к‑к-комбо — ещё и в спальне). Вы же там не бомбу собираете?

Ожидание: ИИ решит проблему рака и импотенции!
Реальность: ИИ заполняет форму 9573302-ЖО в пятнадцати экземплярах.

От рака нервной системы какого-то госслужащего может и спасет)

Ну в общем то сейчас все прорывы в излечении от рака делаются с помощью ии, сейчас вообще вся наука ии использует.

сейчас все прорывы в излечении от рака делаются с помощью ии

Невидимые?

Если задача в том, чтобы автоматизировать заполнение документов для которого есть заранее известный шаблон и заранее полученные данные, то зачем тут нейронка? Давным-давно существуют скрипты делающие это быстро и бесплатно (стоимость офиса и сбора данных не учитывается).
А если задача в том чтобы кто-то прочёл кучу документов и на основании полученной информации дал ответы на вопросы, то это нам не помешает, но вроде как это работа для промт-инжинера (или как сейчас заклинателя ИИ-систем называют)

Статья оставила такое же впечатление, будто кто-то на спецолимпиаде решал задачу максимально сложным способом.

Ну надо ж слона как-то продавать?

Да, задача состоит во втором. Действительно для промпт-инженера задача. Просто автоматизировал его работу до скрипта

Моника Фелула Геллер

Больше похоже на какой то челлендж, чем на реальную ситуацию. На написание и отладку всей этой ерунды ушло больше времени чем это заняло бы по старинке. Хотя чему удивляться, у меня был похожий случай. Приехали с России 5 программистов и стали заполнять документы на устройство на работу. В итоге зачем-то полезли в код (и даже драйвера принтера) и начали писать скрипт вместо того, чтобы за 5 минут в 3 документа закопипастить свои данные. В общем своя альтернативная логика.

Не понял хейтеров, мне сама идея кажется очень полезной. Реализация - ну ХЗ, на любителя.

Мне часто надо заполнять всякие бумажки данными типа серия номер паспорта, кем когда выдан, реквизиты счета, бла-бла. Пока таких документов 1-2 норм и руками. Когда их 25 - задалбывает. Так они ещё вечно все в разном оформлении - то там нормально сделаны места для вставки, то прочеками отбито, то блин подчёркнутые пустые символы...

Тоже себе сделал похожую историю. Только rag тут лишний. У меня получился другой алгоритм:

  • Из файла получаю текст (только это сразу в виде вебстранички - кидаю файл в нее)

  • В тексте языковая модель ищет все места "похожие" на то, что надо заполнить, делает список: описание что там надо, точный текст для копипаста того фрагмента, который потом надо заменить

  • Первая часть списка снова отправляется в языковую модель, вместе со всеми данными которые у меня есть - паспорт, ИНН, реквизиты... (модель работает локально, мне пофиг на токены). На входе я в пару кликов выбираю за какого человека я заполняю - просто из 100 документов с готовыми данными выбирается один. По сути я тут заменил rag ручным выбором. Данных по человеку не так много, в лимит токенов влезть вообще не проблема.

  • Результат получается в виде json - точная строка которую надо менять и на что менять.

  • Через docx.js меняю одно на другое.

  • Алерты на случай если чего-то не нашлось или криво заполнилось сделал снова через языковую модель - отправляю туда файл уже после замены и прошу проверить на правильность заполнения и отсутствие пустых мест.

Из минусов, с которыми не хочу разбираться - если нафигачили многострочное "поле" с кривыми разрывами (то новая строка, то разрыв) или как-то ещё намудрили, то в таких местах приходится ручками дочищать. Но я закидываю файл и через минуту у меня заполненный, а в интерфейсе горит восклицательный знак, если есть подозрения на косяк. Проверить все равно надо все, но лишний раз обратить внимание полезно.

Ну и отдельно лучи поноса тем кто в оформлении таких шаблонов допускает всякие косяки. Например был недавно файл - там были прочерки, но весь файл 14м шрифтом, а пропуски, блин, 1м. Зачем - в душе не понимаю. Разумеется моя тупая схема тут ломается нахрен.

Кода не будет, я сам себе кодил, костыль на костыле. Стыдно такое показывать )) Но с задачей справляется.

Ооо круто. Интересный вариант. Спасибо что поделились
В целом я согласен, что RAG может быть излишним - в современные модели щас на вход можно целиком с десяток документов ссувать.
С оформлением документов вас прекрасно понимаю - постоянно с косячной разметкой сталкиваюсь. Поэтому этот этап оставил человеку на ответственность от греха подальше 😅

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации