SmartEngines 28 фев 2023 в 14:51

Распознавание корпоративных документов: как не утонуть в море бумаг?

7 мин

2.9K

Блог компании Smart EnginesОбработка изображений*Искусственный интеллектПодготовка технической документации*

Обзор

Комментарии 10

kolabaister 28 фев 2023 в 19:11

А цены вы не публикуете принципиально?

Всегда удивляет такая политика. Для меня если у продукта нет цены значит он не продается и страницу можно закрыть и забыть.

SmartEngines 1 мар 2023 в 11:17

Добрый день! Цены на сайте мы действительно не публикуем. Информацию о стоимости наших продуктов мы предоставляем по запросу. Но ваша позиция нам понятна.

OBIEESupport 1 мар 2023 в 02:25

Не, вы это все серьезно? Картинка распознается где? В смартфоне за 2 секунды? Любым почерком? Изображение попадает в файловую систему телефона? А сертификат ФСТЭК на случай обработки персональных данных у вас есть? Или, еще пассаж 2 оператора/100 тыс. документов. Так это же электронный документооборот! Вручную 25 окошек налоговой стригут 2 миллиона документов в год при 8 часовом рабочем дне и только радуются такой нагрузке. Их же из-за этого не сокращают и не увольняют за косяки - это же рукописный ввод, но в бланках.

klimkinMD 1 мар 2023 в 11:05

Интересно, нужен ли сертификат ФСТЭК на ведение списка контактов в своëм телефоне?

OBIEESupport 3 мар 2023 в 17:01

1 марта 2023 года

1 марта 2023 года вступают в силу ч. 8-10 ст. 10 закона «Об информации, информационных технологиях и о защите информации».

Закон устанавливает запрет для ряда российских организаций на использование иностранных мессенджеров (принадлежащих иностранным лицам информационных систем и программ для ЭВМ, которые предназначены и (или) используются для обмена сообщениями исключительно между их пользователями, при котором отправитель определяет получателей сообщений и не предусматривается размещение интернет-пользователями общедоступной информации в интернете).

По состоянию на 1 марта 2023 года к таким сервисам могут быть отнесены:

1. Discord;

2. Microsoft Teams;

3. Skype for Business;

4. Snapchat;

5. Telegram;

6. Threema;

7. Viber;

8. WhatsApp;

9. WeChat.

Просим российские организации учитывать новые обстоятельства при планировании своей деятельности.

SmartEngines 1 мар 2023 в 12:21

Да, все абсолютно серьезно. Изображение документа на телефоне может распознаваться быстрее 2 секунд. Например, разворот паспорта распознается на кадре за 0,15 секунды, а счет на оплату на фотографии - менее чем 1,5 секунды. Вы можете сами попробовать наше распознавание, установив демо-приложение Smart Engines. И убедиться в том, что решение не требует сетевого соединения, переключив смартфон в авиарежим.

По поводу вашей ремарки о распознавании почерка. В этой статье речь идет о документах с печатным и рукопечатным заполнением. Вся обработка с помощью нашего ПО ведется в оперативной памяти устройства. Вопросы хранения файлов и распознанной информации лежат за рамками нашего ПО.

Мы никогда не получаем от наших клиентов изображения и данные на обработку, поэтому нам (как компании) никакие сертификаты на обработку персональных данных не нужны. Поэтому мы не являемся оператором персональных данных, мы разработчики ПО. А вот наши клиенты, которые интегрировали наши SDK в свои мобильные или серверные приложения, безусловно, должны выполнять все необходимые требования по обработке персданных.

OBIEESupport 3 мар 2023 в 16:58

Я тоже не первый год с распознаванием. Скорость чем-то и как-то должна достигаться. Откройте любую мою статью про AI на этом сайте - везде сверху будет написано на какой ОС, какими библиотеками и какими ресурсами все распознается. Так как мобильных случаях - это не менее важная бизнес-критическая информация (хотя бы для планирования нагрузки на сотрудников), которая в статье отсутствует.

Далее, в 2008-2010 для ряда крупнейших банков мы (то есть компания, которую я представляю на этом ресурсе) делали стационарный аналог вашей библиотеки по типу архитектуры: шаблон документа + скан ручной/планшетный = текстовый файл с досылкой в ИС-приемник. Лицензия ABBYY за ядро распознавания тогда обошлась на рабочее место вменяемых денег. На 100 000 мест - практически даром.

Опять же, что вы продвигаете? Если вы пишете под государственные мобильные ОС на java, то достижение явно запоздало. Не исключаю,что вы сможете попасть в государственные каналы дистрибуции, если корректно отнесетесь к регулятивным документам.

Важно же понимать: вдруг вы научились работать с быстрой арифметикой на любых мобильных видеокартах и любых ядрах SoC, то, опять же, такие решения на Котлин известны лет с десяток. Предполагаю, у основных вендоров телефонов давно есть свои библиотеки AI только для своих телефонов, а на других моделях будет торможение - в статье же этого не видно. А вы спокойно из исходного кода собрали некий промежуточный вариант, о чем и хотели сообщить Хабру в этой статье.

SmartEngines 3 мар 2023 в 22:25

Спасибо за ваши комментарии, однако мы все еще не до конца понимаем, какую информацию вы бы хотели от нас получить ?

"Какими библиотеками и какими ресурсами все распознается" - наша компания - вендор систем распознавания, которые мы разрабатываем много лет сами. Мы производим не приложения, а непосредственно библиотеки распознавания документов, и их лицензируем. Про наши научные исследования, используемые нами алгоритмы и разрабатываемые нами библиотеки мы давно и много пишем на хабре. Эта статья - про то, где можно применить нашу библиотеку Smart Document Engine для распознавания корпоративных документов.

Из мобильных ОС наши библиотеки поддерживают Android, iOS и ОС Аврора, из серверных ОС - Windows, MacOS, и производные Linux, также у нас есть модуль WASM для работы в браузерах. Видеокарты мы в своих библиотеках не используем, нашим алгоритмам (включая наш инференс сетей) достаточно CPU. Производительность, конечно, зависит от характеристик и количества ядер, и одно из первых действий, которые делают наши клиенты - это замеры скорости работы на том "железе", на котором предполагается использовать наше ПО.

Мы не поняли ваш комментарий про "государственные мобильные OC на java" и какие-то "каналы дистрибуции". Продвигаем мы наши библиотеки распознавания, которые не являются для нас "промежуточным вариантом" - для нас это наш основной продукт.

OBIEESupport 4 мар 2023 в 00:31

Коллеги! А вы, наверное, как раз те, кто мне и нужен для консультации. Я все прочитал, что смог найти. Подскажите, а устройства "для дома и семьи" - не делаете? У вас есть устройство: https://www.ofitrade.ru/cat/scaners/docs/schityvatel_dokumentov_videoskaner_smartpassport_box_ver_2/ Чего будет стоить образец такого устройства, чтобы его можно было дать детям в руки, формат А4 и больше (по формату издающихся нотных изданий). У меня есть на примете хорошее сканирующее приложение, но таскать с собой сканер типа вашего в садик и школу, на природу пользователям не с руки. А изображение с телефона мой распознаватель почти не берет - ноты требуют очень равномерного освещения и минимум 300dpi по обеим измерениям. Если просто сделаете такое устройство на продажу - покупатели будут.

energo_2000 6 мар 2023 в 11:52

В Казахстане по бухдокументам уже почьи везде электронно, через госсервера.

Накладные и счетфактуры не нужны бумажные.

При растаможке, мы заводим товар в номенклатуру, а потом она последовательно кочует другим покупателям, им вручную чаще всего не надо ничего вбивать.

Т.е уэе на этапе организации системы нет геобходимости вводить печатные доки

Зарегистрируйтесь на Хабре, чтобы оставить комментарий