И зачем тогда нужны сертификации, подписи драйверов и т.п.
Да и когда 1-2 производителя вылетают — можно согласиться, а когда половина производителей печатного оборудования — тут уже и вопросы возникают… Не доведут индусы MS до добра
Читаю на упаковке
Мышь компьютерная… Hyper-X
Производитель — Kingston Technology Corp…
Ниже… Все торговые марки принадлежат Kingston Technology Corp…
Мне фиолетовы ваши внутренние игрища, но рисую еще один минус себе — вместо признания проблемы и вынесения выговора с занесением в грудную клетку отличившимся — «Моя хата с краю, ничего не знаю»…
А на форуме техподдержки HyperX — уже полгода ответ — подождите чуть-чуть… Интересно, если разработчикам недософта предложить зарплату чуть чуть (полгода) подождать, что будет…
И кстати еще вопрос — если на упаковке указано
Minimum System Requirements — W7,8,10, в этих системах периферия должна работать с полным функционалом, или нет? Если да — почему софт (которого до сих пор нет) только для Winstore? На коробках уже кто знает сколько пишется про ПО Ngenuity 2, а есть только непонятная бета…
Боюсь, как бы потом от вас не услышать — Контроллер SSD не кингстон а Физон, микросхемы памяти — Hynix/Samsung/Micron — к ним и обращайтесь…
Не знаю, какая поддержка у накопителей, но столкнувшись с последними версиями недософта Kingston для мышей и клавиатур HyperX мое мнение о компании стало значительно хуже.
Может быть лучше все же заявлять о себе не бравурными релизами на Habre, а еще и как можно более безупречной работой всего того, что выходит под маркой компании?
О том, что и мы программисты, и менеджеры, и маркетологи решают одну задачу – создание успешного продукта/услуги.
Не смешите. Уже лет 15 наверное более правильно говорить — маркетологи решают задачу пропихивания всего того гуано, которое сотворили менеджеры с программистами.
Команда ABBYY постоянно работает над улучшением качества работы различных функций. Например, о применении нейросетей в ABBYY FineReader и об их преимуществах мы подробно рассказывали в этой статье. Надо отметить, что преимущества нейросетей могут быть малозаметны конечному пользователю при работе с отдельными типами документов или в каких-то специфических случаях.
Правдивее было-бы написать — преимущества НИ будут заметны только отдельным пользователям, работающим со специфичными документами. Оставьте эту постоянную ересь про качество в профессиональном сообществе. Я слышу её постоянно, а потом как ниже читаю, что какая-то функция сломалась, не работает и её никто не собирается исправлять (вот кстати пример file.sampo.ru/s66qjn). Кстати — может дадите ссылку на набор документов, на котором FR демонстрирует стабильное повышение качества распознавания уже 1Х версий? О каких настройках с машинкой вы говорите, когда у Вас вообще одна настройка? Или предлОжите создать отдельные наборы глифов для всех машинок, которые тогда использовались для печати документов? Так даже эта работа была организована у Вас через одно место — подтверждать КАЖДЫЙ глиф(!!!). Может уже что-то изменилось, но что мешало создать библиотеку глифов по распознанному документу, которые бы пользователь мог просто сгруппировать по буквам.
Так как подобные простые запросы возвращают множество релевантных результатов...
2. Интересно, насколько дешевле было бы обучение пользователей хитростям построения запросов?
Про блоки мы рассказывали на Хабре. Наши технологии ОСR развиваются, в настоящий момент доступно распознавание документов на 192 языках на основе кириллицы, латиницы, греческого, армянского и арабского алфавитов, а также языках на основе иероглифического письма
Зачем рассказывать — если можно взять любую версию — подсунуть ей простой двухколоночный текст и на 200-400 страницах в зависимости от оформления найти 5-10-20 страниц с неверно расставленными или пронумерованными блоками… Подсунуть неразлинованную таблицу с многострочным текстом в ячейках и увидеть, как ФР разобъёт ячейки строками таблицы…
Проблема объединения слов, концы которых находятся в разных сегментах до сих пор не решена… Про то, что эти блоки могут быть разбиты номерами страниц/колонтитулами, или вклейками особо талантливых DTP-стов — вообще молчу… Полагаю — если в Энергомаше для поиска будут специально выбирать строки, части которых находятся в разных блоках распознавания, вам могут сделать очень больно…
Про распознавание разреженных чертежей и спецификаций — лучше промолчу. Но тут я не знаю пути решения кроме рук — разве может по непохожести картинок на буквы на уменьшенной копии изображения сразу отсекать графику и искать текст дальше…
Вы распознаёте простые глифы — по языкам их разносит простой просмотрщик набора глифов на алфавитах указанных пользователем языков по словарям — не самая передовая технология (помню баги сей простой системы на похожих словах — campana (it) — сатрапа (ru), car (EN) — саг (RU) и т.п. Алгоритм отчасти улучшен — но не идеален. НЕ ПРОЩЕ ЛИ СПРОСИТЬ У ПОЛЬЗОВАТЕЛЯ ПО ПОВОДУ ТАКИХ СЛОВ, если работа не на чистом автомате или выводить где-то в интерфейсе список предупреждений?..
Во всё остальном — КРОМЕ ДОБАВЛЕНИЯ ЯЗЫКОВ — НЕ ВИЖУ НИКАКИХ РЕЗУЛЬТАТОВ УКАЗАННОЙ РАБОТЫ.
В массовых сценариях задачи распознавания рукописного текста встречаются редко.
Это даже не смешно… Тут вон недавно про паспорта выписанные вручную говорили… О том, какое количество разных бланков, заполненных вручную, регулярно распознаётся, я вообще молчу…
Многие наши продукты поддерживают возможности кастомизации на стороне пользователей, в том числе, в части использования пользовательских словарей. Что касается вопроса открытости, недавно мы опубликовали на GitHub свою библиотеку машинного обучения с открытым кодом. Подробнее недавно рассказывали о ней на Хабре.
Принципы работы с пользовательскими словарями реализованы у вас отвратительно — я бы сравнил их с аналогией копания небольшого бассейна на даче игрушечным детским совочком. До сих пор не понимаю отсутствия функции — исправления неверно распознанного несловарного слова по всему документу/пакету FR (точно так же как и извлечения из пакета списка несловарных слов для проверки и обратного исправления по списку — если нужно быстро исправить текст)?
Касательно библиотеки — вообще перестаю понимать Абби — в потребительских продуктах — развитие в сторону для одноклеточных, а тут вдруг выкладываете библиотеку для пользования которой требуются хорошие навыки программирования и понимания принципов работы библиотеки (дай Бог, чтобы они были подробно задокументированы с примерами)…
Совместимость с предыдущими версиями, действительно, сложный вопрос с точки зрения развития продуктов. В рамках сотрудничества с клиентами и партнерами мы обсуждаем различные вопросы развития наших продуктов и реализации новых возможностей.
Автокад, судя по размеру, продукт более сложный, но тем не менее позволяющий сохранять в последней версии чертежи в форматах первых версий. Что Вам мешает — уже лет 10 не могу услышать конкретного ответа.
все это доступно сразу после установки продукта, и не требует изучения документов заказчика.
Я так понимаю — то, что работает без подстройки под реальные условия — обычно работает плохо или средне, крайне редко хорошо и никогда отлично. Это статья о том, что кто-то купил и поставил вашу программу/программно-аппаратный комплекс, или что тогда там делали ваши специалисты?
На время создания индекса влияют следующие факторы:
Каким образом контролируются операции? Учитывая то, что для нормального распознавания чертежей, сложноформатированного текста движку ФР до сих пор надо ВРУЧНУЮ РАЗМЕЧАТЬ ДОКУМЕНТЫ ИЛИ ИСПРАВЛЯТЬ БЛОКИ (тетрис-блоки на многоколоночном тексте, неверная нумерация блоков, захват колонтитулов и номеров страницы в блоки текста, проблема с разбивкой на ячейки таблиц — и это проблемы критичные для полноты поиска), ФР до сих пор отвратительно распознает в тех литературе курсивные обозначения на латинице и греческом (и НЕЛЬЗЯ НИГДЕ НАСТРОИТЬ, ЧТОБЫ КУРСИВ В ПЕРВУЮ ОЧЕРЕДЬ РАСПОЗНАВАЛСЯ ЛАТИНИЦЕЙ ИЛИ ГРЕЧЕСКИМ) результат может очень неприятно удивить заказчика.
И это я не трогаю пока дефекты сканирования…
1. Много лет назад я слышал нечто подобное про Finereader — особенно про постоянное улучшение качества. Вот только улучшения основной функции нет уже лет так 15… Преимущества нейросетей в последней версии как-то особенно незаметны…
2. Оценки релевантности простого запроса «Отчёт» у главного конструктора и главного бухгалтера будут разными. Вы на что ориентируетесь? (и как вариант новой функции — подстройка релевантности в зависимости от должности пользователя)
3. Ваша ОCR уже научилась более менее правильно расставлять блоки на сложных документах и распознавать и распознавать рукописный текст в старой КД? Не заметил. Скажите, где посмотреть?
4. Закрытость форматов ваших программ (словарей в OCR), традиционное отсутствие поддержки экспорта в предыдущие версии — серьёзная причина очень настороженно подходить к сотрудничеству с Вами.
5. Вторая причина — если память не изменяет — Abbyy — формально американская компания… При внедрении таких систем на важных предприятиях наверняка может произойти утечка данных… Какие гарантии её исключения? (особенно в свете свежей истории с Амазоном)
6. Не заметил про скорость (пере)индексирования.
7. Очень хотелось бы потом увидеть в финансовых цифрах реализацию целей Энергомаша с вменяемыми критериями оценки достижения целей в денежном выражении и сроками окупаемости, с учётом стоимости поддержки.
8. PS. Интересует вопрос устранения багов /допиливания заброшенного ABBYY Aligner в частном порядке. Люди, знающие концепцию программы и заложенные в ней алгоритмы, еще не посваливали в мир иной?
И последнее — о смысле: Слов — F — это показатель, а не мера; Текста — если объяснение не понятно даже ребёнку, значит сам автор не понимает то, о чём пишет.
ИМХО — преимуществ видимо два: 1) иностранцы работать с русским так хорошо, как русские, никогда не будут. 2) курс рубля к евро и доллару…
1. Сравнивать некорректно — Согласен. Но тут мы рассматриваем конкретную функцию. Насчёт функционала и использования — ОО используется чаще, значит, чтобы побить его на каком-то поприще, надо предложить лучший функционал за меньшие деньги… Для Вас тут проблема в том, что ОО бесплатный…
2. Вы рассуждаете как теоретик. Посмотрите цветные чертежи в Ридере и той же Суматре… Вас ждёт масса чудных открытий. А про одинаковость показа файлов, если в системах отсутствуют шрифты из них, а глифы не встроены в PDF, я вообще молчу (вспоминая знатную проблему FR8 использования моноширинного курьера для данной цели из-за чего в импортированных картинках буквы налазили друг на друга и получалась откровенная жесть — а ведь должно показывать одинаково?)
3. В чём смысл затруднять доступ к данным в любой задаче? Любые затруднения требуют ресурсов на их преодоление. А когда затруднения создаются самостоятельно а потом героически преодолеваются — почитайте Мифы и легенды Древней Греции — про Сизифа.
4. Странно, почему Autodesk, MS, Adobe — поддерживают обратную совместимость с некоторыми ограничениями, а у АББИ прям супер пупер технологии, в которых это невозможно?
5. Вы уже 10 лет как-бы работаете — только простым пользователям результаты работы в плане основного функционала не заметны. В последнем FR вы заработались настолько, что у вас даже некоторые русские надписи в интерфейс не влезают. Идёте по пути MS — пусть страдают пользователи? Я уже писал одному вашему коллеге, что 15 версия распознаёт хуже 8. Распознавание текста с ударениями и невозможность их убрать при экспорте средствами FR, т.к. другой софт обычно просто не понимает такой текст, как простой русский, просто подчёркивает НИЖАЙШИЙ уровень понимания разработчиками собственной программы и путей её использования.
По поводу повышения качества OCR:
1. Не смешите… Именно в этом отношении у вас явный регресс, если под качеством OCR рассматривать безошибочность макетирования и распознавания… Наверное нейросеть ещё плохо обучена…
2. Не могу понять — почему не используется фоновая рекурсия (в плане проверки/перераспознавания страниц ниже/далее) при исправлении характерных ошибок или добавлении новых слов в словарь?
3. Слабое взаимодействие программы с пользователем, там где сбоят её алгоритмы, тоже будет барьером на пути улучшения.
4. Предложу функцию автоматического исправления слов по частотности встречи словосочетаний в поисковике (для неконфиденциальных документов).
5. И облегчите работу с программными словарями, раз вы сами их не особо пополняете — импорт слов со словоформами из словарей HSpell, добавление новых слов со словоформами, как в Орфо.
6. Основная работа с ПДФ? Вы вроде русский — знаете какая есть большая проблема с ПДФ? Куча ПДФ наделанных в старом адобошлаке с непонятными кодовыми страницами, в которых не работает ни поиск, ни копи-паст. Что-то не вижу функции автоматического исправления таких документов?
Также не вижу расширенных средств редактирования на уровне обычного редактора?
7. Распознавания формул, которое уже даже другие на технологиях Абби сделали, от Абби мы видимо никогда не дождёмся…
В принципе суть понятна, а теперь объясните три простых вещи:
1. Чем FR15 лучше для создания таких форм чем бесплатный ОО? Возможностью скопировать, быстро распознать и переделать чужую форму?
2. На стороне клиента — чем такие формы, кроме наглядности и необходимости тяжеловесного Адоб ридера (ибо простые гляделки не поддерживают заполнение форм) лучше простой текстовой формы, которую можно заполнить на коленке в любой ОС, и гляделки (можно даже серверной), с помощью которой такую форму можно просмотреть в отформатированном виде, проверить на правильность по каким-то простым правилам и исправить, при необходимости?
Про размеры простых текстовых файлов в сравнении с ПДФ и пропускной способностью каналов и разных служб, принимающих формы — вообще молчу. Зашифровать можно любой файл — чем меньше, чем проще и быстрее.
В очередной раз у Абби — как у Виктор Степаныча — Хотели как лучше, а получилось как всегда…
Поставьте вы во главу угла простые принципы:
1. Данные для обработки/передачи, если не требуют защиты, должны иметь МИНИМАЛЬНО достаточный размер и самую широкую поддержку другим софтом, включая манипуляции с ними… (размер/структура пакета FR, возможность обработки в стороннем приложении — Пайнтдотнет, Кромсатор, Скантайлор, Фотошоп для особо талантливых/ быстрого реимпорта отдельных страниц пакета).
2. Действия, сделанные в программе пользователем, должны без проблем переноситься вперёд и НАЗАД по версиям...(Я так понимаю, по Аббийской традиции, FR14-12 пакеты FR15 c расставленными блоками экспортировать не могут)
3. Программа должна иметь минимальный размер и ЗАГРУЖАТЬСЯ И работать на одном железе ЗАМЕТНО быстрее старой версии. Сравнивая размер и функционал 8 и последующих версий — размер FR растёт в разы быстрее…
4. Программа от версии к версии должна делать лучше свою основную работу, а не растекаться по смежным областям, где нужно конкурировать со сторонним софтом, гораздо лучше заточенным на сторонние функции.
5. Такие вещи надо описывать детально в Справке/Преимуществах новой версии, а не на маргинальном для большей части простых пользователей Хабре.
О начали появляться программы по выковыриванию информации из информационного шума…
Какова полезность программы для реального сектора? Не проще и дешевле послать человека типа Бабича разузнать всё на месте по интересующему вопросу? (Реальный сектор обычно не гонится за 110 зайцами)…
И какие преимущества может дать программа, если, по сути, она выдаёт всем одну и ту же информацию из одних и тех же источников, часто дублирующих друг друга?
Каким образом программа работает с фейками? Зная её алгоритмы появляется хороший способ манипулировать сознанием трейдеров компании, используюшей программу… Вы же за это ответственности не несёте, я правильно понимаю?
Работает ли программа с кэшами поисковиков (случаи подчистки информации совсем нередки)? Или как она работает с быстро исчезающими новостями?
Опыт телеграмм каналов, типа Незыгаря, показывает что важная информация часто сначала появляется там, а потом тиражируется СМИ — что тут может предложить программа и чем её обширный но по сути пустой анализ лучше инсайда?..
Кстати, не знаю с китайским работает программа или нет, но было бы очень интересно в качестве доказательства демонстрации возможностей технологии рассмотреть параллельную картину эпидемии, развёртывающейся в Китае по официальным и неофициальным источникам?
Речь не об инвестициях — речь об оплате конкретной разработки. Как показал кризис коммерческие структуры и являются основными потребителями/прожирателями бюджетных денег.
Пока не встречал бизнеса, у которого настолько остро стоит данная проблема, чтобы он готов был оплатить её решение собственными средствами. Неужели еще остались регионы, где большинство паспартов рукописные?
Понял. Только во всех этих местах ввод данных паспорта занимает меньшую часть времени оформления билета/договора. Загруженности указанных клерков я тоже особенно не вижу…
В принципе из указанных областей применения лично меня больше задевало время продажи ж.д. билетов в системе Экспресс. Вот бы её как-то оптимизировать для ускорения.
К тому же для работы с иностранными паспортами гораздо чаще полезна поддержка некириллического алфавита и спецсимволов, а также хорошее знание особенностей языка — например несочетаемых/чрезвычайно редко сочетающихся букв (иероглифов и т.п.)
При том, что, ИМХО, заказчиком подобного приложения может быть только госструктура и за бюджетные деньги…
Интересно — а с рукописными паспортами за границу пускают?
Что касается практической годности — тут тоже есть большие сомнения. С рукописными паспортами не сталкивался лет 20, если не 25.
Поскольку деньги бюджетные — считаю проще было бы потерпеть до замены последних рукописных паспортов, если речь не идёт о какой то региональной аномалии.
Распознавание рукописных паспортов — это частный случай задачи распознавания рукописного текста. Найдя частное решение проблемы, для математиков и физиков вполне естественно искать общее решение
Скажем так, решение задачи ребятам сильно облегчил ограниченный набор данных, требующих распознавания, и, в целом, ОТНОСИТЕЛЬНО ХОРОШИЙ ПОЧЕРК ЛИЦ, ЗАПОЛНЯЮЩИХ ПАСПОРТА ВРУЧНУЮ, т.е. можно сказать, что вместо реального 5-го приближения, как говорят физики, проблема решена в нулевом…
Серьёзно оценивать практическую годность технологии, наверное, можно было бы по выборке из х00-х000 студенческих конспектов по разным предметам, различных анкет, где шрифт налагается на надписи самой анкеты и т.п…
Одно время (лет так несколько) регулярно пил только дистиллированную воду. Никаких проблем…
По литературным данным в местах концентрированного обитания долгожителей вода очень слабоминерализованная, особенно солями жёсткости.
П. Брэгг в своих работах тоже рекомендует пить дистиллированную воду…
Касательно органолептики — всё на любителя…
Поэтому не пишите ерунды…
Прогнал на небольшом примере из книжки Гетлина Petroleum Engineering
ИМХО!!! по качеству по убыванию DEEPL, LINGVANEX, GOOGLE…
Сходство LINGVANEX и DEEPL очень большое — выше 90% что заставляет задуматься…
Замечания по декстопному приложению…
1. В очередной раз приходится повторять прописное — гораздо удобнее выбирать направления перевода из небольшого списка настроенных, нежели в двух длиннющих списках языков, если конечно апп рассчитан на профессионалов, а не случайных любителей…
2. Сам характер аппа с вертикальным разделением — скорее любительский. 99% переводчиков (судя по скринам в вопросах на форумах) использует вертикальное табличное разделение. Такое разделение позволяет также контролировать сегментирование оригинала, если это не сплошной повествовательный текст.
3. Объём перевода за один запрос навскидку раза в 2-3 меньше, чем в Google и DeepL. Это как-то отбивает дальнейшее желание цицкаться.
4. Интеграция со словарём — хорошо. Но эргономика отвратительная. Выделив слово в оригинале в контекстном меню нет «искать в словаре» (про хоткеи тоже не нашёл). Словарь автоматом не переключается на языки перевода — это фишка или как??? Черканите на мой_ник_минус_3года на майлру — сброшу свои предложения по улучшению Лингво и GD, которые я отсылал создателям.
По частому вопросу исправления терминов по всему тексту перевода при наличии такой функции и поддержки формата словарей DSL приложение наверняка найдёт своих поклонников.
5. Как вариант для расширения функционала — распознавание и пересчёт единиц — брит-СИ.
Не сижу я на указанных вами сайтах…
8) По поводу распознавания голоса на клиентских устройствах существенно повысить его качество может комбинированное считывание движения губ (чтение по губам). Не знаю почему это пока не реализовано в софте… Опять таки, чтение по губам наверняка заинтересует и некоторые госорганы…
FB выбросила MSQRD на помойку, а они с лицом плотно работали. Можете обсудить с ними идею стартапа — они ведь из Минска, как и вы.
Погоняю, что вы пока сделали — если увижу искру, сам вас найду…
Да и когда 1-2 производителя вылетают — можно согласиться, а когда половина производителей печатного оборудования — тут уже и вопросы возникают… Не доведут индусы MS до добра
Мышь компьютерная… Hyper-X
Производитель — Kingston Technology Corp…
Ниже… Все торговые марки принадлежат Kingston Technology Corp…
Мне фиолетовы ваши внутренние игрища, но рисую еще один минус себе — вместо признания проблемы и вынесения выговора с занесением в грудную клетку отличившимся — «Моя хата с краю, ничего не знаю»…
А на форуме техподдержки HyperX — уже полгода ответ — подождите чуть-чуть… Интересно, если разработчикам недософта предложить зарплату чуть чуть (полгода) подождать, что будет…
И кстати еще вопрос — если на упаковке указано
Minimum System Requirements — W7,8,10, в этих системах периферия должна работать с полным функционалом, или нет? Если да — почему софт (которого до сих пор нет) только для Winstore? На коробках уже кто знает сколько пишется про ПО Ngenuity 2, а есть только непонятная бета…
Боюсь, как бы потом от вас не услышать — Контроллер SSD не кингстон а Физон, микросхемы памяти — Hynix/Samsung/Micron — к ним и обращайтесь…
Может быть лучше все же заявлять о себе не бравурными релизами на Habre, а еще и как можно более безупречной работой всего того, что выходит под маркой компании?
Не смешите. Уже лет 15 наверное более правильно говорить — маркетологи решают задачу пропихивания всего того гуано, которое сотворили менеджеры с программистами.
Два простых числа называются близнецами если отличаются друг от друга на 2.
Примеры: 5 и 6, 11 и 13, 41 и 43.
Правдивее было-бы написать — преимущества НИ будут заметны только отдельным пользователям, работающим со специфичными документами. Оставьте эту постоянную ересь про качество в профессиональном сообществе. Я слышу её постоянно, а потом как ниже читаю, что какая-то функция сломалась, не работает и её никто не собирается исправлять (вот кстати пример file.sampo.ru/s66qjn). Кстати — может дадите ссылку на набор документов, на котором FR демонстрирует стабильное повышение качества распознавания уже 1Х версий? О каких настройках с машинкой вы говорите, когда у Вас вообще одна настройка? Или предлОжите создать отдельные наборы глифов для всех машинок, которые тогда использовались для печати документов? Так даже эта работа была организована у Вас через одно место — подтверждать КАЖДЫЙ глиф(!!!). Может уже что-то изменилось, но что мешало создать библиотеку глифов по распознанному документу, которые бы пользователь мог просто сгруппировать по буквам.
2. Интересно, насколько дешевле было бы обучение пользователей хитростям построения запросов?
Зачем рассказывать — если можно взять любую версию — подсунуть ей простой двухколоночный текст и на 200-400 страницах в зависимости от оформления найти 5-10-20 страниц с неверно расставленными или пронумерованными блоками… Подсунуть неразлинованную таблицу с многострочным текстом в ячейках и увидеть, как ФР разобъёт ячейки строками таблицы…
Проблема объединения слов, концы которых находятся в разных сегментах до сих пор не решена… Про то, что эти блоки могут быть разбиты номерами страниц/колонтитулами, или вклейками особо талантливых DTP-стов — вообще молчу… Полагаю — если в Энергомаше для поиска будут специально выбирать строки, части которых находятся в разных блоках распознавания, вам могут сделать очень больно…
Про распознавание разреженных чертежей и спецификаций — лучше промолчу. Но тут я не знаю пути решения кроме рук — разве может по непохожести картинок на буквы на уменьшенной копии изображения сразу отсекать графику и искать текст дальше…
Вы распознаёте простые глифы — по языкам их разносит простой просмотрщик набора глифов на алфавитах указанных пользователем языков по словарям — не самая передовая технология (помню баги сей простой системы на похожих словах — campana (it) — сатрапа (ru), car (EN) — саг (RU) и т.п. Алгоритм отчасти улучшен — но не идеален. НЕ ПРОЩЕ ЛИ СПРОСИТЬ У ПОЛЬЗОВАТЕЛЯ ПО ПОВОДУ ТАКИХ СЛОВ, если работа не на чистом автомате или выводить где-то в интерфейсе список предупреждений?..
Во всё остальном — КРОМЕ ДОБАВЛЕНИЯ ЯЗЫКОВ — НЕ ВИЖУ НИКАКИХ РЕЗУЛЬТАТОВ УКАЗАННОЙ РАБОТЫ.
Это даже не смешно… Тут вон недавно про паспорта выписанные вручную говорили… О том, какое количество разных бланков, заполненных вручную, регулярно распознаётся, я вообще молчу…
Принципы работы с пользовательскими словарями реализованы у вас отвратительно — я бы сравнил их с аналогией копания небольшого бассейна на даче игрушечным детским совочком. До сих пор не понимаю отсутствия функции — исправления неверно распознанного несловарного слова по всему документу/пакету FR (точно так же как и извлечения из пакета списка несловарных слов для проверки и обратного исправления по списку — если нужно быстро исправить текст)?
Касательно библиотеки — вообще перестаю понимать Абби — в потребительских продуктах — развитие в сторону для одноклеточных, а тут вдруг выкладываете библиотеку для пользования которой требуются хорошие навыки программирования и понимания принципов работы библиотеки (дай Бог, чтобы они были подробно задокументированы с примерами)…
Автокад, судя по размеру, продукт более сложный, но тем не менее позволяющий сохранять в последней версии чертежи в форматах первых версий. Что Вам мешает — уже лет 10 не могу услышать конкретного ответа.
Я так понимаю — то, что работает без подстройки под реальные условия — обычно работает плохо или средне, крайне редко хорошо и никогда отлично. Это статья о том, что кто-то купил и поставил вашу программу/программно-аппаратный комплекс, или что тогда там делали ваши специалисты?
Каким образом контролируются операции? Учитывая то, что для нормального распознавания чертежей, сложноформатированного текста движку ФР до сих пор надо ВРУЧНУЮ РАЗМЕЧАТЬ ДОКУМЕНТЫ ИЛИ ИСПРАВЛЯТЬ БЛОКИ (тетрис-блоки на многоколоночном тексте, неверная нумерация блоков, захват колонтитулов и номеров страницы в блоки текста, проблема с разбивкой на ячейки таблиц — и это проблемы критичные для полноты поиска), ФР до сих пор отвратительно распознает в тех литературе курсивные обозначения на латинице и греческом (и НЕЛЬЗЯ НИГДЕ НАСТРОИТЬ, ЧТОБЫ КУРСИВ В ПЕРВУЮ ОЧЕРЕДЬ РАСПОЗНАВАЛСЯ ЛАТИНИЦЕЙ ИЛИ ГРЕЧЕСКИМ) результат может очень неприятно удивить заказчика.
И это я не трогаю пока дефекты сканирования…
2. Оценки релевантности простого запроса «Отчёт» у главного конструктора и главного бухгалтера будут разными. Вы на что ориентируетесь? (и как вариант новой функции — подстройка релевантности в зависимости от должности пользователя)
3. Ваша ОCR уже научилась более менее правильно расставлять блоки на сложных документах и распознавать и распознавать рукописный текст в старой КД? Не заметил. Скажите, где посмотреть?
4. Закрытость форматов ваших программ (словарей в OCR), традиционное отсутствие поддержки экспорта в предыдущие версии — серьёзная причина очень настороженно подходить к сотрудничеству с Вами.
5. Вторая причина — если память не изменяет — Abbyy — формально американская компания… При внедрении таких систем на важных предприятиях наверняка может произойти утечка данных… Какие гарантии её исключения? (особенно в свете свежей истории с Амазоном)
6. Не заметил про скорость (пере)индексирования.
7. Очень хотелось бы потом увидеть в финансовых цифрах реализацию целей Энергомаша с вменяемыми критериями оценки достижения целей в денежном выражении и сроками окупаемости, с учётом стоимости поддержки.
8. PS. Интересует вопрос устранения багов /допиливания заброшенного ABBYY Aligner в частном порядке. Люди, знающие концепцию программы и заложенные в ней алгоритмы, еще не посваливали в мир иной?
И последнее — о смысле: Слов — F — это показатель, а не мера; Текста — если объяснение не понятно даже ребёнку, значит сам автор не понимает то, о чём пишет.
ИМХО — преимуществ видимо два: 1) иностранцы работать с русским так хорошо, как русские, никогда не будут. 2) курс рубля к евро и доллару…
2. Вы рассуждаете как теоретик. Посмотрите цветные чертежи в Ридере и той же Суматре… Вас ждёт масса чудных открытий. А про одинаковость показа файлов, если в системах отсутствуют шрифты из них, а глифы не встроены в PDF, я вообще молчу (вспоминая знатную проблему FR8 использования моноширинного курьера для данной цели из-за чего в импортированных картинках буквы налазили друг на друга и получалась откровенная жесть — а ведь должно показывать одинаково?)
3. В чём смысл затруднять доступ к данным в любой задаче? Любые затруднения требуют ресурсов на их преодоление. А когда затруднения создаются самостоятельно а потом героически преодолеваются — почитайте Мифы и легенды Древней Греции — про Сизифа.
4. Странно, почему Autodesk, MS, Adobe — поддерживают обратную совместимость с некоторыми ограничениями, а у АББИ прям супер пупер технологии, в которых это невозможно?
5. Вы уже 10 лет как-бы работаете — только простым пользователям результаты работы в плане основного функционала не заметны. В последнем FR вы заработались настолько, что у вас даже некоторые русские надписи в интерфейс не влезают. Идёте по пути MS — пусть страдают пользователи? Я уже писал одному вашему коллеге, что 15 версия распознаёт хуже 8. Распознавание текста с ударениями и невозможность их убрать при экспорте средствами FR, т.к. другой софт обычно просто не понимает такой текст, как простой русский, просто подчёркивает НИЖАЙШИЙ уровень понимания разработчиками собственной программы и путей её использования.
По поводу повышения качества OCR:
1. Не смешите… Именно в этом отношении у вас явный регресс, если под качеством OCR рассматривать безошибочность макетирования и распознавания… Наверное нейросеть ещё плохо обучена…
2. Не могу понять — почему не используется фоновая рекурсия (в плане проверки/перераспознавания страниц ниже/далее) при исправлении характерных ошибок или добавлении новых слов в словарь?
3. Слабое взаимодействие программы с пользователем, там где сбоят её алгоритмы, тоже будет барьером на пути улучшения.
4. Предложу функцию автоматического исправления слов по частотности встречи словосочетаний в поисковике (для неконфиденциальных документов).
5. И облегчите работу с программными словарями, раз вы сами их не особо пополняете — импорт слов со словоформами из словарей HSpell, добавление новых слов со словоформами, как в Орфо.
6. Основная работа с ПДФ? Вы вроде русский — знаете какая есть большая проблема с ПДФ? Куча ПДФ наделанных в старом адобошлаке с непонятными кодовыми страницами, в которых не работает ни поиск, ни копи-паст. Что-то не вижу функции автоматического исправления таких документов?
Также не вижу расширенных средств редактирования на уровне обычного редактора?
7. Распознавания формул, которое уже даже другие на технологиях Абби сделали, от Абби мы видимо никогда не дождёмся…
1. Чем FR15 лучше для создания таких форм чем бесплатный ОО? Возможностью скопировать, быстро распознать и переделать чужую форму?
2. На стороне клиента — чем такие формы, кроме наглядности и необходимости тяжеловесного Адоб ридера (ибо простые гляделки не поддерживают заполнение форм) лучше простой текстовой формы, которую можно заполнить на коленке в любой ОС, и гляделки (можно даже серверной), с помощью которой такую форму можно просмотреть в отформатированном виде, проверить на правильность по каким-то простым правилам и исправить, при необходимости?
Про размеры простых текстовых файлов в сравнении с ПДФ и пропускной способностью каналов и разных служб, принимающих формы — вообще молчу. Зашифровать можно любой файл — чем меньше, чем проще и быстрее.
В очередной раз у Абби — как у Виктор Степаныча — Хотели как лучше, а получилось как всегда…
Поставьте вы во главу угла простые принципы:
1. Данные для обработки/передачи, если не требуют защиты, должны иметь МИНИМАЛЬНО достаточный размер и самую широкую поддержку другим софтом, включая манипуляции с ними… (размер/структура пакета FR, возможность обработки в стороннем приложении — Пайнтдотнет, Кромсатор, Скантайлор, Фотошоп для особо талантливых/ быстрого реимпорта отдельных страниц пакета).
2. Действия, сделанные в программе пользователем, должны без проблем переноситься вперёд и НАЗАД по версиям...(Я так понимаю, по Аббийской традиции, FR14-12 пакеты FR15 c расставленными блоками экспортировать не могут)
3. Программа должна иметь минимальный размер и ЗАГРУЖАТЬСЯ И работать на одном железе ЗАМЕТНО быстрее старой версии. Сравнивая размер и функционал 8 и последующих версий — размер FR растёт в разы быстрее…
4. Программа от версии к версии должна делать лучше свою основную работу, а не растекаться по смежным областям, где нужно конкурировать со сторонним софтом, гораздо лучше заточенным на сторонние функции.
5. Такие вещи надо описывать детально в Справке/Преимуществах новой версии, а не на маргинальном для большей части простых пользователей Хабре.
О начали появляться программы по выковыриванию информации из информационного шума…
Какова полезность программы для реального сектора? Не проще и дешевле послать человека типа Бабича разузнать всё на месте по интересующему вопросу? (Реальный сектор обычно не гонится за 110 зайцами)…
И какие преимущества может дать программа, если, по сути, она выдаёт всем одну и ту же информацию из одних и тех же источников, часто дублирующих друг друга?
Каким образом программа работает с фейками? Зная её алгоритмы появляется хороший способ манипулировать сознанием трейдеров компании, используюшей программу… Вы же за это ответственности не несёте, я правильно понимаю?
Работает ли программа с кэшами поисковиков (случаи подчистки информации совсем нередки)? Или как она работает с быстро исчезающими новостями?
Опыт телеграмм каналов, типа Незыгаря, показывает что важная информация часто сначала появляется там, а потом тиражируется СМИ — что тут может предложить программа и чем её обширный но по сути пустой анализ лучше инсайда?..
Кстати, не знаю с китайским работает программа или нет, но было бы очень интересно в качестве доказательства демонстрации возможностей технологии рассмотреть параллельную картину эпидемии, развёртывающейся в Китае по официальным и неофициальным источникам?
Пока не встречал бизнеса, у которого настолько остро стоит данная проблема, чтобы он готов был оплатить её решение собственными средствами. Неужели еще остались регионы, где большинство паспартов рукописные?
В принципе из указанных областей применения лично меня больше задевало время продажи ж.д. билетов в системе Экспресс. Вот бы её как-то оптимизировать для ускорения.
К тому же для работы с иностранными паспортами гораздо чаще полезна поддержка некириллического алфавита и спецсимволов, а также хорошее знание особенностей языка — например несочетаемых/чрезвычайно редко сочетающихся букв (иероглифов и т.п.)
Интересно — а с рукописными паспортами за границу пускают?
Поскольку деньги бюджетные — считаю проще было бы потерпеть до замены последних рукописных паспортов, если речь не идёт о какой то региональной аномалии.
Серьёзно оценивать практическую годность технологии, наверное, можно было бы по выборке из х00-х000 студенческих конспектов по разным предметам, различных анкет, где шрифт налагается на надписи самой анкеты и т.п…
По литературным данным в местах концентрированного обитания долгожителей вода очень слабоминерализованная, особенно солями жёсткости.
П. Брэгг в своих работах тоже рекомендует пить дистиллированную воду…
Касательно органолептики — всё на любителя…
Поэтому не пишите ерунды…
ИМХО!!! по качеству по убыванию DEEPL, LINGVANEX, GOOGLE…
Сходство LINGVANEX и DEEPL очень большое — выше 90% что заставляет задуматься…
Замечания по декстопному приложению…
1. В очередной раз приходится повторять прописное — гораздо удобнее выбирать направления перевода из небольшого списка настроенных, нежели в двух длиннющих списках языков, если конечно апп рассчитан на профессионалов, а не случайных любителей…
2. Сам характер аппа с вертикальным разделением — скорее любительский. 99% переводчиков (судя по скринам в вопросах на форумах) использует вертикальное табличное разделение. Такое разделение позволяет также контролировать сегментирование оригинала, если это не сплошной повествовательный текст.
3. Объём перевода за один запрос навскидку раза в 2-3 меньше, чем в Google и DeepL. Это как-то отбивает дальнейшее желание цицкаться.
4. Интеграция со словарём — хорошо. Но эргономика отвратительная. Выделив слово в оригинале в контекстном меню нет «искать в словаре» (про хоткеи тоже не нашёл). Словарь автоматом не переключается на языки перевода — это фишка или как??? Черканите на мой_ник_минус_3года на майлру — сброшу свои предложения по улучшению Лингво и GD, которые я отсылал создателям.
По частому вопросу исправления терминов по всему тексту перевода при наличии такой функции и поддержки формата словарей DSL приложение наверняка найдёт своих поклонников.
5. Как вариант для расширения функционала — распознавание и пересчёт единиц — брит-СИ.
8) По поводу распознавания голоса на клиентских устройствах существенно повысить его качество может комбинированное считывание движения губ (чтение по губам). Не знаю почему это пока не реализовано в софте… Опять таки, чтение по губам наверняка заинтересует и некоторые госорганы…
FB выбросила MSQRD на помойку, а они с лицом плотно работали. Можете обсудить с ними идею стартапа — они ведь из Минска, как и вы.
Погоняю, что вы пока сделали — если увижу искру, сам вас найду…