Как стать автором
Обновить

Как технологии ABBYY помогают улучшить работу систем обнаружения утечек данных

Время на прочтение 10 мин
Количество просмотров 9.6K
Всего голосов 34: ↑33 и ↓1 +32
Комментарии 7

Комментарии 7

Вот так разведчики и палятся. Место рождения в немецкой транскрипции, а фамилия Stierlitz в английской.
Что-то выдавало в Штирлице шпиона — не то нездешний взгляд, не то английская транскрипция в паспорте.
Еще в далеком 2008 году, сингапурская компания Hiperware реализовала подобную систему

Осталось подобные технологии довести для видео.
КДПВ зачет!

А ещё для запароленных архивов.
Кстати, интересно, а повёрнутые на произвольный угол документы FineReader Engine распознаёт?
OCR чувствителен к повороту символов, поэтому в продукте есть предобработка изображения для компенсации такого рода искажений перед распознаванием.
Что касается задачи классификации, в FineReader Engine входят и текстовый, и графический классификаторы. Последний можно обучать на исходных изображениях без компенсации поворотов и перекосов, тогда и в боевом режиме для успешной классификации предобработка не потребуется.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий