vlad2711 21 дек 2017 в 22:32

Чем распознавать на мобильных платформах?

3 мин

17K

Разработка мобильных приложений*Разработка под Android*Google Cloud Vision API*

+16

Комментарии 9

Zifix 22 дек 2017 в 01:26

Сейчас бы сравнить библиотеку OCR общего назначения с библиотекой CV общего назначения.

Тут я распознавал текст и было плохо, а тут квадратики, и было хорошо.

Серьезно? А оценка как формировалась, по субъективным ощущениям? Где примеры кода, где сравнительные тесты на одной и той же выборке?

ZaMaZaN4iK 22 дек 2017 в 14:27

Автор думаю даже понятия не имеет, чем отличается Tesseract от OpenCV. Кстати, следуя логике автора:

Мой совет: обходите её стороной. Наисана она на С++.

OpenCV тоже писан на крестах, и его тоже нужно обходить стороной.

Библиотеки абсолютно разного назначения: Tesseract используется для распознавания текста, имея некоторую (довольно слабую) предобработку изображений (основанную на Leptonica). OpenCV — Computer Vision library, которая вообще не умеет в распознавание символов, но имеет много классных штук для олбработки изображений. Можно и даже нужно комбинировать OpenCV и Tesseract для получения более-менее приемлемого результата.

А что касается готовых API — мне действительно интересно, что же там под капотом у них работает.

vlad2711 22 дек 2017 в 17:02

Я прекрасно знаю что opencv на С++, и я не имел ввиду обходить tesseract стороной из-за того что он на С++, как-то все равно на чем написано, проблема в том что он не может распознавать текст нормально. Просто так вышло что написал я про язык программирования не там где надо, но сейчас подправлю.

Устройство на котором я тестил имеет мощнейший процессор и камеру на 16Мп, но даже с таким железом и вынесением в отдельный поток было жесткое провесание секунд на 10, а результат был полным бредом, в лучшем случае половина распознавалась. Вот почему она ужасна.

vlad2711 22 дек 2017 в 17:33

Ок, а где вы видите здесь сравнение? Это характеристика каждой библиотеки, а не сравнение какая круче, ведь как вы заметили глупо сравнивать распознавалку лиц и текста.

Спрашиваете как формировалась оценка, я вам отвечу: в течении года я пробовал разные библиотеки распознавания — одни распознавали лица, другие текст, а третьи квадратики. Я клепал небольшую приложуху с одной из библиотек и распознавал с их помощью разные фото. Тестил это добро на xiaomi mi max: процессор Sharpadragon 630, 3гб оперативки, 16мп камера

Данные были реально разными даже для библиотек с одинаковыми функциями, поэтому я не в праве говорить какая библиотека лучше, но tesseract был просто очевидно хуже, там даже сильно и сравнивать не надо было, он не мог распознать и половину текста, а еще размер APK c tesseract в 17 раз превосходил APK с mobile vision. Поэтому можете быть уверены, что эти выводы были сделаны на основе реального опыта.