alizar Sep 30 2009 at 08:36

Демо-версия Google Docs OCR

1 min

IT-companies

+23

Comments 22

Dreammaker Sep 30 2009 at 09:07

А что насчёт русского, украинского etc?

MYPABEU Sep 30 2009 at 10:27

Сейчас проверю…

MYPABEU Sep 30 2009 at 10:28

Че-то у меня не работает… Пишет вот такую гадость:
Error processing document:
Unable to read response, or response is empty

dark_ruby Sep 30 2009 at 15:34

у меня просто вернул пустои докунет — т.е. русский он не распознает

nik_the_spirit Sep 30 2009 at 18:06

Надеюсь это временно)

vcrank Sep 30 2009 at 18:22

У меня получилось получить результаты распознования только с демо-картинки. В остальных случаях или пустой документы висит минут 5 (ENG, пара предложений), либо выдаёт различные ошибки. Можно списать на начало хабраэффекта

andrew_b Sep 30 2009 at 18:23

А есть возможность загрузки через e-mail?
А то сфоткал на телефон, отправил, загрузил обратно документ — карманный сканер теперь реальность.

vcrank Sep 30 2009 at 18:29

На данном этапе этого пока точно нет =) Это видно по скрину

Но кто знает каков будет уровень интеграции, когда сервис доедут до ума.
Может быть будет распознавание видео с ютуба :)

andrew_b Sep 30 2009 at 18:41

Да, я сам покапался, сейчас это просто демонстрация. Но я почему-то уверен, что в недалеком будущем по e-mail загружать всё-таки можно будет. Есть же возможность заливать по электронной почте документы в гугл докс, фотки в пикасу, вот и возможность сканировать тоже появится. Ждем!

budda Sep 30 2009 at 20:24

там скарее всего все построено на каком то opensource ом движке, а у них у всех проблемы с кирилицей

pxx Oct 2 2009 at 08:15

Google sponsors the development of an open-source OCR software called OCRopus, but it's not clear if the online service provided by Google Docs uses OCRopus.

grokinn Oct 1 2009 at 04:43

а может гугл в конце концов купит ABBYY?

can3p Oct 1 2009 at 05:36

я думаю, гугл ее скорее обанкротит. Сейчас они только запустили сервис, потом купят десяток патентов, несколько программных решений, которые уже есть ан рынке, и получим качество распознавание не хуже, чем в finereader. После этого программа будет актуальна только для тех, кто распознает очень много документов, остальные забудут платное решение как страшный сон.

grokinn Oct 1 2009 at 07:37

ну насколько я понимаю качество finereader (не превзойденное ни одним свободным решением) является результатом многолетних целенаправленных исследований в этой области, чем гугл никогда не занимался. имхо легче и дешевле купить чем написать свой вменяемый OCR

Scala Oct 1 2009 at 07:40

Google не занимался OCR? Вы про Google Books слышали?

grokinn Oct 1 2009 at 07:51

слышал, но не припомню чтоб где то писали что гугл разрабатывал OCR ПО под этот проект, он вроде пользовался готовыми решениями, а под «гугл никогда не занимался» я имел ввиду не занимался самостоятельными исследованиями и написанием ПО для универсального OCR

can3p Oct 1 2009 at 08:35

гугл много чем не занимался. Все дело в правильном менеджменте и нужной сумме денег. До появления google Android он не делал платформы для мобильных устройств. До google translate он не занимался автоматизированным переводом, и тд

Scala Oct 1 2009 at 08:58

code.google.com/p/ocropus/

mrgall Oct 5 2009 at 05:53

Они как раз купили reCAPTCHA 3 недели назад :)

r1der Oct 1 2009 at 06:26

не уверен… абби все равно пока что лидео на этом рынке… гугл то он конечно гугл… но он не может сделать все за 20 минут все что наши компании делали несколько лет… недостаточно просто скупить технологий… пока все работает криво… ждем обновлений… на самом деле судя по всему система будет распознавать скорее всего только более или менее понятный текст, практической пользы да и приемуществ перед finereader у этого сервиса не будет…

Scala Oct 1 2009 at 09:04

За 20 минут действительно не сделают. Они взяли недавно открытый 10-летний труд от HP и вот уже несколько лет продолжают его модернизировать.

copist Oct 5 2009 at 05:00

Гугль возьмут FineReader SDK и будут тайком продвигать как свой. Шутка.