У меня получилось получить результаты распознования только с демо-картинки. В остальных случаях или пустой документы висит минут 5 (ENG, пара предложений), либо выдаёт различные ошибки. Можно списать на начало хабраэффекта
Да, я сам покапался, сейчас это просто демонстрация. Но я почему-то уверен, что в недалеком будущем по e-mail загружать всё-таки можно будет. Есть же возможность заливать по электронной почте документы в гугл докс, фотки в пикасу, вот и возможность сканировать тоже появится. Ждем!
Google sponsors the development of an open-source OCR software called OCRopus, but it's not clear if the online service provided by Google Docs uses OCRopus.
я думаю, гугл ее скорее обанкротит. Сейчас они только запустили сервис, потом купят десяток патентов, несколько программных решений, которые уже есть ан рынке, и получим качество распознавание не хуже, чем в finereader. После этого программа будет актуальна только для тех, кто распознает очень много документов, остальные забудут платное решение как страшный сон.
ну насколько я понимаю качество finereader (не превзойденное ни одним свободным решением) является результатом многолетних целенаправленных исследований в этой области, чем гугл никогда не занимался. имхо легче и дешевле купить чем написать свой вменяемый OCR
слышал, но не припомню чтоб где то писали что гугл разрабатывал OCR ПО под этот проект, он вроде пользовался готовыми решениями, а под «гугл никогда не занимался» я имел ввиду не занимался самостоятельными исследованиями и написанием ПО для универсального OCR
гугл много чем не занимался. Все дело в правильном менеджменте и нужной сумме денег. До появления google Android он не делал платформы для мобильных устройств. До google translate он не занимался автоматизированным переводом, и тд
не уверен… абби все равно пока что лидео на этом рынке… гугл то он конечно гугл… но он не может сделать все за 20 минут все что наши компании делали несколько лет… недостаточно просто скупить технологий… пока все работает криво… ждем обновлений… на самом деле судя по всему система будет распознавать скорее всего только более или менее понятный текст, практической пользы да и приемуществ перед finereader у этого сервиса не будет…
Демо-версия Google Docs OCR