Как стать автором
Обновить

Комментарии 140

НЛО прилетело и опубликовало эту надпись здесь
Понятно, что никто не покупает софт, который нужен на один вечер. Именно поэтому мы и запустили данный сервис.

Насчет того, что будет в дальнейшем что-то сказать сложно. Естественно, какая-то монетизация будет присутствовать. Но пока это всё в будущем, мы просто хотим пообщаться с людьми, которым данный сервис интересен, получить их отзывы, узнать чего они хотят, что им нравится, а что нет.
По юзабилити, имхо было бы неплохо сделать множественный выбор файлов, через зажатый ctrl.
+ Ещё лично мне бы было удобно, чтобы в профиле была опция «Отправлять оповещение на e-mail», а все ссылки, на распознанные документы, выводились на отдельной странице, с указанием их срока хранения.
>Понятно, что никто не покупает софт, который нужен на один вечер
светлая и неожиданная мысль.
А в сервисе какая версия движка используется?
А то по поводу Лингвы — там онлайн сервис на две версии запаздывает (если не путаю).

>>Понятно, что никто не покупает софт, который нужен на один вечер.
Если софт нужен на один вечер, то хватит и trial-версии :)

А вот для редкого использования очень даже полезно, мне например распознавание текстов надо редко, может раз в месяц, гораздо проще зайти на сайт, заплатить электронными деньгами пару рублей и распознать страницу, нежели качать/покупать программу, устанавливать ее и т.п.
Отлично работает!
Звучит заманчиво. но к сожелению посмотреть не получаеться. наверно храброэфект.
Это вы врёте. Всё у нас хорошо.
А смысл мне врать?
IE — Internet Explorer cannot display the webpage
FF, Chrome тоже самое.
Причины такого мне абсолютно непонятны: сам захожу без проблем, да и вообще, грузили сервер и посерьёзнее, чем сейчас.
неа… не пингуеться
это не показатель, проверьте маршрут
У меня даже на айфоне через GPRS нормально грузится!
Тоже проверил: билайновский EDGE из под Opera mini отобразил страницу довольно резво. Только так делать никому не советую: под мобильные девайсы вёрстка не затачивалась :)
не врет человек — был период, когда сервис не откликался и у меня. Но сейчас все работает!
Это Вы врёте :) Не загружается страничка.
а за минуса конечно «спасибо». интересная реакция на багрепорты.
Лично мной ваш коммент был воспринят не как багрепорт, а как желание упомянуть ХЭ.
И пишите, пожалуйста, грамотно.
>И пишите, пожалуйста, грамотно.
Для Вас серьёзно это важно?
Да.
Не вини себя.
Минус за коммент, который не имеет отношение к действительности — это неадекватно?..

Вы бы лучше заморочились вопросом того, почему у всех отображается, а у вас — нет!
>>Вы бы лучше заморочились вопросом того, почему у всех отображается, а у вас — нет!

это ответ разроботчика юзверу? это я юзвер должен морочиться над этим вопросом? У вас хоть один вопрос был поставлен чтоб выяснить причину. Просто категорическое НЕТ у нас роботает, вы сами решайте почему у вас не роботает. Возможно когда у вас сервак за спиной, сами локально в Росии то все и роботает. Ладно проехали.
Кто сказал, что у всех?

Я из Англии

ERROR

The requested URL could not be retrieved

While trying to retrieve the URL: www.finereaderonline.ru/

The following error was encountered:

Connection Failed
Да.
Магия.
Ну все другие руские сайты/сервисы работают. Так что наврят ли мой провайдер режет.
Аналогично, .ru не открывается, com — открывается (франция).
Если в конфиги интернет-подключения добавить OpenDNS то и .ru откроется, только что я себе проверила :)
я из Москвы, но вот .com работает, а .ru нет
А вот и ответ… корпоративная сеть — роботает через швецкие сервера.
Зашол с дома всё ок.
Но также само это первый случай чтобы не открывался сайт з ru зоны.
У меня из Канады не работал некоторое время
Сорри, был не прав.

В следующий раз, при описании багов пишите, пожалуйста, условия их возникновения как можно подробнее. Это поможет их скорейшему исправлению
Человек не врет.
Англия.

ERROR

The requested URL could not be retrieved

While trying to retrieve the URL: www.finereaderonline.ru/

The following error was encountered:

Connection Failed
Грузит через раз, бывает.
Из Московской области работает.
НЛО прилетело и опубликовало эту надпись здесь
На данный момент поддержаны 4 языка: русский, английский, немецкий, французский.
Мобильную версию!
А лучше даже WM (для начала) приложение — чтобы с камерой работа — фоткнул — она отправилась, распозналась и обратно пришла.
Ну или хотя бы легкую версию
Мобильную версию — это можно. Вы уже не первый, кто хочет.
А идею приложения под WM ещё никто не предлагал. Спасибо, запишем в книжицу :)
и/или веб камеру подключить (Flash?) и забрать с нее «фотку» текста для распознования… я не уверен как можно это реализовать, — просто идея.
Не, вебкамеры не хватит. 0.3 МП — это почти ничто для OCR. 1.3 МП — в общем-то тоже.
и про айфон не забудьте :)
Да! Да! да!
Всякие записки, объявы, визитки — фоткать, сразу переводить в текст, и текст этот совать в заметки, кадендарь, контакты и СМС-ки!
Для визиток уже есть такое приложение, BCR :) Правда только под устройства с Symbian 9.x и автофокусом.
Evernote?
Несколько раз, действительно, были ситуации, когда нужен был именно такой сервис на один вечер.
Наверное большой прибыли от такого проекта ждать не стоит, но на лояльность к компании и на продвижение такие сервисы влияют очень сильно. Молодцы!

Ещё бы если дали возможность распознать 1-2 странице без регистрации, было бы вообще супер… Иногда регистрироваться просто лень, а 1-2 странице хотелось бы попробовать чтобы оценить качество сервиса и составить свое мнение о вашей технологии распознавания.
Проблема в том, что там, где можно без регистрации распознать 1-2 страницы, можно распознать и любое другое количество страниц.
Может тогда OpenID?
Понравилось чувство юмора про торренты.
Приятно видеть стремление компании не игнорировать ситуацию с пиратством, не «закручивать гайки», а развивать свой продукт в новых изменившихся условиях!
эти условия совсем не новые :)
Они давно уже не игнорируют ситуацию с пиратством — у них одна из самых навороченных систем защиты. :)
Правда, кажется это слабо помогает. :(
Про «самую навороченную систему защиты» — передам ответственным людям. Им будет приятно :)
И помогает это, по-моему, в достаточной мере.
Хорошо бы сделать правку файла на лету. Как в самой программе, т.к. много косяков.
Работа с блоками в браузере? Сложновато. В ближайшее время вряд ли потянем, имхо. Но я передам. Всё передам :)
Спасибо :)
Oткрывать в Google Docs :) если гугловский API позволяет загружать документы и расшаривать их для редактирования.
В гугл-Волну!
Там работа с блоками будет встроенной и родной.
Надо сделать под них робота FineReaddy!
НЛО прилетело и опубликовало эту надпись здесь
// ОФФТОП

Пока регистрировался и набирал капчу пришла в голову мысль про использование вашего же сервиса для сканирования ваших же капчей(естесвенно после обработки от грязи)… Насоздовать армию ботов-капчечитателей( у каждого по 50 выстрелов в день) и спамить потом.

Я это к чему —
Защита бы не помешала.
Дык это. Мне та же самая мысль пришла )) Увы, распознает неверно.
Спасибо, думаю для меня этот сервис прекратил поиски альтернативного программного обеспечения для распознавания документов под ubuntu
НЛО прилетело и опубликовало эту надпись здесь
Зачем вы фотографировали монитор? Есть же PrintScreen :)
Ненене, не надо скриншоты распознавать. Пожалуйста.
Для этого есть ScreenShot Reader.
а в чем проблема с скриншотами?
Думаю, что проблема прежде всего с определением DPI. Но вообще, это к нашим технологам, а не ко мне.
Вот уж не должно быть проблемой — автоматом отличить скриншот от скана проблема кажется существенно более простая, чем распознать скан. Как минимум по контрасту границ, а так же размеру и слишком ровному расположению цельных тёмных пятнышек-буковок… Давно б занялись и сделали.
Распознавать скриншоты, чтобы распознавать скриншоты? ЦА это в основном не нужно, ЦА распознаёт сканы, фотки и имеющиеся на компе электронные документы.
Распознавать особенности подсунутой картинки, чтоб выбрать более адекватный и быстрый способ её распознавания. Мне кажется это вполне адекватный этап распознавания, когда есть несколько разных алгоритмов, подходящих под разные особенности.
Распознавать скриншоты — баловство какое-то. Зачем ABBYY идти на поводу у идиотов или ищущих забавы?
чтобы ему сложней было распознать)
Файл для OCR, мягко говоря, неудачный. Попробуйте сканы пораспознавать.
Улыбнуло «Мы рады представитьвам unePeader» =)
порадовала следующая распознанная строчка:
кому нужно просто распознать naf страниц =)

будем пользоваться)
Хорошая задумка. Как предложение — добавить поддержку ODF. Было бы очень хорошо.
Плюс поставить не могу, но тоже за odf
Люблю когда крупные компании сами шутят про торренты. Это располагает))
Не открывается и не пингуется, провайдер Qwerty. Проблема не в DNS, имя finereaderonline.ru разрешается в 194.186.183.86.
Лог traceroute:
traceroute to finereaderonline.ru (194.186.183.86), 30 hops max, 38 byte packets
1 10.182.0.1 (10.182.0.1) 1.876 ms 1.531 ms 1.433 ms
2 213.85.211.5 (213.85.211.5) 1.242 ms 1.187 ms 1.231 ms
3 213.85.208.142 (213.85.208.142) 1.481 ms 1.363 ms 1.526 ms
4 213.85.208.250 (213.85.208.250) 3.442 ms 1.608 ms 1.724 ms
5 MSK15-G22.119.transtelecom.net (217.150.48.50) 23.261 ms 2.332 ms 2.083 ms
6 212.44.128.149 (212.44.128.149) 2.207 ms 8.334 ms 2.208 ms
7 ccr2-MEN.Moscow.gldn.net (194.67.17.20) 3.098 ms 3.032 ms 3.484 ms
8 * * *
и далее таймауты. Точно такая же картина и с опцией -I.
Судя по всему, какие-то внутренние проблемы в ГТ. Я бы все-таки рекомендовал обратиться в их техподдержку.

Finereaderonline.com открывается без проблем, хотя traceroute до него тоже не доходит. )
finereaderonline.ru и finereaderonline.com — ссылаются на один и тот же IP (62.213.108.133), что хорошо видно в nslookup.
По IP 194.186.183.86 этот сервис располагался больше недели назад.
Видимо для зоны ru, что-то где-то не так закешировалось в DNS серверах — техническая служба попытается в ближайшее вермя разобраться.
Спасибо за фидбэк… :)
А API не планируется?
Какой API хотелось бы и для каких целей?
Я, к примеру, хотел сделать поиск по сканированной документации, хранящейся на сервере, подобный тому, который работает на books.google.com

Спасибо, учтем… )
Йех)) А вот что значит ответ «У Вас недостаточно доступных страниц. Вам нужно, по крайней мере, 769»? Был скормлена книга в формате djvu размером 5.5 метров, вот скрин pic.ipicture.ru/uploads/090703/THEbLCISU1.png
С другими djvu-шками та же история))
Если Вам кажется, что что-то не так с оценкой (что вполне возможно), то оправьте пожалуйста файл мне: мыло critical-bug на Яндексе.
Эта надпись говорит о том, что в вашем файле — 769 страниц формата A4, а значит для распознавания этого файла Вам должно быть выделено на сервисе, как минимум, 769 страниц. Количество доступных страниц отображается в правой колонке.
На данный момент, сервис позволяет распознать только 50 страниц в день — именно такое количество страниц доступно каждому пользователю.
Спасибо) Просто подумалось что в таком случае будут распознаны первые 50 страниц в файле))
Пока так, все-таки бэта — «coz it's betta than nothing» =)
Так в следующем апдейте выбор страниц при закачке многостраничного файлика будет? И возможность завтра не загружать Ваш сервер повторной загрузкой того же файлика, чтоб распознать следующие 50? ;)
Ждали пока я универ закончу, не иначе :))) Полезный сервис, очень.
Было бы очень хорошо, чтобы можно было сразу .pdf распознавать (правда придется вам научится страницы в них читать…), потому как .jpg пачками подгружать не всегда удобно.
50 страниц мне за глаза, просто формат .pdf люблю нежно :)
Формат PDF скорее всего будет поддержан, возможно в виде отдельного сервиса.
Знаю, что вопрос жутко узко-профильный, интересующий может быть только студентов-аспирантов, но всё же спрошу:
Можете ли вы включить поддержку TeX, LaTeX как дополнительный формат. Будет теряться информация про layout, но порой она и не важна. Хотя даже её можно реализовать приблизительно, меняя опции документа (пример — текст в два столбика или один, отступы от краёв и т.д.).
На форуме файнридера часто просят добавить возможность распознавания формул. Почитайте его. Насколько я знаю, не хотят этого делать.
Понятно… работы придётся затратить просто уйму. А результат получиться нужный только малой (если не сказать мизерной) доле целевого рынка, так что грамотный менеджер зарубит проект ещё на корню, как нерентабельный.

От аматоров open-source комьюники ждать решений не приходиться, т.к. схожих решений с FineReader для линукса просто нет. ocrg и иже с ними не рассматриваются из-за своей малопригодности.

Итого: можно с Вашей помощью распозновать текст в ТХТ формат, а потом поздними вечерами допиливать его нужными ТеХ конструкциями. Хоть и не идеальное, но решение. Спасибо.
Есть Cuneiform, например. Даже лежит на ланчпаде. Даже пишется в последнее время активно.
Когда-то, во времена ранних версий своих и Файнридера, рвал его как грелку, но был погублен бездарным менеджементом. Нынче, как это модно после такого эпикфола — опенсорс.
дла такого проекта как OCR нужны не только программисты, но и ученые. Нужны сложные алгоритмы.
В опен-соурсе организовать сложные научные разработки, видимо, трудно…
Попробовал распознать — работает на ура. Что хотелось бы, страничку с ссылка на распознанные документы, галку «Прислать на e-mail». В платной версии возможность организации папок для документов и их хранение на сервере. Корпоративный аккаунт -)
Спасибо за идеи
НЛО прилетело и опубликовало эту надпись здесь
юзайте русский язык :)
Нам вообще исходный файл больше интересен :)
НЛО прилетело и опубликовало эту надпись здесь
Теперь сервис умеет разворачивать изображения в правильную сторону самостоятельно.
Спасибо за отзыв… )
НЛО прилетело и опубликовало эту надпись здесь
Языки (причём не только украинский ;), можно сказать, возглавляют этот список.
А в чём принципиальная проблема со скриншотами? Есть же ScreenShot Reader. Не планируете добавить поддержку?
блин, сервис наверное отличный, но попробовать не смог, нафига туда этот долбаный флеш нужно пихать в кнопку «загрузить» у меня проблемы с ним под Ubunt-ой (да я знаю, что удругих работает) может adblock режет… сделали бы на яве… как у гугля — это раз уж вы просили багрепорты :)
Вообще-то, в случае незагрузки флэша, должен сработать альтернативный uploader. Странно, что это не так. А где именно у гугля на яве?
Попробуйте отключить Flash или Javascript — тогда загрузка будет происходить по-другому.

Спасибо за репорт :)
>А где именно у гугля на яве?
я имел ввиду загрузку аттачментов в gmail
Аттачменты в Gmail грузятся тоже флешом, причем, примерно тем же самым… :)
Но если флеш не работает, то его нужно либо явно отключить, либо отключить Jscript — красоты поменьше, но функционал будет доступен весь.
отключил adblock для www.finereaderonline.com/ — не помогло

вот так выглядит это после загрузки страницы «распознать» lh3.ggpht.com/_HMgPcsvGIOo/Sk5JIc8n9NI/AAAAAAAAAOE/9Gjc7Cp6qRg/s800/sh-1.png
а так после нажатия на кнопку lh4.ggpht.com/_HMgPcsvGIOo/Sk5KGYawV1I/AAAAAAAAAOI/To8UpQtQ-N4/s800/sh-2.png

так дело в том, что флэш вроде как и работает, видео я в трубе могу смотреть, и как правило меню на сайтах работают…
попробовал и в Opera 10b тоже самое, но там вобще кнопки «загрузить» не видно с самого начала
И все же попробуйте отключить Javascript.
Про Оперу понятно, а основной браузер, я так понял, не Опера. А какой?
И ещё скажите пожалуйста, какая у Вас версия флэша?
ура! под хромом заработало, — появилась кнопка «Choose file»? загрузил пробную страницу!
По сути, поставив Хром, Вы отключили-таки флэш. Это, в принципе, решение проблемы, но нам было бы полезно узнать вашу исходную конфигурацию (браузер + версия флэша как минимум), чтобы недуг побороть.
моя конфигурация:

budda@desktop:~$ uname -a
Linux desktop 2.6.28-13-generic #44-Ubuntu SMP Tue Jun 2 07:57:31 UTC 2009 i686 GNU/Linux + Firefox 3.0.11 + adobe-flashplugin v10.0.22.87jaunty1 + swfdec-mozilla swfdec-mozilla 0.8.2-1ubuntu1

ну для полноты картины покажу, что вобще у меня стоит для работы с флешем:
sudo dpkg --list '*swf*'
||/ Имя Версия Описание
+++-==============-==============-============================================
ii libswfdec-0.8- 0.8.4-1 SWF (Macromedia Flash) decoder library
un swf-player (описание недоступно)
ii swfdec-gnome 2.26.0-1 Tools to play SWF files (Macromedia Flash) o
ii swfdec-mozilla 0.8.2-1ubuntu1 Mozilla plugin for SWF files (Macromedia Fla
ii swftools 0.8.1-2.1ubunt Collection of utilities for SWF file manipul

sudo dpkg --list '*flash*'
ii adobe-flashplu 10.0.22.87-2ja Adobe Flash Player plugin version 10
un flash-npapi-pl (описание недоступно)
un flashplayer-mo (описание недоступно)
un flashplugin (описание недоступно)
ii flashplugin-in 10.0.22.87ubun Adobe Flash Player plugin installer
ii flashplugin-no 10.0.22.87ubun Adobe Flash Player plugin installer (transit
un libflash-mozpl (описание недоступно)
un libflashsuppor (описание недоступно)
подсунул свежеотсканированный книжный разворот со сканера в tiff
распознало плохо:
1. не повернул страницу вправо на 90 град
2. ну и в результате п.1 первая страница — непонятные символы типа «tr н о;
3. вторую страницу вообще посчитал сплошной картинкой

после поворота страницы вручную и повторной загрузки сервис дал результаты сопоставимые с работой FineReadera!

тогда напишите в рекомендациях (пока не допилите) при загрузке, что файл нужно разворачивать, а то есть пользователи еще более тупые чем я :)
Теперь сервис должен поворачивать изображения сам, научили… )
моя конфигурация:

budda@desktop:~$ uname -a
Linux desktop 2.6.28-13-generic #44-Ubuntu SMP Tue Jun 2 07:57:31 UTC 2009 i686 GNU/Linux + Firefox 3.0.11 + adobe-flashplugin v10.0.22.87jaunty1 + swfdec-mozilla swfdec-mozilla 0.8.2-1ubuntu1

ну для полноты картины покажу, что вобще у меня стоит для работы с флешем:
sudo dpkg --list '*swf*'
||/ Имя Версия Описание
+++-==============-==============-============================================
ii libswfdec-0.8- 0.8.4-1 SWF (Macromedia Flash) decoder library
un swf-player (описание недоступно)
ii swfdec-gnome 2.26.0-1 Tools to play SWF files (Macromedia Flash) o
ii swfdec-mozilla 0.8.2-1ubuntu1 Mozilla plugin for SWF files (Macromedia Fla
ii swftools 0.8.1-2.1ubunt Collection of utilities for SWF file manipul

sudo dpkg --list '*flash*'
ii adobe-flashplu 10.0.22.87-2ja Adobe Flash Player plugin version 10
un flash-npapi-pl (описание недоступно)
un flashplayer-mo (описание недоступно)
un flashplugin (описание недоступно)
ii flashplugin-in 10.0.22.87ubun Adobe Flash Player plugin installer
ii flashplugin-no 10.0.22.87ubun Adobe Flash Player plugin installer (transit
un libflash-mozpl (описание недоступно)
un libflashsuppor (описание недоступно)

А можно не присылать пользователю его же пароль в письме подтверждения регистрации? Глупо это, имхо и небезопасно. И да, это паранойя.
Мы много думали над этим.
Есть точка зрения, что пользоваться сервисом будут довольно редко. А если так, то пароль будет забываться. Поэтому решили, что так удобнее.
Я случайно не единственный, кто заглянул в ToS? =)

4. СТОИМОСТЬ УСЛУГ И ПОРЯДОК ОПЛАТЫ

1. 4.1. В настоящее время Сайт и Сервис функционируют в тестовом режиме, пользование Сервисом и Сайтом является безвозмездным и направлено на ознакомление Вас с возможностями Сервиса.
2. 4.2. ABBYY оставляет за собой право в любое время в одностороннем порядке установить плату за пользование предоставляемыми Сервисом услугами, а также изменять ее размер.

Приоткройте завесу тайны. Сколько будет стоить после окончания тестирования? Сколько будет стоить для обычных тестеров и для активных, или оказавшихся особенно полезными? Можно ли будет после тестирования распознать 10 страниц в месяц бесплатно? Или 30 за смс-ку $1?
Тайна такая тайна, что мы сами ничего не знаем :(
Хорошо бы добавить в список форматов сохранения результатов открытый формат ODF
Тут уже не раз просили, но, думаю, что вряд ли будет.
А разве doc плохо открывается OpenOffice`ом? Я сам им пользуюсь на домашнем компьютере, вроде доволен.
Удивительно, что до этого додумались только в 2009-ом году.
О том же подумал. Тем более, что видел в нете англоязычный сервис, в описании которого было написано, что у них в основе лежит движок распознания ABBYY.
Работает, как зайчик… Если .ru вдруг не доступен, попробуйте .com, хотя проблемы с .ru должны были побороть еще в пятницу.
Простите, только сейчас прочитал вышеимеющиеся комментарии. Через .com сайт действительно доступен, через .ru — нет. Было бы неплохо дописать об этом хотя бы пост скриптумом — не все читают все комментарии.
Пожалуйста сделайте распознование капчи с Дёти.ру
Спасибо. ;)
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.