Понятно, что никто не покупает софт, который нужен на один вечер. Именно поэтому мы и запустили данный сервис.
Насчет того, что будет в дальнейшем что-то сказать сложно. Естественно, какая-то монетизация будет присутствовать. Но пока это всё в будущем, мы просто хотим пообщаться с людьми, которым данный сервис интересен, получить их отзывы, узнать чего они хотят, что им нравится, а что нет.
+ Ещё лично мне бы было удобно, чтобы в профиле была опция «Отправлять оповещение на e-mail», а все ссылки, на распознанные документы, выводились на отдельной странице, с указанием их срока хранения.
>>Понятно, что никто не покупает софт, который нужен на один вечер.
Если софт нужен на один вечер, то хватит и trial-версии :)
А вот для редкого использования очень даже полезно, мне например распознавание текстов надо редко, может раз в месяц, гораздо проще зайти на сайт, заплатить электронными деньгами пару рублей и распознать страницу, нежели качать/покупать программу, устанавливать ее и т.п.
Тоже проверил: билайновский EDGE из под Opera mini отобразил страницу довольно резво. Только так делать никому не советую: под мобильные девайсы вёрстка не затачивалась :)
>>Вы бы лучше заморочились вопросом того, почему у всех отображается, а у вас — нет!
это ответ разроботчика юзверу? это я юзвер должен морочиться над этим вопросом? У вас хоть один вопрос был поставлен чтоб выяснить причину. Просто категорическое НЕТ у нас роботает, вы сами решайте почему у вас не роботает. Возможно когда у вас сервак за спиной, сами локально в Росии то все и роботает. Ладно проехали.
А вот и ответ… корпоративная сеть — роботает через швецкие сервера.
Зашол с дома всё ок.
Но также само это первый случай чтобы не открывался сайт з ru зоны.
Мобильную версию!
А лучше даже WM (для начала) приложение — чтобы с камерой работа — фоткнул — она отправилась, распозналась и обратно пришла.
Ну или хотя бы легкую версию
Несколько раз, действительно, были ситуации, когда нужен был именно такой сервис на один вечер.
Наверное большой прибыли от такого проекта ждать не стоит, но на лояльность к компании и на продвижение такие сервисы влияют очень сильно. Молодцы!
Ещё бы если дали возможность распознать 1-2 странице без регистрации, было бы вообще супер… Иногда регистрироваться просто лень, а 1-2 странице хотелось бы попробовать чтобы оценить качество сервиса и составить свое мнение о вашей технологии распознавания.
Понравилось чувство юмора про торренты.
Приятно видеть стремление компании не игнорировать ситуацию с пиратством, не «закручивать гайки», а развивать свой продукт в новых изменившихся условиях!
Пока регистрировался и набирал капчу пришла в голову мысль про использование вашего же сервиса для сканирования ваших же капчей(естесвенно после обработки от грязи)… Насоздовать армию ботов-капчечитателей( у каждого по 50 выстрелов в день) и спамить потом.
Вот уж не должно быть проблемой — автоматом отличить скриншот от скана проблема кажется существенно более простая, чем распознать скан. Как минимум по контрасту границ, а так же размеру и слишком ровному расположению цельных тёмных пятнышек-буковок… Давно б занялись и сделали.
Распознавать скриншоты, чтобы распознавать скриншоты? ЦА это в основном не нужно, ЦА распознаёт сканы, фотки и имеющиеся на компе электронные документы.
Распознавать особенности подсунутой картинки, чтоб выбрать более адекватный и быстрый способ её распознавания. Мне кажется это вполне адекватный этап распознавания, когда есть несколько разных алгоритмов, подходящих под разные особенности.
Не открывается и не пингуется, провайдер Qwerty. Проблема не в DNS, имя finereaderonline.ru разрешается в 194.186.183.86.
Лог traceroute:
traceroute to finereaderonline.ru (194.186.183.86), 30 hops max, 38 byte packets
1 10.182.0.1 (10.182.0.1) 1.876 ms 1.531 ms 1.433 ms
2 213.85.211.5 (213.85.211.5) 1.242 ms 1.187 ms 1.231 ms
3 213.85.208.142 (213.85.208.142) 1.481 ms 1.363 ms 1.526 ms
4 213.85.208.250 (213.85.208.250) 3.442 ms 1.608 ms 1.724 ms
5 MSK15-G22.119.transtelecom.net (217.150.48.50) 23.261 ms 2.332 ms 2.083 ms
6 212.44.128.149 (212.44.128.149) 2.207 ms 8.334 ms 2.208 ms
7 ccr2-MEN.Moscow.gldn.net (194.67.17.20) 3.098 ms 3.032 ms 3.484 ms
8 * * *
и далее таймауты. Точно такая же картина и с опцией -I.
Судя по всему, какие-то внутренние проблемы в ГТ. Я бы все-таки рекомендовал обратиться в их техподдержку.
Finereaderonline.com открывается без проблем, хотя traceroute до него тоже не доходит. )
finereaderonline.ru и finereaderonline.com — ссылаются на один и тот же IP (62.213.108.133), что хорошо видно в nslookup.
По IP 194.186.183.86 этот сервис располагался больше недели назад.
Видимо для зоны ru, что-то где-то не так закешировалось в DNS серверах — техническая служба попытается в ближайшее вермя разобраться.
Спасибо за фидбэк… :)
Йех)) А вот что значит ответ «У Вас недостаточно доступных страниц. Вам нужно, по крайней мере, 769»? Был скормлена книга в формате djvu размером 5.5 метров, вот скрин pic.ipicture.ru/uploads/090703/THEbLCISU1.png
С другими djvu-шками та же история))
Эта надпись говорит о том, что в вашем файле — 769 страниц формата A4, а значит для распознавания этого файла Вам должно быть выделено на сервисе, как минимум, 769 страниц. Количество доступных страниц отображается в правой колонке.
На данный момент, сервис позволяет распознать только 50 страниц в день — именно такое количество страниц доступно каждому пользователю.
Так в следующем апдейте выбор страниц при закачке многостраничного файлика будет? И возможность завтра не загружать Ваш сервер повторной загрузкой того же файлика, чтоб распознать следующие 50? ;)
Было бы очень хорошо, чтобы можно было сразу .pdf распознавать (правда придется вам научится страницы в них читать…), потому как .jpg пачками подгружать не всегда удобно.
50 страниц мне за глаза, просто формат .pdf люблю нежно :)
Знаю, что вопрос жутко узко-профильный, интересующий может быть только студентов-аспирантов, но всё же спрошу:
Можете ли вы включить поддержку TeX, LaTeX как дополнительный формат. Будет теряться информация про layout, но порой она и не важна. Хотя даже её можно реализовать приблизительно, меняя опции документа (пример — текст в два столбика или один, отступы от краёв и т.д.).
Понятно… работы придётся затратить просто уйму. А результат получиться нужный только малой (если не сказать мизерной) доле целевого рынка, так что грамотный менеджер зарубит проект ещё на корню, как нерентабельный.
От аматоров open-source комьюники ждать решений не приходиться, т.к. схожих решений с FineReader для линукса просто нет. ocrg и иже с ними не рассматриваются из-за своей малопригодности.
Итого: можно с Вашей помощью распозновать текст в ТХТ формат, а потом поздними вечерами допиливать его нужными ТеХ конструкциями. Хоть и не идеальное, но решение. Спасибо.
Есть Cuneiform, например. Даже лежит на ланчпаде. Даже пишется в последнее время активно.
Когда-то, во времена ранних версий своих и Файнридера, рвал его как грелку, но был погублен бездарным менеджементом. Нынче, как это модно после такого эпикфола — опенсорс.
дла такого проекта как OCR нужны не только программисты, но и ученые. Нужны сложные алгоритмы.
В опен-соурсе организовать сложные научные разработки, видимо, трудно…
Попробовал распознать — работает на ура. Что хотелось бы, страничку с ссылка на распознанные документы, галку «Прислать на e-mail». В платной версии возможность организации папок для документов и их хранение на сервере. Корпоративный аккаунт -)
блин, сервис наверное отличный, но попробовать не смог, нафига туда этот долбаный флеш нужно пихать в кнопку «загрузить» у меня проблемы с ним под Ubunt-ой (да я знаю, что удругих работает) может adblock режет… сделали бы на яве… как у гугля — это раз уж вы просили багрепорты :)
Аттачменты в Gmail грузятся тоже флешом, причем, примерно тем же самым… :)
Но если флеш не работает, то его нужно либо явно отключить, либо отключить Jscript — красоты поменьше, но функционал будет доступен весь.
вот так выглядит это после загрузки страницы «распознать» lh3.ggpht.com/_HMgPcsvGIOo/Sk5JIc8n9NI/AAAAAAAAAOE/9Gjc7Cp6qRg/s800/sh-1.png
а так после нажатия на кнопку lh4.ggpht.com/_HMgPcsvGIOo/Sk5KGYawV1I/AAAAAAAAAOI/To8UpQtQ-N4/s800/sh-2.png
так дело в том, что флэш вроде как и работает, видео я в трубе могу смотреть, и как правило меню на сайтах работают…
попробовал и в Opera 10b тоже самое, но там вобще кнопки «загрузить» не видно с самого начала
По сути, поставив Хром, Вы отключили-таки флэш. Это, в принципе, решение проблемы, но нам было бы полезно узнать вашу исходную конфигурацию (браузер + версия флэша как минимум), чтобы недуг побороть.
budda@desktop:~$ uname -a
Linux desktop 2.6.28-13-generic #44-Ubuntu SMP Tue Jun 2 07:57:31 UTC 2009 i686 GNU/Linux + Firefox 3.0.11 + adobe-flashplugin v10.0.22.87jaunty1 + swfdec-mozilla swfdec-mozilla 0.8.2-1ubuntu1
ну для полноты картины покажу, что вобще у меня стоит для работы с флешем:
sudo dpkg --list '*swf*'
||/ Имя Версия Описание
+++-==============-==============-============================================
ii libswfdec-0.8- 0.8.4-1 SWF (Macromedia Flash) decoder library
un swf-player (описание недоступно)
ii swfdec-gnome 2.26.0-1 Tools to play SWF files (Macromedia Flash) o
ii swfdec-mozilla 0.8.2-1ubuntu1 Mozilla plugin for SWF files (Macromedia Fla
ii swftools 0.8.1-2.1ubunt Collection of utilities for SWF file manipul
sudo dpkg --list '*flash*'
ii adobe-flashplu 10.0.22.87-2ja Adobe Flash Player plugin version 10
un flash-npapi-pl (описание недоступно)
un flashplayer-mo (описание недоступно)
un flashplugin (описание недоступно)
ii flashplugin-in 10.0.22.87ubun Adobe Flash Player plugin installer
ii flashplugin-no 10.0.22.87ubun Adobe Flash Player plugin installer (transit
un libflash-mozpl (описание недоступно)
un libflashsuppor (описание недоступно)
подсунул свежеотсканированный книжный разворот со сканера в tiff
распознало плохо:
1. не повернул страницу вправо на 90 град
2. ну и в результате п.1 первая страница — непонятные символы типа «tr н о;
3. вторую страницу вообще посчитал сплошной картинкой
после поворота страницы вручную и повторной загрузки сервис дал результаты сопоставимые с работой FineReadera!
тогда напишите в рекомендациях (пока не допилите) при загрузке, что файл нужно разворачивать, а то есть пользователи еще более тупые чем я :)
budda@desktop:~$ uname -a
Linux desktop 2.6.28-13-generic #44-Ubuntu SMP Tue Jun 2 07:57:31 UTC 2009 i686 GNU/Linux + Firefox 3.0.11 + adobe-flashplugin v10.0.22.87jaunty1 + swfdec-mozilla swfdec-mozilla 0.8.2-1ubuntu1
ну для полноты картины покажу, что вобще у меня стоит для работы с флешем:
sudo dpkg --list '*swf*'
||/ Имя Версия Описание
+++-==============-==============-============================================
ii libswfdec-0.8- 0.8.4-1 SWF (Macromedia Flash) decoder library
un swf-player (описание недоступно)
ii swfdec-gnome 2.26.0-1 Tools to play SWF files (Macromedia Flash) o
ii swfdec-mozilla 0.8.2-1ubuntu1 Mozilla plugin for SWF files (Macromedia Fla
ii swftools 0.8.1-2.1ubunt Collection of utilities for SWF file manipul
sudo dpkg --list '*flash*'
ii adobe-flashplu 10.0.22.87-2ja Adobe Flash Player plugin version 10
un flash-npapi-pl (описание недоступно)
un flashplayer-mo (описание недоступно)
un flashplugin (описание недоступно)
ii flashplugin-in 10.0.22.87ubun Adobe Flash Player plugin installer
ii flashplugin-no 10.0.22.87ubun Adobe Flash Player plugin installer (transit
un libflash-mozpl (описание недоступно)
un libflashsuppor (описание недоступно)
Мы много думали над этим.
Есть точка зрения, что пользоваться сервисом будут довольно редко. А если так, то пароль будет забываться. Поэтому решили, что так удобнее.
Я случайно не единственный, кто заглянул в ToS? =)
4. СТОИМОСТЬ УСЛУГ И ПОРЯДОК ОПЛАТЫ
1. 4.1. В настоящее время Сайт и Сервис функционируют в тестовом режиме, пользование Сервисом и Сайтом является безвозмездным и направлено на ознакомление Вас с возможностями Сервиса.
2. 4.2. ABBYY оставляет за собой право в любое время в одностороннем порядке установить плату за пользование предоставляемыми Сервисом услугами, а также изменять ее размер.
Приоткройте завесу тайны. Сколько будет стоить после окончания тестирования? Сколько будет стоить для обычных тестеров и для активных, или оказавшихся особенно полезными? Можно ли будет после тестирования распознать 10 страниц в месяц бесплатно? Или 30 за смс-ку $1?
Тут уже не раз просили, но, думаю, что вряд ли будет.
А разве doc плохо открывается OpenOffice`ом? Я сам им пользуюсь на домашнем компьютере, вроде доволен.
О том же подумал. Тем более, что видел в нете англоязычный сервис, в описании которого было написано, что у них в основе лежит движок распознания ABBYY.
Простите, только сейчас прочитал вышеимеющиеся комментарии. Через .com сайт действительно доступен, через .ru — нет. Было бы неплохо дописать об этом хотя бы пост скриптумом — не все читают все комментарии.
FineReader Online