Как стать автором
Обновить

Комментарии 31

НЛО прилетело и опубликовало эту надпись здесь
Главный вопрос распознование картинки где происходит, на сервере или на локальном компьютере?
На сервере.
Когда вы выбрали блок текста и клинкули “Copy Text” (Ctrl+C), он посылается на сервер с Ocrad OCR — движком с открытым кодом для распознавания текста. Ocrad попытается распознать кусок растровой картинки в текст, что может занять пару секунд, и после завершения вернет распознанный текст, который можно будет вставить обычным образом куда угодно (Ctrl+V).
Если бы вы касались темы расширений таких вопросов бы не задавали. На клиенте хрома это сделать невозможно, точнее возможно, но через поганые приложения — читай извращения, которые как 5 колесо в разработке расширений, на лисе попроще. Бесит, не могу.
Вот, распознавание цифр на клиенте: myselph.de/neuralNet.html
Могли бы и пояснить, почему невозможно: ограничение CORS.
да, следует пояснить. Вот есть к примеру kdzwinel.github.io/JS-OCR-demo
Вот что, на js медленно работает? Ну не сказал бы. Правда точность слабовата. Но в общем есть потенциал распознавать на клиенте.

Я про то, что хром, чтобы получить доступ к чему нибудь кроме урлов в сети и пары кнопок в интерфейсе браузера, нативному коду или службе на компе пользователя требует писать так называемые приложения. Что выглядит каким то убогим корявым непонятной пользователю вещью. С FF немного легче благодаря c-types однако чтобы лис не вис (т.к один поток работы интерфейса и кода расширения ) без Palant'а автора AdBlockPlus на StackOverflow не обойтись. то есть все это первопроходчество какое то. :-)
CORS кстати, не причем, на расширения он не распространяется. А вот Stroke Width Transform (SWT) на js боюсь напряжно выйдет, понятия не имею как он работает правда. С handwriting куда проще, там же тупняк сразу бинаризованный идеальный образец.
Вобщем на js переписать все, мне кажется кровь из глаз у разработчиков пойдет. А нативные либы заливать — гемор с расширениями и кроссплатформенностью. нужно же 3 платформы поддерживать минимум. Винда линух макось. Сейчас КУДА проще.
CORS кстати, не причем, на расширения он не распространяется.
Да, вы правы, нашел на stackoverflow
Если с CORS проблем в расширении нет, то не понятно, почему
На клиенте хрома это сделать невозможно
Жаль, что с русским текстом не работает.
С русским текстом прекрасно работает, только ему нужно подсказать, что это русский:

image
My bad, искал по полному названию — habrahabr.ru/search/?q=Project+Naptha и как-то не подумал проверить по половине.
Та ничего, думаю, многие могли не видеть тот пост, а приложение действительно удобное)
Жалко для Firefox нет, обещали прислать письмо, давно жду.
Удобнее было бы конечно если бы распознавал на локальном компьютере
Пинги, траффик, нагрузка на сервер. Блокировки.
а расширение под 200 метров, сложности с обновлением, подарок от RAM в пол гига, вероятные висы — не? :-)
Полгига рамы в случае современных браузеров это в пределах погрешности ;)
А вообще может вы и правы, возможно и правда такое дополнение слишком тяжелым было. Моё мнение похоже несколько предвзято, потому что долго приходилось пользоваться достаточно мощным компьютером с медленным и нестабильным интернетом, поэтому тяну всё в офлайн…
Гугловцы вроде сделали чтобы на телефоне распознавашка работала
Если ещё актуально, Chrome-версия Naptha работает в Firefox, благодаря тому, что Firefox во многом совместим по API дополнений с Chrome.

Достаточно скачать .crx, завести учётную запись разработчика на AMO и там подписать это дополнение, выбрав «я самостоятельно буду распространять, не публикуйте на AMO».

Кроме того, есть нативный аналог — Copyfish.
Очень круто, спасибо! Осталось дождаться расширения, добавляющего улыбки на лица на картинках или следящие со всех картинок за мышкой глаза. Думаю, как то можно отделение текста применить для сжатия изображений, а там недалеко и до deep learning video compression(например, что-то такое) и до deep learning interactive video compression(своеобразный аналог программы deep.exe из вселенной Лабиринта отражений, только с обработкой на компьютере, а не на мозгах пользователей).
Вроде же у яндекса перевод текста с наведением камеры есть?
Не все так удачно, или я что то делаю не так?image
image
Вы мне мозг сломали своими рекурсивными скриншотами :)

Duke565 — установите английский язык в меню Language, очевидно что плагин пытается распознать русский.
Все пошло хорошо
У меня тоже нормально работает (только текст почему-то выделился в форме параллелограмма):
Хм, под линуксом и хромиумом что то не ставится:
«UTILITY_PROCESS_CRASHED_WHILE_TRYING_TO_INSTALL»
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации