limonte 14 ноя 2015 в 18:46

Project Naptha — выделяй, копируй и переводи тексты с любых картинок

2 мин

38K

Google ChromeОбработка изображений*Расширения для браузеров

+26

Комментарии 31

НЛО прилетело и опубликовало эту надпись здесь

SOLON7 14 ноя 2015 в 20:22

Главный вопрос распознование картинки где происходит, на сервере или на локальном компьютере?

limonte 14 ноя 2015 в 20:25

На сервере.

Когда вы выбрали блок текста и клинкули “Copy Text” (Ctrl+C), он посылается на сервер с Ocrad OCR — движком с открытым кодом для распознавания текста. Ocrad попытается распознать кусок растровой картинки в текст, что может занять пару секунд, и после завершения вернет распознанный текст, который можно будет вставить обычным образом куда угодно (Ctrl+V).

Alexufo 15 ноя 2015 в 02:31

Если бы вы касались темы расширений таких вопросов бы не задавали. На клиенте хрома это сделать невозможно, точнее возможно, но через поганые приложения — читай извращения, которые как 5 колесо в разработке расширений, на лисе попроще. Бесит, не могу.

dtestyk 15 ноя 2015 в 05:35

Вот, распознавание цифр на клиенте: myselph.de/neuralNet.html
Могли бы и пояснить, почему невозможно: ограничение CORS.

Alexufo 15 ноя 2015 в 05:45

да, следует пояснить. Вот есть к примеру kdzwinel.github.io/JS-OCR-demo
Вот что, на js медленно работает? Ну не сказал бы. Правда точность слабовата. Но в общем есть потенциал распознавать на клиенте.

Я про то, что хром, чтобы получить доступ к чему нибудь кроме урлов в сети и пары кнопок в интерфейсе браузера, нативному коду или службе на компе пользователя требует писать так называемые приложения. Что выглядит каким то убогим корявым непонятной пользователю вещью. С FF немного легче благодаря c-types однако чтобы лис не вис (т.к один поток работы интерфейса и кода расширения ) без Palant'а автора AdBlockPlus на StackOverflow не обойтись. то есть все это первопроходчество какое то. :-)

Alexufo 15 ноя 2015 в 05:52

CORS кстати, не причем, на расширения он не распространяется. А вот Stroke Width Transform (SWT) на js боюсь напряжно выйдет, понятия не имею как он работает правда. С handwriting куда проще, там же тупняк сразу бинаризованный идеальный образец.
Вобщем на js переписать все, мне кажется кровь из глаз у разработчиков пойдет. А нативные либы заливать — гемор с расширениями и кроссплатформенностью. нужно же 3 платформы поддерживать минимум. Винда линух макось. Сейчас КУДА проще.

dtestyk 15 ноя 2015 в 09:31

CORS кстати, не причем, на расширения он не распространяется.

Да, вы правы, нашел на stackoverflow

dtestyk 15 ноя 2015 в 09:33

Если с CORS проблем в расширении нет, то не понятно, почему

На клиенте хрома это сделать невозможно

Kivin 14 ноя 2015 в 20:58

Жаль, что с русским текстом не работает.

limonte 15 ноя 2015 в 02:36

С русским текстом прекрасно работает, только ему нужно подсказать, что это русский:

Gorodnya 14 ноя 2015 в 20:59

На hh/gt не нашел ни единого упоминания о этом замечательном расширении для Google Chrome.

А я нашёл — Расширение к браузеру для извлечения текста из изображений )
Но согласен, расширение интересное.

limonte 14 ноя 2015 в 21:02

My bad, искал по полному названию — habrahabr.ru/search/?q=Project+Naptha и как-то не подумал проверить по половине.

Gorodnya 14 ноя 2015 в 21:39

Та ничего, думаю, многие могли не видеть тот пост, а приложение действительно удобное)

dtestyk 15 ноя 2015 в 00:50

Еще можно в гугле искать: site:habrahabr.ru OR site:geektimes.ru Project Naptha

Randl 14 ноя 2015 в 21:54

Жалко для Firefox нет, обещали прислать письмо, давно жду.
Удобнее было бы конечно если бы распознавал на локальном компьютере

Alexufo 15 ноя 2015 в 02:32

а чем удобнее?) пинги?

Randl 15 ноя 2015 в 02:49

Пинги, траффик, нагрузка на сервер. Блокировки.

Alexufo 15 ноя 2015 в 02:58

а расширение под 200 метров, сложности с обновлением, подарок от RAM в пол гига, вероятные висы — не? :-)

Randl 15 ноя 2015 в 11:33

Полгига рамы в случае современных браузеров это в пределах погрешности ;)
А вообще может вы и правы, возможно и правда такое дополнение слишком тяжелым было. Моё мнение похоже несколько предвзято, потому что долго приходилось пользоваться достаточно мощным компьютером с медленным и нестабильным интернетом, поэтому тяну всё в офлайн…

tumikosha 26 авг 2016 в 14:45

Гугловцы вроде сделали чтобы на телефоне распознавашка работала

dartraiden 24 окт 2018 в 08:34

Если ещё актуально, Chrome-версия Naptha работает в Firefox, благодаря тому, что Firefox во многом совместим по API дополнений с Chrome.

Достаточно скачать .crx, завести учётную запись разработчика на AMO и там подписать это дополнение, выбрав «я самостоятельно буду распространять, не публикуйте на AMO».

Кроме того, есть нативный аналог — Copyfish.

dtestyk 15 ноя 2015 в 00:38

Очень круто, спасибо! Осталось дождаться расширения, добавляющего улыбки на лица на картинках или следящие со всех картинок за мышкой глаза. Думаю, как то можно отделение текста применить для сжатия изображений, а там недалеко и до deep learning video compression(например, что-то такое) и до deep learning interactive video compression(своеобразный аналог программы deep.exe из вселенной Лабиринта отражений, только с обработкой на компьютере, а не на мозгах пользователей).

vitektm 15 ноя 2015 в 00:45

Вроде же у яндекса перевод текста с наведением камеры есть?

neznae4ko 15 ноя 2015 в 13:43

Не все так удачно, или я что то делаю не так?

Duke565 15 ноя 2015 в 18:38

limonte 15 ноя 2015 в 18:55

Вы мне мозг сломали своими рекурсивными скриншотами :)

Duke565 — установите английский язык в меню Language, очевидно что плагин пытается распознать русский.