Evernote как он есть или что думает Игорь Ашманов

    2 апреля в блоге компании Evernote Corporation было объявлено о старте русскоязычной версии сервиса Evernote. В США его запустили в феврале 2008 года, аккурат после инвестиций в размере $5 млн* из венчурного фонда «Тройки Диалог» (инвестиции, как сообщала РБК, были выделены на «кроссплатформенное решение по распознаванию рукописного текста»). К настоящему моменту имеется 900 тыс. зарегистрированных пользователей англоязычной версии.

    Судя по всему, распознавание идет шустро? Не всегда.

    Что такое и зачем нужен Evernote легко узнать в блоге и на сайте, но то, что проект принадлежит компании Evernote Corp., которую возглавляет Степан Пачиков узнать уже посложнее. Пачиков — тот самый удин с которым дружит Познер (последний не преминул похвастаться знакомством с настоящим IT-шником в «Одноэтажной Америке»).

    Распознавание



    Распознавание – ядро Evernote, главное, что в нем есть технологически важного. Заметки с помощью Evernote делаются без писанины – устройство принимает текст как изображение и распознает символы, превращая изображение в документ.

    Ставиский



    Локализация сервиса на русский язык стала первой, но не единственной. «В этом году мы планируем перевести сервис на еще один из основных мировых языков. Какой именно язык будет следующим, пока не решено», — говорит вице-президент Evernote Corp. Дмитрий Ставиский.

    То, что вторым после английского языком Evernote стал русский, в Evernote Corp. объясняют тем, что компания имеет российские корни (о том, что российские корни имеет и инвестор, представитель компании не сказал). Кроме того, в Evernote боялись повторить судьбу Facebook: когда социальная сеть пришла в Россию, ее место было уже занято клонами.

    Ашманов



    По мнению директора компании «Ашманов и партнеры» Игоря Ашманова, сервис вполне может стать популярным в Рунете: «Однако только в том случае, если он будет полностью отвечать требованиям пользователей, а система распознавания не будет допускать серьезных ошибок».

    Итак..



    Разработчики утверждают, что Evernote способен распознать любой текст, даже русский рукописный. Но это – опрометчивое заявление. Оно не вполне соответсвует действительности.

    Например, системе не удалось распознать рукописный текст и лишь отчасти номер машины на фотографии, сделанной телефоном (конечно качество фото оставляло желать лучшего, было много «шума» и освещение размывало цифры, но номер просматривался хорошо).

    Так на вводимый целиком номер _н192му [199]_ Evernote не реагировал никак. То же самое происходило при вводе цифр _192_ и сочетания _192му_

    Расстроившись мы решили попробовать другие сочетания — при вводе буквы _н_ и цифр _199_ сервис резво выделил слишком большой кусок в первом случае и точно угадал во втором:









    Неудача постигла Evernote и с надписью «Microsoft», Билл Гейтс со своим майкрософтом не распознался, а намалеванная краской надпись на старой будке — вполне:





    В слове «from» Evernote распознал слово «тайга»:





    и отказался работать с текстом в документе, который был перевернут вверх тормашками.

    На последнее, впрочем, Evernote имел, как нам кажется, полное право – алгоритм распознавания не обязан предвидеть иное расположение букв в надписи. Но что касается остального…

    Хотя нельзя не признать, что Evernote прекрасно справлялась с поиском в тех случаях, когда картинка была достаточно контрастной, слово написано четко и слева направо. При соблюдении этих условий, размер текста значения не имел:





    Разработчики пошли по перспективному пути, подключив к процессу распознавания кроме алгоритма определения символов еще и лингвистику, исправляя слова с ошибками путем сличения их по некому алгоритму с тезаурусом. Благодаря чему надежда на то, что со временем Evernote станет читать по-русски лучше, сохраняется.

    Бизнес-модель сервиса рассчитана на продажу платных аккаунтов. За $5 в месяц или $45 в год пользователь сможет получить «приоритетное» (т.е. улучшенное) распознавание текста на картинках, загружать в десять раз больше информации (по сравнению с бесплатным аккаунтом – 500 Мб против 40) и не смотреть рекламу.

    снова Ашманов



    Игорь Ашманов уверен, что в Рунете сейчас можно продать все, главное, чтобы это «все» было достаточно «гламурным». Если так, то по-настоящему гламурными в Рунете сейчас являются только два типа ресурсов — сайты знакомств и развлечения (даже в кризис среднестатистический любитель онлайн-игр оставляет в Сети $9 в месяц).

    Вот с кем придется конкурировать г-ну Пачикову.

    ________________________________

    * По оценке одного эксперта, который пожелал остаться неизвестным (но в отечественной IT-тусовке этот человек авторитетен ничуть не менее г-на Пачикова), бюджет проекта Evernote составил $6 млн. Инвестиции, насколько нам известно, будут продолжаться и впредь.

    Автор: Ольга Федина
    Ads
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More

    Comments 18

      0
      По мне так проект просто отличный. Хотя вот не знаю что нужно делать чтобы превышать бесплатные объемы залива информации — мне пока комфортно в бесплатном аккаунте.
        0
        на платном можно произвольные файлы хранить в Evernote, а файлами 500 Мб набрать уже несложно
        +1
        Неплохо бы поправить ссылки на скриншоты и указать первоисточник: www.itoday.ru/15228.html
          0
          текст публикуется в авторской версии. а что не так со ссылками?
            0
            Они ведут на один и тот же скриншот.
              0
              уже нет, спасибо.
          0
          1. Классно подогнали факты — сравнивать надпись «Микрософт», набранную нестандартным шрифтом с «тенью», которая превращает буквый в одно бесформенное пятно с чёткой, как будто планшетом написанной надписью — эт шедевр. Равно как и рукописную каку-маляку — это ж двуязычие, надо понимать. Если бы язык явно был задан, а распозналась чушь — тогда ещё можно было бы критиковать.

          2. >Разработчики пошли по перспективному пути, подключив к процессу распознавания кроме алгоритма определения символов еще и лингвистику
          Открою страаашную тайну: лингвистику используют во всех мало-мальски работающих программах распознавания текстов и речи. Это понятно даже по ошибкам, которые делают эти программы.

          В-общем, автор обзора недалеко ушёл от критикуемого Познера.
            0
            побуду за автора, ладно?)

            1. мы ничего не подгоняли. мы просто поверили обещанию распознать и русский и английский шрифт в любом виде. и проверили это утверждение
            микрософт на фото с Гейтсом, кстати, был узнан утилитой для распознавания визиток от ABBYY (Business Card Reader).

            «рукописную каку-маляку» Эверноут прекрасно распознавал по-русски (это, к сожалению, не относится к сфотографированным страницам блокнота), а с английским словом неожиданно выдал _тайгу_

            2. сентенция принадлежит не столько автору, сколько редактору.

            3. Познер отнюдь не критикуем, Познер горячо любим и обожаем. Знакомством с Пачиковым хвастаться не зазорно)
            0
            О как ловко привлекли внимание к статье именем Игоря Ашманова, ну прям ваще! Надо было идти дальше — упомянуть еще больше хороших людей, и тоже цитаток навставлять! Заголовок будет еще более броским!

            Нельзя же так обламывать, я думал Игорь Ашманов и впрямь про еверноут расскажет.
              0
              так рассказал.
                0
                а над заголовком я трудилась, в надежде, что он вам понравится) понравился ведь?)
                  +1
                  Я в восторге!1! С нетерпением жду следующей статьи, с еще более цепляющим заголовком, например, «Черненькая из ВиаГры и распознование текста» =) Отдача будет еще больше — черненькая из виагры лучше Игоря Ашманова, и заголовок становится таким, триллером =)

                  Я, конечно же, шучу. Спасибо за статью, просто я думал она будет немного про другое.
                    0
                    не думаю, что черненькая лучше Игоря) но желание читателя — закон, поэтому с удовольствием изменю заголовок на более соответствующий)
                +1
                Я вообще такой бессмысленной фразы:

                «сервис вполне может стать популярным в Рунете: «Однако только в том случае, если он будет полностью отвечать требованиям пользователей, а система распознавания не будет допускать серьезных ошибок»

                не говорил. Потому что это и так очевидно, и является необходимым условием успеха любого проекта, а интересно обсуждать условия достаточные. Не знаю, откуда это взялось.

                Что касается гламура, необходимого для успеха, то Эверноут достаточно гламурный проект.

                Интересно здесь отметить другое: здесь произошло очень ловкое перепозиционирование ключевой технологии, так, что её возможные недостатки перестали иметь значение.

                Поясню: когда вы позиционируете распознавание, как нечто для ведения записей или ввода текста в компьютер, то вы отчаянно боретесь за последние несколько процентов точности. Скажем, точность в 95% — не очень хорошая, потому что даже каждую двадцатую букву или каждое двадцатое слово исправлять неприятно. А уж 90% — вообще мучение.
                А дотянуть до 98% точности для рукописного текста — пока нереально, по-моему.

                Заметим, что первый в истории наладонник — Newton от Apple — провалился в начале 90-х не только потому, что, как принято говорить, «опередил время», а в первую очередь потому, что заявленный рукописный ввод распознавал плохо и в практическом применения страшно раздражал пользователей.
                Потом уже для Палма и других наладонников придумали упрощённый ввод (граффити).

                Интересно напомнить, что ту распознавалку Эплу продал не кто иной, как Степан Пачиков. То есть мы имеем дело, условно говоря, с реинкарнацией той технологии. Конечно, написано заново и писали другие люди, но всё же.

                Ну так вот — «чистое» распознавание текста — сложная задача. Но это в такой пуристической и неудобной постановке задачи.
                А вот сли вы на основе распознавания скриншота доски после совещания формируете список тегов для последующего поиска скриншота в архиве, там можно распознать и 30% и даже 20% слов — уже будет достаточно для тегирования и поиска.

                То есть качество распознавания перестаёт быть критическим фактором. Начинают играть факторы удобства, поддержки платформ и интерфейсов, качество раскрутки и поддержки и т.п. Но при этом наличие распознавания остаётся главной фишкой. Что и позволяет владельцам надеяться на успех проекта.

                Молодец Пачиков, что тут скажешь.
                  0
                  здравствуйте Игорь, спасибо за развернутый комментарий.

                  Вышеприведенная фраза — дитя редактуры и авторского восприятия. Обстоятельства ее появления я постараюсь узнать у Ольги

                  Гламура Эверноуту хватает, верно. Этим он мне и симпатичен. Пользоваться им приятно и удобно, тоже верно. Помимо вышеозначенных сбоев с номером и Микрософтом серьезных ошибок замечено пока не было. Фото презентационных слайдов, объявления на стенах, вывески и рекламные щиты Эверноут узнает.

                  Что касается «чистого» распознавания — въедливость и критичность по отношению к работе сервиса были заданы главредом.

                  0
                  Пользоваться им приятно и удобно, тоже верно.

                  Это вы вроде как согласились с Игорем, который типа это где-то тут сказал? Такие уловки милые, прям глазу приятно.
                    0
                    вроде как согласилась. ага.

                    текст заметки — не мой. но Эверноутом пользуюсь я. Пользоваться удобно. Но иногда выдаются забавные сбои. Об этом и ведется речь.

                    а вы о чем?)
                      0
                      Да так, срываю покровы, не обращайте внимания =)

                  Only users with full accounts can post comments. Log in, please.