• [Личный опыт] Amazon vs Microsoft: чем отличается процесс собеседований в крупных ИТ-компаниях
    0
    Мне пока 37, пока проблем из-за возраста не испытывал. Отвечу вам на ваш комментарий через 3 года, если не забуду.

    Вы считаете, что профессиональный/личностный рост и счёт в банке не коррелируют?
  • [Личный опыт] Amazon vs Microsoft: чем отличается процесс собеседований в крупных ИТ-компаниях
    0
    Прошли? :)
  • 20 проектов, 20 языков, срок вчера
    0
    >сами используем смарткет, совет тем кто начинает с ним и читает их апи — не верьте ему
    для того, чтобы запустить процесс, который описывает Наталья, не нужно погружаться в Smartcat API, разработчики плагина для Serge уже пострадали за вас :)
    По поводу непонятной документации API упрёк приняли, исправимся.
  • Немного о котах, или какую CAT мы выбрали для синхроподкастов
    0
    Спасибо за подробное исследование и выбор Smartcat. Нам приятно, что наш продукт подошёл для ваших задач! Пара уточнений:
    • Smartcat бесплатен вообще для всех без ограничений, не только для фрилансеров;
    • Ну и пишемся мы теперь Smartcat, а не SmartCAT, но это мелочи

  • Сколько стоит перевести Хабр?
    +1
    Интересный результат прислали из GetLoc: спустя более 10 дней подсчёта Хабра получилось 41 920 106 слов (237 379 782 символа). И это уже с учетом повторяемости, т.е. весь объем сравнился друг с другом. Все сегменты уникальные.
    Похоже, что это единственный кроулер, который не сошёл с дистанции и посчитал весь объём Хабра с комментариями.
  • Сколько стоит перевести Хабр?
    0
    Сначала мы попробовали использовать Easyling (обзор этого сервиса был на Хабре), но он при подсчёте Хабра зависает и перестаёт считать.
    Менее 9 миллионов слов мы насчитали с помощью http://www.sitewordcount.com/#/ (который работает на движке Langprism).

    Наши коллеги из компании GetLoc после выхода этого поста решили проверить наш подсчёт с помощью своего движка, подсчёт идёт уже пятый день, цифра уже превысила нашу — почти 13 миллионов слов. Посмотрим, когда досчитается.
  • Сколько стоит перевести Хабр?
    0
    Это очень интересный вопрос. Самый, наверное, популярный способ — сделать выборку текстов (скажем, 1% от объёма), перевести её с помощью человека, а потом результат сравнить с постредактированным машинным переводом. Если допустить, что человеческий перевод является эталонным, то можно сравнить отличие эталонного текста от постредактированного МТ и сделать вывод о качестве.
  • Сколько стоит перевести Хабр?
    0
    Ежу не было известно, насколько быстрее и насколько дешевле обойдётся машинный перевод. Мы же привели конкретные цифры, которые могут быть приблизительным ориентиром для бизнеса.
  • Сколько стоит перевести Хабр?
    0
    комментарии, пожалуй, потребуют препроцессинга, чтобы движок МТ их понял. Всё-таки, когда люди пишут комментарии, они не так себя дисциплинируют как при написании статей. Конечно, на Хабре качество текста в комментариях повыше, чем, скажем, в сообществе MDK, но, думаю, препроцессинг понадобится.
    Такой подход использует отдел машинного перевода eBay. Им приходится переводить большое количество контента, созданного пользователями (описания товаров), который совсем не заточен на перевод. Ребята из eBay создали (и ежедневно дополняют) набор правил, который изменяет исходный текст перед отправкой в движок машинного перевода так, чтобы на выходе был более качественный перевод: исправление опечаток, расшифровка аббревиатур, исправление сленговых оборотов и т.д.
  • Сколько стоит перевести Хабр?
    +2
    Google Toolbar?
    Но ведь тут у вас вообще нет контроля за качеством того, что там потенциальные покупатели напереводили.
  • Сколько стоит перевести Хабр?
    0
    Это, кстати, довольно распространённый способ проверить качество, а также выявить различные узкие места в исходном тексте и переводе.
  • Сколько стоит перевести Хабр?
    0
    Есть :) Но не такие классные.
  • Сколько стоит перевести Хабр?
    +2
    Попробую ответить сразу всем комментаторам выше.
    Стоит, конечно, оговориться, что на самом деле Хабр мы переводить не собирались, а использовали его для расчётов. Скажем так, чтобы местные жители понимали масштаб контента, о котором мы говорим. Нашей целью было показать прикладное применение машинного перевода в промышленных масштабах.
    Представьте, что у вас интернет-магазин и вы решили выйти на другой рынок. Переводить описания товаров вручную традиционным способом долго и дорого. Полагаться только на машинный перевод — опасно (помните все эти смешные описания с AliExpress? их, кстати, всё меньше). Сценарий машинный перевод+постредактирование в этом случае — хорошее соотношение по срокам/стоимости.
    E-commerce — самый очевидный пример. Есть ещё различные отзывы на сервисах бронирования, например.

    Пример другого рода — трейдерские сводки. В международных компаниях, где те или иные действия обусловлены событиями в разных точках мира, очень важно получать новостные сводки как можно быстрее (но при этом не «сырой» результат машинного движка). Тут машинный перевод + постредактирование позволяют перевести новость быстро и понятно, успев до того, как она протухнет.

    Мой любимый пример — пачки юридических документов, которые обязательно нужно переводить на другие языки при международных процессах. Задержки в таких случаях могут стоить больших денег.

    Иными словами, Хабр мы переводить не будем, мы лишь на примере Хабра демонстрируем экономическую целесообразность работы с машинным переводом на больших объёмах.
  • Диалектика нейронного машинного перевода
    0
    Борис, а можете прокомментировать этот бенчмарк-тест компании intent.to? Похоже, отказ от использования NMT делает Promt самым выгодным по цене и самым слабым по accuracy.
  • Антивирусный бот для Telegram
    0
    С одной стороны, это неудобство, да. С другой стороны, если бот будет в тихом режиме и перестанет сообщать об ошибках проверки, то непроверенные ссылки будут выглядеть для пользователя как безопасные, а не очень хорошо.
  • Антивирусный бот для Telegram
    0
    сегодня выкатили эту фишку, проверьте, пожалуйста. Будем рады фидбеку.
  • Обзор антивируса 360 Total Security
    0
    Интересно, как выстроен процесс локализации в 360.
    Насколько я понимаю, исходный контент пишется на китайском языке (или английском?). На первый взгляд русская локализация сделана довольно небрежно: очень много неоправдных сокращений:
    «Подр. информ.» вместо «Подробная информация»
    «Модель неподдерж. роутера»
    «Оптимизир.»
    «1.4 ГБ» читается как «1.4 ГЕ» (потому что Б вышла за пределы поля), причём, число должно быть 1,4, в русском языке дробный разделитель — запятая.
    проблемы с множественным числом:
    «Найдено 22 пунктов для оптимизации»
    «Строгий-режим» почему-то написано через дефис (наверное, по аналогии со «Смарт-режимом»)
    странные пробелы между словами и нелокализованный бейдж New.
    В общем, было бы интересно почитать, как вы занимаетесь локализацией продуктов.
  • Антивирусный бот для Telegram
    0
    По поводу переписки: Privacy mode (когда бот может получать только команды или реплики, адресованные ему) нам по понятным причинам не подходит, а других вариантов Bot API пока не предлагает. Если появится возможность получать из групповых чатов только сообщения со ссылками, файлами и медиаобъектами (иначе троянец можно замаскировать, например, под гифку), то мы сами будем рады уменьшить нагрузку и не обрабатывать лишнюю информацию.
    Если нет желания звать бота в групповой чат, всегда можно форварднуть боту сообщения на проверку.
  • Антивирусный бот для Telegram
    0
    По поводу VirusTotal: поизучаем этот вопрос, но, похоже, есть юридические заморочки.
  • Антивирусный бот для Telegram
    0
    Да, спасибо, мысль хорошая!
  • Антивирусный бот для Telegram
    0
    Можно этого и не делать: подозрительные файлы и ссылки при необходимости можно форварднуть боту из любого чата.
    Стоит ли пользоваться ботами в групповых чатах — ваш личный выбор.
  • Антивирусный бот для Telegram
    +1
    Не то чтобы мы об этом не подумали — пусть попробуют :)
  • Антивирусный бот для Telegram
    0
    В настоящий момент мы предупреждаем о ссылках, где распространяются вирусы, и о социальной инженерии (то есть фишинг тоже отлавливаем), поэтому навскидку нет особого смысла указывать категорию ссылки. Собственно, наш бот срабатывает на те же ссылки, что и наш антивирус по дефолту (без включенного родительского контроля).
  • Антивирусный бот для Telegram
    +1
    Сделать бота для массовой аудитории на базе virustotal.com не получится, их API сурово ограничивает число запросов в минуту.

    Если это было не очень понятно из статьи, то 7 человек — это не семь программистов (а разработчики, техписы, переводчики, тестировщики), а 3 месяца — это время от идеи до нынешней реализации, а не 2160 часов тяжёлого непрерывного труда :) Ну, и наш бот всё же не наколеночная поделка.
  • Антивирусный бот для Telegram
    –1
    Александр, здравствуйте! Наш отдел к пабликам никакого отношения не имеет, мы занимаемся разработкой продуктов. Как бы мы сами к этой истории ни относились, лично мы повлиять на её исход не можем. Так что давайте хоть здесь не будем мусолить эту тему и поговорим о боте :)
    Могу вам гарантировать, что из нашей команды никто ваш паблик не отжимал.
  • Распознавание бирманского языка: теперь мы умеем даже это
    0
    спасибо за ответ! если честно, ни разу не пользовался десктопной версией, но давно пользуюсь облачной (хорошо бы ещё страницы не сгорали там со временем).
    А что если реализовать распознавание языка через семплирование? Например, брать по фразе из нескольких мест текста в зависимости от размера файла и, пока пользователь настраивает то, куда ему лучше экспортнуть файл (мой фич-реквест на экспорт в яндекс.диск, видимо заигнорили) и в каком формате, автоматически определять язык. А уж затем распознавать с учётом определённого языка.
  • Распознавание бирманского языка: теперь мы умеем даже это
    0
    Спасибо за интересный рассказ!
    Скажите, а планируете ли вы научить ваш OCR самостоятельно определять язык, на котором написан документ? Если я правильно понимаю, я сейчас подсуну Fine Reader текст на бирманском для распознавания, я должен вручную указать «бирманский» в списке языков. Даже если взять распространённые языки: английский, немецкий, французский, русский и т.д. — в облачном Fine Reader мне постоянно приходится самому выбирать язык, на котором написан распознаваемый документ. Причём, самая засада с немецким — когда я точно не уверен, новая орфография используется в тексте или старая.
    Думаю, в 2015 году технологически уже не так сложно реализовать автоматическое определение языка и снизить количество действий пользователя (+ облегчить интерфейс).
  • Локализация продуктов или еще один пост с заголовком «Трогни чтобы начать»
    0
    Спасибо за ответ!
    А успех локализации на том или ином рынке замеряете как-нибудь? (ну, кроме количества пользователей и подписок)
  • Локализация продуктов или еще один пост с заголовком «Трогни чтобы начать»
    +1
    Игорь, отличная организация процесса — всё понятно и без лишних костылей!
    У меня вопрос такого плана: вписан ли в этот процесс контроль качества локализации и каким образом он осуществляется?
    И как у вас организована работа с терминологией?
  • Памятка начинающим переводчикам приложений под Android или как начать переводить приложения
    0
    Ну оценить риски с точки зрения переводчика — очень наивно, ведь вы не вкладывали в разработку деньги и время и не рискуете репутацией продукта и команды.
    Меню принудительной смены языка — во-первых, лишний элемент интерфейса (не забудьте, мы говорим о мобильных приложениях, а не об интерфейсе 1С: Бухгалтерия); во-вторых, лишняя работа. В подавляющем большинстве приложений язык переключается вместе со сменой локали.
    Я сам пишу время от времени разработчикам приложений и предлагаю сделать русскую локализацию, мне охотно отвечают, но локализацию либо не добавляют, либо делают её усилиями своих ресурсов (внешних или внутренних).
  • Памятка начинающим переводчикам приложений под Android или как начать переводить приложения
    0
    не соглашусь, это не глупость, а клиентоориентированность.
    если разработчик берёт за своё приложение деньги, то и локализацию он должен поставлять соответствующего качества.
    Представьте, вы кореец, у вас крутое приложение «Компас» за 5 баксов, тут пишет вам условный Сергей из условного Липецка и говорит, что переведёт бесплатно. Вы соглашаетесь, он вам переводит с кучей ошибок, которые вы никогда не заметите, так как не знаете русского. И потом начинается самое интересное: пользователи начинают требовать деньги назад и так далее.

    Знаете, было немного обидно, когда я отправил файлы перевода, общей сложностью содержащие 3,5К строк, а разработчик сказал, что не будет добавлять в перевод

    А вы предварительно договорились о том, что будете переводить? Если нет, то считайте это тренировкой.

    глупо отказываться от локализации, которую Вам дали бесплатно

    Бесплатно не равно качественно :)

    В целом, я, конечно, поддерживаю ваш интерес и прокачивание умений в этой сфере, но прошу и разработчиков понять тоже.
  • Памятка начинающим переводчикам приложений под Android или как начать переводить приложения
    +2
    Хорошая статья. То, что вы разобрались во всём настолько глубоко, достойно уважения.
    Правда, не поддерживаю идею самостоятельной локализации и «выковыривания» ресурсов из .apk.
    Хочу рассказать вам, почему разработчики могут не предоставлять вам ресурсы для перевода:
    1. российский рынок им не интересен;
    2. все или некоторые функции продукта могут быть недоступны на территории России;
    3. разработчик не хочет запускать русскую локализацию без гарантий русскоязычной поддержки;
    4. волонтёрская локализация чревата тем, что переводчик-волонтёр ничем не обязан продукту и может испариться в любой момент, тогда разработчику придётся искать нового переводчика, смешивать русский и английский, либо отключать русский — гарантий регулярной поддержки нет никаких;
    5. так как вы волонтёр, с точки зрения дедлайнов на вас надавить нельзя, потому что вы ничем не обязаны, а отсутствие переведённых строк на каком-то языке может стать для продукта release-stopping issue;
    6. нанимать переводчика или агентство для русской локализации может быть неоправданно с финансовой точки зрения.
    7. другие причины (например, отсутствие русской локализации Telegram).

    Успехов!
  • Serge — решение для непрерывной локализации от Evernote
    0
    Спасибо за ответы!
    Что у memoQ в этом плане?

    У memoQ есть приложение Content connector — может забирать файлы из локальной сети, с компа или SVN (вроде бы ещё откуда-то, но я не пробовал).
    ABBYY в своём SmartCAT решили эту задачу через «горячую папку» — система постоянно проверяет, не изменились ли файлы в указанной папке на моём компьютере. Мне кажется, пока не очень изящное решение. Работоспособность не пробовал.
    Transifex позволяет делать непрерывную локализацию своими средствами. У них есть классная статья в блоге, где они рассказывают, как непрерывно локализуют самих себя. К сожалению, сам тоже пока не имел возможности попробовать (корпоративные ограничения).
  • Serge — решение для непрерывной локализации от Evernote
    +1
    Игорь, спасибо за интересный обзор. Обязательно хочу поэкспериментировать с Serge в своей работе, когда будет время.
    У меня есть несколько вопросов:
    Правильно ли я понимаю, что Pootle у вас является основным внутренним CAT-инструментом? И именно это и послужило одним из драйверов создания Serge? У меня на работе несколько иная схема, где в ядре находится memoQ.

    Описанная вами цепочка работает только на локализации интерфейсов? Пробовали ли вы применить Serge для локализации документации? Была бы интересна такая схема в условиях гибкой разработки документации.
  • Аккордеон про архитектуру и локализацию
    +2
    Привет, Алексей! Спасибо, что ссылаетесь на мою статью, рад, что за 2 года она по-прежнему актуальна :)
    На работе сейчас я имею дело с более 20 различными форматами хранения текстов, пока что самое элегантное решение из всех, что я испробовал — использовать единый удобный промежуточный формат — XLIFF. Его понимают почти все популярные (да и неизвестные) системы перевода, он позволяет кастомизировать себя довольно гибко и помимо строк хранить практически любые метаданные, риск того, что переводчики сломают синтаксис, заметно снижается.
    Чуть раньше вашей статьи ребята из Evenote представили своё решение Serge, как будет время, хочу изучить его повнимательнее. Возможно, оно может помочь и в вашей работе.

    По поводу машинного перевода для локализации игр и околоигровых приложений («автоперевод» в вашей статье) я, конечно, в корне не согласен, но, думаю, этот спор тут затевать не стоит :)

  • Локализация приложений для китайского рынка
    +1
    если заказ разовый и объём небольшой, то можно воспользоваться сервисами типа Gengo или Alconost Nitro. По обеим ссылкам есть расценки. Если же проект подразумевает постоянные обновления и развитие, то лучше найти переводческое агентство (лучше в самом Китае). Расценки агентств (в паре английский-китайский упрощённый/традиционный) от 0,04 до 0,20 долларов за слово исходного языка в зависимости многих параметров (формат исходного текста, тематика, необходимость вычитки, тестирования, вид тестирования, ведение глоссариев, консультаций по интернационализации и т.д.)
  • Как работает поиск на Airbnb
    +2
    Скажите, пожалуйста, ведётся ли в недрах Airbnb работа по разрушению языковых барьеров? Планируете ли вы использовать машинный перевод описаний квартир и отзывов? Или внедрить мультиязычные описания квартир, если, например, хозяин знает несколько языков или позаботился о красивом описании своей квартиры с помощью знакомых переводчиков?
    Планируете ли вы использование машинного перевода для отзывов? Например, я недавно прокатился по Испании и Португалии, останавливаясь через Airbnb: некоторые квартиры сложно было оценить на основании отзывов, потому что многие были на португальском и испанском. Либо, можно использовать ранжирование отзывов в зависимости от локали пользователя, как это делает Foursquare. Где бы я ни был, в первую очередь я вижу подсказки на русском языке, а потом все остальные. В отношении жилья, как мне кажется, людям важнее будут отзывы соотечественников, так как в разных странах разные приоритеты. Немец пожалуется на отсутствие в квартире спутникового телевидения с немецкоязычными каналами, а русский похвалит пешую доступность классного итальянского ресторанчика.
    В общем, было бы интересно почитать о локализации в Airbnb, каким образом всё построено и на что делается акцент.
    Судя по вашей картинке из предыдущего поста, работы в этом направлении предстоит ещё немало.

    Кстати, о локализации: спасибо за функцию машинного перевода сообщений с помощью гугла, один из хозяев не говорил ни на одном языке, кроме испанского. Только, пожалуйста, прикрутите эту функцию и в мобильную версию, потому что с телефона приходилось копировать сообщение и вставлять его в переводчик.
  • Машинный перевод для профи
    0
    Спасибо!
  • Машинный перевод для профи
    0
    Интересно было бы почитать про это подробнее. Не подскажете, есть ли уже доступные материалы об этом?
  • Банкомат. Некоторые особенности
    –1
    Знает ли кто-нибудь, правда ли, что если во время ограбления набрать на банкомате PIN задом наперёд, то будет вызвана служба безопасности? Или это очередной фэйк, распространяемый в соцсетях?
    Сам я не рискну пробовать, чтобы не спровоцировать ложный вызов или блокировку карты.