Pull to refresh
  • by relevance
  • by date
  • by rating

Google закрывает Инструменты переводчика

Google API *Cloud services IT-companies
Google недавно разослал извещение о том, что 4 декабря закрывает сервис Инструменты переводчика или как его еще называют Google Translator Toolkit.

image

Недавно мы сообщали Вам, что 4 декабря 2019 мы прощаемся с Инструментами переводчика Google. Вы получили последнее напоминание, поскольку сервис прекратит работу менее чем за 2 недели. Ниже мы описали, как Вы можете загрузить свои данные.
Читать дальше →
Total votes 27: ↑15 and ↓12 +3
Views 29K
Comments 46

В Facebook AI продемонстрировали прямой машинный перевод с одного языка на другой

Machine learning *Artificial Intelligence Learning languages
image

Facebook AI представила новую систему машинного перевода M2M-100 с 15 млрд параметров. Она способна переводить с одного языка на другой напрямую, не используя английский в качестве промежуточного.
Читать дальше →
Total votes 7: ↑7 and ↓0 +7
Views 2.8K
Comments 11

В Яндекс.Браузер внедрили машинный перевод видеороликов

Working with video *Machine learning *Artificial Intelligence Learning languages

Яндекс объявил о работе над сервисом машинного перевода видео с одного языка на другой. Это позволит пользователям смотреть ролики в браузере с закадровым переводом. Прототип сервиса уже представлен, пока он переводит видео только с английского языка.

Читать далее
Total votes 24: ↑24 and ↓0 +24
Views 6.7K
Comments 15

Яндекс обвинили в краже идеи для сервиса перевода видео

Working with video *Machine learning *Copyright

Непубличное акционерное общество «Оллмай.блог» подало иск против Яндекса в Aрбитражный суд Москвы. IT-гиганта потребовали опровергнуть слова о том, что он разработал технологию машинного перевода видео, не имеющую аналогов в мире.

Читать далее
Total votes 16: ↑15 and ↓1 +14
Views 3.4K
Comments 7

Небольшой эксперимент с Google Translate

IT-companies
Просматривая и оценивая в очередной раз сервисы предлагаемые великим Гуглом, зацепился за Google Translate. Для тестирования выбрал небольшую новость с Mashable.com про Apple(ссылка на оригинал статьи — http://mashable.com/2008/01/09/apple-prepares-to-standardize-itunes-prices-across-europe/)

Сразу оговорюсь, что, вероятней всего, новость не содержит ничего примечательного и занимательного для среднестатистического хабрачитателя. Мне лишь хотелось на реальном примере выяснить насколько сервис пригоден для использования и поделится опытом.

Итак, оригинальный вариант перевода от Гугла:
Читать дальше →
Total votes 30: ↑20 and ↓10 +10
Views 1.1K
Comments 33

Google Docs: машинный перевод текстов

IT-companies
Онлайновый офисный пакет Google Docs обзавелся очередным нововведением. На этот раз функцией машинного перевода документов. За перевод отвечает, что не удивительно, сервис Google Translate, который перелопачивает текст на 42 языка.

Пользоваться новой возможностью просто. Достаточно открыть документ в Google Docs и выбрать пункт Translate Document в меню Tools. Результат не заставит себя ждать.

Само собой, машинный перевод текста — это отнюдь не счастье всем и даром, а зачастую сложночитаемая белиберда. Тем не менее, люди, совершенно не понимающее того или иного языка и активно пользующиеся Google Docs получили инструмент для перевода, который избавит их от пары-тройки лишних кликов, нужных для использования стороннего сайта (даже все того-же Google Translate) или программы.

via internetno
Total votes 13: ↑10 and ↓3 +7
Views 2.1K
Comments 5

Очки-переводчик от японцев

Gadgets
image

Устройство от NEC в виде очков преобразует перевод устной иностранной речи прямо на сетчатку глаза.
Интересно, что сигнал поступает с проектора сразу на сетчатку, которая по зрительным нервам тут же отправляет сигнал в мозг человека. И собеседники могут вести разговор на разных языках и не утруждать себя переводом, а просто смотреть друг на друга. Пока точность автоматического перевода не слишком велика, поэтому пока новинка дорабатывается, её могут использовать люди, работающие в сфере услуг, например, а не на серьёзных конференциях. Новинка появится уже в 2010 году.

Ссылка на новость
Как я понял, устройство подаёт сигнал в мозг не в текстовой форме. Каким образом это возможно, может, кто знает?
Total votes 45: ↑36 and ↓9 +27
Views 1.3K
Comments 53

Google и Microsoft теперь автоматически переводят с гаитянского креольского языка

Google API *Machine learning *Cloud services Learning languages IT-companies
imageУважаемое Хабрасообщество, сегодня через как всегда молниеносную Википедию (спасибо анониму!) я обнаружил, что Google Translate и Bing Translator начали осуществлять статистический машинный перевод с (и «на» тоже) гаитянского креольского языка (что такое креольский язык?). Гаитянский — один из официальных языков Республики Гаити, на котором говорят 14 миллионов человек; образовался на основе французского образца 18 века, упростился и понабрал в себя всё что только можно.

Одним из любимых моих развлечений остаётся просмотр Википедии на свежедоступном для перевода языке. Несколько месяцев назад после того как стала доступна альфа-версия перевода с персидского (фарси) Google, кажется, переводил «Владимир Путин» с персидского на русский как «сапоги». Потом перевод стал лучше.

Сейчас вы имеете вдвое больше возможностей найти что-нибудь интересное и посмеяться (исключительно над переводом!) вдвое дольше, не забыв подсказать Google как надо переводить. Кстати, удивительно, но в гаитянской Википедии номинально аж 50 тысяч статей (почти столько же сколько в греческой и Википедии на хинди) при том что из Гаити гаитянскую Википедию особо не посещают и наверное не редактируют (а теперь уж не скоро начнут). Но тем не менее! Вот татар 6-8 миллионов, что всего лишь в 2 раза меньше, а статей в татарской Википедии только 5 тысяч, что в 10 раз меньше и это нерадостный факт. Вы уверены, что в Татарстане не было землетрясений? =))

P.S.:
Поместил в ленту новостей, т.к. ни к чему другому пост не подходит.

Под катом ссылка на официальный блог Microsoft и другие блоги, потому что СМИ ещё об этом не знают.

Читать дальше →
Total votes 9: ↑5 and ↓4 +1
Views 574
Comments 4

Диалог со Вселенским Разумом

Reading room


Есть просто плохие вещи. Есть очень плохие. А есть вещи настолько плохие, что в них, в полном согласии с заветами даосизма и дзэн-буддизма, неожиданно прорезается сакральный смысл, о котором «хорошие» вещи не смеют и мечтать. Небезызвестный агент Малдер, например, в моменты, когда расследование заходило в тупик, пересматривал «худший фильм всех времён и народов» — «План 9 из открытого космоса». По его словам, фильм был настолько отвратителен, что отключал всю разумную часть мозга, активизируя подсознательные процессы, которые могли привести к гениальному наитию. :)

Ужасное качество современного машинного перевода давно стало притчей во языцех. Даже могучий Google Translate справляется со своими обязанностями с громким скрипом, не говоря уже о таких чудесных продуктах, как PROMT. Однако какой там PROMT! Некий сайт Bad Translator заставляет нас понять в полной мере, что такое по-настоящему плохой перевод. Однако, следуя первому абзацу топика, этот перевод именно настолько ужасен, что внезапно обретает философскую глубину и даже способен стать аналогом… диалога со Вселенной.

Под катом инструкция и образцы глубокомысленных (иногда действительно глубокомысленных) диалогов со Вселенским Разумом.
Читать дальше →
Total votes 144: ↑117 and ↓27 +90
Views 760
Comments 140

Шифр Copiale Cipher XVIII в. расшифрован с помощью статистического машинного перевода

Cryptography *
Translation
Более 60 лет назад Уоррен Уивер, пионер в области машинного перевода, впервые предложил применить технику криптоанализа для интерпретации иноязычных текстов.

В известном письме 1947 года к математику Норберту Винеру он писал: «Вполне естественно задаться вопросом, можно ли проблему перевода рассматривать как проблему криптографии. Когда я вижу текст на русском языке, я говорю: «На самом деле это написано на английском, но закодировано какими-то странными символами. Сейчас попробую расшифровать»».

Эта догадка привела в итоге к разработке целого поколения программ статистического машинного перевода, таких как Google Translate — и, неслучайно, к появлению новых инструментов для анализа исторических шифров».

Сейчас группа шведских и американских лингвистов применила техники статистического машинного перевода для взлома одного из самых трудных шифров: Copiale Cipher, рукописного 105-страничного манускрипта конца XVIII века. Учёные опубликовали свою работу в преддверии конференции Ассоциации компьютерной лингвистики в Портленде.
Читать дальше →
Total votes 97: ↑89 and ↓8 +81
Views 7K
Comments 38

Что нам стоит «умный» продукт построить?

Programming *
Translation
В последнее время словосочетание «машинное обучение» (Machine Learning, ML) стало невероятно модным. Подобно любой распиаренной технологии, энтузиазм здесь превосходит уровень реализации конкретных продуктов. Можно спорить, но мало какие алгоритмические технологии со времен потрясающих инноваций от Google 10-15 лет назад привели к появлению продуктов, широко распространившихся в массовой культуре. Не то, чтобы с тех пор не было прорывов в машинном обучении, не было столь потрясших и имевших в основе вычислительные алгоритмы. Netflix может использовать умные рекомендации, но он и без этого Netflix. А вот если бы Брин и Пейдж не анализировали в своих корыстных целях графовую структуру веба и гиперссылки, у нас не было бы Google.

Почему так? Ведь пытались же. Немало стартапов хотели нести технологии машинной обработки естественного языка в массы, но все по очереди канули в Лету, после того, как люди, собственно, пробовали их использовать. Сложность получения хорошего продукта с использованием машинного обучения не в понимании основной теории, но в понимании сферы деятельности и поставленной задачи. Понимании столь глубоком, чтобы на интуитивном уровне видеть, что будет работать, а что нет. У интересных задач нет готовых решений. Наш текущий уровень в каких-либо прикладных областях, например, той же обработке естественного языка, сильнее движут вперед откровения, относящиеся к этой области, чем новые техники решения общих задач машинного обучения. Часто отличие программы, используемой каждый день, от полуработающей курсовой — это особый взгляд на проблему и хорошая модель решения.

Я не пытаюсь убедить вас не делать классных продуктов, основанных на машинном обучении. Я всего лишь пытаюсь прояснить, почему это так непросто.
Читать дальше →
Total votes 20: ↑19 and ↓1 +18
Views 2.2K
Comments 5

Не надо вычислять смысл и знания, когда их можно доставать из машинной памяти

IT Infrastructure *
Как говорил великий классик Аристотель, «известное, оказывается, известно немногим».

Языковеды всего мира подвержены одной пагубной иллюзии, полагая, что если они сумеют построить «правильный синтаксический граф», (то есть, «дерево фразы»), то они в этом случае, наконец-таки, решат это треклятую проблему машинной обработки естественно-язычных текстов (еят). Вот и ищут лингвисты денно и нощно какие-то мифические связи и отношения между словами (семантическими единицами) в предложениях и абзацах текстов. Да ещё и кибернетиков подключили к этим своим безуспешным поискам. Прошло уже полвека таких изысканий, а воз, как говорится, и поныне там. Не строится никак этот граф, давая много лет устойчивые 50% ошибок. Уже и сотни миллионов долларов потрачены. Один только проект «Watson» чего стоит. А ведь, в принципе, этих «связей и отношений» и нет на самом-то деле. Всё это, если внимательно вдуматься, искусственные наукообразные выдумки, из-за которых, собственно, прогресс в деле создания технологии осмысленной обработки еят зашел в тот тупик, где сейчас и пребывает.

Лингвисты как те инопланетяне, в руки которых попало обыкновенное для землян куриное яйцо. Вот они его могут изучать и так и сяк. И обмерить вдоль и поперек, и взвесить, и рентгеном просветить, и скорлупу исследовать на состав, и её твердость по Моосу замерить, и хрупкость уточнить, и цвет откалориметрировать. В общем провести всё, что только можно измерить, а вот понять, как оно образуется, того бедняги никак не смогут, поскольку самой курицы не знают и не ведали. Точно также не могли туземцы океанических островов нашей планеты понять, каким это образом транзисторный приемник, занесенный к ним западной цивилизацией, может издавать членораздельные звуки или звуковые мелодии. И как-бы они не изучали этот приемник, не пробовали его на зуб или на вкус, того бы вовек сами не поняли, что к такому устройству еще и радиостанция нужна. Подобная картина наблюдается и с языковедами, изучающими еят, как продукт (яйцо, транзистор) человеческого мышления (курицы, радиостанции), не обращая, при этом, внимания на самого «генератора (производителя) яйца».
Читать дальше →
Total votes 27: ↑13 and ↓14 -1
Views 1.8K
Comments 14

Какая же сила нужна «сильному ИИ»?

Brainfuck *
В принципе, любой Интеллект какого-либо Объекта или Системы определяется ПОВЕДЕНИЕМ этого Объекта или этой Системы, которое, в свою очередь, определяется в общем случае двумя технологиями: ФИЗИОЛОГИИ (Психики), как рефлекторные реакции на входное воздействие, и РАЗУМА (Сознания), как осмысленные решения на оценку обстановки.

Уровень известных «перцептронных» технологий (и иже с ними различной «нейро-кванто-семанто-статистико-математико-сетевой лабуды) это, как раз, технология Физиологии. То есть, пришёл сигнал на вход, значит, выполнил соответствующее действие. Но это просто «безмозглые автоматы» и вот они называются «слабым ИИ».
Однако, естественный Интеллект человека базируется, в основном, на второй технологии – на Разуме. А это уже «сильный ИИ». Вот в чём их принципиальная разница – в Сознании.
Читать дальше →
Total votes 38: ↑12 and ↓26 -14
Views 1.8K
Comments 82

Машинный перевод и автоматический словарь в Яндексе

Яндекс corporate blog
Каждый большой продукт включает в себя много сложных и интересных технологий, над созданием которых работали люди, зачастую посвятившие им целую жизнь. И в браузере Yandex реализованы многие разработки наших коллег, которые могут остаться не замеченными неспециалистами и казаться незначимыми деталями. Например, одной из облачных технологий Яндекса, которые интегрированы в Браузер, стал наш собственный переводчик.

Сам Яндекс.Перевод вышел из беты несколько месяцев назад. От других немногочисленных подобных сервисов его отличает автословарь, уникальная технология которого разработана командой лингвистов и программистов Яндекса. Во время его разработки удалось объединить современные статистические подходы машинного перевода и традиционные лингвистические инструменты.



Чтобы понять, насколько значимым шагом в развитии машинного перевода является появление автословаря, стоит вспомнить, что 20 лет назад были распространены синтаксические переводчики, для которых таблицы соответствия фраз на разных языках составляли вручную. Процесс их создания стал меняться только в конце 1990-х, когда появились первые статистические переводчики. Для обучения их моделям переводов стали использовать параллельные тексты. Документы, в которых одно и то же написано на разных языках, извлекали, например, из дипломатической документации. Большой базой параллельных текстов стали документы ООН. Но на подобной лексике создать общелексический переводчик не получилось, потому что даже неформальные тексты он переводил сухим дипломатическим языком.
Читать дальше →
Total votes 65: ↑59 and ↓6 +53
Views 19K
Comments 30

Новые подробности о шифре Copiale 18 века

Cryptography *


Журнал Wired опубликовал замечательную историю о том, как специалисты по машинному переводу текстов вместе с лингвистами сумели найти ключ к шифру масонского манускрипта 1760-1780-х годов, который никто не мог прочитать с момента его находки в 1970 году и который считался одним из самых трудных шифров в мире. О расшифровке рукописи сообщалось год назад — в октябре 2011 года, тогда были расшифрованы первые 16 страниц текста. С тех пор учёные значительно продвинулись в понимании этого уникального документа, составленного членами ордена Окулистов.

Оказалось, что кроме расшифрованного текста, отдельные символы расшифрованной рукописи означают цифры, которые составляют другую, отдельную шифрограмму, и её пока не удалось расшифровать.
Читать дальше →
Total votes 141: ↑137 and ↓4 +133
Views 61K
Comments 66

Loc Kit: управление локализацией и машинный перевод

Allcorrect Group corporate blog Programming *
Добрый день, читатели.

Мы продолжаем знакомить вас с докладчиками, которые выступят на конференции Loc Kit. На этот раз это специалисты из компаний IBM, Dell и Acronis.

image

На нашей конференции будет два доклада, посвященных машинному переводу, и это не случайно. В локализации программного обеспечения машинный перевод применяется давно, и, возможно, в некоторых областях живых переводчиков окончательно заменят человекоподобные роботы машинные.

image
Михаил Васильев, кандидат медицинских наук (не удивляйтесь ;)), работает в данной отрасли с 1988 года, с 1991 года — в компании IBM, а с 1992 года занимается вопросами поддержки национальных языков, а также переводом и локализацией.

Михаил — «отец» русской раскладки клавиатуры и русскоязычной версии OS/2. С 1995 года по настоящее время руководит Центром сервисных переводческих услуг IBM Russia/CIS.

image

Мы не утверждаем, что именно этот котик помог Михаилу придумать русскоязычную раскладку клавиатуры, но всё может быть.
Подробности
Total votes 6: ↑4 and ↓2 +2
Views 4.8K
Comments 7

Тренды локализации и локализация трендов: резюме Localization World-2013

ABBYY corporate blog
Недавно мы с коллегами побывали на конференции для тех, кто занимается локализацией всего на свете, — Localization World. Специализированных мероприятий для переводчиков не так уж и много. Есть мероприятия для фрилансеров, есть научные — к примеру, ежегодные конференции TAUS, есть отраслевые — как LegalTech. Localization World — единственное мероприятие, объединяющее тех, кто делает переводы, кто их заказывает и кто разрабатывает технологии для этой сферы. На ней обсуждают технологии, инструменты, системы статистики, сервисы и многое другое, без чего переводчику жить можно, но сложно.

Localization World стартовал в начале 2000-х годов — первая встреча состоялась осенью 2003 года в Сиэтле, и с тех пор проходит с аншлагом. Сначала конференция не была ежегодной, теперь же специалисты собираются аж на двух-трех LocWorld в год, в 2013 году уже прошли встречи в Сингапуре и Лондоне, последняя — 12-14 июня, а в начале октября мероприятие пройдет в США, в Силиконовой долине. На мероприятия приезжают около 400-500 человек, а это достаточно много для отрасли.
Читать дальше →
Total votes 16: ↑16 and ↓0 +16
Views 3.4K
Comments 2

SmartCAT: облачные технологии для переводчиков

ABBYY corporate blog
Работа переводчиков интересна: через них постоянно проходит много информации на разных языках. Часто случается, что перевод очередной 100-страничной инструкции нужен был ещё вчера. И если похожие тексты уже переводились ранее (предыдущие версии инструкции или другая техническая документация), то задача может быть немного проще, но при этом заниматься копипастом и следить, чтобы все изменения были учтены, то еще занятие. Для того чтобы использовать уже существующий перевод и обеспечить при этом его последовательность существует специальный класс программ, называемых CAT-инструментами.

CAT расшифровывается как Computer-Aided (Assisted) Translation – «перевод с помощью компьютера» или «автоматизированный перевод». Но не стоит отождествлять данные технологии с машинным переводом, когда вы вводите текст на одном языке, нажимаете кнопку и получаете его перевод: автоматизированный перевод — более широкое понятие, и в случае CAT-систем используется уже имеющийся перевод, сделанный человеком.

На днях ABBYY Language Services начала закрытое тестирование SmartCAT — собственной платформы для автоматизации процесса перевода. И в этом посте мы постараемся немного рассказать, что умеют делать CAT-системы.
Читать дальше →
Total votes 20: ↑20 and ↓0 +20
Views 24K
Comments 18

Easyling — подсчет сайтов в два клика

Allcorrect Group corporate blog
Tutorial
image

Сегодня мы впервые публикуем обзор программы от нашего технического специалиста Yuliya_Sadovnik

Из наших предыдущих статей вы могли узнать немного о «нетворческой» части процесса локализации, заглянуть на нашу внутреннюю кухню и убедиться, что локализация — это диагноз серьезно. Тем не менее, как бы хорошо ни был поставлен процесс, может возникнуть проблема или трудновыполнимая задача, на решение которой порой не хватает привычных ресурсов, и нужно искать спасение в новых или даже сочетать несколько.
Читать дальше →
Total votes 6: ↑4 and ↓2 +2
Views 3.2K
Comments 2