Обновить

Комментарии 9

Контроль качества переводов на основе ИИ

Единственная понятная, в смысле цели проекта, фраза из статьи. Правда, неясно, а зачем нужно контролировать это качество, кому именно и что именно?

Меня, вот, интересует «буквальный контекстный перевод» (БКП), относительно автономных, коротких смысловых фраз длинного предложения. Например, во французском языке. Какое, здесь, может быть «качество» и его «контроль»? «Качество», в данном случае это просто соответствие фразы одного языка фразе другого, причем максимально буквально, но, с охранением смысла, просто, чтобы учить иностранные слова в контексте их использования. А «контроль» тут, как по мне, вообще не нужен. Лучше, пусть ваш ИИ подскажет алгоритм, на Питоне, как разбить французские слова в предложении на слоги?

Дело в том, что ИИ-сервисы делают это на «раз-два», но для целей синтаксического слогоделения, т.е. правил переноса для письменной речи, а мне надо для фонетического слогоделения, такого, чтобы слоги содержали один произносимый гласный звук. Все бесплатные ИИ-сервисы не могут дать фонетическое слогоделение правильно, всегда с ошибками, даже французский «Мистраль». Хотя, транскрпицию они делят на слоги почти идеально. Но, обычный текст не могут, как их не уговаривай. Поддакивают, что они не правы, но кидаются из одной крайности в другую и так по циклу.

Вот это понятная задача. А зачем нужен ваш «контроль качества» – непонятно!

Вы правы, есть вопросы. Конкретные проблемы, которые решает KTTC:
Профессиональные переводчики - проверяют качество работы перед сдачей клиенту (экономия времени на ручной вычитке)
Переводческие агентства - контролируют качество работы фрилансеров, оценивают сотни переводов в день
Компании с многоязычным контентом - проверяют качество машинного перевода документации, интерфейсов, маркетинговых материалов
Локализация софта/игр - автоматическая проверка терминологии, стиля, культурной адаптации

Вместо ручной проверки 100 страниц = 8 часов работы, автоматическая оценка делает это за 2 минуты
Объективные метрики (точность, флюентность, терминология) вместо субъективного "кажется нормально"
Выявление типичных ошибок: неправильные термины, несоответствие тону, фактические неточности.

У вас немного другая, но интересная проблема. Лингвистический анализ для обучения языкам. Это отдельная ниша. Пробовали API от forvo.com для реальных произношений? Или может связку epitran (графема→фонема) + syllabifier

Конкретные проблемы, которые решает KTTC

Понятно, но это для крупного бизнеса, поэтому, решения для себя и «простых смертных» нужно ваять самому.

Пробовали API от forvo.com для реальных произношений? Или может связку epitran (графема→фонема) + syllabifier

Спасибо за информацию. Только сайт не грузится, наверное, надо использовать вэпээн. Остальные моменты приму к сведению, возможно, попробую.

Пока, свои задачи решаю в полуавтоматическом режиме. Несложно наваять скрипт, который делит предложения по знакам пунктуации и словам-связкам. Потом проходишь его вручную и корректируешь шероховатости. Тоже, по слогоделению текста. Беру синтаксическое разделение обычного текста и фонетическое разделение транскрипции от ИИ-сервиса и, далее, всё корректирую вручную. Ручная проверка в любом случае нужна, чтобы осваивать язык, его нужно пропускать через себя, а, поскольку, я готовлю обучающие данные и для пользователей, то, чем меньше там будет ошибок, тем лучше. В крайнем случае, пользователь моей обучающей программы может разобрать данные, отредактировать их и пересобрать заново (см. мою статью: «Уроки французского и пересоздание данных для изучения иностранного языка с помощью обучающей программы «L'école»» : https://habr.com/ru/articles/972594/ ) .

Так что, безвыходных ситуаций не бывает: «В любом случае, существует три выхода, даже если вас – съели!».

Хех, спасибо! Почитаю) успехов вам

Знаю одно место, которое почему-то абсолютно не горит желанием сделать нормальный перевод с китайского на русский. И это даже не Али)))

P.s. уже вправду думаю что это не баг, а фича

Если бы у них был инструмент, который автоматически находит самые критичные косяки, но может это их фишка да. Или просто их и так все устраивает.

Это особенность страны, многие таблички на двух языках, и английский там хромает.

И это даже не Али)))

Но продавцы теже и алистайл - их неотъемлемая фишка :-))

Да, читаешь и не понимаешь, что ты купил)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации