Как стать автором
Обновить

Комментарии 64

Таки надо оригинальную звуковую дорожу делать тише, а то треш какой-то получился.
Заменил ролик на более правильный по звуку. Остальные ролики здесь.
О, теперь хорошо.
Мне очень понравилось слушать эти переводы и они очень хорошо отражают научный подход TED. Очень иронично показалось слушать историю о человеке потерявшем голос таким переводом. Теперь на работе удобно слушать TED, я хотел бы, чтобы вся переведенная на русский база TED была озвучена подобным образом.
Вы специально строите свои предложения, чтобы они были похожи на машинный перевод?
Переводы берутся из субтитров, созданных усилиями сообщества TED.
Все процессы представленного проекта предельно автоматизированы.
Я так понимаю все равно какой то тюнинг проводится. Потому что в демо на сайте vitalvoice.ru/demo/ далеко не так хорошо с интонациями и знаками препинания.
Новая версия движка на совершенно иных принципах. На демо еще не обновили.
Ага, писал сразу после просмотра видео, втянулся видимо. Сейчас перечитал и правда похоже на машинный перевод. Иронично, что мне это заметил человек с Вашим никнеймом. =)
Это синтезируемая речь? Я не верю!
Да, неплохо, но прослушиваются «провалы» в голосе подобно таким как в festival.
Или мне кажется, или иногда голос прямо посередине слов как будто реверберирует.
А я не верю, что можно принять ее за настоящую. Да, очень круто, иногда даже похоже. Но давайте без пафоса.
А технология может работать real time? Я уже представил как это толкнет IT стран СНГ вперед...:)
Может.
Это просто невероятно.
А субтитры делаются вручную или генерируются системой распознавания голоса?
Вручную, конечно.
НЛО прилетело и опубликовало эту надпись здесь
ну да, очень неплохо изучить два-три десятка языков. ну и умереть потом спокойно, ощущая себя интеллектуалом
НЛО прилетело и опубликовало эту надпись здесь
А все серии рабыни Изауры — на португальском.
Зная два-три десятка языков, человек уже не просто знает два-три десятка языков. Странно это объяснять [вроде бы] образованному человеку.
Хорошо, даже очень Хорошо.
Насчет голоса скажу вам, что после американских фильмов 90-ых годов, нас жителей постсоветского пространства не испугаешь приятным голосом и дикцией робота))
VoiceFabric — это скорее материя речи, чем фабрика речи.
Но на логотипе буквы I оформлены в виде труб, из которых валит дым (в форме «комиксного облачка»), что тоже намекает на «фабрику».
Робоголос действительно хорош, как и идея русской озвучки TED.
Единственное, что «резануло» по глазам — название («Фабрика речи» VoiceFabric), fabric в английском языке — это ткань, материал, а никак не фабрика.
На уровне, иногда бывают огрехи, но очень приятно что теперь я могу послушать выступления известных специалистов по космологии и квантовой физике. Жду продолжения.
Каждый четверг — 10 новых роликов.
Теперь буду ждать как сериал :)
А чем обусловлено такое ограничение? Просто очень интересно. Ресурсоемкость технологии, лицензионные ограничения, необходимость ручной доводки материала или желание растянуть интерес зрителя сериальной моделью?
сериальная модель, отчасти :)
С другой стороны — залить 10 роликов на vimeo + их оформить (ввести описание, поставить ссылки) + оформить на сайте, продумать, где оставить, чтобы заметили :) вообщем ресурсоемко.
сам процесс озвучки занимает где-то на 1 час видео — 5 минут работы движка.
Очень интересно — интонация в голосе выбирается автоматически основываясь только на пунктуации или каким-то образом используется оригинальная звуковая дорожка? Может быть вообще ее правил редактор?
Здорово! осталось только «булькание» убрать и будет не отличить
насколько я понял, бульканье появляется, когда робот торопится. когда медленно говорит — вообще незаметно, что это не человеческий диктор.

всплывает проблема английского языка с его словами, более короткими, чем наши. думаю, в случае с немецким будет проще.
Клево, но как убрать английскую дорожку?
С оригинальной дорожкой двойственная история. С одной стороны — она конечно мешает. С другой — помогает, так как из нее слушателем подсознательно берется оригинальное интонирование и эмоциональная окраска. А как известно, роботы хуже всего справляются с эмоциями.
Согласен, но может быть, ее сильнее приглушить? Приходится вслушиваться в русский текст.
Показалось, что русская речь немного отстает от английской, из-за этого интонации и акценты смещаются. Вы не подгоняли перевод так, чтобы он примерно попадал в английский темп?
Это самая интересная с точки зрения реализации задача.
Проблема ведь в том, что английская речь и русская разная по длительности звучания отдельных предложений. Английская короче. Поэтому синтез должен успеть произнести русское предложение и еще успеть его «привязать» (по смыслу и месту) к оригинальному звучанию. Профессиональный перевод (человеческий) справляется с этой задачей тем, что просто не все что говорится озвучивается. Плюс к этому человек-дублер работает на различных темпах. У синтеза тоже есть разные темпы, но звучит это неприятно для уха, когда одна фраза спокойная по темпу, а другая — с места в карьер.
И есть еще небольшая хитрость. Начало каждой фразы роботосинтеза смещено по отношению к оригиналу во всех роликах на 1,5 сек. Для достижения «эффекта Володарского», так сказать :)
Кстати, то ли технология другая то ли синтезированный голос «подтюнили», но на сайте продукт «RSS-радио» синтезирует голос на порядок «роботизированней» speechpro.ru/techno/synthesis -> rssradio.ru/
Новая версия движка на совершенно иных принципах. На демо еще не обновили.
Google уже хочет вас купить =)
2:55 «Понимаете ли вы что все они [аварии] стали следствием человеческой ошибки, а не ошибки машины… И могут быть предотвращены с помощью той же машины.»

Когда ситнезированный голос, говорит про ошибки человека и предлагает заменить человека на машину — это как-то очень напоминает GladOS из Portal :)

ps: Проект отличный! Будущее здесь.
Спасибо. Очень интересно, как IT специалисту. Немного неинтересно, как человеку, изучающему английский язык с помощью TED.
Неужели мы дожили до этого момента?
Просто суперовая технология!
Будущее здесь!
> Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык.

Почему приятно? Вы не знаете английский язык? Вы, пишуший на Хабрахабре. Сайте об IT. Ужас…
Поверьте, не все знают английский настолько хорошо, чтобы нормально понимать разговорную речь
Я верю. Поэтому надо не переводить и тормозить процесс обучения, а изучать долбанный английский язык!
Интонирование речи приятно удивило. Как это достигается? Расставить правильные интонации — это очень сложная задача.

С синтезом, конечно, косяки вылазят. Форманты плохо стыкуются. Не пойму, в чем проблема добиться гладкой стыковки?
я понял, что это не человек, только когда он начал заикаться в середине.

и голос очень приятный, бархатистый. надеюсь, диктор, отдавший его бездушной машине, не будет распят какой-нибудь актёрской гильдией ;)
Очень впечатляет! А скоро у простых юзеров появится возможность использовать Вашу технологию?
У меня на базе ЦРТ работает автоматическое радио — bot.fm
Просто выделяешь любой текст, выбираешь голос, жмешь внопку — оно озвучивается и вставляется тебе в боткаст.
Ссылку не открыть.
Сайт стоит на locum.ru к сожалению. Они нестабильны и медленны.
Сейчас вот заработало.
Шикарно! Не знал что есть что-то подобное. Интересно насколько сложно заставить робота интонировать основываясь на оригинальной дорожке…
Что такое «оригинальня дорожка»?
английская речь
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории