Мне очень понравилось слушать эти переводы и они очень хорошо отражают научный подход TED. Очень иронично показалось слушать историю о человеке потерявшем голос таким переводом. Теперь на работе удобно слушать TED, я хотел бы, чтобы вся переведенная на русский база TED была озвучена подобным образом.
Я так понимаю все равно какой то тюнинг проводится. Потому что в демо на сайте vitalvoice.ru/demo/ далеко не так хорошо с интонациями и знаками препинания.
Ага, писал сразу после просмотра видео, втянулся видимо. Сейчас перечитал и правда похоже на машинный перевод. Иронично, что мне это заметил человек с Вашим никнеймом. =)
Насчет голоса скажу вам, что после американских фильмов 90-ых годов, нас жителей постсоветского пространства не испугаешь приятным голосом и дикцией робота))
Робоголос действительно хорош, как и идея русской озвучки TED.
Единственное, что «резануло» по глазам — название («Фабрика речи» VoiceFabric), fabric в английском языке — это ткань, материал, а никак не фабрика.
На уровне, иногда бывают огрехи, но очень приятно что теперь я могу послушать выступления известных специалистов по космологии и квантовой физике. Жду продолжения.
А чем обусловлено такое ограничение? Просто очень интересно. Ресурсоемкость технологии, лицензионные ограничения, необходимость ручной доводки материала или желание растянуть интерес зрителя сериальной моделью?
сериальная модель, отчасти :)
С другой стороны — залить 10 роликов на vimeo + их оформить (ввести описание, поставить ссылки) + оформить на сайте, продумать, где оставить, чтобы заметили :) вообщем ресурсоемко.
сам процесс озвучки занимает где-то на 1 час видео — 5 минут работы движка.
Очень интересно — интонация в голосе выбирается автоматически основываясь только на пунктуации или каким-то образом используется оригинальная звуковая дорожка? Может быть вообще ее правил редактор?
С оригинальной дорожкой двойственная история. С одной стороны — она конечно мешает. С другой — помогает, так как из нее слушателем подсознательно берется оригинальное интонирование и эмоциональная окраска. А как известно, роботы хуже всего справляются с эмоциями.
Согласен, но может быть, ее сильнее приглушить? Приходится вслушиваться в русский текст.
Показалось, что русская речь немного отстает от английской, из-за этого интонации и акценты смещаются. Вы не подгоняли перевод так, чтобы он примерно попадал в английский темп?
Это самая интересная с точки зрения реализации задача.
Проблема ведь в том, что английская речь и русская разная по длительности звучания отдельных предложений. Английская короче. Поэтому синтез должен успеть произнести русское предложение и еще успеть его «привязать» (по смыслу и месту) к оригинальному звучанию. Профессиональный перевод (человеческий) справляется с этой задачей тем, что просто не все что говорится озвучивается. Плюс к этому человек-дублер работает на различных темпах. У синтеза тоже есть разные темпы, но звучит это неприятно для уха, когда одна фраза спокойная по темпу, а другая — с места в карьер.
И есть еще небольшая хитрость. Начало каждой фразы роботосинтеза смещено по отношению к оригиналу во всех роликах на 1,5 сек. Для достижения «эффекта Володарского», так сказать :)
Кстати, то ли технология другая то ли синтезированный голос «подтюнили», но на сайте продукт «RSS-радио» синтезирует голос на порядок «роботизированней» speechpro.ru/techno/synthesis -> rssradio.ru/
2:55 «Понимаете ли вы что все они [аварии] стали следствием человеческой ошибки, а не ошибки машины… И могут быть предотвращены с помощью той же машины.»
Когда ситнезированный голос, говорит про ошибки человека и предлагает заменить человека на машину — это как-то очень напоминает GladOS из Portal :)
У меня на базе ЦРТ работает автоматическое радио — bot.fm
Просто выделяешь любой текст, выбираешь голос, жмешь внопку — оно озвучивается и вставляется тебе в боткаст.
Русский голос TED