Pull to refresh

Comments 64

Таки надо оригинальную звуковую дорожу делать тише, а то треш какой-то получился.
Заменил ролик на более правильный по звуку. Остальные ролики здесь.
Мне очень понравилось слушать эти переводы и они очень хорошо отражают научный подход TED. Очень иронично показалось слушать историю о человеке потерявшем голос таким переводом. Теперь на работе удобно слушать TED, я хотел бы, чтобы вся переведенная на русский база TED была озвучена подобным образом.
Вы специально строите свои предложения, чтобы они были похожи на машинный перевод?
Переводы берутся из субтитров, созданных усилиями сообщества TED.
Все процессы представленного проекта предельно автоматизированы.
Я так понимаю все равно какой то тюнинг проводится. Потому что в демо на сайте vitalvoice.ru/demo/ далеко не так хорошо с интонациями и знаками препинания.
Новая версия движка на совершенно иных принципах. На демо еще не обновили.
Ага, писал сразу после просмотра видео, втянулся видимо. Сейчас перечитал и правда похоже на машинный перевод. Иронично, что мне это заметил человек с Вашим никнеймом. =)
Это синтезируемая речь? Я не верю!
Да, неплохо, но прослушиваются «провалы» в голосе подобно таким как в festival.
Или мне кажется, или иногда голос прямо посередине слов как будто реверберирует.
А я не верю, что можно принять ее за настоящую. Да, очень круто, иногда даже похоже. Но давайте без пафоса.
А технология может работать real time? Я уже представил как это толкнет IT стран СНГ вперед...:)
Это просто невероятно.
А субтитры делаются вручную или генерируются системой распознавания голоса?
Вручную, конечно.
UFO landed and left these words here
ну да, очень неплохо изучить два-три десятка языков. ну и умереть потом спокойно, ощущая себя интеллектуалом
UFO landed and left these words here
А все серии рабыни Изауры — на португальском.
Зная два-три десятка языков, человек уже не просто знает два-три десятка языков. Странно это объяснять [вроде бы] образованному человеку.
Насчет голоса скажу вам, что после американских фильмов 90-ых годов, нас жителей постсоветского пространства не испугаешь приятным голосом и дикцией робота))
VoiceFabric — это скорее материя речи, чем фабрика речи.
Но на логотипе буквы I оформлены в виде труб, из которых валит дым (в форме «комиксного облачка»), что тоже намекает на «фабрику».
Робоголос действительно хорош, как и идея русской озвучки TED.
Единственное, что «резануло» по глазам — название («Фабрика речи» VoiceFabric), fabric в английском языке — это ткань, материал, а никак не фабрика.
На уровне, иногда бывают огрехи, но очень приятно что теперь я могу послушать выступления известных специалистов по космологии и квантовой физике. Жду продолжения.
Каждый четверг — 10 новых роликов.
Теперь буду ждать как сериал :)
А чем обусловлено такое ограничение? Просто очень интересно. Ресурсоемкость технологии, лицензионные ограничения, необходимость ручной доводки материала или желание растянуть интерес зрителя сериальной моделью?
сериальная модель, отчасти :)
С другой стороны — залить 10 роликов на vimeo + их оформить (ввести описание, поставить ссылки) + оформить на сайте, продумать, где оставить, чтобы заметили :) вообщем ресурсоемко.
сам процесс озвучки занимает где-то на 1 час видео — 5 минут работы движка.
Очень интересно — интонация в голосе выбирается автоматически основываясь только на пунктуации или каким-то образом используется оригинальная звуковая дорожка? Может быть вообще ее правил редактор?
Здорово! осталось только «булькание» убрать и будет не отличить
насколько я понял, бульканье появляется, когда робот торопится. когда медленно говорит — вообще незаметно, что это не человеческий диктор.

всплывает проблема английского языка с его словами, более короткими, чем наши. думаю, в случае с немецким будет проще.
Клево, но как убрать английскую дорожку?
С оригинальной дорожкой двойственная история. С одной стороны — она конечно мешает. С другой — помогает, так как из нее слушателем подсознательно берется оригинальное интонирование и эмоциональная окраска. А как известно, роботы хуже всего справляются с эмоциями.
Согласен, но может быть, ее сильнее приглушить? Приходится вслушиваться в русский текст.
Показалось, что русская речь немного отстает от английской, из-за этого интонации и акценты смещаются. Вы не подгоняли перевод так, чтобы он примерно попадал в английский темп?
Это самая интересная с точки зрения реализации задача.
Проблема ведь в том, что английская речь и русская разная по длительности звучания отдельных предложений. Английская короче. Поэтому синтез должен успеть произнести русское предложение и еще успеть его «привязать» (по смыслу и месту) к оригинальному звучанию. Профессиональный перевод (человеческий) справляется с этой задачей тем, что просто не все что говорится озвучивается. Плюс к этому человек-дублер работает на различных темпах. У синтеза тоже есть разные темпы, но звучит это неприятно для уха, когда одна фраза спокойная по темпу, а другая — с места в карьер.
И есть еще небольшая хитрость. Начало каждой фразы роботосинтеза смещено по отношению к оригиналу во всех роликах на 1,5 сек. Для достижения «эффекта Володарского», так сказать :)
Кстати, то ли технология другая то ли синтезированный голос «подтюнили», но на сайте продукт «RSS-радио» синтезирует голос на порядок «роботизированней» speechpro.ru/techno/synthesis -> rssradio.ru/
Новая версия движка на совершенно иных принципах. На демо еще не обновили.
2:55 «Понимаете ли вы что все они [аварии] стали следствием человеческой ошибки, а не ошибки машины… И могут быть предотвращены с помощью той же машины.»

К