Комментарии 64
Таки надо оригинальную звуковую дорожу делать тише, а то треш какой-то получился.
очень недурно!
Мне очень понравилось слушать эти переводы и они очень хорошо отражают научный подход TED. Очень иронично показалось слушать историю о человеке потерявшем голос таким переводом. Теперь на работе удобно слушать TED, я хотел бы, чтобы вся переведенная на русский база TED была озвучена подобным образом.
Вы специально строите свои предложения, чтобы они были похожи на машинный перевод?
Переводы берутся из субтитров, созданных усилиями сообщества TED.
Все процессы представленного проекта предельно автоматизированы.
Все процессы представленного проекта предельно автоматизированы.
Я так понимаю все равно какой то тюнинг проводится. Потому что в демо на сайте vitalvoice.ru/demo/ далеко не так хорошо с интонациями и знаками препинания.
Ага, писал сразу после просмотра видео, втянулся видимо. Сейчас перечитал и правда похоже на машинный перевод. Иронично, что мне это заметил человек с Вашим никнеймом. =)
Это синтезируемая речь? Я не верю!
Хорошая реклама от Dodge на эту тему ) www.youtube.com/watch?v=Qw7_UTk0d6Y
А технология может работать real time? Я уже представил как это толкнет IT стран СНГ вперед...:)
Это просто невероятно.
А субтитры делаются вручную или генерируются системой распознавания голоса?
А субтитры делаются вручную или генерируются системой распознавания голоса?
НЛО прилетело и опубликовало эту надпись здесь
Хорошо, даже очень Хорошо.
Насчет голоса скажу вам, что после американских фильмов 90-ых годов, нас жителей постсоветского пространства не испугаешь приятным голосом и дикцией робота))
VoiceFabric — это скорее материя речи, чем фабрика речи.
Робоголос действительно хорош, как и идея русской озвучки TED.
Единственное, что «резануло» по глазам — название («Фабрика речи» VoiceFabric), fabric в английском языке — это ткань, материал, а никак не фабрика.
Единственное, что «резануло» по глазам — название («Фабрика речи» VoiceFabric), fabric в английском языке — это ткань, материал, а никак не фабрика.
На уровне, иногда бывают огрехи, но очень приятно что теперь я могу послушать выступления известных специалистов по космологии и квантовой физике. Жду продолжения.
Каждый четверг — 10 новых роликов.
Теперь буду ждать как сериал :)
А чем обусловлено такое ограничение? Просто очень интересно. Ресурсоемкость технологии, лицензионные ограничения, необходимость ручной доводки материала или желание растянуть интерес зрителя сериальной моделью?
Очень интересно — интонация в голосе выбирается автоматически основываясь только на пунктуации или каким-то образом используется оригинальная звуковая дорожка? Может быть вообще ее правил редактор?
Редактор ничего не правил :)
Здорово! осталось только «булькание» убрать и будет не отличить
Клево, но как убрать английскую дорожку?
С оригинальной дорожкой двойственная история. С одной стороны — она конечно мешает. С другой — помогает, так как из нее слушателем подсознательно берется оригинальное интонирование и эмоциональная окраска. А как известно, роботы хуже всего справляются с эмоциями.
Согласен, но может быть, ее сильнее приглушить? Приходится вслушиваться в русский текст.
Показалось, что русская речь немного отстает от английской, из-за этого интонации и акценты смещаются. Вы не подгоняли перевод так, чтобы он примерно попадал в английский темп?
Показалось, что русская речь немного отстает от английской, из-за этого интонации и акценты смещаются. Вы не подгоняли перевод так, чтобы он примерно попадал в английский темп?
Это самая интересная с точки зрения реализации задача.
Проблема ведь в том, что английская речь и русская разная по длительности звучания отдельных предложений. Английская короче. Поэтому синтез должен успеть произнести русское предложение и еще успеть его «привязать» (по смыслу и месту) к оригинальному звучанию. Профессиональный перевод (человеческий) справляется с этой задачей тем, что просто не все что говорится озвучивается. Плюс к этому человек-дублер работает на различных темпах. У синтеза тоже есть разные темпы, но звучит это неприятно для уха, когда одна фраза спокойная по темпу, а другая — с места в карьер.
Проблема ведь в том, что английская речь и русская разная по длительности звучания отдельных предложений. Английская короче. Поэтому синтез должен успеть произнести русское предложение и еще успеть его «привязать» (по смыслу и месту) к оригинальному звучанию. Профессиональный перевод (человеческий) справляется с этой задачей тем, что просто не все что говорится озвучивается. Плюс к этому человек-дублер работает на различных темпах. У синтеза тоже есть разные темпы, но звучит это неприятно для уха, когда одна фраза спокойная по темпу, а другая — с места в карьер.
И есть еще небольшая хитрость. Начало каждой фразы роботосинтеза смещено по отношению к оригиналу во всех роликах на 1,5 сек. Для достижения «эффекта Володарского», так сказать :)
Кстати, то ли технология другая то ли синтезированный голос «подтюнили», но на сайте продукт «RSS-радио» синтезирует голос на порядок «роботизированней» speechpro.ru/techno/synthesis -> rssradio.ru/
Google уже хочет вас купить =)
2:55 «Понимаете ли вы что все они [аварии] стали следствием человеческой ошибки, а не ошибки машины… И могут быть предотвращены с помощью той же машины.»
Когда ситнезированный голос, говорит про ошибки человека и предлагает заменить человека на машину — это как-то очень напоминает GladOS из Portal :)
ps: Проект отличный! Будущее здесь.
Когда ситнезированный голос, говорит про ошибки человека и предлагает заменить человека на машину — это как-то очень напоминает GladOS из Portal :)
ps: Проект отличный! Будущее здесь.
Спасибо. Очень интересно, как IT специалисту. Немного неинтересно, как человеку, изучающему английский язык с помощью TED.
Неужели мы дожили до этого момента?
Просто суперовая технология!
Будущее здесь!
Просто суперовая технология!
Будущее здесь!
> Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык.
Почему приятно? Вы не знаете английский язык? Вы, пишуший на Хабрахабре. Сайте об IT. Ужас…
Почему приятно? Вы не знаете английский язык? Вы, пишуший на Хабрахабре. Сайте об IT. Ужас…
Интонирование речи приятно удивило. Как это достигается? Расставить правильные интонации — это очень сложная задача.
С синтезом, конечно, косяки вылазят. Форманты плохо стыкуются. Не пойму, в чем проблема добиться гладкой стыковки?
С синтезом, конечно, косяки вылазят. Форманты плохо стыкуются. Не пойму, в чем проблема добиться гладкой стыковки?
Птица Говорун)
Очень впечатляет
я понял, что это не человек, только когда он начал заикаться в середине.
и голос очень приятный, бархатистый. надеюсь, диктор, отдавший его бездушной машине, не будет распят какой-нибудь актёрской гильдией ;)
и голос очень приятный, бархатистый. надеюсь, диктор, отдавший его бездушной машине, не будет распят какой-нибудь актёрской гильдией ;)
Очень впечатляет! А скоро у простых юзеров появится возможность использовать Вашу технологию?
Шикарно! Не знал что есть что-то подобное. Интересно насколько сложно заставить робота интонировать основываясь на оригинальной дорожке…
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Русский голос TED