Pull to refresh
  • by relevance
  • by date
  • by rating

«Тинькофф банк» разработал голосового помощника-мужчину по имени Олег или Иван

Artificial Intelligence Voice user interfaces
Вчера на корпоративе сотрудников «Тинькофф банка» основатель и председатель совета директоров банка Олег Тиньков объявил, что компания разработала голосового помощника, который может общаться с пользователями на естественном языке, почти как Алиса от «Яндекса», пишут «Ведомости». Официальная презентация состоится через неделю.

«Пока очень скромно, мы решили назвать „Олег”. Но может быть, ещё поменяем, может, „Иван” назовём», — сказал Тиньков на корпоративе, отвечая на вопрос Ивана Урганта.
Читать дальше →
Total votes 16: ↑9 and ↓7 +2
Views 5K
Comments 21

Нейросеть Facebook заговорила голосом Билла Гейтса

Artificial Intelligence The future is here


Шон Васкез и Майк Льюис из компании Facebook представили синтезатор речи с новым принципом работы весьма эффектным образом: на аккаунте разработчиков на Github появилась коллекция сэмплов, где нейросеть убедительно имитирует речь основателя Microsoft. На записях звучат несколько коротких фраз произвольного содержания, в которых не только точно копируется тембр голоса Гейтса, но и тонко передаются естественные интонации — последнее долгое время оставалось для искусственного интеллекта недосягаемо высокой планкой.
Читать дальше →
Total votes 10: ↑9 and ↓1 +8
Views 5.3K
Comments 11

Российский стартап клонирования голоса Vera Voice выходит на американский рынок

Start-up development Artificial Intelligence Sound
image

Российский сервис Vera Voice объявил о запуске технологии в США. В приложения клонирования голоса Parodist теперь есть возможность создавать контент на английском языке. Пока доступны голоса 32 знаменитых личностей, в том числе Дональда Трампа, Джо Байдена, Уилла Смита и Билли Айлиш.
Читать дальше →
Total votes 10: ↑10 and ↓0 +10
Views 2.6K
Comments 2

Nvidia представила нейромодель генерации выразительной речи

Artificial Intelligence Sound

Nvidia на конференции Interspeech показала модель диалогового ИИ для выразительного синтеза речи, чтобы генерировать голоса для персонажей, виртуальных помощников и персонализированных аватаров. Технология позволяет имитировать ритм, интонации и тембры голосов людей.

Читать далее
Total votes 12: ↑12 and ↓0 +12
Views 2.1K
Comments 4

Подкастинг меняет традиционные СМИ

Lumber room
Французская газета International Herald Tribune (IHT) стала, наверное, первой в мире, которая полностью интегрировала подкастинг в систему публикации материалов. Теперь у них на каждой веб-странице имеется кнопка «Нажмите здесь, чтобы прослушать эту страницу».
Читать дальше →
Rating 0
Views 264
Comments 20

Озвучка закрытия и открытия крышки ноутбука и синтез речи в Ubuntu

Lumber room
Можно заставить ноутбук разговаривать при открытии и закрытии крышки, это поднимет настроение вам и повеселит ваших друзей.

Выглядеть это будет примерно так: видео на youtube.

Причем речь мы будем синтезировать, то есть, вы пишите текст, а ноутбук будет это произносить. Естественно, таким образом вы сможете настроить, что именно будет произносить ваш ноутбук, когда вы закрываете крышку.

Читать дальше →
Total votes 30: ↑27 and ↓3 +24
Views 624
Comments 16

Обзор мобильных Text-To-Speech движков

Development of mobile applications *
imageЕсли Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.
Читать дальше →
Total votes 35: ↑32 and ↓3 +29
Views 45K
Comments 23

YouTube Create, или разговор роботов

IT-companies
На YouTube запущен новый раздел — www.youtube.com/create

Теперь можно создавать анимированные ролики, озвученные синтезированными голосами и размещать их на видеохостинге.

Идея реализована при помощи партнеров YouTube, которые сейчас не всегда справляются с нагрузками. Мне не удалось разместить ролик на канале после его создания и preview-просмотра.

Но как итог — возможно создание вот таких видео:



*доступен ли русский язык, так и не смог разобраться.
… видимо, ожидается бурное рождение новых мемов.

Заявлены следующие возможности:
  • запись собственного голоса;
  • загрузка собственной музыки;
  • сочетание выражений лица и движений;
  • создание собственных персонажей;
  • наложение различных спецэффектов.
Total votes 91: ↑79 and ↓12 +67
Views 633
Comments 49

Русский голос TED

Self Promo


Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык. Вдвойне приятно, когда делают качественную озвучку. Но если в этом замешаны высокие технологии — тогда вообще замечательно.

Недавно Центр речевых технологий — компания, одна из немногих имеющая собственные системы синтеза и распознавания речи, — начала озвучивание на русский язык материалов конференции TED, используя технологию синтеза русской речи. Озвученные роботом материалы размещаются в блоге «Фабрика речи» (VoiceFabric).
Читать дальше →
Total votes 85: ↑82 and ↓3 +79
Views 1K
Comments 64

Робот Милена исполняет желания в Twitter

Самый Нужный ТЕЛЕФОН corporate blog
Привет, Хабр!

У нас для вас очередная радостная новость. Голосовой сервис заказа услуг и товаров «Самый нужный телефон» обзавелся собственным ботом. Одно сообщение роботу Милене — и желание осуществится.


Читать дальше →
Total votes 10: ↑6 and ↓4 +2
Views 1K
Comments 9

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 1

Центр речевых технологий (ЦРТ) corporate blog Asterisk *Development of communication systems *
Часть 2
Часть 3
Часть 4

Учитывая, возросший интерес сообщества к Asterisk решил внести и свою лепту и рассказать о построении голосовых меню с использованием синтеза и распознавания речи.

Статья рассчитана на специалистов, имеющих опыт работы с построением IVR в Asterisk и имеющих представление о системах голосового самообслуживания.

СГС (системы голосового самообслуживания) значительно расширяют возможности по созданию голосовых приложений и позволяют пользователю получать информацию и заказывать услуги самостоятельно, без участия оператора. Это может быть маршрутизация вызовов, запрос и выдача информации по расписанию авиарейсов, состояние банковского счета, заказ такси, запись на прием к врачу и пр.
Распознавание позволяет отказаться от линейных меню, создаваемых с помощью DTMF, разговаривать с системой человеческим языком и легко создавать меню с множественным выбором.
Синтез значительно упрощает работу с динамически меняющейся информацией и большими объемами текстовых данных.


Читать дальше →
Total votes 26: ↑25 and ↓1 +24
Views 27K
Comments 22

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 2

Центр речевых технологий (ЦРТ) corporate blog Asterisk *Development of communication systems *
Часть 1
Часть 3
Часть 4

В предыдущей статье была описана общая схема работы, установлен UniMRCP, Asterisk подключен к VoiceNavigator и создано простое голосовое приложение.
Остановимся подробнее на возможностях синтеза и распознавания. Первая часть статьи будет посвящена языку разметки SSML, вторая — построению грамматик.

Использование языка разметки SSML


Управление синтезом речи на лингвистическом и акустическом уровне, происходит с помощью управляющих тегов в формате SSML.
С помощью тегов можно определить произношение, управлять интонацией, скоростью и громкостью звучания и т.д.
Опишу только наиболее используемые теги.
Подробную информацию по всем тегам можно получит в описании стандарта .
Читать дальше →
Total votes 22: ↑21 and ↓1 +20
Views 7.5K
Comments 8

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 3

Центр речевых технологий (ЦРТ) corporate blog Asterisk *Development of communication systems *
Часть 1
Часть 2
Часть 4

В предыдущей статье было рассказано о тегах синтеза и о построении грамматик распознавания.
В этой части мне хотелось бы показать построение конкретного голосового приложения в Asterisk. Чтобы не придумывать голосовое меню для магазина «Рога и копыта», решил поступить проще и найти на Хабре ранее реализованный пример, на котором можно наглядно показать преимущества использования синтеза и распознавания.

На Хабре нашелся вот этот пост, который когда-то довольно активно обсуждался. Автор предлагает прослушивать прогноз погоды по телефону, используя множество предзаписанных файлов и xml-информеры с сайта Gismeteo. Мне хотелось бы усовершенствовать данное приложение и показать, как синтез и распознавание облегчают жизнь при построении IVR и получении динамической информации.

Приложение будет запрашивать город, погоду в котором хотелось бы узнать, затем спрашивать время (сегодня днем, завтра вечером и т.д.) и сообщать необходимую информацию.
Читать дальше →
Total votes 15: ↑14 and ↓1 +13
Views 5.5K
Comments 2

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 4

Центр речевых технологий (ЦРТ) corporate blog Asterisk *Development of communication systems *
VoiceNavigator Asterisk UniMRCP

Часть 1
Часть 2
Часть 3

В четвертой части, как и было обещано, рассмотрим ограничения и недостатки Asterisk как голосовой платформы и особенности его взаимодействия с VoiceNavigator.
Голосовая платформа – это программно-аппаратный комплекс с функциями синтеза и распознавания речи, позволяющий создавать решения, направленные на оптимизацию работы контакт-центра, усовершенствование работы с клиентами и построение систем голосового самообслуживания.

Asterisk голосовой платформой в чистом виде не является, т.к. работа с серверами синтеза и распознавания не является его основной задачей и реализуется посредством UniMRCP. Поэтому часть недостатков и ограничений связана именно с реализацией работы в UniMRCP.

Среди больших и известных голосовых платформ, использующихся в колл-центрах для построения СГС, стоит отметить Avaya Voice Portal, Genesys Voice Platform, Siemens OpenScape CCVP, Cisco Unified CCX, Voxeo, Voxpilot.
Информации в Рунете очень не много, как и специалистов по данным продуктам с соответствующим уровнем компетенции. Используются в больших колл-центрах, стоимость соответствующая, и доступна она только для больших компаний.
Если будет интерес к какой-то из платформ, готов написать о них отдельно.

Два основных недостатка, существующие в Asterisk+UniMRCP — это отсутствие поддержки VoiceXML и неработающий barge-in для синтеза речи.
Читать дальше →
Total votes 6: ↑6 and ↓0 +6
Views 7.2K
Comments 3

«Умный дом» собственными руками

Computer hardware
Sandbox
Представьте картину: вы входите домой, автоматически включается свет и приятный женский (мужской, впрочем — кому как) голос приветствует вас. Вы небрежно бросаете фразу в сторону микрофона: «Дом, включи мой компьютер». Через несколько секунд слышите привычный шелест кулеров своего родного железного коня.

Фантастика? Под хабракатом я хочу поделиться своими успехами в построении подобной системы у себя дома.
Читать дальше →
Total votes 88: ↑68 and ↓20 +48
Views 70K
Comments 47

FreeSWITCH + mod_unimrcp + VoiceNavigator. Синтез и распознавание русской речи во FreeSWITCH

Центр речевых технологий (ЦРТ) corporate blog Development of communication systems *
VoiceNavigator FreeSWITCH UniMRCP

В продолжение серии статей об интеграции Asterisk и VoiceNavigator опишу интеграцию VoiceNavigator с FreeSWITCH.

На Хабре имеется несколько статей и упоминаний об FS, но с популярностью Asterisk он не сравнится))

FreeSWITCH, являясь продолжением и развитием идей заложенных в Asterisk, имеет действительно модульную архитектуру, где весь основной функционал, на сколько это возможно, вынесен в отдельные модули. Это позволяет обеспечить большую гибкость создаваемых решений, масштабируемых от софтфона до софтсвича. FreeSWITCH может быть использован в качестве коммутатора, АТС, медиа-шлюза или медиа-сервера для приложений IVR, использующих XML-файлы для управления алгоритмом обработки звонка.

Для FreeSWITCH в отличие от Asterisk нет необходимости отдельно компилировать UniMRCP. Поддержка UniMRCP уже добавлена и работает «из коробки» в виде модуля asr_tts/mod_unimrcp.

Ниже описывается установка FreeSWITCH, подключение к нему VoiceNavigator и создание тестового голосового приложения.
Читать дальше →
Total votes 4: ↑4 and ↓0 +4
Views 8.3K
Comments 4

Синтез точка всё. Хабрахабр в прямом эфире

Self Promo

Представляем бесплатное мобильное приложение Radio RSS для iPhone и iPad, читающее в прямом эфире новости Хабрахабра, Яндекса, Спортбокса, Сноба и Коммерсанта.

И другие сервисы синтеза русской речи...
Total votes 92: ↑84 and ↓8 +76
Views 1.1K
Comments 72

«Умный дом» собственными руками. Часть 3. Синтез и распознавание голоса с помощью Google

Computer hardware
В прошлой статье мы смогли добиться получения изображения с наших веб-камер в виде снимков раз в секунду. Теперь пришла пора взяться за обещанное — распознавание и синтез голоса.
Читать дальше →
Total votes 75: ↑70 and ↓5 +65
Views 50K
Comments 47

Синтез речи в Chrome

Google Chrome
Google внедрил в браузер интерфейсы Text-to-Speech API, так что теперь любое приложение или расширение Chrome способно читать текст вслух. Синтез речи из расширения осуществляется элементарной командой

chrome.tts.speak('Hello, world!');

(предварительно требуется добавить tts в список разрешений для данного расширения).

С помощью модуля chrome.ttsEngine можно прикрутить к браузеру свой собственный движок синтеза речи, например, для русского языка.
Читать дальше →
Total votes 55: ↑45 and ↓10 +35
Views 19K
Comments 19