Все потоки
Поиск
Написать публикацию
Обновить
14
0
Сергей Исаев @DemiurgeSerge

CEO в DataFabric (Semantic web)

Отправить сообщение
Как раз с сентября мы и тестируем «Читатель» под Android. Приложение оказалось излишне требовательно к ресурсам, т.к. синтез происходит прямо на устройстве. Сейчас приложение корректно работает только на устройствах с 2Гб памяти и все это время мы пробуем его оптимизировать. Функциональность и интерфейс полностью разработаны. Проблема исключительно в «прожорливости».
Кто хочет принять участие в тестировании «Читателя» под Android, можете написать мне в ЛК, я дам Вам права на скачивание и тестирование, но от Вас будем ждать обратной связи.
api.voicefabric.ru/
Не сочтите за рекламу. Много заявок приходит именно для озвучивания роликов на YouTube.
Но не игры, а в основном, обучающие курсы и озвучка иностранных роликов и русскими субтитрами.
Вы бы сами комфортно смотрели такие ролики с такой озвучкой?
Примеры голосов.
Мне кажется, что Гугл знает не все или Вы не правильно у него спрашиваете.
Алкотел — это крупная старая Питерская компания, и со слов основателя — Александра Короленко (знаком с ним лично), существует дольше, чем французский Alcatel (который уже китайский).
Название Алкотел — это сокращение имени основателя АЛександр КОроленко — он сам рассказывал еще в 2000-чных годах.
Посмотрите, что эта компания выпускала 20 лет назад и все должно встать на свои места — многих еще на свете не было.
Мы сейчас переделываем сайт компании. Там будет встроен и синтез и распознавание голоса. Что бы все было наглядно и применимо.
1.Записываем их в студии, просим диктора читать необходимые тексты как в обычной жизни. Синтез может быть «заточен» под определенные тексты, например — чтение художественной литературы, новости, объявления и т.д. Поэтому дикторы должны читать соответствующие вещи.
Если синтез сделан на художественной литературе, то чтение новостной ленты будет звучать «особенно».
Также очень важно следить за состоянием и настроением диктора. Что бы оно было одинаковое на протяжении всего чтения — а это месяц, а то и больше. Бывало, что мы отпускали диктора на выходные только потому, что у него было плохое настроение — а это сказывалось на голосе.

2.Не могу сам ответить, спрошу у наших ученых.

3.Здесь необходимо разделять работы.
Синтезом речи ЦРТ занимается уже 25 лет. Но, в основном, мы работали с SDK под Windows. Он сейчас работает много где, достаточно позвонить в Мегафон, РЖД, ФормулаКино и т.д.
Портирование SDK с Windows на iOS — это отдельная работа.
И также, совершенно отдельная работа — это создание читалки, которая умеет работать с нашим SDK.
Сроки намеренно не называю — секрет.

4.Профессиональный бэкграунд? В синтезе речи? Наверное, сейчас, самый большой в России. У нас несколько десятков ученых и научных сотрудников. А несколько лет назад мы создали собственную кафедру речевых технологий на базе университета ИТМО (СПб)
Хорошая идея, записал.
Carol действительно английский-американский язык.
Но флаг США мы решили не ставить, т.к. американского языка нет.
Это слова — омонимы.
В русском языке их достаточно много.
т.е. эти слова меняют свое ударение в зависимости от контекста, типа — замОк и зАмок.

Синтез смотрит грамматический контекст: какую роль играет слово в предложении, узнает падеж, числительное.
И в зависимости от этого принимает решение о том, где ставить ударение.

Если слово без контекста или его не достаточно, то здесь как раз и могут появляться ошибки.
т.е. RSS Radio прочитал отрывок новости или заголовок, где смысла было недостаточно для определение правильного ударения.
Нет, на данный момент, последняя версия это iOS7. Но обещаем в сентябре быстро отреагировать на iOS8.
Послушать примеры звучания голосов ЦРТ можно здесь.
PR нужен всем и всегда. Если бы Coca-Cola не тратила на свою рекламу миллионы дол в год, ее бы дано забыли и пили бы то, что рекламируется.
Под словом «рекламируется», я подразумеваю — быть постоянно навиду.

Даже у здания Пентагона есть свой PR, иначе оно не было бы так известно.
Вообще, чисто психологически, количество повторов определенной информации однозначно влияет на веру в нее. Это я как маркетолог говорю.
Опять-таки, все зависит от сценария использования системы. Для примера, могу привести приложение для идентификации по голосу в любых фонограммах — на 8 ядрах приложение совершает до 100 млн сравнений в сутки (!!!)
Количество ложных срабатываний зависит от многих факторов — от шумов, от уровня эха, ну и конечно от настроек системы. Мы можем управлять этими порогами, и на этапе внедрения вместе с заказчиком определяем оптимальные настройки системы для достижения приемлемого уровня ошибок. Например, в одном из наших проектов мы довели уровень т.н. «равновероятностной ошибки» до 0,1 %.
Я просто оставлю это здесь: VXML.ru
Мы постарались собрать все про VXML на русском в одном месте.
Недавно был в Маке в Париже. Там стоит 6-8 терминалов, но все ровно были огромные очереди во все 6 нормальных касс. Могу сделать скидку на туристов, которые не желали пользоваться терминалами (французский не все знали), но тем не менее… очереди были огромны даже из местных. К этому надо приучать — например делать скидку 3-5%, если заказал через терминал.
сорри, были там 25.11.2009 — забыл сколько лет я женат…
мы ездили 25.11.2011
2 года назад был на экскурсии в ЦЕРН. Ездили туда с женой в свадебное путешествие.
По возвращению хотел написать статью-инструкцию на Хабр, как можно устроить для себя такое путешествие.
Но руки не дошли, черновик статьи до сих пор лежит в документах.

Мало кто знает, но в ЦЕРН можно попасть также легко как в любой музей города.
Экскурсии проводятся (или проводились) 2 раза в день. При большом количестве участников из России, можно было даже заказать русскоговорящего экскурсовода. Все очень просто и организованно.
Зарегистрироваться на экскурсию можно прямо на официальном сайте ЦЕРН.

Готов ответить на вопросы хабра-людей, кто хочет съездить, типа:
1.Сколько стоит билет на самолет? 11000 руб. туда-обратно через Амстердам в Женеву.
2.В самом ЦЕРНе не поесть! Там есть много столовых, но вас туда не пустят.
3.Ближайшая гостиница находится в 3 км пешком от ЦЕРНа и в 1 км от аэропорта. Но она находится уже на территории Франции. Осторожно, когда будете говорить адрес таксисту. Он из аэропорта Женевы (Швейцария) повезет вас во Францию. Стоит это 40 евро.
4.и т.д.

Информация

В рейтинге
Не участвует
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Дата рождения
Зарегистрирован
Активность