Как раз с сентября мы и тестируем «Читатель» под Android. Приложение оказалось излишне требовательно к ресурсам, т.к. синтез происходит прямо на устройстве. Сейчас приложение корректно работает только на устройствах с 2Гб памяти и все это время мы пробуем его оптимизировать. Функциональность и интерфейс полностью разработаны. Проблема исключительно в «прожорливости».
Кто хочет принять участие в тестировании «Читателя» под Android, можете написать мне в ЛК, я дам Вам права на скачивание и тестирование, но от Вас будем ждать обратной связи.
api.voicefabric.ru/
Не сочтите за рекламу. Много заявок приходит именно для озвучивания роликов на YouTube.
Но не игры, а в основном, обучающие курсы и озвучка иностранных роликов и русскими субтитрами.
Вы бы сами комфортно смотрели такие ролики с такой озвучкой?
Примеры голосов.
Мне кажется, что Гугл знает не все или Вы не правильно у него спрашиваете.
Алкотел — это крупная старая Питерская компания, и со слов основателя — Александра Короленко (знаком с ним лично), существует дольше, чем французский Alcatel (который уже китайский).
Название Алкотел — это сокращение имени основателя АЛександр КОроленко — он сам рассказывал еще в 2000-чных годах.
Посмотрите, что эта компания выпускала 20 лет назад и все должно встать на свои места — многих еще на свете не было.
1.Записываем их в студии, просим диктора читать необходимые тексты как в обычной жизни. Синтез может быть «заточен» под определенные тексты, например — чтение художественной литературы, новости, объявления и т.д. Поэтому дикторы должны читать соответствующие вещи.
Если синтез сделан на художественной литературе, то чтение новостной ленты будет звучать «особенно».
Также очень важно следить за состоянием и настроением диктора. Что бы оно было одинаковое на протяжении всего чтения — а это месяц, а то и больше. Бывало, что мы отпускали диктора на выходные только потому, что у него было плохое настроение — а это сказывалось на голосе.
2.Не могу сам ответить, спрошу у наших ученых.
3.Здесь необходимо разделять работы.
Синтезом речи ЦРТ занимается уже 25 лет. Но, в основном, мы работали с SDK под Windows. Он сейчас работает много где, достаточно позвонить в Мегафон, РЖД, ФормулаКино и т.д.
Портирование SDK с Windows на iOS — это отдельная работа.
И также, совершенно отдельная работа — это создание читалки, которая умеет работать с нашим SDK.
Сроки намеренно не называю — секрет.
4.Профессиональный бэкграунд? В синтезе речи? Наверное, сейчас, самый большой в России. У нас несколько десятков ученых и научных сотрудников. А несколько лет назад мы создали собственную кафедру речевых технологий на базе университета ИТМО (СПб)
Это слова — омонимы.
В русском языке их достаточно много.
т.е. эти слова меняют свое ударение в зависимости от контекста, типа — замОк и зАмок.
Синтез смотрит грамматический контекст: какую роль играет слово в предложении, узнает падеж, числительное.
И в зависимости от этого принимает решение о том, где ставить ударение.
Если слово без контекста или его не достаточно, то здесь как раз и могут появляться ошибки.
т.е. RSS Radio прочитал отрывок новости или заголовок, где смысла было недостаточно для определение правильного ударения.
PR нужен всем и всегда. Если бы Coca-Cola не тратила на свою рекламу миллионы дол в год, ее бы дано забыли и пили бы то, что рекламируется.
Под словом «рекламируется», я подразумеваю — быть постоянно навиду.
Даже у здания Пентагона есть свой PR, иначе оно не было бы так известно.
Опять-таки, все зависит от сценария использования системы. Для примера, могу привести приложение для идентификации по голосу в любых фонограммах — на 8 ядрах приложение совершает до 100 млн сравнений в сутки (!!!)
Количество ложных срабатываний зависит от многих факторов — от шумов, от уровня эха, ну и конечно от настроек системы. Мы можем управлять этими порогами, и на этапе внедрения вместе с заказчиком определяем оптимальные настройки системы для достижения приемлемого уровня ошибок. Например, в одном из наших проектов мы довели уровень т.н. «равновероятностной ошибки» до 0,1 %.
Недавно был в Маке в Париже. Там стоит 6-8 терминалов, но все ровно были огромные очереди во все 6 нормальных касс. Могу сделать скидку на туристов, которые не желали пользоваться терминалами (французский не все знали), но тем не менее… очереди были огромны даже из местных. К этому надо приучать — например делать скидку 3-5%, если заказал через терминал.
2 года назад был на экскурсии в ЦЕРН. Ездили туда с женой в свадебное путешествие.
По возвращению хотел написать статью-инструкцию на Хабр, как можно устроить для себя такое путешествие.
Но руки не дошли, черновик статьи до сих пор лежит в документах.
Мало кто знает, но в ЦЕРН можно попасть также легко как в любой музей города.
Экскурсии проводятся (или проводились) 2 раза в день. При большом количестве участников из России, можно было даже заказать русскоговорящего экскурсовода. Все очень просто и организованно.
Зарегистрироваться на экскурсию можно прямо на официальном сайте ЦЕРН.
Готов ответить на вопросы хабра-людей, кто хочет съездить, типа:
1.Сколько стоит билет на самолет? 11000 руб. туда-обратно через Амстердам в Женеву.
2.В самом ЦЕРНе не поесть! Там есть много столовых, но вас туда не пустят.
3.Ближайшая гостиница находится в 3 км пешком от ЦЕРНа и в 1 км от аэропорта. Но она находится уже на территории Франции. Осторожно, когда будете говорить адрес таксисту. Он из аэропорта Женевы (Швейцария) повезет вас во Францию. Стоит это 40 евро.
4.и т.д.
Кто хочет принять участие в тестировании «Читателя» под Android, можете написать мне в ЛК, я дам Вам права на скачивание и тестирование, но от Вас будем ждать обратной связи.
Не сочтите за рекламу. Много заявок приходит именно для озвучивания роликов на YouTube.
Но не игры, а в основном, обучающие курсы и озвучка иностранных роликов и русскими субтитрами.
Вы бы сами комфортно смотрели такие ролики с такой озвучкой?
Примеры голосов.
Алкотел — это крупная старая Питерская компания, и со слов основателя — Александра Короленко (знаком с ним лично), существует дольше, чем французский Alcatel (который уже китайский).
Название Алкотел — это сокращение имени основателя АЛександр КОроленко — он сам рассказывал еще в 2000-чных годах.
Посмотрите, что эта компания выпускала 20 лет назад и все должно встать на свои места — многих еще на свете не было.
Если синтез сделан на художественной литературе, то чтение новостной ленты будет звучать «особенно».
Также очень важно следить за состоянием и настроением диктора. Что бы оно было одинаковое на протяжении всего чтения — а это месяц, а то и больше. Бывало, что мы отпускали диктора на выходные только потому, что у него было плохое настроение — а это сказывалось на голосе.
2.Не могу сам ответить, спрошу у наших ученых.
3.Здесь необходимо разделять работы.
Синтезом речи ЦРТ занимается уже 25 лет. Но, в основном, мы работали с SDK под Windows. Он сейчас работает много где, достаточно позвонить в Мегафон, РЖД, ФормулаКино и т.д.
Портирование SDK с Windows на iOS — это отдельная работа.
И также, совершенно отдельная работа — это создание читалки, которая умеет работать с нашим SDK.
Сроки намеренно не называю — секрет.
4.Профессиональный бэкграунд? В синтезе речи? Наверное, сейчас, самый большой в России. У нас несколько десятков ученых и научных сотрудников. А несколько лет назад мы создали собственную кафедру речевых технологий на базе университета ИТМО (СПб)
Но флаг США мы решили не ставить, т.к. американского языка нет.
В русском языке их достаточно много.
т.е. эти слова меняют свое ударение в зависимости от контекста, типа — замОк и зАмок.
Синтез смотрит грамматический контекст: какую роль играет слово в предложении, узнает падеж, числительное.
И в зависимости от этого принимает решение о том, где ставить ударение.
Если слово без контекста или его не достаточно, то здесь как раз и могут появляться ошибки.
т.е. RSS Radio прочитал отрывок новости или заголовок, где смысла было недостаточно для определение правильного ударения.
Под словом «рекламируется», я подразумеваю — быть постоянно навиду.
Даже у здания Пентагона есть свой PR, иначе оно не было бы так известно.
Мы постарались собрать все про VXML на русском в одном месте.
По возвращению хотел написать статью-инструкцию на Хабр, как можно устроить для себя такое путешествие.
Но руки не дошли, черновик статьи до сих пор лежит в документах.
Мало кто знает, но в ЦЕРН можно попасть также легко как в любой музей города.
Экскурсии проводятся (или проводились) 2 раза в день. При большом количестве участников из России, можно было даже заказать русскоговорящего экскурсовода. Все очень просто и организованно.
Зарегистрироваться на экскурсию можно прямо на официальном сайте ЦЕРН.
Готов ответить на вопросы хабра-людей, кто хочет съездить, типа:
1.Сколько стоит билет на самолет? 11000 руб. туда-обратно через Амстердам в Женеву.
2.В самом ЦЕРНе не поесть! Там есть много столовых, но вас туда не пустят.
3.Ближайшая гостиница находится в 3 км пешком от ЦЕРНа и в 1 км от аэропорта. Но она находится уже на территории Франции. Осторожно, когда будете говорить адрес таксисту. Он из аэропорта Женевы (Швейцария) повезет вас во Францию. Стоит это 40 евро.
4.и т.д.