Как стать автором
Обновить

Комментарии 45

а из файла какой опт надо поставить?
лично я больше espeak уважаю, он и транскрипцию выпишет. но это для англ.
Упс, не в тот уровень комментарий запостился.
а из файла какой опт надо поставить?

Не совсем понял вас.
он имел ввиду -f
При инсталляции любым из способов дает ошибку на отсутствие файла readme.md
пришлось сделать touch readme.md
только после этого
python setup.py install
прошло успешно.
Спасибо, недосмотрел-с. Починено.
Неплохо задумано.
На этом можно сделать бизнес. Записать таким образом книги и продавать. А ленивые школьники пусть покупают по 5 баксов «Войну и Мир», никому не охота читать в наше время томы книг…
По поводу томов книг вы, наверное, правы.
Но, думаю, они предпочтут слушать профессиональных дикторов в нормальных аудиокнигах, а не роботов, каким бы хорошим у них не было произношение.
Не за горами дубляж на основе субтитров в роликах на Youtube.
А там, смотри дальше, дубляж для фильмов будет.
Одноголосое озвучание Гугло-диктором.
вряд ли гуглодиктор успеет озвучить двух ругающихся персонажей — скорость маловата
Не думаю, что изменение скорости говора для гугла окажется проблемой.
Володарский 2.0
Скорее бы. Я думаю, что это приведет к тому, что все эти унылые дикторы наконец сдохнут, а фильмы озвучивать будут профессионалы, которые действительно умеют играть голосом.
Почему сразу одноголосое? Уверен, со временем будет несколько дикторов, на выбор. А у Яндекса или Аби появится аналогичный проект с озвучкой Володарского :)
многоголосный перевод. финальные титры. «Роли озвучивали: Шрек — Google, Осёл — Яндекс, принцесса Фиона — Аби». :)
Конечно все предпочитают слушать нормальных дикторов вместо TTS робота. Но если книга не озвучена? Тогда выбор или читать или слушать TTS.

Кстати, еще лет 10 назад я обратил внимание, что речь TTS робота перестает резать слух через час прослушивания, а через несколько часов вообще не воспринимается как нечто неестественное. В общем к этому быстро привыкаешь.
Не знаю сколько вам лет, но некоторое время назад был своего рода бум TTS. И книги записывали все дела.

Неудобно это. Да и для простых текстов только подходит.
с ударениями так натуральнее звучит:

Привет ха'бра'хабр
или так:

Привет ха'брахабр
Ещё вчера, как только увидел, подумал об озвучивании аудиокниг. Надо будет подумать на счет расстановки ударений. Спасибо за скрипт, буду думать.
Ещё забыл уточнить: а есть ограничение на одну «порцию» текста?
Нет, но что-то мне подсказывает, что гугль может забанить если больше x запросов за раз. Надо протестировать будет.
Есть ограничение на количество букв в слове (90), но таких длинных слов не существует, так что это не проблема.
гугль запросто может забанить.
причом бановая частота нигде не опубликована.
натыкался на это на не особо лихих частотах обращения к data api youtube.
в онлайн версии шибко длинные тексты не озвучиваются.
например:
«маленький, цифровой ревербератор реверберировал, реверберировал, да не выреверберировал.» читает
а «с регулятором уровня волюме» уже нет.
Надо составить базу слов и набор ударений. Обычно словари типа как в яндексе имеют «апострофы» на месте ударений, и их нужно заменять на пробелы или соответствующие знаки, чтобы гугл делал на них акцент и озвучивал правильно. — возможно сугубо субъективное мнение…
Сильно сам код копать не стал, но в setup.py у вас путаница: упорядочите методы по смыслу, а то очень неудобно читать. Сначала идёт описание, потом техническая часть.
Зачем «include_package_data=True»?
Да и делать пакет явно не стоило, так как тут у вас практически всё в одном файле — сделайте просто модуль. KISS, блин.

За программу спасибо, прикольно получилось.
Пакет я сделал потому что gtts (бинарник) удобнее через него ставить, все «из коробки».

Сейчас переделаю setup.py.
Представляю я как будет муторно слушать войну и мир с тем произношением, какое сейчас есть.
НЛО прилетело и опубликовало эту надпись здесь
Привет хабра хабр
а нет ли универсального формата для хранения текста с ударениями, паузами и т.д.?
Есть. Посмотрите в сторону функции TTS в ICE Book Reader'а, дальше в сторону любого голосового движка и транскрипций в системе SAMPA.
Не забанят за излишнее использование ресурса? По автоматическим запросам к посковику, например, есть довольно жёсткое ограничение, после чего следует капча.
Еще лет 5 назад сталкивался с платными он-лайн API для синтеза речи. Поддержка русского языка там была вполне толковая. Так что если боитесь бана, то платите денюжки и все будет впорядке.
А как насчет обратной операции? Стоит задача расшифровки записей скайпа, с распознаванием > 40% текста.
на сайте translate переводится только 1 предложение в голос
ваш конвертер с большими текстами работает?
Да. Конвертер разбивает текст на предложения по 90 символов и склеивает потом скачанные mp3-файлы вместе.
Если кто перепишет под Ruby, дайте знать :) спасибо
Есть ли ограничения на макс. размер текста?
Видимо автор заранее предугадал запросы. Одни из первых строк кода:

class TextToSpeech(object):
replacers = ( # list of replacers
(u'ё', u'йо'),
(u'трех', u'трьох'),
(u'хабрахабр', u'хабрах+абр'),
)
Супер!!!
Спасибо за пост. Качество перевода в голос на высоте.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории