b0n3Z8 мар 2011 в 07:01

Простой конвертер текста в речь с использованием Google Translate

1 мин

48K

Python *

+79

Комментарии 45

Homakov 8 мар 2011 в 07:06

а из файла какой опт надо поставить?
лично я больше espeak уважаю, он и транскрипцию выпишет. но это для англ.

b0n3Z 8 мар 2011 в 07:11

Упс, не в тот уровень комментарий запостился.

b0n3Z 8 мар 2011 в 07:10

а из файла какой опт надо поставить?

Не совсем понял вас.

eigrad 8 мар 2011 в 16:19

он имел ввиду -f

shadowalone 8 мар 2011 в 07:30

При инсталляции любым из способов дает ошибку на отсутствие файла readme.md
пришлось сделать touch readme.md
только после этого
python setup.py install
прошло успешно.

b0n3Z 8 мар 2011 в 07:41

Спасибо, недосмотрел-с. Починено.

thebestzorro 8 мар 2011 в 07:46

Неплохо задумано.

Laytlas 8 мар 2011 в 07:48

На этом можно сделать бизнес. Записать таким образом книги и продавать. А ленивые школьники пусть покупают по 5 баксов «Войну и Мир», никому не охота читать в наше время томы книг…

LostSenSS 8 мар 2011 в 07:58

По поводу томов книг вы, наверное, правы.
Но, думаю, они предпочтут слушать профессиональных дикторов в нормальных аудиокнигах, а не роботов, каким бы хорошим у них не было произношение.

RayZ 8 мар 2011 в 08:08

Не за горами дубляж на основе субтитров в роликах на Youtube.
А там, смотри дальше, дубляж для фильмов будет.
Одноголосое озвучание Гугло-диктором.

SCode 8 мар 2011 в 08:27

вряд ли гуглодиктор успеет озвучить двух ругающихся персонажей — скорость маловата

RayZ 8 мар 2011 в 09:05

Не думаю, что изменение скорости говора для гугла окажется проблемой.

mechmind 8 мар 2011 в 08:31

Володарский 2.0

binariti 8 мар 2011 в 10:05

Скорее бы. Я думаю, что это приведет к тому, что все эти унылые дикторы наконец сдохнут, а фильмы озвучивать будут профессионалы, которые действительно умеют играть голосом.

arkady 8 мар 2011 в 10:36

Почему сразу одноголосое? Уверен, со временем будет несколько дикторов, на выбор. А у Яндекса или Аби появится аналогичный проект с озвучкой Володарского :)

funca 9 мар 2011 в 20:25

многоголосный перевод. финальные титры. «Роли озвучивали: Шрек — Google, Осёл — Яндекс, принцесса Фиона — Аби». :)

tushev 8 мар 2011 в 18:23

Конечно все предпочитают слушать нормальных дикторов вместо TTS робота. Но если книга не озвучена? Тогда выбор или читать или слушать TTS.

Кстати, еще лет 10 назад я обратил внимание, что речь TTS робота перестает резать слух через час прослушивания, а через несколько часов вообще не воспринимается как нечто неестественное. В общем к этому быстро привыкаешь.

asfd 8 мар 2011 в 08:04

Не знаю сколько вам лет, но некоторое время назад был своего рода бум TTS. И книги записывали все дела.

Неудобно это. Да и для простых текстов только подходит.

ivaleyev 8 мар 2011 в 07:59

с ударениями так натуральнее звучит:

Привет ха'бра'хабр

ivaleyev 8 мар 2011 в 08:01

или так:

Привет ха'брахабр

Ockonal 8 мар 2011 в 08:02

Ещё вчера, как только увидел, подумал об озвучивании аудиокниг. Надо будет подумать на счет расстановки ударений. Спасибо за скрипт, буду думать.

Ockonal 8 мар 2011 в 08:06

Ещё забыл уточнить: а есть ограничение на одну «порцию» текста?

b0n3Z 8 мар 2011 в 08:07

Нет, но что-то мне подсказывает, что гугль может забанить если больше x запросов за раз. Надо протестировать будет.
Есть ограничение на количество букв в слове (90), но таких длинных слов не существует, так что это не проблема.

qmax 8 мар 2011 в 17:25

гугль запросто может забанить.
причом бановая частота нигде не опубликована.
натыкался на это на не особо лихих частотах обращения к data api youtube.

qmax 8 мар 2011 в 17:23

в онлайн версии шибко длинные тексты не озвучиваются.
например:
«маленький, цифровой ревербератор реверберировал, реверберировал, да не выреверберировал.» читает
а «с регулятором уровня волюме» уже нет.

SCode 8 мар 2011 в 08:10

Надо составить базу слов и набор ударений. Обычно словари типа как в яндексе имеют «апострофы» на месте ударений, и их нужно заменять на пробелы или соответствующие знаки, чтобы гугл делал на них акцент и озвучивал правильно. — возможно сугубо субъективное мнение…

Maccimo 9 мар 2011 в 04:05

Всё уже украдено до нас: www.gramota.ru/slovari/info/zarva/

ZZZ_Sochi 8 мар 2011 в 08:39

Сильно сам код копать не стал, но в setup.py у вас путаница: упорядочите методы по смыслу, а то очень неудобно читать. Сначала идёт описание, потом техническая часть.
Зачем «include_package_data=True»?
Да и делать пакет явно не стоило, так как тут у вас практически всё в одном файле — сделайте просто модуль. KISS, блин.

За программу спасибо, прикольно получилось.

b0n3Z 8 мар 2011 в 08:58

Пакет я сделал потому что gtts (бинарник) удобнее через него ставить, все «из коробки».

Сейчас переделаю setup.py.

KJouflay 8 мар 2011 в 09:03

Представляю я как будет муторно слушать войну и мир с тем произношением, какое сейчас есть.

НЛО прилетело и опубликовало эту надпись здесь

Mobby 8 мар 2011 в 14:39

Привет хабра хабр

eschava 8 мар 2011 в 09:47

а нет ли универсального формата для хранения текста с ударениями, паузами и т.д.?

selenite 8 мар 2011 в 14:19

Есть. Посмотрите в сторону функции TTS в ICE Book Reader'а, дальше в сторону любого голосового движка и транскрипций в системе SAMPA.

grep0 8 мар 2011 в 10:11

Не забанят за излишнее использование ресурса? По автоматическим запросам к посковику, например, есть довольно жёсткое ограничение, после чего следует капча.

tushev 8 мар 2011 в 18:12

Еще лет 5 назад сталкивался с платными он-лайн API для синтеза речи. Поддержка русского языка там была вполне толковая. Так что если боитесь бана, то платите денюжки и все будет впорядке.

selenite 8 мар 2011 в 14:19

А как насчет обратной операции? Стоит задача расшифровки записей скайпа, с распознаванием > 40% текста.

eigrad 8 мар 2011 в 16:21

www.google.com/mobile/voice-search/ :-)

delaf 8 мар 2011 в 15:23

на сайте translate переводится только 1 предложение в голос
ваш конвертер с большими текстами работает?

b0n3Z 9 мар 2011 в 00:34

Да. Конвертер разбивает текст на предложения по 90 символов и склеивает потом скачанные mp3-файлы вместе.

delaf 8 мар 2011 в 15:24

Если кто перепишет под Ruby, дайте знать :) спасибо

sindrom 8 мар 2011 в 17:02

Есть ли ограничения на макс. размер текста?

Kokker 8 мар 2011 в 19:00

Видимо автор заранее предугадал запросы. Одни из первых строк кода:

class TextToSpeech(object):

 replacers = ( # list of replacers

 (u'ё', u'йо'),

 (u'трех', u'трьох'),

 (u'хабрахабр', u'хабрах+абр'),

 )

oktell1 8 мар 2011 в 19:44

Супер!!!
Спасибо за пост. Качество перевода в голос на высоте.

fullsize 28 мая 2011 в 17:03

Амба!
habrahabr.ru/blogs/google/120161/

Зарегистрируйтесь на Хабре, чтобы оставить комментарий