Comments 15
Послушать примеры озвучки можно в нашем канале Radiogram Top-10.
открывается мини приложение с пустым экраном и ничего не происходит... почему бы не выложить в любом другом адекватном аудио хостинге примеры озвучки?
всё вроде норм открывается: айфон, десктоп
может у вас что-то не так?
наверное у него более безопасная среда
со смартфона открылась, на десктопе linux (офф клиент) - нет
Не важно, формат мини приложения меня не шибко интересует, так как аудио записи не получится слушать и управлять в моем плеере (например оффлайн, переключение треков кнопками громкости или с гарнитуры без разблокировки экрана)
с другой стороны я не целевая группа данной задачи, прежде чем слушать я бы хотел сам выбирать информацию.
Свистящие звуки зашкаливают, не нравится слушать. Вы сами это слушали?
Ударения "успеть чИхнуть", интонаций вопроса в конце предложения нет. Послушал чуть чуть и не могу больше, очень режет слух.
Еще зачитывание названий каналов сбивает с толку. Конкретно слушал выпуск где рокетбанк и дальше.
Каждый день в машине слушаю.
Мы используем наиболее продвинутую TTS. Она все еще может путать ударения на русском языке, но по качеству это уже на голову выше, чем ттс-ки годичной давности. Думаю еще полгода-год, и генеративную речь нельзя будет отличить от настоящей.
телеграм-каналы не нужно слушать. их необходимо запретить.
Так их вроде с самого начала слушают.
Скрытый текст

А можно немного технических подробностей? Какую модель вы выбрали для озвучки? Онлайн или оффлайн? Как запускаете модель — на проце или видяшке? На каком языке написан сервис? Как запускаете модель — через нечто вроде олламы и запрашиваете через рест апи на локалхосте или через пайторч подключили прямо в коде приложения? Сколько ресурсов это жрет? Сколько всего есть ресурсов на серваке?
Голосовая модель: онлайн от OpenAI с доступом по rest + кастомные обработчики. Сервис написан на NodeJS. По ресурсам за счет внешних сервисов получается достаточно адекватно, основная нагрузка идёт в момент генерации выпусков, когда собираются аудио-файлы. Сейчас всё крутится на сервере 8 ядер, 16 гб озу. Плюс допсервер для для вспомогательных операций. Под онлайн-трансляции (делаем такие для новостных каналов) используются отдельные серверы 4 ядра, 8 гб, на каждом из которых стартует свой набор из нескольких потоков вещания.
Мессенджер - от слова "Сообщение". Ломается сама концепция, но если учитывать слепых людей - очень достойно
Телеграм-каналы теперь можно слушать