Обновить
4K+
2
Дмитрий Лукьянов@dmitriy_weez

Пользователь

7
Рейтинг
Отправить сообщение

От MVP на Whisper до собственной ASR: как мы построили платформу субтитров для RUTUBE

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели6.5K

Автоматическое создание субтитров для пользовательского контента может выглядеть довольно простой задачей: берем готовую ASR‑модель, распознаем аудио из видео и сохраняем результат.

Именно таким и был наш первый MVP в RUTUBE — сервис на базе Whisper, который позволил быстро проверить гипотезу и запустить субтитры в production. Но очень быстро стало понятно, что между «распознать речь» и «сделать субтитры для всего контента» лежит огромный пласт работы.

Миллионы новых видео, ролики длиной до 24 часов, неизвестный язык, шумный пользовательский контент, требования к качеству текста и жесткие ограничения по скорости обработки — всё это превратило задачу из простого ASR в полноценную платформу с микросервисной архитектурой и собственной системой распознавания речи.

В статье расскажу, почему Whisper не подошел для production, как мы перестроили всю архитектуру и за счет чего смогли выйти на производительность около 1200 видео в час на один ASR.

Читать далее

Информация

В рейтинге
853-й
Работает в
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, ML разработчик
Ведущий
Python
FastAPI
Asyncio
ООП
Linux
Git
Docker
Английский язык