Обновить

Создаём субтитры для любого видео в интернете с помощью нейросети в браузере

Время на прочтение11 мин
Охват и читатели26K
Всего голосов 19: ↑18 и ↓1+22
Комментарии19

Комментарии 19

насколько сложно сделать перевод на выбранный язык с голосами используемыми в видео?

Клонирование голоса сложно сделать, тем более локально. Моя статья в первую очередь про распознавание речи на устройстве пользователя, когда язык субтитров совпадает с языком видео. Я говорю только про генерацию текста.

Но команда перевода видео исследует эту задачу

А есть какие-нибудь сравнения с другими моделями, типа whisper?

Whisper и большая часть текущих SOTA моделей совершенно не влазят в наши ограничения по drive / ram, так еще и не приспособлены к стриминговому режиму работы, а это один из наиболее важных критериев для нас из-за длины записей.
Плюс почти все такие бейслайны хорошо работают на английском, но далеко не на русском.

Про ограничения понимаю, мне скорее интересно про точность.

Да, я понимаю.

Просто точность может зависеть от домена и датасета, поэтому с большими моделями без обучения на наших датасетах сравнение не валидно.

Если сравнивать с моделью перевода видео, то у нас отставание на 10-15% (относительные) по WER на нашем русском датасете.

НЛО прилетело и опубликовало эту надпись здесь

Вы скажите не к вам, но... мне кажется, вы этими плюшками не затянете пользоваться очень-очень назойливым браузером который лезет в систему и пользователю куда его совсем не просят!
Помните IE 15 лет назад?

частный кейс: слушаю видео и закрываю

Видел варианты, по прикручиванию перевода от Яндекса к любым други браузерам.

Было бы здорово добавить и английские субтитры. Когда увидел заголовок, то сразу подумал об использовании для учебы: смотреть без субтитров, где нужно — включать английские, а для новых слов — английские субтитры менять на русские.

Английские субтитры в браузере уже есть на YouTube и Coursera, где работает функция перевода видео с иностранных языков. Субтитры интерактивные - по клику на незнакомое слово браузер покажет его перевод.

Субтитры будут доступны сразу, если видео раньше было переведено другим пользователем. Если интерактивных субтитров нет, нужно сначала перевести видео - тогда появятся и субтитры. При этом вы сможете слушать ролик в оригинале и читать субтитры на английском (фича работает для 6 языков).

Если говорить о создании английских субтитров для любого видео в интернете по технологии, которая описана в этой статье, - у нас есть такая идея, но о сроках пока говорить рано

Спасибо, полезная вещь. Ещё пригодился бы функционал выгрузки субтитров в текстовый файл, раз уж они есть.

(Тестирую — к публичному видео, выложенному на облако Mail.ru, не генерирует, пишет «недоступны»).

аа еще очень важный момент
RLHF ?
когда модель будет дообучаться? прикрутить отзывы или что-то типа фидбэка

устал уже слушать
перевод first - первый, а не сначала,
github - джитаб

chatgpt -чет-чтото там гэпэте

серьезно?  год уже нарицательному  имени...
серьезно? год уже нарицательному имени...


Что-то это работает только на канале youtube. Пробовал проделать в одноклассниках не сработало.

Точно ли последняя версия Браузера (можно в меню в «О браузере» проверить обновления)? Если да, то можно ещё разок перезапустить и проверить.

Я тоже столкнулся с такой же проблемой. Функция создания субтитров работает только на YouTube, на Rutube и Premier.one она отсутствует. Версия браузера - 23.7.5.735. Не же, что можно создавать субтитры на любом видеосервисе?... Это ошибка

А как сохранить субтитры перевода нейросети?

Давно уже использую Whisper и Vosk для генерации субтитров из звука.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.ya.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия