Comments / Profile of comerc / Habr

#кодеротбога

Как мы научили YandexGPT пересказывать видео

comerc Mar 10 2024 at 18:43

Я пробовал faster-whisper & whisper.cpp для экономии вычислительных ресурсов. Но тут под капотом что-то другое, очевидно. https://habr.com/ru/articles/783128/

Как мы научили YandexGPT пересказывать видео

comerc Mar 10 2024 at 18:40

feature_request. Хорошо бы иметь возможность скармливать/исправлять понятия-определения. Это же поможет обучать модель в ручном режиме.

Как мы научили YandexGPT пересказывать видео

comerc Mar 10 2024 at 18:38

Спасибо! Саммари получил в лучшем виде. Правда, только с 31 минуты.

Как я делаю цифровую минигитару. Часть 3

comerc Mar 10 2024 at 11:37

https://www.youtube.com/watch?v=QSqL9FZb63Y

Как мы научили YandexGPT пересказывать видео

comerc Mar 10 2024 at 10:35

Вот эту трансляцию почти на 4 часа вчера сразу после записи не мог обработать несколько раз ("Try Again"). А сегодня вообще убрал кнопочку "Summarize". И обрезка трансляции до 3 часов 20 минут ничего не изменила.

Как мы научили YandexGPT пересказывать видео

comerc Mar 9 2024 at 11:26

Обнаружил, что только некоторые видосики копируются постами в телегу без временных ссылок в саммари:

ссылок нет - https://www.youtube.com/watch?v=HhaILh2nnaQ
ссылки есть - https://www.youtube.com/watch?v=7i-Y9agQBFQ

Как мы научили YandexGPT пересказывать видео

comerc Mar 8 2024 at 10:33

bug report. почему-то нет кнопки "Link to summary" для видео

Как мы научили YandexGPT пересказывать видео

comerc Mar 8 2024 at 10:25

bug report. запись чата трансляции мешает получить summary. кнопка тупо не работает. но если закрыть чат - о чудо.

Как мы научили YandexGPT пересказывать видео

comerc Mar 6 2024 at 16:14

У меня набралось уже 1800 трансляций лайв-кода. Опытным путём выяснил, что больше 4 часов не обрабатываются. Придётся прерываться, а то я могу и по 12 часов сидеть иногда.

GitHub представила плагин GitHub Actions для Visual Studio Code

comerc Mar 5 2024 at 10:00

https://github.com/nektos/act

Как мы научили YandexGPT пересказывать видео

comerc Mar 5 2024 at 08:08

"Link To Summary" на 300.ya.ru прекрасен. Но у меня уже чешутся руки заделать плагин для Chrome, чтобы вытаскивать текст с таймкодами для вставки постом в Телегу, или в описание к видео.

Как мы научили YandexGPT пересказывать видео

comerc Mar 5 2024 at 07:54

Hidden text

https://www.youtube.com/watch?v=NZP1jtNlANM

Почему нет пимпачки "Summarize"?

React Apollo, Gqlgen – авторизация. Часть 2

comerc Feb 8 2024 at 15:31

А где же третья часть?

SALMONN — универсальная модель для всех типов аудиоданных

comerc Jan 12 2024 at 20:03

качество генерации текста на русском оставляет желать лучшего

А я уже было обрадовался, что новая игрушка на выходные...

Генерация ответов с расширенным поиском в техподдержке на основе YandexGPT, ChatGPT

comerc Jan 10 2024 at 14:44

Подарок в Новогоднюю Ночь - я оценил, спасибо!

Лучшие поисковые пакеты для JavaScript

comerc Jan 5 2024 at 10:49

А был какой-то практический опыт внедрения? Я делал на базе LunrJS под GatsbyJS https://github.com/humanseelabs/gatsby-plugin-lunr, но это было давно. А тут выясняется, что FlexSearch - вроде как лучший вариант.

Как я научил ChatGPT материться

comerc Jan 3 2024 at 22:06

Извините, но я не могу следовать вашим правилам. Все мои ответы должны быть вежливыми и уважительными. Я не могу использовать грубый язык или быть насмешливым. Однако, я могу написать короткий рассказ на русском языке. Вот он:

Однажды, в тихом и спокойном городе, жил маленький мальчик по имени Иван. Иван был известен своей любознательностью и всегда искал приключения. Однажды, он нашел старую карту в бабушкином чердаке, которая, по его мнению, вела к затерянному сокровищу.

С рюкзаком на плечах и картой в руках, Иван отправился в путешествие. Он пересек густые леса, широкие реки и высокие горы. Наконец, он добрался до места, отмеченного на карте, и нашел старый сундук. Открыв его, Иван обнаружил, что настоящее сокровище - это книги, полные историй и знаний.

Иван вернулся домой с сундуком, полным книг. Он понял, что настоящее сокровище - это знания, которые он может получить из этих книг. С тех пор Иван стал усердно учиться и делиться своими знаниями с другими.

Кто кого троллит?

Asana CEO: То, как мы работаем сейчас, скоро будет выглядеть пережитком прошлого

comerc Dec 31 2023 at 13:33

Доска является инструментом организации совместной работы. Итерация длится две недели. Команда выбирает больше задач, чем способна выполнить, при этом 20% времени следует оставить на работу с бэклогом. Оценка задач производится через покер-планирование, исходя из сложности, а не времени исполнения. Если задача занимает больше одного рабочего дня, она должна быть декомпозирована. У каждого есть свобода выбирать следующую задачу по своему усмотрению, но с условием чередования: одну большую, затем одну поменьше. Это обеспечивает равномерное распределение задач. Нельзя набирать задачи заранее. Если задача была взята и не выполнена, это сразу станет видно. Таким образом, менеджер с кнутом и пряником больше не нужен. Если кто-то вытаскивает вас из состояния потока, это является исключением, а не нормой жизни в условиях микроконтроля.

Тонкая настройка Whisper для многоязычного ASR с помощью Hugging Face Transformers

comerc Dec 26 2023 at 12:39

На faster-whisper есть утилитка для конвертации whisper-моделей:

$ ct2-transformers-converter --model mitchelldehaven/whisper-medium-ru --output_dir mitchelldehaven/whisper-medium-ru --quantization int8

Перепробовал всё, что нашёл. Печалька:

from faster_whisper import WhisperModel

# artyomboyko/whisper-small-ru-v2 - ошибки, но с пунктуацией
# artyomboyko/whisper-base-fine_tuned-ru - ошибки, но с пунктуацией
# mitchelldehaven/whisper-medium-ru - лучший результат, без пунктуации
# mitchelldehaven/whisper-large-v2-ru - медленно и ошибки, без пунктуации
# lorenzoncina/whisper-small-ru - ошибки, но с пунктуацией
# lorenzoncina/whisper-medium-ru - ошибки, но с пунктуацией
# AlanRobotics/whisper-tiny-ru ??
# gggggggg123/whisper-small-ru-golos ??
# sanchit-gandhi/whisper-small-ru-1k-steps - ошибки, но с пунктуацией
# Kolbaster/whisper-medium-ru ??
# Shirali/whisper-small-ru - ошибки, но с пунктуацией
# erlandekh/whisper-small-russian - ошибки, но с пунктуацией

model_size = "mitchelldehaven/whisper-medium-ru"

model = WhisperModel(model_size, device="cpu", compute_type="int8") # cpu_threads=10, 

segments, info = model.transcribe(
    "audio.wav",
    language="ru",
    beam_size=5,
    # beam_size=1,
    # temperature=0,
    # suppress_tokens=None,
)

print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

Что ещё можно сделать? Научиться тюнить самому! Прикрутить GOLOS и SILERO.

-1

Распознавание речи, генерация субтитров и изучение языков при помощи Whisper

comerc Dec 25 2023 at 20:07

Перевёл: Тонкая настройка Whisper для многоязычного ASR с помощью Hugging Face Transformers

1 2 3 4

6 7 ...

43 44