Комментарии / Профиль iwram / Хабр

Алексей@iwram

Системный администратор

Подписчики

ПрофильСтатьи6ПостыНовостиКомментарии202

Почему одного Whisper оказалось недостаточно и как мы создали полноценный сервис распознавания речи

Как дополнение, при внедрении vad снижается нагрузка на дорогое распознавание whisper (т.к. не надо обрабатывать шум) - ожидал что предоставите графики до и после внедрения vad, время распознавания снижается почти в 2-3 раза в зависимости от аудио. vad очень легкие и сама модель занимает 3 мбайта, работает очень быстро.

И вопрос, как часто у вас галлюцинировал whisper (фразы типа "Thank you", "субтитры сделал DimaTorzock" и другие) - собирали ли какую то статистику или встраивали в инференс дополнительные флаги?

Как я снизил WER с 33% до 3.3% для русской речи на CPU: сравнение GigaAM, Whisper и Vosk

iwram 21 фев в 17:30

Сударь. Вам еще в чатике распознавания речи написали, что реппозиторий https://github.com/borisovai/voice‑input отдает 404, оценить код никто не сможет...

Также есть отдельные настройки по шумодаву и в некоторых ситуациях, может вести себя не так как ожидается - например если говорить очень громко, может заигнорить и пропустить.

На каких данных сверяли wer?

Обзор лучших API для распознавания речи 2026

iwram 10 фев в 16:16

Хотел уточнить по цифрам. Например wer 0.5496 по вашей таблице - выходит, что модель ошиблась в половине случаев если считать по общей сумме? Сам замеряю качество и бывают например случае где одни модели "слышат", то что не надо "слышать", другие же наоборот.

Можете ли вы выложить полученные тексты в архиве, могут быть неточности в том числе на стороне "золотого датасета" - т.е. какая нибудь модель распознала лучше, чем предлагаемые субтитры (например написано "идет музыка", "песня") - тестируемая модель пропустила т.к. посчитала шумом, а вы при проверке добавляете ошибку wer.

KubeVirt: мифы и реальность об оверхедах виртуализации в Kubernetes

iwram 21 янв в 15:56

Согласен.

Маркетологи компании, отдайте обратно аккаунт Андрею. В дополнение можно почитать доку https://docs.kernel.org/virt/kvm/api.html

If KVM_CAP_SYNC_REGS is defined, these fields allow userspace to access certain guest registers without having to call SET/GET_*REGS. Thus we can avoid some system call overhead if userspace has to handle the exit. Userspace can query the validity of the structure by checking kvm_valid_regs for specific bits. These bits are architecture specific and usually define the validity of a groups of registers. (e.g. one bit for general purpose registers)

И другие "уменьшаторы" накладных расходов описаны на популярном ресурсе.

Печально, что от обычной нормальной базы пытаются уйти в другие абстракции - которые на более высоком уровне якобы решат проблемы лежащие ниже.

ICNLI: как мы переосмыслили управление инфраструктурой через естественный язык

iwram 8 янв в 01:01

В статье не хватает картинок, где llm вместо alter использует drop т.к. это быстрее...

Fury Messenger: От «семейного чата» до народного мессенджера (или как я перестал спать и начал фиксить баги)

iwram 2 янв в 14:41

Вы ответили на удобный вопрос. Будут ли техническое описание, вроде как хабр это про технологии, а не про маркетинговый мусор. Расскажите что ваше решение - это не "Болдженос". Удачи, надеюсь мои предположения ошибочны.

Fury Messenger: От «семейного чата» до народного мессенджера (или как я перестал спать и начал фиксить баги)

iwram 2 янв в 05:50

Ясно что ссылки на гитхаб не будут. Но хотя бы схему взаимодействия и принцип работы можно нарисовать. А так смотрится как очередной супер проект с целью нагнать аудиторию в телеграм....

+16

Сколько VRAM нужно для нейросетей?

iwram 21 дек 2025 в 19:23

И работает и есть проблемы. Не все модели будут корректно работать если купите самый дорогой mac studio. Оставлю это https://github.com/pytorch/pytorch/issues/141287 - некоторые модели и в том числе для дообучения - будут работать через процессор, что вызывает печаль. Не стал бы на данный момент инвестировать в яблоки, если цель запускать модели и остальные вещи связанные с ML

НАЙС.ОС — как Не пересборка RHELL оказалась RHEL

iwram 16 дек 2025 в 02:54

Считаю статью неполной т.к. нет отдельного пункта про "нескучные обои". Требую на уровне законодательства ввести обязательное требование обозревать обои во всех новых дистрибутивах!

+12

GigaAM-v3: открытая SOTA-модель распознавания речи на русском

iwram 4 дек 2025 в 14:16

Во многих статьях под словом "домены" - чаще всего подразумевали другие языки, в рамках вашей статьи насколько понял, используется только русский язык, а домены - это наборы данных разного качества и содержимого.

Еще хотел уточнить, делали ли вы гибридную модель, где есть 2 головы - CTC (на быстрое распознавание) и RNNT (на более точное) и как такую модель используете в своих проектах?

И на вопрос, который вы обычно не отвечаете на своих докладах и выступления, ну или говорите фразу типа "бесплатного google colab для этого не хватит" - так все таки, сколько времени и на каких мощностях вы обучили модель которую выложили и с какой попытки получилось? Спасибо.

«Взяли лучшее и объединили»: философия сервера Selectel

iwram 14 ноя 2025 в 19:16

О, интересно. А можно подушнить? Пишу по факту, давно брали компанией у вас достаточно много серверов и пару штук были глючные, настолько что при после установки дистрибутива были проблемы во время работы - конечно винил только свои кривые руки, а не сервер или неисправный процессор, что также сообщала ваша техническая поддержка, потеряв пару дней, нам заменили сервер и компенсировали 2 дня для данных серверов. С тех пор приходится быть с провайдером связи очень прямолинейным - не работает железка, просто возьмите и замените, зачем мне терять время, которое мне никто не компенсирует. Надеюсь с новыми серверами в случае глюков, вы не заставляете клиентов проводить дебаг за свой счет. Спасибо.

AMD заявила, что будет поддерживать старые видеокарты много лет

iwram 13 ноя 2025 в 13:39

Жизненный цикл ПО у AMD короче в 2 раза чем у NVIDIA - эта ситуация многим надоела.

AMD заявила, что будет поддерживать старые видеокарты много лет

iwram 13 ноя 2025 в 09:20

В это время nvidia поддерживает свои старые карты 9-10 лет, а тут amd дала подарок и стала на карты 4х летней давности "продлила" поддержку...

Внутреннее устройство Docker. Заглянем под капот

iwram 6 ноя 2025 в 12:44

Нужно больше статей про контейнеры..... Но пока лучшая https://habr.com/ru/articles/935178/

Я построил контент-завод на n8n. Он работает. Зарабатывает — нет :-(

iwram 16 окт 2025 в 08:10

Возможно люди просто не желают читать контент сгенерированный нейросетью....

+22

Clickhouse / zookeeper. Развертывание

iwram 30 авг 2025 в 08:11

Все описано в доке https://clickhouse.com/docs/ru/guides/sre/keeper/clickhouse-keeper

Акцент на линейность чтения и записи и конечно по ресурсам кипер в отношении памяти менее прожорлив в отличие от zookeeper.

По статье - надеюсь тут говорится про тестовый стенд, а не реализацию в production.

Как мы мигрировали на новый шардированный кластер ClickHouse

iwram 29 авг 2025 в 15:42

Интересно, а админы clickhouse знают что вы вставляете в distributed table? Помню на старой работе такое не приветствовалось т.к. кластер зукипера чувствовал себя не очень при таких нагрузках?

Как я перенёс операторный PostgreSQL Patroni из Kubernetes на bare metal без сбоев

iwram 18 авг 2025 в 07:28

Странно, почему так мало причин по уходу постгреса в кубернетесь на bare metal или укажите по ресурсам в кубере и какие железяки стали целевыми. Графики по latency до и после будут?

Файловая репликация в СХД АЭРОДИСК ENGINE: для тех, кто устал терять данные по тупым причинам

iwram 18 авг 2025 в 03:54

Это получается rsync в кроне. Проверяли ли состояние гонки, когда большой файл не успевает провести синхронизацию за интервал задания? Где система хранит индексы и как справится с условным миллиардом мелких файликов? Думаю что делали тесты и знаете какие есть ограничения.

Про справедливый энергообмен работодатель–сотрудник

iwram 30 июл 2025 в 14:36

Отдохните и пишите достойные технические интересные статьи. Удачи!

2 3 ...

10 11

В рейтинге: 5 017-й

Откуда: Красноярск, Красноярский край, Россия

Дата рождения: 2 мая 1986

Зарегистрирован: 29 июля 2013

Активность: сегодня в 09:58

Администратор серверов, Администратор баз данных

Старший

От 1 ₽

Linux

Высоконагруженные системы

Elasticsearch

ClickHouse

Базы данных

Информация

Специализация