Комментарии / Профиль UtrobinMV / Хабр

Михаил Утробин@UtrobinMV

Machine Learning

Подписчики

ПрофильСтатьи7ПостыНовостиКомментарии148

GigaChat vs Opus в агентском аудите файрвола: попытка сравнения

Все верно Гигачат - национальная sota! А вы знаете лучше модели среди Российских разработок? Или вы знаете как можно лучше и быстрее обучать модели, находясь под Санкциями США и Европы? Я бы прежде всего гордился, тем что мы тут идем с небольшим отставанием полгода - год. А в некоторых моделях даже опережаем конкурентов из других стран.

GigaChat vs Opus в агентском аудите файрвола: попытка сравнения

UtrobinMV 20 июн в 08:57

А вы в курсе и как то следите по развитию Гигачат, по бенчмаркам гоняли её? Знаете сильные слабые стороны модели. Или подписка "за 20 баксов", это все что вы знаете? У каждой модели есть своя специфика, и нужно знать сильные и слабые стороны каждой модели, чтобы знать где и как лучше применить какую модель. "А модель универсал?" это что по вашему? "кофе заваривать умеет?"

GigaChat vs Opus в агентском аудите файрвола: попытка сравнения

UtrobinMV 17 июн в 13:56

Самореклама через поливание грязью других, плохая практика! Выглядит так, что вы плохо разбираетесь в LLM, раз используете модели под те задачи, для которых они не затачивались.

GigaChat vs Opus в агентском аудите файрвола: попытка сравнения

UtrobinMV 17 июн в 09:36

А кто сказал что GigaChat изначально подходит как модель к данной задаче? Там вроде у модели есть специфика, и она однозначно не под все кейсы подходит.

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

UtrobinMV 28 мар в 05:13

Мое личное предположение, что архитектура DeepSeek просто более удачная, а это тоже немаловажно. Поэтому и свернули в ту сторону. Тем более что не нужно было бы писать и адаптировать инференс.

9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026

UtrobinMV 13 мар в 17:09

На 1x4090 нормального ничего не поднять. А если и поднимите, то будет в лучшем случае 4 токена в секунду. Проверено. А статья это жуткая генерация LLM, реального опыта в ней 0.

GPU Intel Arc на Raspberry Pi и non-x86 платформах — запуск, настройка и анализ производительности

UtrobinMV 16 ноя 2025 в 12:59

На самом деле Интел на x86 то работает нестабильно. Намного полезней было бы запустить драйвера Nvidia и карточки nvidia например на Orange PI 5.

Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO

UtrobinMV 11 ноя 2025 в 08:27

Я бы предложил использовать механизм разворачивания модели DeepSeek-R1-0528 с квантизацией AWQ 4bit, это позволит использовать DeepSeek с большим контекстом. При этом выгружать на CPU ничего не придется.

Команда Datalab выпустила бесплатную OCR модель Chandra,...

UtrobinMV 3 ноя 2025 в 09:53

А с русским языком у нее как?

Неочевидные подробности обучения двухбашенных моделей

UtrobinMV 29 авг 2025 в 13:36

А вывод?

LLM против хаоса: как я автоматизировал ревизию прав доступа в админке Авито

UtrobinMV 28 авг 2025 в 07:10

Какой фреймворк использовался для написания агентов? Какие llm?

MERA v.1.2.0 Новая версия независимого бенчмарка, что поменялось?

UtrobinMV 24 фев 2025 в 21:41

Могу ли я сравнивать различные модели, с помощью данного бенчмарка, не отправляя сабмиты на сайт? т.е. в каком файле, после выполнения замеров, хранятся полученные метрики по модели?

Как я объединил перевод и суммаризацию текстов, и что из этого вышло

UtrobinMV 4 фев 2025 в 18:17

Стоит попробовать, чтобы проверить. Модели можно доучивать на своих данных. В модели large больше параметров и она больше способна к переобучению. Поэтому здесь главное не переборщить.

Как я объединил перевод и суммаризацию текстов, и что из этого вышло

UtrobinMV 4 фев 2025 в 06:53

Сравнение моделей выполнено по большому количеству метрик, так как каждая из них оценивает различные критерии.
Традиционные метрики, такие как BLEU, ROUGE и chrF, оценивают совпадения на уровне слов, n-грамм или подслов, но не всегда гарантируют, что результат будет полезным или понятным для человека. Более информативными в данном случае являются нейросетевые метрики, такие как COMET и BERTScore, которые учитывают именно семантическое сходство.
Для финальной проверки качества всегда стоит привлекать человеческую оценку, чтобы убедиться, что модель действительно решает поставленную задачу. Также можно использовать большие языковые модели (LLM), такие как DeepSeek V3 или ChatGPT-4, для автоматизированной оценки.
Однако не стоит полностью исключать традиционные метрики, так как их достаточно легко и быстро вычислить, и в целом они на начальном этапе коррелируют с нейросетевыми метриками.
Большие языковые модели (LLM) действительно показывают отличные результаты в задаче суммаризации, особенно модели с 30 миллиардами параметров и более. Многие датасеты на Hugging Face уже создаются с использованием таких моделей, включая ChatGPT-4. С выходом DeepSeek V3 можно ожидать появления еще большего количества подобных датасетов.
brief можно использовать для генерации заголовков, конечно. Возможно, даже base версия модели будет здесь более эффективной, так как она лучше справляется с краткими текстами. У Ильи Гусева, очень хорошая модель, которую я сам изначально использовал для суммаризации и она была лучшая для русского языка. Плюсы модели суммаризации Ильи, в том, что они учились именно на домене новостного сайта. И если ваша задача формировать заголовки новостей, то здесь возможно модель Ильи справится даже лучше.
Я же старался сделать модель для более широкого круга использования, не ограничивающегося только новостными сайтами. Таких моделей общего использования не хватает в открытом доступе.

Text-to-speech. Анализ открытых решений синтеза речи

UtrobinMV 31 окт 2024 в 06:53

Добрый день! Эту модельку забыли добавить для сравнения. https://huggingface.co/utrobinmv/tts_ru_free_hf_vits_low_multispeaker Модель тоже на базе VITS, имеет свой словарь состоящий из букв русского алфавита, работает на Transformers без дополнительного кода, имеет ONNX версию, и двухголосый режим работы. Должна без особых проблем заводится на Triton Inference Server. Так же есть расширенная версия, которая училась сама расставлять ударения https://huggingface.co/utrobinmv/tts_ru_free_hf_vits_high_multispeaker

Опыт тюнинга Llama3 405B на AMD MI300x

UtrobinMV 24 сен 2024 в 18:33

Ноль полезности. Зачем использовать Jax для тюнинга. Когда все научное сообщество использует pytorch? Прочитав статью думаю, что начинающие энтузиасты решат, что нужно купить AMD и изучать Jax. Но это путь в никуда, взять два самых непопулярных продукта и попытаться из них что то сделать.

Не самая лучшая статья для перевода!

Аналоги зарубежных приложений для команд дизайна

UtrobinMV 18 сен 2024 в 08:41

Недавно нашел вот такой проект. https://github.com/Figma-Linux/figma-linux

Что скажете?

Начинаем работу с PyTorch 2.0 и Hugging Face Transformers

UtrobinMV 1 мая 2024 в 09:37

Пробовал, использовать torch.compile в стандартный transformers моделях. Не получается компилировать. Пробовал на t5. Поделитесь опытом, как вы это делаете? И если можно то скиньте какие у вас версии библиотек (обновленные версии)

Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась

UtrobinMV 31 мар 2024 в 07:01

А что можно использовать вместо cultural X?

Сравнение локальных моделей машинного перевода для английского, китайского и русского языков

UtrobinMV 7 фев 2024 в 08:23

Модели в открытом доступе. Каждый может воспользоваться. Я еще не встречал плохих отзывов, в целом все оценивают положительно.

2 3 ...

7 8