Комментарии / Профиль killeralex / Хабр

Пользователь

Подписчики

Как мы за неделю подружили DeepSeek-R1 с отечественными процессорами ARM64, NVIDIA A100 в 100% отечественном сервере

Воспользовался устаревшими и бесплатными LLM. Предлагаю вот это

1 По существу выбора модели — выбор слабый, и это видно без чужих подсказок. DeepSeek-R1-Distill-Llama-70B был выпущен в январе 2025. На момент публикации статьи (июнь 2026) это модель полуторагодовалой давности, а в темпе развития LLM это огромный срок. Объективные метрики подтверждают слабость выбора для заявленных задач: модель показывает низкие показатели по coding и agentic-задачам, а также слабый instruction-following — именно то, что нужно для "генерации документации, помощи в отладке, ревью кода", заявленных автором как целевые сценарии. То есть даже без сравнения с чем-то более новым — сама модель плохо подходит под заявленные кейсы использования по своим объективным характеристикам, а не только по "возрасту".

Хуже того: скорость генерации этой модели на эталонных провайдерах составляет около 43 токена/с, что делает результат статьи (20-23 токена/с на двух A100 80GB) откровенно слабым показателем для такого объёма заявленного железа — это не озвучено и не объяснено автором как ограничение, а подано как достижение.

2 Структурная проблема статьи — несоответствие объёма "танцев с бубном" реальной сложности задачи.
Если разобрать техническую часть (разделы 4.1–4.4) непредвзято: реальных нетривиальных трудностей там названо ровно две — флаг сборки BUILD_SHARED_LIBS=OFF и NUMA-привязка GPU к разным узлам. Это специфичные, но довольно стандартные проблемы для любого мультипроцессорного non-NVLink сервера, не уникальные для ARM64. При этом громкость заголовка ("за неделю подружили", "нетривиальный квест", "многое сломалось, но мы победили") не соответствует объёму реально описанных трудностей — у читателя создаётся ожидание глубокого инженерного разбора, а получает он две команды cmake и один флаг numa.

3 Внутреннее противоречие в логике статьи.
Раздел 5.4 объясняет разделение модели на два GPU через "сознательное решение" ради параллелизма и NUMA-оптимизации — но в этом же разделе признаётся, что один A100 (80GB) мог бы вместить всю модель целиком (42GB). Это значит, что вся "сложность" с tensor-split и NUMA distribute была добровольно созданной задачей, а не необходимостью, диктуемой железом. Это не лишает текст ценности, но подает решение как вынужденное технологическое преодоление, тогда как по факту это было исследовательское решение "посмотреть, что будет, если делать сложнее, чем нужно".

4 Раздел 9 (про суверенитет) логически нестрогий, независимо от тона.
Тезис "отсутствие закладок и килл-переключателя" обосновывается отечественностью CPU, но ключевой компонент инференса — GPU NVIDIA A100, на котором выполняются все матричные вычисления (это прямо признаётся в разделе 8: "CPU почти не участвуют в генерации"). Получается логический разрыв: главный аргумент про суверенитет строится вокруг компонента, который сам автор в предыдущем разделе назвал второстепенным для самой задачи LLM-инференса. То есть структура аргументации сама себя подрывает на уровне последовательности изложения, без участия чьей-либо критики.

5 Что в статье объективно сильно:
Конкретные численные данные по VRAM, NUMA-топологии и скорости prefill/generation — это проверяемые, полезные цифры.
Честное признание, что GPU не отечественные — редкая для маркетингового текста саморефлексия.
Описание физической архитектуры сервера (раздел 7) — фактурно и конкретно, в отличие от более общих разделов.

Итог
Главная объективная слабость текста — не в возрасте модели как таком, а в том, что выбранная модель плохо подходит под заявленные задачи по своим собственным паспортным характеристикам (слабый coding/agentic), при этом сложность реализации представлена как искусственно завышенная относительно объёма реально описанных трудностей, а ключевой идеологический тезис статьи (суверенитет) содержит внутреннее логическое противоречие с другим разделом той же статьи.

Как мы за неделю подружили DeepSeek-R1 с отечественными процессорами ARM64, NVIDIA A100 в 100% отечественном сервере

killeralex 23 июн в 15:30

Не знаю, что хочу больше к себе домой. Руку Сергея Шишкина или Модульный сервер «М1». Вступление директора по развитию очень понравилось

Фемтех: зачем нужна отдельная категория технологий для женского здоровья

killeralex 23 авг 2025 в 03:28

Мемтех)

У меня три календаря и одна жизнь: как я перестал быть курьером между женщинами

killeralex 2 июл 2025 в 04:23

Школа куколдов. А за автоматизацию - респект

-11

Разработчики полюбили ИИ, но пока для продуктов стало хуже

killeralex 8 дек 2024 в 15:17

Выводы-то какие Ланит сделал? Например, о чем статья-то?

Записки архитектора. Управление масштабными проектами, в которых не создаётся нового функционала

killeralex 6 дек 2024 в 11:04

Впечатление, что статейку писАла Алиса. Слово =Портирование= повторилось 20 раз подряд. Статья ни о чем

Как подружить FinOps и облако? Прерываемые виртуальные машины

killeralex 2 дек 2024 в 14:49

Вот про Степана здорово скреативили. Вспоминается красный трактор и поросёнок

Как искусственный интеллект поможет увеличить эффективность команд

killeralex 25 ноя 2024 в 16:29

Продакт-оУнер - это сильно...

-2

Современный on-call менеджмент: 5 основных шагов от мониторинга до постмортема

killeralex 21 ноя 2024 в 14:01

ИТ-директор, например, CTO в общем случае должен ночью спать спокойно. Исполнители L2 находятся в его подчинении. Вот некоторые из них по расписанию могут и не спать, а могут и спать

MECE: Основы структурного мышления для решения сложных задач

killeralex 19 ноя 2024 в 20:34

Полная группа событий для них магия

Такие разные обзоры

killeralex 18 ноя 2024 в 18:43

Липа

Подход к разработке системы компетенций в компании Улей

killeralex 16 ноя 2024 в 23:37

Вопрос: составители таблиц (матриц, карт) компетенций и проставители КПЭ (КПИ) к себе применяют эти, должно быть, прописанные методики?

Зачем собаке пятая нога? & Повсеместно отсутствующий элемент в организационной структуре

killeralex 5 ноя 2024 в 17:14

Статья ни о чем. Обсуждать нечего. Хабр, очевидно, не литературная страничка. (А сейчас зачастую превращается в набор эссе типа =Был сварщиком, стал пайтонистом=)

Войти в айти за год с нуля: быстро, качественно, недорого

killeralex 3 ноя 2024 в 20:08

В отзыве на фото не согласен с B1. Нафиг вообще не нужно

Функциональная спецификация на разработку ERP-системы на примере ABAP-отчета

killeralex 31 окт 2024 в 15:54

Даже понятно почему это вечнозеленое заминусовали

Войти в IT – в 37 и с дипломом филфака

killeralex 28 окт 2024 в 04:01

Да уж. Графоманство в чистом виде. Откуда столько кармы? Много слов. Гуманитарий в чистом виде. С повадками бизнес-тренера

+12

Технологии искусственного интеллекта для военного назначения. Прогноз рынка до 2032 года

killeralex 8 окт 2024 в 11:55

Статья ниочем. Похоже на писУльки 6 ЦНИИ МО РФ

Машинное обучение. Решения о жизни и смерти на поле боя. Часть I

killeralex 8 янв 2023 в 12:34

1 Перевод отвратительный. Американский дебильный новояз типа =Мужчины и женщины=

2 В плане моделирования боевых действий пустота

Как стать программистом самостоятельно

killeralex 26 дек 2022 в 15:26

Уважаемая Юлия) Какова, е честно, цель статьи? Сверить часы с самоизучающими? Предложить коучинг?

2 В BigData от фонда Apache не хватает джавовских Camel, Flink, NiFi etc (например)

3 Зона комфорта - враг развития. Слоган копирайтера или выпускника МГИМО. Мотивация, стартап - примерно оттуда же

4 Hibernate это ORM для РСУБД. ORM не равно РСУБД. На mindmap тогда надо указать ветку ORM

Оформляем большие документы по ГОСТам в MS Word и не только

killeralex 15 дек 2022 в 07:53

Вставлю свои 5 копеек. 1 Техпис (он же пистех) на проекте это зло, особенно на госпредприятии, даже если формально оно АО. 2 Нормоконтроллеров нужно устранять как класс, для чего постоянно внушать эту мысль иголками в кукле гендира и/или 1го (функционального) зама 3 Если макулатуру пишет > 1 человека, то редактор=корректор=отв. исполнитель один. Он же в силу бедности организации и верстает. Поэтому в коллективе создателей макулатуры рекомендуется договориться: 1.25 абзац, Times New Roman 11/14, 1/1.5 инт, ненумерованные списки форматировать не бриллиантами и даже не дефисами, а длинными тире. Прим.1. Рамки ЕСПД печатать глупо. Т к ГОСТы в основном это рекомендации. 2. Упомянутые гендир и первый зам тратят не свои деньги на раздутую бухгалтерию и т.н. экономистов, а нанять профессионального корректора со стажем работы в нормальной ежедневной общероссийской газете жмут 100 тыс руб в месяц. Это признак тупости вот таких начальников (директоров, бизнесменов, господрядчиков, импортозаместителей; нужное подчеркнуть)

2 3 4