Комментарии / Профиль Walker2000 / Хабр

Валерий Курышев@Walker2000

Директор по продукту

Рейтинг

Подписчики

Хабр Карьера

ПрофильСтатьи12ПостыНовостиКомментарии226

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 17 июн в 06:33

Добрый день. Спасибо за оценку )

Вообще пишут, что для максимизации производительности лучше перейти на Linux. Но в моем случае компьютер по выполняет функции офисного. Как-от переходить специально на Linux выглядит излишним. С WSL не экспериментировал по причине дефицита времени.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 12 июн в 10:19

Пришлите ссылочку, если не затруднит.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 11 июн в 16:58

Не за что. Рад, что статья принесла пользу )

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 11 июн в 04:58

Мини ПК на strix halo со 128 ГБ на Озон сейчас от 250 тыс. Подорожало, до нового года было в районе 180. Потребление в зависимости от режима. От 60 до 120 Вт. Нормально работает в среднем (80…90 Вт). Разгонять до 120 смысла особого нет, скорость генерации практически не растет.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 11 июн в 04:48

Хорошее замечание. Я поджал модели для того, чтобы влезали в память сразу три. Но потом остановился на двух. Поэтому можно параметры поднять слегка. На сколько по вашим ощущениям увеличивается качество генерации с KV кэшем в bf16 по сравнению с Q8? Я читал, что разницы не заметно.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 10 июн в 17:25

Выгрузка и загрузка моделей сильно замедляет сессию. Не прижилось как то.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 10 июн в 15:15

Лучше 3090 с 24 Гб. Тогда можно будет qwen3.6-27b побыстрее инференсить. Наверное, с 50 t./s. Но модель сжатую до q4 придется юзать при этом.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 10 июн в 11:05

Да, это стоит попробовать, спасибо за наводку. Ранее смотрел в сторону qwen code. Но на тот момент это была еще сырая система, только только скопированная с гугловской cli. Возможно, ситуация изменилась.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 10 июн в 06:18

Pi не смотрел. Claude code понравился хорошими результатами «из коробки» по сравнению с OpenCode и Kilocode.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 10 июн в 05:36

Раньше я использовал в основном gpt-oss-120b, потом qwen3-coder-next (80 млрд параметров), с появлением qwen3.6 перешел на модели этой линейки. Качество ответов у них выше, контекстное окно больше. Из имеющихся сейчас моделей 3.6 показалось оптимальным выбором.

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Walker2000 10 июн в 05:31

Pi не смотрел. Claude code понравился хорошими результатами «из коробки» по сравнению с OpenCode и Kilocode.

RLM-Toolkit: Полное руководство по обработке 10M+ токенов

Walker2000 24 янв в 17:50

Добрый день. Очень любопытный фреймворк. Настолько, что захотелось попробовать. Но если в лоб запустить простейший код Quickstart из репозитория проекта (поменяв правда модель с gpt-4o на локальную qwen3-coder-30b из под ollama), он не работает.

from rlm_toolkit import RLM

# Создаём RLM с OpenAI
rlm = RLM.from_ollama("qwen3-coder:30b")

# Простой запрос
result = rlm.run("Объясни квантовые вычисления простыми словами")
print(result.final_answer)

Выпадает с ошибкой:

TypeError: RLM.run() missing 1 required positional argument: 'context'

Если проставить аргументы query и context, то спустя минуту вывалится уже с ошибкой:

 print(result.final_answer)
          ^^^^^^^^^^^^^^^^^^^
AttributeError: 'RLMResult' object has no attribute 'final_answer'

Слегка обескураживает...

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 30 дек 2025 в 08:10

Похоже, пользователь Реддит, который опубликовал эти результаты, что-то намудрил с настройками в LM Studio.

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 13 ноя 2025 в 15:25

А если модель не влезает в видюху? Вот здесь есть тест gpt-oss-120b на компе RTX 5090 (32 GB VRAM) + Ryzen 9 9950X3D + 96 GB RAM. В три раза медленнее, чем получается на моём Strix Halo. На днях дополню пост, пожалуй.

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 12 ноя 2025 в 18:19

Зависимость вывода первого токена от длины контекста

Для qwen3-coder-30b примерно такая картина. Единственное, квантизация здесь q8_0. И параметры настройки нейросети в LM Studio были ещё не оптимальные, скорее всего. И кнопка мощности в среднем положении (80 Вт на графическом ускорителе). Так что в реальности побыстрее должно быть. На коротком контексте быстродействие qwen30-coder-30b можно посмотреть в обзоре, который в статье последним приведён. Там простая qwen3-30, думаю, они примерно одинаково себя ведут. Мне больше понравилась gpt-oss-120b, надо сказать.

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 11 ноя 2025 в 14:07

У GMKtec EV0-X2 три вентилятора для охлаждения. Плюс эта модель в принципе наиболее покупаемая была на тот момент времени судя по количеству заказов. Поэтому решил остановиться на нем. Сейчас немного напрягает внешний источник питания. Возможно, стоило по этой причине приглядеться к Beelink GTR 9 Pro AI. Но я не изучал, насколько эффективно у него работает система охлаждения.

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 10 ноя 2025 в 14:40

Я не занимался тестированием видеокарт и не планирую, если честно. Как по мне, такой подход слишком сложный и энергозатратный. Но тема популярна, попробуйте поискать решение на реддит, полагаю, кто-то точно делал такое сравнение.

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 10 ноя 2025 в 14:33

VRAM до 96 Гб. Судя по ссылке с тестами LLM на Strix Halo, Linux можно на него поставить. Приведенные тесты делались на Linux.

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 10 ноя 2025 в 13:21

Спасибо за оценку. Про генеративные модели не подскажу, к сожалению, не работал с ними.

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Walker2000 10 ноя 2025 в 11:47

4090 это 300 тыс руб. Есть ли смысл связываться, если можно купить готовый комп под инференс моделей вплоть до 120 млрд. параметров за 200?