Однажды я открыл биллинг и просто посмотрел, на что уходят токены. Не на «подумать над архитектурой». А на переименование переменных, генерацию тестов по готовому ТЗ и прогон миграций. Всё это считалось по тарифу флагманской модели, хотя такую работу вытянет модель в десятки раз дешевле.

Ниже – как развести действительно сложные задачи и рутину по двум моделям внутри Claude Code, не ставя ни одного стороннего форка. И три зоны, куда дешёвую модель я не пускаю принципиально.

Что на самом деле сжигает токены

Если разобрать мои сессии в Claude Code по типам задач, картина ясна: примерно 80% – это не размышление, а механика. Написать функцию, для которой уже есть точное ТЗ. Накидать юнит-тест. Поправить форматирование. Переименовать символ по всему модулю. Сгенерировать SQL-миграцию по схеме.

Ни одна из этих задач не требует фронтирной модели. Я же по привычке гонял через топ всё подряд – и платил за токены вывода, которых в разработке генерируется много, по самому верхнему прайсу.

Отсюда и решение: флагман остаётся там, где нужны глубокие размышления, а конвейер уходит тому, кто дешевле. В тот же вечер я разнёс задачи по двум моделям. Opus остался планировать, держать архитектуру и проверять результат. Всю механику забрал DeepSeek V4 – в том же интерфейсе Claude Code.

Цифры

Вот актуальные ставки за миллион токенов из прайсов Anthropic и DeepSeek на июнь 2026. Вывод считаю отдельно – в коде модель пишет много, и платите вы в основном именно за выходные токены.
Вот актуальные ставки за миллион токенов из прайсов Anthropic и DeepSeek на июнь 2026. Вывод считаю отдельно – в коде модель пишет много, и платите вы в основном именно за выходные токены.

Двадцать пять долларов за миллион выходных у Opus против восьмидесяти семи центов у DeepSeek V4-pro – это разница примерно в тридцать раз. У младшего flash выход стоит двадцать восемь центов: почти в сто раз дешевле флагмана.

Имейте в виду: я видел в другой статье ценник «DeepSeek V4 – $1.74 на вход и $3.48 на выход». Это устаревший прайс, который переписывают друг у друга, не сверяясь с первоисточником. Я залез в официальную документацию DeepSeek: на июнь 2026 V4-pro стоит $0.435 и $0.87. Проверяйте дату у любой цифры, которую вам показывают, – это касается и моих чисел тоже.

DeepSeek не заменит Opus – на сложной архитектуре он начинает плыть. Но те самые 80% рутины он закрывает спокойно, а флагман остаётся ровно там, где без него никак не получится добиться нужного качества.

Вся идея – в одну строку

Opus думает. DeepSeek делает.

Технически это две сессии Claude Code поверх одного проекта. Первая работает на Opus и играет роль тимлида: разбирает задачу, держит контекст, ставит подзадачи и принимает работу. Вторая – на DeepSeek, это исполнитель: получает конкретную задачу и пишет код. Обе сессии открыты в одной рабочей папке, видят те же файлы, те же MCP-серверы и те же скиллы. Отличается только цена токена у движка под капотом – и эта разница решает всё.

На практике это просто два окна терминала в одном каталоге: в одном запущен обычный Claude, в другом – команда, которая ходит на DeepSeek.

Как это поставить штатно, без форков

Сначала – чего делать не нужно.

В части гайдов первым шагом предлагают поставить сторонний форк Claude Code. Не делайте этого. Терминальный агент получает доступ ко всей вашей кодовой базе целиком, и доверять этот доступ чужой пересборке – так себе идея. Никакой форк здесь не нужен.

Связка собирается на родных механизмах. Claude Code умеет ходить на произвольный endpoint через переменную ANTHROPIC_BASE_URL. У DeepSeek есть Anthropic-совместимый API по адресу /anthropic – он принимает тот же формат запросов. Поэтому они стыкуются напрямую, без прослоек: вы просто говорите клиенту ходить на другой сервер.

Порядок такой. Регистрируете аккаунт на platform.deepseek.com, пополняете на пару долларов, выпускаете API-ключ. Дальше заводите отдельную команду, чтобы обычный claude остался на Opus, а вторая ходила на DeepSeek. У меня это маленький bash-скрипт claude-deepseek в ~/.local/bin/:

#!/usr/bin/env bash export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic export ANTHROPIC_API_KEY=ваш_ключ_deepseek export ANTHROPIC_MODEL=deepseek-v4-pro export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash exec claude "$@"

Разберу строки, чтобы было видно, что где:

  • ANTHROPIC_BASE_URL – переключает клиента с серверов Anthropic на DeepSeek.

  • ANTHROPIC_API_KEY – ключ DeepSeek (Anthropic-ключ здесь не нужен).

  • ANTHROPIC_MODEL – основная модель сессии, ставлю deepseek-v4-pro.

  • ANTHROPIC_DEFAULT_HAIKU_MODEL – модель для служебных фоновых вызовов (короткие технические запросы, которые клиент делает сам). Сюда ставлю дешёвый deepseek-v4-flash, чтобы и фон стоил копейки. В старых версиях Claude Code эта переменная называлась ANTHROPIC_SMALL_FAST_MODEL.

  • exec claude "$@" – запускает обычный клиент с этим окружением и пробрасывает все аргументы.

chmod +x, и готово. Теперь claude у меня – это Opus для задач «включить голову», а claude-deepseek – для задач «поработать руками». Проверял живьём на актуальной версии Claude Code: интерфейс и команды те же, но запросы уходят в DeepSeek, и выходные токены стоят в разы дешевле.

Три зоны, куда DeepSeek я не пускаю

Это самая важная часть.

Первое – ничего чувствительного. Все запросы уходят на серверы DeepSeek. Коммерческий код, ключи, данные клиентов и любую персональную информацию туда не отправляю – для этого есть флагман и закрытый контур. Это базовая гигиена: вы буквально пересылаете содержимое файлов внешнему провайдеру.

Второе – архитектура и тонкие развязки. Там, где нужно удерживать всю систему в голове и аккуратно сшивать модули, остаётся Opus. На сложном DeepSeek склонен додумывать и может сломать проект.

Третье – длинные автономные цепочки. Когда агент идёт по пайплайну в десяток шагов и ошибка на третьем распознаётся десятом, нужен тот, кто реже ошибается. Дешёвую модель я ставлю только туда, где вижу результат сразу и могу его проверить на месте.

Как-то я поручил DeepSeek собрать формулу для калькулятора – посчитать стоимость по нескольким параметрам. Код он написал чисто, а вот коэффициенты внутри проставил с потолка: ровные числа, которых в задаче не было. Результат, естественно, оказался неверным. Поймал я это, только когда пересчитал один пример руками. С тех пор правило простое: код пишет DeepSeek, а арифметику и «факты» я ему не доверяю. Любые цифры, метрики и константы от дешёвой модели перепроверяйте сами.

Сколько это даёт в деньгах

По итоговому счёту выходит в три-пять раз дешевле. Opus вы всё равно держите на оркестрации, и часть бюджета уходит ему. Но основная масса токенов раньше сгорала именно на рутине по цене флагмана – а теперь та же рутина считается по ставке, которая в десятки раз ниже.

Схема собирается за десять минут, не требует форков и не ломает привычный воркфлоу. Стоит попробовать хотя бы на одном проекте – посмотреть на свой биллинг через неделю.

Свой первый продукт я собрал ровно на этом подходе. Разборы похожих связок – как платить за Claude Code из России, чем заменить его дешевле, какие сервисы реально нужны новичку – выкладываю в своём Telegram-канале про практический AI: t.me/ai_smart_usage.