лень было заморачиваться с созданием api, заставил его qwen code для поиска запускать и сохранять в файл, в cli инструментах норм поиск и безлимитный условно
Странный выбор модели, берете Qwen3-Coder-30B-A3B, если на пк норм памяти(32 или 64 гб), запускаете на ночь промт и качество для такой простой задачи может дать неплохое, или GPT-OSS-20B(побыстрее будет)
А что за стек? На моих тестах из бесплатных сейчас лидер по reasoning Kimi k2 thinking, в кодинге glm 4.6, r1 и qwen coder заметно хуже. Пока не было glm и kimi из бесплатных связку Gemini 2.5 pro(планирование, архитектура) +qwen(кодирование) юзал, неплохо вполне
R1-0528 очень медленная и плохо с tools работает, лучшее, что сейчас есть для кодинга, это glm 4.6. Если нужен reasoning, то Kimi k2-thinking, были большие надежды на MiniMax m2, но в кодинге не очень себя показывает.
Очень много, gemini 3 flash за пару первых дней больше 300м токенов потратил
лень было заморачиваться с созданием api, заставил его qwen code для поиска запускать и сохранять в файл, в cli инструментах норм поиск и безлимитный условно
Странный выбор модели, берете Qwen3-Coder-30B-A3B, если на пк норм памяти(32 или 64 гб), запускаете на ночь промт и качество для такой простой задачи может дать неплохое, или GPT-OSS-20B(побыстрее будет)
А что за стек? На моих тестах из бесплатных сейчас лидер по reasoning Kimi k2 thinking, в кодинге glm 4.6, r1 и qwen coder заметно хуже. Пока не было glm и kimi из бесплатных связку Gemini 2.5 pro(планирование, архитектура) +qwen(кодирование) юзал, неплохо вполне
R1-0528 очень медленная и плохо с tools работает, лучшее, что сейчас есть для кодинга, это glm 4.6. Если нужен reasoning, то Kimi k2-thinking, были большие надежды на MiniMax m2, но в кодинге не очень себя показывает.
На cloud.ru есть glm-4.6, MiniMax M2