Annsky1 мая в 10:15

Реальные данные о размерах подписок и качестве разнообразных моделей. Опыт Амбассадора AI

Средний

7 мин

8.8K

Искусственный интеллект

Обзор

Из песочницы

Комментарии 16

Jacov911 1 мая в 18:05

Это перевод?

Annsky 2 мая в 08:02

Нет

Rahspide 4 мая в 02:09

Кстати про модели. Тот же github copilot,пока что лучшее чем я пользовался в работе с моделями.

1500 запросов в месяц,вроде немного,но доступ к тому же гпт5.5 и бездонный гпт5 мини, которого можно использовать как второй мозг для большой модели.

Ну и для долгих сессий deepseek v4. Цена в целом не прям большая,особенно если использовать флеш с рисонингом Макс.

AleGen 4 мая в 03:53

О, интересно! Я бы попробовал! Подскажите, пожалуйста, какова цена? И как можно юзать (ведь, наверное, россиян банят?...), и как оплачивать?

Rahspide 4 мая в 08:49

Ну сейчас явно НЕ получится зарегистрироваться. А платил стандартно - карта Казахстана)

Россиян не банят, но скорее всего запросы придется через квн вести. Я честно без него не пытался даже, тк вообще не вылезаю из под него.
Юзать можно, как со стандартными инструментами github, так и интегрировав в тот же Opencode( как я и использую)

ontop 7 мая в 22:14

Смысла в Copilot все меньше. Рассылка была, что в июне переходят на тарифы оплаты по факту. Я так понял в 40$ входило 1500 месячного лимита, что не плохо. Я при 8 часах работы 150 сжигал максимум.

Если вы например оплачивали 15 числа, то у получали 1500 на 15 дней до 1 числа ещё 1500 до 15 числа (небольшая халява).

Учитывая подорожание Copilot теперь подписки будет хватать в 2-2.5 раза меньше где-то, голосуем рублем. Sonnet станет x3.

А так у меня было 40$ Copilot, 20$ Claude, 20$ ChatGPT.

Kimi 2.6 приятно удивил. Ещё удивило, что мало спрашивает и делает более глобально. Может где-то рядом с GPT5.4, но точно не по скорости. У меня отвечает 6-10 секунд пинг до Kimi, с Китая летят к нам?

Chatgpt ответы вообще без пинга.

Rahspide 8 мая в 08:58

Я kimi очень хотел попользоваться, но знакомый после тестов сказал что моделька очень быстро теряет контекст (он конечно не занимается добавлением mcp но сам факт) Бенчи у Kimi вызывают интерес, особенно в сравнении с топами типо того же GPT и Opus.

Касательно copilot. Ну посмотрим поглядим. В данный момент я не использую топовые модели типо GPT 5.5 или Opus 4.7. Обращение к ним неоправданно дорогое. Да и контекст. 144к токенов у опуса?) Мне его в луп вывести, загрузкой инструментов и агентс.мд ?) Остатка контекста хватит буквально на Hello Worl...../compress.

GPT 5.4 пожирает ровно 1 запрос. С режимом xhigh, он дотягивается до 5.5 в режиме medium, а большего мне и не надо )
У копилота остаётся ещё одно приятное преимущество. Бесконечный доступ к gpt5-mini. Да контекст 200к. Ну камон. Он не тратит запросы, его можно и нужно использовать как второй мозг для моделей.

ontop 8 мая в 10:08

Могу вам порекомендовать запускать GPT5.4 на low. Опытным путем пришел к выводу, что при такой настройке GPT5.4 все равно умнее чем например GPT5.2 на high.

То есть это режим размышления, где модель думает, а ей думать вообще не нужно. То есть когда модель умная, например GPT5.5 она на low показывает результат по задачам намного лучше чем Gemini 3.1 PRO, Sonnet 4.6 high.

Я бы это определил так, LLM это море которое уже прямо сейчас знает все ответы, но ее можно запустить в режим размышления, который на самом деле слишком переоценена, когда польза от него невысокая.

Вот только ChatGPT например хитрят, у них low, high по лимитам не видно разницы.

А вот claude подписка ощущается. Ставишь Sonnet 4.6 low, она работает не хуже, но ест меньше в 1.5 раза. Тоже и Copilot.

Кстати если вам надо например сделать какую-то очень сложную задачу даю лайв-хак.

Подписка ChatGPT -20$. Используете стандартно, но когда надо сделать большую задачу на много этапов пишете большой план с определением плана двигаться по всем пунктам до конца. Оставляете его на конец. Потом когда у вас остаётся 5-10% загружаете в него этот план с переходами между этапами и просите его двигаться 10 этапов, друг за другом. Настройку выбираете GPT5.5 xhigh и запускаете. У них там есть настройка доделать до конца, даже если лимиты закончились.

У меня как-то рекорд был, один такой запуск задачи продлился 2 часа. :) GPT5.5 на 2 часа делал рефакторинг всего кода, тесты и так далее, без остановки, нужно только правильно план написать.

Rahspide 8 мая в 10:26

Ну пока есть рабочий Копайлот, это решается дерективой
- Пока не доделаешь и не протестируешь - сессию не заканчиваешь)

Интересное замечание, учту. В моём случае обычно всё крайне банально.
Если задача сложная GPT5.4 xhigh прорабатывает план. Максимально подробно, поэтапно. С верификацией. Сохраняет его и даёт краткий промт.
Это уже я загружаю в Deepseek v4 flash. Тут как раз можно поставить low, тк думать модели не надо, просто следуй задаче. Последняя задача на 100кк токенов мне стоила....около 40 центов.
Но ваш вариант тоже интересный) В любом случае, посмотрю что будет летом с гитхабом и буду думать где взять подписку повыгоднее.

Раз у нас сессия с самообразованием, делюсь своим мелким лайфхаком : https://github.com/decolua/9router
Индусы конечно гении....

ontop 8 мая в 11:47

Я использую omniroute, но как понял это похожая история, попробую 9route :)
На бесплатный Kiro Sonnet 4.5 я еще пока успел, но это временно как понял. Как пишет статьи на русском мне больше нравится чем Sonnet 4.6 и другие модели.

ontop 8 мая в 14:58

Кстати если ищите новый тариф, можете попробовать Windsufr, там есть триал 14 дней. За 20$ вполне не плохой тариф, но иногда бывают перебои в работе GPT 5.5, остальное работает.
Kimi 2.6 с минимальным пингом.

ontop 9 мая в 14:22

Хочу поблагодарить автора, её промпт мне очень помог, а именно начать систематически эволюцинировать hermes agent. Ранее можно сказать ходил по кругу, одно улучшали, другое портили, это происходило постоянно, а сейчас появились жесткие рамки. Видимо мне стоит более профессионально изучать тему работы с нейросетями.

До этого не было важной цепочки, а благодаря этому промпту, получилось начать эволюцию hermes. Можно сказать я нашел главную проблему в личности агента, она была не правильная. Переформатировал личность, стало всё совсем по другому.

Kimi2.6 прекрасно работает с этим в долгую, особенно если вы занимаетесь не просто кодингом, а созданием агента, который должен совершенствоваться, благодаря взаимодествия с вами, для меня это переход на новый level. https://habr.com/ru/articles/1021474/comments/#comment\_29806216

Annsky 12 мая в 07:31

Можете подсказать, что поменяли в личности? Я тоже пользуюсь Hermes и стараюсь его развивать.

ontop 12 мая в 07:56

Да всю личность SOUL.md (там много противоречий было со промптом).
Еще добавил часть из популярного на Github промпта https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md, только не ту которая про Simplicity First.

Вот это:

## 4. Goal-Driven Execution Define success criteria. Loop until verified. Transform tasks into verifiable goals: - "Add validation" → "Write tests for invalid inputs, then make them pass" - "Fix the bug" → "Write a test that reproduces it, then make it pass" - "Refactor X" → "Ensure tests pass before and after" For multi-step tasks, state a brief plan: ``` 1. [Step] → verify: [check] 2. [Step] → verify: [check] 3. [Step] → verify: [check]

Можно сказать после всего этого мой Kimi 2.6 opencode Go, начал очень хорошо делать задачи и планы. Пишет планы по 1-2 часа, собирает источники грамотно. Создает скиллы.
Последний план был по запуску на локальной машине перспективной Qwen3.6-27B.i1-IQ4_XS-attn_qkv-IQ4_XS.gguf (хорошие отзывы на reddit) на 9070 16GB видеокарте с контекстом 65k (сейчас пробую на 80k контекста выйти).
Получилось 30t/s выжать, что для повседневных задач хватает, но контекст пока только 65k.

Так скоро появится новый продукт на рынке, PCI GEN5 платы с памятью как DDR5 только для видеокарт, покупаешь 16GB DDR6 и доустанавливаешь в оставшийся PCI слот, если не хватает выгрузить LLM полностью, для 256k-512k контекста. Видеокарты с 24 ГБ дорого, а вот взять 4060 + 16GB, 9060xt +16GB и такую плату с памятью на 16GB вполне.

semibratov 30 мая в 10:19

Kimi 2.6 реально лучше работает чем Deepseek 4?

ryba1967 8 июн в 06:19

Было бы интересно увидеть продолжение. Получается, что вы много работали в Claude Code, а потом ушли в OpenCode? Или сразу был OpenCode с подпиской Claude? Почему не стали оставаться на Claude в связке с другими провайдерами?

И как это сочетается с работой, насколько официально, разработка в команде, насколько формальный процесс, метрики на производительность разработки, что-то ещё?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий