Какую-то чушь написал... 1к токенов это 1-2 объёмные промта, я за неделю работы в агенте антропик сжёг где-то 40кк т.е. Миллионов токенов и мне это обошлось в 20$ на дипсик модели... На опус от клауде ушло бы 40-50$, но не 200-300 за 1к.
Опять же чем тяжелее модель тем дороже её токен, чем больше слоев и меньше попадание в кэш. Ты можешь заплатить за 1кк токенов как 0,1$ так и в три-пять раз больше, зависит от множества факторов. А про 200-300 это бред... Разве что ты сделаешь модель и допустить до неё 100 пользователей, вот тогда затраты на её обучения придётся размазывать по ним и тогда твои 1к токенов будут столько стоить. А когда у твоей модели пользователей миллиард, то затраты на обучения тонким слоем размазываются и ты платишь условно только за электричество затраченое твоим промтом
deepseek-reasoner 95 запросов (это где-то 5-10 промтов, остальное запросы к инструментам и цепочки типа прочесть файл - прочитать его в контекст - прочесть следующий) 5М токенов deepseek-chat 112 запросов - 550К токенов
суммарно в конце февраля за 5 дней работы 265М токенов (260 deepseek-chat) потрачено 12.47$ но там уже некоторые промты писались исключительно матом... чтобы пар спустить )) а в ответ "Да вы правы, я ошибся. Вот новая исправленая версия"
а еще обе модели нагло игнорируют системный промт, ты строго задаешь правила взаимодействия, а он всеравно все делает по своему )) но тут возможен конфликт встроенных частей промта которые подставляет claude code.... Типа в промте claude может быть написано "ты кодинг асистент, сделай хорошо" а твое дополнение к системному промту "не делай ничего если промт не содержит слова 'начинай'" и если ты ему напишешь "надо исправить ошибку" он сразу понесется лезть в файлы и пытаться ее исправлять... Но если напишешь какое-то просто правило типа "добавляй эмодзи в начало каждого сообщения" или "в ответ на промт пинг всегда отвечай понг" это он будет учитывать.
Интересная новость. Текущая v3 в кодинге очень тупая, если речь о deepseek-chat. Deepseek-reasoner немного умнее, но и в два раза дороже, что в итоге лишает её преимущества перед Claude Opus. Да и контекстное окно 128к против 200к. Пользуюсь моделью deepseek-chat api через anthropic api в Claude code. Это просто боль, но зато дешёвая :)) интересно как оно с v4 будет
Какую-то чушь написал... 1к токенов это 1-2 объёмные промта, я за неделю работы в агенте антропик сжёг где-то 40кк т.е. Миллионов токенов и мне это обошлось в 20$ на дипсик модели... На опус от клауде ушло бы 40-50$, но не 200-300 за 1к.
Опять же чем тяжелее модель тем дороже её токен, чем больше слоев и меньше попадание в кэш. Ты можешь заплатить за 1кк токенов как 0,1$ так и в три-пять раз больше, зависит от множества факторов. А про 200-300 это бред... Разве что ты сделаешь модель и допустить до неё 100 пользователей, вот тогда затраты на её обучения придётся размазывать по ним и тогда твои 1к токенов будут столько стоить. А когда у твоей модели пользователей миллиард, то затраты на обучения тонким слоем размазываются и ты платишь условно только за электричество затраченое твоим промтом
deepseek-reasoner 95 запросов (это где-то 5-10 промтов, остальное запросы к инструментам и цепочки типа прочесть файл - прочитать его в контекст - прочесть следующий) 5М токенов
deepseek-chat 112 запросов - 550К токенов
суммарно в конце февраля за 5 дней работы 265М токенов (260 deepseek-chat) потрачено 12.47$ но там уже некоторые промты писались исключительно матом... чтобы пар спустить )) а в ответ "Да вы правы, я ошибся. Вот новая исправленая версия"
а еще обе модели нагло игнорируют системный промт, ты строго задаешь правила взаимодействия, а он всеравно все делает по своему )) но тут возможен конфликт встроенных частей промта которые подставляет claude code.... Типа в промте claude может быть написано "ты кодинг асистент, сделай хорошо" а твое дополнение к системному промту "не делай ничего если промт не содержит слова 'начинай'" и если ты ему напишешь "надо исправить ошибку" он сразу понесется лезть в файлы и пытаться ее исправлять... Но если напишешь какое-то просто правило типа "добавляй эмодзи в начало каждого сообщения" или "в ответ на промт пинг всегда отвечай понг" это он будет учитывать.
Даже не в два, а где-то в 4 могу точнее статистику посмотреть в логах. И контекстное окно закрывается быстрее
Зависимость цены не прямая, тк на ризонер ты тратишь меньше уточняющие промтов.
Интересная новость. Текущая v3 в кодинге очень тупая, если речь о deepseek-chat. Deepseek-reasoner немного умнее, но и в два раза дороже, что в итоге лишает её преимущества перед Claude Opus. Да и контекстное окно 128к против 200к. Пользуюсь моделью deepseek-chat api через anthropic api в Claude code. Это просто боль, но зато дешёвая :)) интересно как оно с v4 будет