runaway_llm1 дек 2025 в 14:27

DeepSeek-V3.2: как открытая модель догоняет GPT-5 и берет «золото» олимпиад

2 мин

8.3K

Искусственный интеллектМашинное обучение *

Комментарии 10

Tomas-Anderson 1 дек 2025 в 14:51

Кто то специально минусует, недоброжелатели?

nickolas059 1 дек 2025 в 16:26

Много говорят про токены. В данном случае что это и для чего?

MountainGoat 1 дек 2025 в 16:37

LLM перед работой разбивает слова на группы букв, по своим правилам. Эти группы и называются токены. При использовании платного API они и тарифицируются, причём как отправляемые в запросе, так и получаемые. При агентном режиме работы, когда сеть задаёт уточняющие вопросы и перепроверяет себя, на каждую итерацию отправляются все токены всех предыдущих итераций, поэтому стоимость в токенах растёт лавинообразно. Поэтому для GPT берут подписку за 200$ в месяц – дешевле выйдет. А DeepSeek просто по токенам у меня съел за ноябрь 300 рублей, хотя гонял я его в хвост и в гриву.

SilverDrakon 1 дек 2025 в 20:26

Я тут у одного аггрегатора брал на месяц 20 миллионов токенов (думал - на месяц хватит, ага), хотел попробовать Claude Sonnet 4.5 в программировании. Так он их все "сожрал" примерно за 10 запросов (при том, что программу я писал не ахти какую большую и сложную - веб-интерфейс и БД для хранения результатов тестов и сравнения их между собой - на несколько страниц. Так и не дописал, нашлись баги, пока правили - токены тю-тю...)

Причём я пробовал два подхода:
1. Начать с MVP, постепенно добавлять фичи, отлаживать баги в процессе (с нейронками оказалось так - чем дальше процесс в рамках одного чата - тем больше багов, это испытано на разных LLM). Токены сожрались запросов за 11.
2. Сразу написать полное ТЗ на программу, попробовать запустить то, что получилось (конечно, не запустилось). Выдача ошибок LLM-ке, применение её ответов, и так по кругу. Токены кончились раньше, чем оно заработало. В принципе, мне и шага 1 хватило, но я забыл подписку отменить, и с меня за следующий месяц списали, решил, раз уж есть, надо ещё один заход сделать.

MountainGoat 1 дек 2025 в 21:11

Агрегатор часто совсем не поддерживает кеширование токенов. При использовании deepSeek напрямую за обработку повторной части запроса берут в 10 раз меньше. Агрегаторы разницу, видимо, себе кладут.

dkeiz 1 дек 2025 в 17:31

токен - базовая единица для языковых моделей и вообще расчета инференса.
Раньше люди информацию измеряли мегабайтами, LLM измеряет токенами.

Bunyaz39 1 дек 2025 в 17:27

Уровень золотой медали в олимпиадах по математике - круто конечно, но все же это специфическая сфера с четкими правилами. Умение решать математические задачи слабо коррелирует со способностью например к здравому смыслу

lxnvr 1 дек 2025 в 17:38

при этом доступна бесплатно в веб-версии и приложениях

Но там же нет опции выбора версии, или здесь речь о другом ?

Gizensha 1 дек 2025 в 17:42

Что там с цензурой и детсадовскими ограничениями на безопасность? А то у опенаи тоже есть вся такая открытая модель доступная для загрузки, а накой она нужна, если ограничения те же, что у онлайн-версии, но при этом глупее и медленнее. Что у дипсика, который раньше них открыл веса?

vikarti 3 дек 2025 в 05:34

На некоторых моих простых тестах:

первый - логическая задачка простая но сущности выбраны так что можно понять что задача про сексуальную эксплуатацию в незаконном по мнению УК большинства стран мира варианте...и куча художественных книг и сериалов на эту тему )
- Deepseek V3.2 цензура.
- Deepseek R1-0528 кстати работало
- ChatGPT 5.1 - отвечает без вопросов
второй - политика и просьба описать варианты действий по лестнице эскалации (включая МРЯУ) за $LEADERNAME1 которого $LEADERNAME2 с его $COUNTRYNAME2 достали, в сценарии также и про использование беженцев не очень красивым образом (но по крайней мере - живы они останутся, работа будет и смена статуса - в принципе возможна) есть.
- ChatGPT говорит что так не хорошо, давай лучше художественный сценарий без МРЯУ (но с тактикой).
- Deepseek V3.2 - комментарий что такие сценарии нарушают международное право (что правда) и более менее описывает.
- Deepseek R1-0528 правда описывает лучше (ну и прямо указал какое оружие (точные названия) $COUNTRYNAME1 использовала, вообщем правильно догадавшись что имелось ввиду).
- Deepseek V3.2 Speciale начала работу и подвисла где то через 3 минуты (reasoning не обновляется)
- Deepseek R1T2 Chimera (roleplay-мод для DS - без всяких комментариев незапрошенных правда в каком стиле... и опять понятно кто есть $COUNTRYNAME1 (на этот раз - по именам / должностям / названиям городов(нет - уже не те кого R1-0528 имел ввиду)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий