Comments 30
Уже доступно на ollama: https://github.com/ollama/ollama/releases/tag/v0.11.0
16gb на 21b это жестоко. Ждем квантованную версию
Это и есть квантованая версия, как я вижу все модели работают в режиме fp4 ниже их округлять, имхо, не имеет смысла
Короче, потестил версию b20: за 20 минут на ноутбуке с 6cpu 32Gb ram 4Gb vram выжрал 8000 токенов на перебирание всех подряд вариантов и ничего не ответил. Это решим максимального размышления. на простом и среднем уровне размышления за 2 и 7 мин соответственно, выдавал неверные ответы в задачке на логику.
Задачка
В деревне живут трое друзей: Алексей, Борис и Виктор.
Один из них — кузнец, другой — пекарь, третий — плотник.
Кузнец живёт ближе всех к реке.
Плотник живёт дальше всех от леса.
Борис живёт между Алексеем и Виктором.
Алексей — не кузнец.
Виктор — не пекарь.
Пекарь живёт ближе к лесу, чем кузнец.
Кто кем работает?
Как и всегда, все зависит от запроса...
```
В деревне живут трое друзей: Алексей, Борис и Виктор.
Один из них — кузнец, другой — пекарь, третий — плотник.
Кузнец живёт ближе всех к реке.
Плотник живёт дальше всех от леса.
Борис живёт между Алексеем и Виктором.
Алексей — не кузнец.
Виктор — не пекарь.
Пекарь живёт ближе к лесу, чем кузнец.
Кто кем работает?
```
реши эту задачу перебором
Скрытый текст
Нужно определить, кто кем работает, при наличии следующих пунктов:
Персона Оставшиеся варианты профессий Алекей кузнец, пекарь, плотник Борис кузнец, пекарь, плотник Виктор кузнец, пекарь, плотник
Условия
Кузнец живёт ближе всех к реке.
Плотник живёт дальше всех от леса.
Борис живёт между Алексеем и Виктором. (по расположению вдоль дороги к реке)
Алекей — не кузнец.
Виктор — не пекарь.
Пекарь живёт ближе к лесу, чем кузнец.
Перебор
Шаг 1 – Ограничение по профессиям
Так как Алекей точно не кузнец, у него остаются две профессии:
пекарь
плотник
Так как Виктор точно не пекарь, у него остаются две профессии:
кузнец
плотник
Следовательно, Борис вынужден быть пекарём, потому что все профессии должны быть разными.
Персона Профессия Алекей ? (пекарь / плотник) Борис Пекарь Виктор ? (кузнец / плотник)
Шаг 2 – Расположение по реке
Кузнец живёт ближе всех к реке, значит его объезд находится справа (самый правый).
Если Виктор является кузнецом → он самый правый.
Если Алекей бы был кузнецом, условие Алекей — не кузнец нарушило бы бы, поэтому это невозможно.
Таким образом Виктор – кузнец и находится дальше всего от леса (слева от всего) и ближе всего к реке (с правой стороны).
Объезд Профессия 1 (дальн. от реки) Плотник (Виктор) 2 (середина) ? 3 (ближе к реке) Пекарь (Борис)
Шаг 3 – Борис живёт между Алексеем и Виктором
Если Виктор находится слева, а Борис справа от него, то Алекей должен быть слева от Бориса.
Таким образом Алекей – левый объект (объезд 1), а Борис – средний (объезд 2).
Получаем расположение:
Приоритет по дереву (от северо‑запада к юго‑востоку) Персона 1 (дальн. от леса) Алекей 2 (середина) Борис 3 (ближе к реке) Виктор
Шаг 4 – Проверка оставшихся условий
Плотник живёт дальше всех от леса.
Алекей (объезд 1) действительно дальше всех от леса → Алекей должен быть плотником. ✔️Пекарь живёт ближе к лесу, чем кузнец.
Борис (объезд 2) находится ближе к лесу, чем Виктор (объезд 3) → условие выполнено. ✔️Пекарь (Борис) действительно ближе к лесу, чем кузнец (Виктор). ✔️
Алекей не кузнец. ✔️
Виктор не пекарь. ✔️
Итог
Персона Профессия
Алекей Плотник
Борис Пекарь
Виктор Кузнец
Так всё условие zadania удовлетворяет.
Перебором явно не лучший вариант. Надо исключать неверные варианты заранее. Не во всех задачах можно перебором сделать. Потому я так вопрос не задавал.
о3 и грок3 решают без уточнения способа решения задачи
Так ответ-то неправильный. Ошибка в утверждении: "Следовательно, Борис вынужден быть пекарём, потому что все профессии должны быть разными.".
Правильный ответ такой:
Алексей — пекарь
Борис — кузнец
Виктор — плотник
We trained the models on a mostly English, text-only dataset, with a focus on STEM, coding, and general knowledge.
Наконец-то модель которой не стали забивать голову кучей языков, поэтому чудес на русском ожидать не стоит. Да и сравниваем мы 20B модель с еще актуальным Grok3, у которого 2.7T параметров.
Ничего не ответил потому что у вас закончился бюджет контекста на размышления.
Я тоже не понимаю задачу в которой "Кузнец живёт ближе всех к реке" и "Плотник живёт дальше всех от леса", но живут они в ряд. Даже если лес на другой стороне реки, задача не решается.
16 гб:(
Прямо как в старые добрые времена с GPT-2
OpenAI потихоньку начинают оправдывать свое название, респект!
почти не уступает o3

120b получше владеет языком, и обе хорошо решают математические задачи
вобщем у нас тут сильный перекос в математику
в цепочке рассуждений доступен вызов инструментов вроде веб-поиска и Python
это как? дайте ссылочку, если есть, на объяснение.
это tool call прямо по ходу генерации ответа?
Не совсем. Просто модель во время размышления:
1) Пишет текст
2) В какой-то момент выдает токен tool call
3) Потом дальше пишет текст, с учётом результата вызова
4) Заканчивает размышление, и выдает ответ пользователю
это все понятно, я в теме.
как может быть вызвана функция и получено что там она вернет по ходу генерации ответа???
вызов функции прерывает генерацию, потом ответ функции возвращается модели в новом запросе.
вроде как бы такое есть, но описание нигде найти не могу.
исполнение модели прерывается (приложение ищет завершенный json определенной структуры), на клиенте код выполняет функцию, то что она вернула, добавляется в текущее контекстное окно и генерация продолжается
понял, спасибо.
то есть, в режиме вывода stream отлавливать нужный тэг с имененем функции, потом прерывать вывод (как?), выполнять функцию, вставлять результаты, возобновлять вывод...
прервать->вставить->возобновить - это возможно? это как то описанов в стандарте OpenAI API?
приложение для инференса (llama.cpp/vllm/..) делает это самостоятельно, если запуск нейросети делать самому (в этом случае у тебя будет цикл где ты получаешь по одному токену, в нем и контролируй), то зависит от библиотеки.
Еще, если библиотека или сервер не умеют tool calling, можно попробовать structured output, описать условие завершения генерации, и уже самому все перезапускать, но tool calling кажется все уже поддерживают
В деревне живут трое друзей: Алексей, Борис и Виктор.
Один из них — кузнец, другой — пекарь, третий — плотник.
Кузнец живёт ближе всех к реке.
Плотник живёт дальше всех от леса.
Борис живёт между Алексеем и Виктором.
Алексей — не кузнец.
Виктор — не пекарь.
Пекарь живёт ближе к лесу, чем кузнец.
Кто кем работает?
OpenAI: GPT OSS 120B
Today at 0:37
Рассуждение заняло 21 секунд(ы)
Ответ
Алексей – пекарь
Борис – кузнец
Виктор – плотник
Проверка условий
Условие
Как оно выполняется
Кузнец живёт ближе всех к реке
Кузнец – Борис; он действительно самый «близкий» к реке (это условие задаёт его уникальное положение).
Плотник живёт дальше всех от леса
Плотник – Виктор; его расстояние от леса максимально.
Борис живёт между Алексеем и Виктором
По расстоянию до леса — у Алексея (пекаря) расстояние меньше, чем у Бориса (кузнеца), а у Бориса — меньше, чем у Виктора (плотника). То есть Борис находится посередине между ними.
Алексей — не кузнец
Алексей – пекарь, условие выполнено.
Виктор — не пекарь
Виктор – плотник, условие выполнено.
Пекарь живёт ближе к лесу, чем кузнец
Пекарь – Алексей, его расстояние до леса меньше, чем у кузнеца (Бориса).
Все условия удовлетворены единственно возможным способом, поэтому распределение профессий таково:
Алексей – пекарь, Борис – кузнец, Виктор – плотник.
на groq тоже уже обе доступны.
бесплатно 1к запросов / 200к токенов в день.
контекст 128к.
ну и цены норм 0.15$ вход / 0.75$ выход за старшую
0) На русском с моделью лучше не общаться, думал попробовать для постпроцессинга/LLM-as-judge, но там такие ляпы, что русский текст точно не стоит ей показывать.
1) Модель где-то на уровне GLM 4.5 air, где-то лучше, где-то хуже. Вроде из того, что вижу по отзывам людей, модель так себе в кодинге, но хороша в tool calling. Работает ощутимо быстрее GLM air за счёт всего 5.1b активных.
2) Использовать вместо qwen 3 coder или GLM 4.5 смысла(кроме экономического) нет. По провайдерам - у groq на openrouter что-то не то с конфигом, так что осторожнее.
3) Модель зацензурена по самые помидоры. Safety!



А что за интерфейс, что показывает вероятности слов?
P.S. 20B-модель вроде не так зацензурена )
P.P.S. похоже, что это https://github.com/lmg-anon/mikupad
.
OpenAI выпустила модель с открытыми весами, которая почти не уступает o3