OpenAI только что выпустил o3-mini для всех. Она чуть качественнее и заметно быстрее o1 / Хабр

Срочно в номер с пометкой "молния" :) Ссылка на оригинальную новость: https://openai.com/index/openai-o3-mini/

OpenAI представила новую компактную "рассуждающую" модель для логических задач — o3-mini. Она отличается высокой скоростью, невысокой стоимостью и хорошими способностями в науке, математике и программировании.

Модель поддерживает весь стандартный функционал: вызов функций (тулов), структурированные ответы (JSON) и сообщения разработчика (дебаг), а также умеет работать в режиме стриминга (как, впрочем, и абсолютно все модели).

Из новинок: в o3-mini добавлены три режима «степени размышления» (low, medium, high), чтобы выбирать между большей скоростью и более глубоким анализом (полагаю, они не влияют на саму модель, а в первую очередь на глубину CoT: chain-of-thought, цепочки размышлений).

o3-mini доступна в ChatGPT (включая бесплатный тариф, Plus, Team, Pro) и через API (для некоторых групп разработчиков, которые дослужились до 3-5 тира, увы, я пока не среди них, в API доступа не увидел).

Она заменяет предыдущую o1-mini, повышая лимит сообщений (до 150 в сутки для Plus и Team) и обеспечивает лучшую точность и скорость для технических задач. При желании можно включить поиск (ChatGPT Search), который добавляет актуальные результаты с ссылками на источники (из интернета). Также доступен расширенный режим (o3-mini-high) для более сложных запросов.

Практически во всех бенчмарках - от математики и программирования, и до ответов на вопросы для докторов наук o3-mini (в режиме high) показывает результаты практически идентичные текущей самой мощной (из доступных) моделей OpenAI: o1. В тестах по разработке даже чуть выше:

С интеллектом, сопоставимым с OpenAI o1, OpenAI o3-mini обеспечивает более высокую производительность и эффективность. Помимо оценок её способностей в технических областях наук, указанных выше, o3-mini демонстрирует превосходные результаты в оценках по математике и знанию фактов, и это в "среднем" режиме рассуждений. В тестах o3-mini выдавала ответы на 24% быстрее, чем o1-mini, со средним временем ответа 7,7 секунд по сравнению с 10,16 секунд.

Заключение

Модель выкатывается постепенно - у меня появилась лишь через полчаса с момента выхода новости.

В целом, главный вывод - эта модель продолжает историю с глобальным снижением стоимости искусственного интеллекта — с момента запуска GPT-4 OpenAI суммарно снизили цены в пересчёте на токен на 95%, при этом не только не жертвуя, но и увеличивая качество рассуждений.

----

P.S. 2025 год на дворе, неужели вы думали я не бахну ссылку на свой Телеграм канал в конце статьи? Я там регулярно пишу по ИИ/агентов, даю более глубокую аналитику по новостям, и рассказываю как сделать компанию, в которой все сотрудники — AI-агенты. Велком!