Как стать автором
Обновить

OpenAI только что выпустил o3-mini для всех. Она чуть качественнее и заметно быстрее o1

Время на прочтение2 мин
Количество просмотров39K

Срочно в номер с пометкой "молния" :) Ссылка на оригинальную новость: https://openai.com/index/openai-o3-mini/

OpenAI представила новую компактную "рассуждающую" модель для логических задач — o3-mini. Она отличается высокой скоростью, невысокой стоимостью и хорошими способностями в науке, математике и программировании.

Модель поддерживает весь стандартный функционал: вызов функций (тулов), структурированные ответы (JSON) и сообщения разработчика (дебаг), а также умеет работать в режиме стриминга (как, впрочем, и абсолютно все модели).

Из новинок: в o3-mini добавлены три режима «степени размышления» (low, medium, high), чтобы выбирать между большей скоростью и более глубоким анализом (полагаю, они не влияют на саму модель, а в первую очередь на глубину CoT: chain-of-thought, цепочки размышлений).

o3-mini доступна в ChatGPT (включая бесплатный тариф, Plus, Team, Pro) и через API (для некоторых групп разработчиков, которые дослужились до 3-5 тира, увы, я пока не среди них, в API доступа не увидел).

Она заменяет предыдущую o1-mini, повышая лимит сообщений (до 150 в сутки для Plus и Team) и обеспечивает лучшую точность и скорость для технических задач. При желании можно включить поиск (ChatGPT Search), который добавляет актуальные результаты с ссылками на источники (из интернета). Также доступен расширенный режим (o3-mini-high) для более сложных запросов.

Практически во всех бенчмарках - от математики и программирования, и до ответов на вопросы для докторов наук o3-mini (в режиме high) показывает результаты практически идентичные текущей самой мощной (из доступных) моделей OpenAI: o1. В тестах по разработке даже чуть выше:

С интеллектом, сопоставимым с OpenAI o1, OpenAI o3-mini обеспечивает более высокую производительность и эффективность. Помимо оценок её способностей в технических областях наук, указанных выше, o3-mini демонстрирует превосходные результаты в оценках по математике и знанию фактов, и это в "среднем" режиме рассуждений. В тестах o3-mini выдавала ответы на 24% быстрее, чем o1-mini, со средним временем ответа 7,7 секунд по сравнению с 10,16 секунд.

Заключение

Модель выкатывается постепенно - у меня появилась лишь через полчаса с момента выхода новости.

В целом, главный вывод - эта модель продолжает историю с глобальным снижением стоимости искусственного интеллекта — с момента запуска GPT-4 OpenAI суммарно снизили цены в пересчёте на токен на 95%, при этом не только не жертвуя, но и увеличивая качество рассуждений.

----

P.S. 2025 год на дворе, неужели вы думали я не бахну ссылку на свой Телеграм канал в конце статьи? Я там регулярно пишу по ИИ/агентов, даю более глубокую аналитику по новостям, и рассказываю как сделать компанию, в которой все сотрудники — AI-агенты. Велком!

Теги:
Хабы:
Всего голосов 42: ↑34 и ↓8+30
Комментарии75

Другие новости

Истории

Работа

Data Scientist
50 вакансий

Ближайшие события

19 марта – 28 апреля
Экспедиция «Рэйдикс»
Нижний НовгородЕкатеринбургНовосибирскВладивостокИжевскКазаньТюменьУфаИркутскЧелябинскСамараХабаровскКрасноярскОмск
22 апреля
VK Видео Meetup 2025
МоскваОнлайн
23 апреля
Meetup DevOps 43Tech
Санкт-ПетербургОнлайн
24 апреля
VK Go Meetup 2025
Санкт-ПетербургОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань
14 мая
LinkMeetup
Москва
5 июня
Конференция TechRec AI&HR 2025
МоскваОнлайн
20 – 22 июня
Летняя айти-тусовка Summer Merge
Ульяновская область