Всё, что надо знать о медленной, но умной OpenAI Strawberry / Habr

OpenAI выпустили вчера свою долгожданную модель o1 (также известную как Strawberry), первую модель компании, способную к рассуждению.

Если пропустили, а вникать лень, то вот собрал со всех уголков основное:

Основная фишка - новые модели могут решать более сложные задачи в областях науки и программирования. Но им требуется больше времени на ответ. В ходе обучения они совершенствуют процесс размышления, пробуют различные стратегии и осознают свои ошибки.
Интересно, что разработчики говорят о том, что "мы стремимся к тому, чтобы будущие версии думали часами, днями и даже неделями". Звучит странно, вроде хочется ответ получить побыстрей, но тут логика такая, что чем дольше модель ворочает нейромозгами, тем ответ качественней. Сейчас o1 думает несколько секунд.
Первая "превью"-модель уже интегрирована в чат-бот ChatGPT и API.
Также выпущена облегченная модель o1-mini, ориентированная конкретно на программирование.
Сейчас новые модели доступны пользователям платных пакетов ChatGPT Plus и Team, но o1-mini планируется включить и в бесплатную версию чат-бота.
В неделю можно отправить 30 сообщений в старшую версию o1-preview, 50 сообщений в маленькую o1-mini.
Новая модель - не замена gpt-4o во всех задачах. Лучше использовать её, чтобы посчитать что-то или закодить - модель справляется с олимпиадными задачами по математике и программированию на уровне золотых медалистов международного тура. По физике в сложных тестовых заданиях, устойчивых к решению с использованием поисковика Google, она сравнима с PhD-level студентом.
Пока нет связи с интернетом, там она искать не умеет.
В preview-версии могут быть баги, полноценная модель уже есть, её тестируют и выкатят позднее.
Промпты для новой модели можно использовать простые - o1 всё понимает, нет необходимости в обширных объяснениях.