Pull to refresh

Всё, что надо знать о медленной, но умной OpenAI Strawberry

Reading time2 min
Views5.6K

OpenAI выпустили вчера свою долгожданную модель o1 (также известную как Strawberry), первую модель компании, способную к рассуждению.

Если пропустили, а вникать лень, то вот собрал со всех уголков основное:

  • Основная фишка - новые модели могут решать более сложные задачи в областях науки и программирования. Но им требуется больше времени на ответ. В ходе обучения они совершенствуют процесс размышления, пробуют различные стратегии и осознают свои ошибки.

  • Интересно, что разработчики говорят о том, что "мы стремимся к тому, чтобы будущие версии думали часами, днями и даже неделями". Звучит странно, вроде хочется ответ получить побыстрей, но тут логика такая, что чем дольше модель ворочает нейромозгами, тем ответ качественней. Сейчас o1 думает несколько секунд.

  • Первая "превью"-модель уже интегрирована в чат-бот ChatGPT и API.

  • Также выпущена облегченная модель o1-mini, ориентированная конкретно на программирование.

  • Сейчас новые модели доступны пользователям платных пакетов ChatGPT Plus и Team, но o1-mini планируется включить и в бесплатную версию чат-бота.

  • В неделю можно отправить 30 сообщений в старшую версию o1-preview, 50 сообщений в маленькую o1-mini.

  • Новая модель - не замена gpt-4o во всех задачах. Лучше использовать её, чтобы посчитать что-то или закодить - модель справляется с олимпиадными задачами по математике и программированию на уровне золотых медалистов международного тура. По физике в сложных тестовых заданиях, устойчивых к решению с использованием поисковика Google, она сравнима с PhD-level студентом.

  • Пока нет связи с интернетом, там она искать не умеет.

  • В preview-версии могут быть баги, полноценная модель уже есть, её тестируют и выкатят позднее.

  • Промпты для новой модели можно использовать простые - o1 всё понимает, нет необходимости в обширных объяснениях.

Tags:
Hubs:
Total votes 7: ↑4 and ↓3+1
Comments23

Other news