AlexanderAnisimov Oct 1 2024 at 19:38

OpenAI выпустила новый функционал для разработчиков (API)

1 min

3.8K

В рамках конференции DevDay компания OpenAI объявила о новом функционале для разработчиков и сразу сделала его доступным. Релиз 1 октября включает в себя:

Realtime API: API для встраивания голосовых функций в приложения, включая ввод и вывод звука. Подключение через вебсокет. Модель пока используется 4о (а точнее говоря, специальная новая gpt-4o-realtime-preview), но обещают вскоре предоставить также и 4o-mini. Цены можно посмотреть в этой статье (а они не сказать что бы очень низкие, так что mini наверняка будет востребована у тех кому это актуально). Про доступность пока ничего не могу сказать: в платформе эту фичу обещают сделать позднее, а вебсокет я не проверял.

Дистилляция моделей (документация): инструмент файн-тюнинга более дешевых моделей (GPT-4o mini) с помощью той информации, которую генерируют более продвинутые модели (o1-preview и GPT-4o).

Image fine-tuning: Данные для файн-тюнинга GPT-4o теперь могут включать в себя не только текст, но и картинки, которые можно передавать либо в виде ссылок (URL), либо в виде base64. Кроме документации также есть небольшая статья.

Evaluations: Инструмент автоматизации тестирования качества промптов и моделей, реализованный в платформе. Используется в том числе в составе вышеописанной дистилляции.

Кэширование промптов: Механизм сокращения затрат (до двух раз) на вызовы API в некоторых сценариях. Документация.

AI-помощники для генерации системных промптов и json-схем в Functions calling. Для системных промптов в чате плейграунда выглядит это примерно так:

Only registered users can participate in poll. Log in, please.

Насколько интересны для вас новые фичи?

43.86%Интересны, планирую использовать на практике25

31.58%Выглядит интересно, но пока не знаю как использовать18

12.28%Пока мало информации, нужно разбираться с подробностями7

12.28%Не интересно7

57 users voted. 8 users abstained.

Hubs:

Artificial Intelligence