Это самая совершенная модель из всех, намного превосходящая своих предшественников, включая таинственной gpt2-chatbot.
Она появится уже сегодня в виде приложения для пк.
Новая модель GPT4 Omni будет бесплатной для всех пользователей;
Она лучше базовой GPT-4 во всём, особенно в кодинге;
GPT4o натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали. Она будет доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее.
GPT-4 Omni будет понимать эмоции и тон голоса.
Модель общается естественным и понятным языком, обрабатывает информацию в реальном времени и даже умеет шутить и понимать эмоции. Делает паузы, если вы спросите ее что-то.
GPT-4 Omni определяет эмоции на камере и умеет переводить разные языки голосом, то есть теперь у вас будет с собой карманный переводчик.
GPT-4 Omni подмечает даже микровыражения восторга. Модель практически невозможно отличить от живого человека. Видео разговора с моделью можно посмотреть здесь. Вот еще 33 видео от OPEN AI с примерами работы новой модели.
Новая токенизация для различных языков будет куда дешевле, а длина контекста выросла в разы. Модель суммарно в 3.5 раза дешевле для русского языка.
У модели контекстное окно 128k токенов, это примерно две книги «Великий Гетсби»
Новая модель доступна в виде приложения на ПК. В десктопном приложении ей можно показывать экран целиком и просить сделать любые действия, подправить код, что-то рассказать и тп. То есть у вас теперь будет линчый ассистент, который всегда видит ваш экран.
Доступ к модели уже начали выдавать пользователям ChatGPT, API доступен разработчикам.
Режим разговора будет доступен для подписчиков Plus в ближайшие дни.
Это выглядит как революция. Мир технологий уже не будет прежним.
🔥 Модель 👇
https://openai.com/index/hello-gpt-4o/
А здесь Послание Сэма Альтмана к сегодняшней презентации: https://blog.samaltman.com/gpt-4o
Ждем, чтобы потестить, у себя в канале я опубликую ее обзор и первые впечатления, а как появится api, добавлю в бота, чтобы любой мог потестить, заходите в гости.
А вот некоторые крутые скрытые фишки новой GPT4o, о которых не говорили на презентации.
1) GPT4o на 2 головы опередил всех в создании текста на изображениях, сгенерированных искусственным интеллектом. Великолепный результат.
2) Новая модель позволяет генерировать шрифты.
3) Поддерживает 3d-рендеринг.
4/ GPT4o может создавать звуковые эффекты, а не только речь.
5) Эффективная и стабильная работа в преобразовании изображений в зависимости от контекста.
А на здесь , вы можете посмотреть виде как модель отвечает на русском языке.
Сегодня намечена Google I/O, где нам покажут обновленный Gemini, ждем достойного ответа.