Comments 36
Спасибо Сэм, мы еще от gpt-5 не отошли.

В чем не отошли? Очень крутая модель получилась, как по мне.
Не крутая модель обычная 5, тестирую довольно активно, тексты на русском стала писать хуже, стала чаще ошибаться, за исключением "думающей" модели и работе с кодом, с 0 пишет неплохие готовые решение. Закончится подписка если не вернут 4о, перестану пользоваться ..
Так ведь вернули уже.

Да-да-да, тот самый "пользователь", который нашел столько недостатков в пятерке, но даже и не знает, что вернули уже все старые модели, которые были до релиза GPT-5. Прям очень верим, ну прям очень.
С русским языком стала работать хуже, в этом согласен. Проявляется на художественной составляющей и в кривых формах слов.
Ммм те самые депрессивные черные цвета
С гпт5 проблемы были в основном из-за накрученных ожиданий
[картинка сравнение размера gpt4 / gpt5]
реальность такова что ближайшие лет 10 их будут тихонько понемногу подкручивать, развивать агенты, оптимизировать стоимость расчетов, делать доступнее, по чуть чуть контекст расширять да улучшать внимание к нему.
потом личные ассистенты появятся с тройной памятью (быстрая/долговременная) индивидуальной под каждого пользователя.
понятное дело каждый шаг будет преподносится как game changer но по факту будет иметь кучу ограничений и особенностей, которые будут фиксится так же годами...
На самом деле сокращение паузы между релизами, тревожный сигнал как по мне. Слишком быстро могут выпустить сырой продукт
5 оказалась провалом. Надо срочно перебить новостной фон. Даже если еще ничего не готово. Иначе инвесторы могут и задуматься, а без них OpenAI станет банкротом очень быстро.
А вот с обещаниями можно будет разобраться и потом. Через полгодика.
Надо делить аудитории. Желающим выпускать раннюю версию, а остальным более отлаженную.
Вот только что попросил через Copilot агента модель Сонет 4 (лучшее что есть для агентов по общему признанию) поправить Angular UI: не прятать распознаваемый автоматически текст после завершения распознавания. Сеть облажалась с двух попыток: все время пыталась сохранить распознаваемый текст в новую переменную после завершения, потом показывать это значение и очищать при старте нового распознавания. И оно ещё и не работало.
Ради прикола поменял модель на gpt5 и получил ожидаемое решение в котором просто команда очистки перенесена из завершения распознавания в начало.
Вообще, это ультра-простейшая задача для нейронок, я был крайне удивлен что сонет не осилил. Но все же это как минимум один пример эффективности gpt5.
По моим тестам тоже самое. Gpt5 очень эффективно расходует токены, быстрее приходит к правильному решению и вообще быстрее эти самые токены генерирует.
На одной и той же задаче на не очень большой кодовой базе опус тужился минут 20 чтобы вставить новую страницу, в итоге сдался и не смог скомпилировать проект после своих изменений, gpt5 за 8 минут сказал "Не вижу backend под это дело. Надо ли отключить авторизацию, чтобы можно было проверить?" и ещё через 4 минуты у меня была рабочая версия с искусственными данными. Докинув бэк, ещё 5 минут у него заняла генерация вместе с тестами, проверка и фикс найденного бага. Да, модель не идеально генерирует код в не очень простой кодовой базе, но с правильными инструкциями чинит быстро.
Опус пытался добавить кучу графиков, каких то красивостей и всячески угодить, хотя у проекта есть уже собственная стилистика и её нужно было придерживаться, сделал зачем-то standalone html страницу, хотя не просили. Но gpt5 при этом сделал реально то что нужно, я попросил "отдельный дашборд и на него пару графиков", он и добавил 2 графика, поняв задачу буквально.
В общем и целом отличный инструмент для рабочих задач практически любого характера. Кроме кода я ещё несколько тестов проводил и результаты похожие. Иногда не хватает этой самостоятельности, но она в принципе настраивается через инструкции, а инструкциям gpt следует очень хорошо. Для кого то может быть плюсом отсутствие своеволия.
В эмоциональном плане конечно болван болваном, но мне и не нужно брататься с инструментом, да и смайликов и в рабочих спам-чатах хватает, и от родственников. Я с нейросетью не поболтать захожу обычно, так что не поддерживаю всеобщий психоз по возвращению 4o.
Иногда отдельные сети могут перемудривать в отдельных задачах. Поэтому примеры дело такое. Может с вашей задачей и гпт4 бы справился, а у соннета просто в данном случае затуп.
По мне релиз провальный, не потому что он теперь не дружелюбно говорит, а потому что умнее не стал. Они даже это не рекламируют, они рекламируют, что стало меньше галлюцинаций и ещё что-то второстепенное. А в гпт-6 собираются сосредоточиться на какой-то третичной фича вообще. Т.е. всё развитие ллм у опенэйай прекратилось и идёт шлифовка околорюшечек.
Сонет 4 (лучшее что есть для агентов по общему признанию)
Разве Claude Opus не опережает Sonnet?
Настройка характера ИИ? Сразу вспомнился Horizon: Burning Shores, где ИИ-ассистент в попросил убить его.
Если пользователь верит в карты таро и плоскую землю, GPT6 будет его поддерживать? ИИнформационный пузырь
Мне кажется они хотят добиться умалчивания. Чтобы ИИ не поддерживал, но и не спорил, если пользователь слишком уверен в себе. Надеюсь это можно будет настроить, потому что я хочу брутальной честности. Если я объективно ошибаюсь в собственных выводах, я хочу об этом узнавать сразу. Я не боюсь быть неправым, но и признавать ошибки умею, просто вместо обычного "ты не прав и всё тут" хочется слушать аргументы, а языковая модель умеет подбирать слова.
Но не знаю как лучше для большинства. До недавнего времени я думал, что представляю себе, как люди пользуются ChatGPT, но, как оказалось, даже близко не представлял. Думающим режимом o3 пользовалось около 1% платных пользователей, все остальные платёжки сидели на 4o, который их спамил смайликами и "братанами". "Вот это ты абсолютно точно подметил, братишка, да ты прямо таки настоящий ас словесных изысканий. Давай теперь разберемся, что же будет дальше."
А дальше есть шанс, что под влиянием массового бизнеса удобный инструмент, который с каждым поколением становился все точнее в следовании инструкциям и выполнении задач, превратится во что-то неизвестно-непонятное.
Политические предпочтения и подстраиваться в мелочах, быть партнёром?
Это же уже не llm
Исследовательская деятельность походу всё, будут комершиал продукты с минимальными изменениями
это нормальная модель, ориентированная на код.
Тексты, в том числе на русском, она пишет сжато.
Впрочем, я использую немного другую версию.
Что насчёт GPT 6: модели стали обучаться быстрее, в том числе могут самообучаться - только дай сервера и электричество. Можно хоть каждые 3 месяца можешь обновлять.
Другой вопрос - нужен fine tuning человека эксперта для утверждения изменений.
Модели конкурентов - Azure, Xai , Qwen, Depseq, GLM, Kimi, фейсбукик боты - модернизируют на ходу без изменения названий модели.
Обсирать gpt5 странное субьективное решение, модель чертовски умна, но это не всем очевидно из-за странностей в общении с пользователем.
хоть каждые 3 месяца можешь обновлять.
Мне кажется, что openai чаще дообучает
Обновления без явных анонсов стали нормой последние полгода: модель "допрошиваются" на ходу после релиза на основании отзывов экспертов и пользователей гитхаб, например. Или икс, в случае с Xai. Это нормально, так как модель усложняется, а спецы делавшие код бегают туда-сюда между компаниями. Получается открытая бета.
AGI на этом, полномочия... всё?
Посредственно сгенерированная картинка в начале статьи размещена для экономии времени на прочтение? Спасибо)
Как по мне галлюцинаций в gpt стало намного больше и спорит он отчаяннее, пока не тыкнешь его носом в документацию. Как по мне, дипсик сейчас рулит, тоже ошибается, но значительно реже
Я готовлюсь к AZ 900 и сужу по тому как он перевирает документацию Microsoft, дипсик намного лучше покормлен/накормлен
Сэм Альтман рассказал о GPT-6