runaway_llm Aug 19 at 16:42

Сэм Альтман рассказал о GPT-6

1 min

22K

Artificial IntelligenceMachine learning *

Comments 36

vaslobas Aug 19 at 17:15

Спасибо Сэм, мы еще от gpt-5 не отошли.

MaksimMukharev Aug 19 at 17:26

В чем не отошли? Очень крутая модель получилась, как по мне.

Shurik911 Aug 19 at 18:29

Не крутая модель обычная 5, тестирую довольно активно, тексты на русском стала писать хуже, стала чаще ошибаться, за исключением "думающей" модели и работе с кодом, с 0 пишет неплохие готовые решение. Закончится подписка если не вернут 4о, перестану пользоваться ..

OuS Aug 19 at 22:38

Так ведь вернули уже.

Aleksej2020 Aug 20 at 03:07

Так ведь убрали сначала

Vikki_Odessa Aug 21 at 20:55

Странно, у меня из устаревших моделей только 4о, и то на 5ку постоянно сбивается

AVX10 Aug 20 at 05:13

Да-да-да, тот самый "пользователь", который нашел столько недостатков в пятерке, но даже и не знает, что вернули уже все старые модели, которые были до релиза GPT-5. Прям очень верим, ну прям очень.

MaksimMukharev Aug 20 at 08:16

С русским языком стала работать хуже, в этом согласен. Проявляется на художественной составляющей и в кривых формах слов.

ngromyko Aug 19 at 20:50

Ммм те самые депрессивные черные цвета

riky Aug 20 at 09:51

С гпт5 проблемы были в основном из-за накрученных ожиданий
[картинка сравнение размера gpt4 / gpt5]

реальность такова что ближайшие лет 10 их будут тихонько понемногу подкручивать, развивать агенты, оптимизировать стоимость расчетов, делать доступнее, по чуть чуть контекст расширять да улучшать внимание к нему.

потом личные ассистенты появятся с тройной памятью (быстрая/долговременная) индивидуальной под каждого пользователя.

понятное дело каждый шаг будет преподносится как game changer но по факту будет иметь кучу ограничений и особенностей, которые будут фиксится так же годами...

OverFitter Aug 20 at 10:59

Спасибо, chatgpt

oookkdjjjdjdj Aug 19 at 18:06

На самом деле сокращение паузы между релизами, тревожный сигнал как по мне. Слишком быстро могут выпустить сырой продукт

BugM Aug 19 at 18:43

5 оказалась провалом. Надо срочно перебить новостной фон. Даже если еще ничего не готово. Иначе инвесторы могут и задуматься, а без них OpenAI станет банкротом очень быстро.

А вот с обещаниями можно будет разобраться и потом. Через полгодика.

BlackMokona Aug 19 at 19:19

Тем более долговременная память уже есть. Нужно только составить анкету пользователя для ИИ удобную и эффективную. Чтобы туда нужное выписывала.

MaksimMukharev Aug 20 at 08:17

Надо делить аудитории. Желающим выпускать раннюю версию, а остальным более отлаженную.

amazingname Aug 19 at 22:46

Вот только что попросил через Copilot агента модель Сонет 4 (лучшее что есть для агентов по общему признанию) поправить Angular UI: не прятать распознаваемый автоматически текст после завершения распознавания. Сеть облажалась с двух попыток: все время пыталась сохранить распознаваемый текст в новую переменную после завершения, потом показывать это значение и очищать при старте нового распознавания. И оно ещё и не работало.

Ради прикола поменял модель на gpt5 и получил ожидаемое решение в котором просто команда очистки перенесена из завершения распознавания в начало.

Вообще, это ультра-простейшая задача для нейронок, я был крайне удивлен что сонет не осилил. Но все же это как минимум один пример эффективности gpt5.

thethee Aug 20 at 04:08

По моим тестам тоже самое. Gpt5 очень эффективно расходует токены, быстрее приходит к правильному решению и вообще быстрее эти самые токены генерирует.

На одной и той же задаче на не очень большой кодовой базе опус тужился минут 20 чтобы вставить новую страницу, в итоге сдался и не смог скомпилировать проект после своих изменений, gpt5 за 8 минут сказал "Не вижу backend под это дело. Надо ли отключить авторизацию, чтобы можно было проверить?" и ещё через 4 минуты у меня была рабочая версия с искусственными данными. Докинув бэк, ещё 5 минут у него заняла генерация вместе с тестами, проверка и фикс найденного бага. Да, модель не идеально генерирует код в не очень простой кодовой базе, но с правильными инструкциями чинит быстро.

Опус пытался добавить кучу графиков, каких то красивостей и всячески угодить, хотя у проекта есть уже собственная стилистика и её нужно было придерживаться, сделал зачем-то standalone html страницу, хотя не просили. Но gpt5 при этом сделал реально то что нужно, я попросил "отдельный дашборд и на него пару графиков", он и добавил 2 графика, поняв задачу буквально.

В общем и целом отличный инструмент для рабочих задач практически любого характера. Кроме кода я ещё несколько тестов проводил и результаты похожие. Иногда не хватает этой самостоятельности, но она в принципе настраивается через инструкции, а инструкциям gpt следует очень хорошо. Для кого то может быть плюсом отсутствие своеволия.

В эмоциональном плане конечно болван болваном, но мне и не нужно брататься с инструментом, да и смайликов и в рабочих спам-чатах хватает, и от родственников. Я с нейросетью не поболтать захожу обычно, так что не поддерживаю всеобщий психоз по возвращению 4o.

Suor Aug 20 at 04:32

Иногда отдельные сети могут перемудривать в отдельных задачах. Поэтому примеры дело такое. Может с вашей задачей и гпт4 бы справился, а у соннета просто в данном случае затуп.

По мне релиз провальный, не потому что он теперь не дружелюбно говорит, а потому что умнее не стал. Они даже это не рекламируют, они рекламируют, что стало меньше галлюцинаций и ещё что-то второстепенное. А в гпт-6 собираются сосредоточиться на какой-то третичной фича вообще. Т.е. всё развитие ллм у опенэйай прекратилось и идёт шлифовка околорюшечек.

edo1h Aug 20 at 06:43

В смысле второстепенное? Галлюцинации — это самая большая проблема, наверное, сегодня. Просишь написать код, а он тебе вставляет вызовы несуществующих методов, или вообще несуществующую библиотеку.

amazingname Aug 20 at 06:45

Просто пользуйтесь агентами. Агент компилирует код и не завершает работу пока код не компилируется.

Aleus1249355 Aug 20 at 19:30

Сонет 4 (лучшее что есть для агентов по общему признанию)

Разве Claude Opus не опережает Sonnet?

Kwisatz Aug 19 at 23:17

Настройка характера ИИ? Сразу вспомнился Horizon: Burning Shores, где ИИ-ассистент в попросил убить его.

xSinoptik Aug 20 at 02:02

Если пользователь верит в карты таро и плоскую землю, GPT6 будет его поддерживать? ИИнформационный пузырь

thethee Aug 20 at 04:41

Мне кажется они хотят добиться умалчивания. Чтобы ИИ не поддерживал, но и не спорил, если пользователь слишком уверен в себе. Надеюсь это можно будет настроить, потому что я хочу брутальной честности. Если я объективно ошибаюсь в собственных выводах, я хочу об этом узнавать сразу. Я не боюсь быть неправым, но и признавать ошибки умею, просто вместо обычного "ты не прав и всё тут" хочется слушать аргументы, а языковая модель умеет подбирать слова.

Но не знаю как лучше для большинства. До недавнего времени я думал, что представляю себе, как люди пользуются ChatGPT, но, как оказалось, даже близко не представлял. Думающим режимом o3 пользовалось около 1% платных пользователей, все остальные платёжки сидели на 4o, который их спамил смайликами и "братанами". "Вот это ты абсолютно точно подметил, братишка, да ты прямо таки настоящий ас словесных изысканий. Давай теперь разберемся, что же будет дальше."

А дальше есть шанс, что под влиянием массового бизнеса удобный инструмент, который с каждым поколением становился все точнее в следовании инструкциям и выполнении задач, превратится во что-то неизвестно-непонятное.

edo1h Aug 20 at 06:45

потому что я хочу брутальной честности

А если нейросеть ошибается, это «брутальная честность» весьма раздражает

Aleksej2020 Aug 20 at 03:30

Политические предпочтения и подстраиваться в мелочах, быть партнёром?

Это же уже не llm

AlexRihter9690 Aug 20 at 04:28

Исследовательская деятельность походу всё, будут комершиал продукты с минимальными изменениями

Narel_Wenress Aug 20 at 06:02

это нормальная модель, ориентированная на код.

Тексты, в том числе на русском, она пишет сжато.

Впрочем, я использую немного другую версию.

Что насчёт GPT 6: модели стали обучаться быстрее, в том числе могут самообучаться - только дай сервера и электричество. Можно хоть каждые 3 месяца можешь обновлять.

Другой вопрос - нужен fine tuning человека эксперта для утверждения изменений.

Модели конкурентов - Azure, Xai , Qwen, Depseq, GLM, Kimi, фейсбукик боты - модернизируют на ходу без изменения названий модели.

Обсирать gpt5 странное субьективное решение, модель чертовски умна, но это не всем очевидно из-за странностей в общении с пользователем.

edo1h Aug 20 at 06:46

хоть каждые 3 месяца можешь обновлять.

Мне кажется, что openai чаще дообучает

Narel_Wenress Aug 20 at 20:08

Обновления без явных анонсов стали нормой последние полгода: модель "допрошиваются" на ходу после релиза на основании отзывов экспертов и пользователей гитхаб, например. Или икс, в случае с Xai. Это нормально, так как модель усложняется, а спецы делавшие код бегают туда-сюда между компаниями. Получается открытая бета.

Sapsan_Sapsanov Aug 20 at 12:31

AGI на этом, полномочия... всё?

Narel_Wenress Aug 20 at 20:10

На самом деле agi ближе, чем кажется. Самообучаемые модели уже реальны и доступны.

sidewinder1 Aug 21 at 20:52

Посредственно сгенерированная картинка в начале статьи размещена для экономии времени на прочтение? Спасибо)

Vikki_Odessa Aug 21 at 21:02

Как по мне галлюцинаций в gpt стало намного больше и спорит он отчаяннее, пока не тыкнешь его носом в документацию. Как по мне, дипсик сейчас рулит, тоже ошибается, но значительно реже

Narel_Wenress Aug 21 at 21:57

Они все примерно одинаково работают, лучше кажутся те, что больше имитируют человека и партнёра в ответах, то есть общаются и проявляют участие.

Vikki_Odessa Aug 22 at 00:04

Я готовлюсь к AZ 900 и сужу по тому как он перевирает документацию Microsoft, дипсик намного лучше покормлен/накормлен