Чувак, без обид, ну вот как тебя поддержать подпиской на канал, если ты пропускаешь важные детали. Ты канал не о ноготках ведешь, тут детали важны. В оригинале было 5.4 pro, а ты где написал, что это прошка решал.
Я смотрел твой канал, он примерно такого уровня постоянно - вроде бы по новостям пишешь, а суть постоянно роняешь.
update - в статье речь идет о 5.4 Pro. Это совсем не то, с чем мы имеем дело с обычным 5.4
Автор, научись точно писать новости.
старый коммент в целом интересно, но не верится, потому что как сказали выше - отмечено, что очень тяжело нейронкам даются нормальные абстракции, а уж точность вычислений в математике, если нужны - без инструментов вообще полный швах
очень странный опыт, мы как будто в разных вселенных мне нейронка не ищет лживые баги, пишет "код нормальный" я не знаю, вы с чатом работаете? Я на Codex 5.3 high сижу
но по поводу высокоуровневых абстракций и алгоритмов - опыт похожий, нейронке очень тяжело придумать нормальную абстракцию, особенно что-то уникальное
в таких статьях, разбирающих ошибки предсказаний, есть такой же изъян, как у статей, которе фокусируются на сбывшихся предсказаниях.
Эффект критики как бы делает вашу статью чуть умнее безоговорочного восхищения пророками, но если приглядеться, вы предлагаете точно такой же подход с черри-пикингом, только с обратным знаком
Действительно умный разбор заключался бы в том, чтобы составить таблицу прогнозов со столбцами, что сбылось, что не сбылось, что задерживается, далее возможно, сделать какие-то выводы. Тогда бы у нас была карта мощности предсказателя, как своего рода поверочный документ прибора с указанием диапазона и погрешностей.
Тю, не сбылось. Да мы, милок, и так видим, что не сбылось. Но есть вещи, которые сбылись или, в случае с Илоном, были сделаны. Именно благодаря этим вещам некоторые люди продолжают сохранять авторитет и отличаются от бабок-гадалок и диванных критиков.
Обьясните почему звездочки ухудшают, а собственно набор - то есть нажатие клавиш не ухудшает? Я хочу сказать, в чем смысл? Если кто-то стоит рядом, чтобы считать звездочки - он тем более сможет увидеть нажатия клавиш.
синхронно с постом - автор того ЖЖ объявил, что устал отвлекаться на блог и сказал что временно покидает нас. Не вру, такое было заявление, я еще подумал - ну гад, подгадал )))
В постах было описание, как он сделал прототип для себя, не финтех, не высокая ответственность или нагрузка. Но он был впечатлен, что изменилось в программировании за последние полгода с Codex и Opus последних моделей
вайбкодить - по определению "бездумно" кодить, если вы читали тот пост Карпаты - поэтому ему в принципе пока не место в 2025-2026
Чтобы вникнуть в специфику - можно натравить Codex на любой говнокод и попросить представить - схемы - объяснение понятным языком
Не один раз натравить. Несколько раз и на extrahigh режиме - но это все равно вопрос 1 вечера.
Я не секу в Питоне, но я два раза уже предлагал бэкендерам правки их багов, они обалдевали и принимали - потому что я постоянно гоняю Codex с промптом в стиле "Объясни что изменилось в API за последние несколько дней, что там опять сделали бэкендеры". Правда я подумал и решил больше фиксы свои не предлагать.
Я заметил, что в компаниях, одобряющих LLM, не особо ценят, что ты работаешь как команда - скорее ты получишь больше нагрузки за тот же прайс. Поэтому сейчас я шифруюсь как могу
Я в agents.md записал - сначала создаём файл задачи с описанием, анализом существующего кода и пишем два варианта решения - одно предельно KISS с минимальными правками, второе по уму
И знаете, ни разу не было, чтобы он в Kiss варианте предложил какой-то ООП головного мозга. Часто, особенно с багами, в первом варианте он дает реально решения в несколько строчек
Пользуйтесь.
Ps это уже не гворя о том, что оба варианта я с ним обсуждаю, прежде чем разрешить работать.
Не знаю на чем сидел Дима, подозреваю он просто раздолбай, но Codex 5.3 exhigh вполне эффективно ищет баги по симптомам, да и без симптомов тоже
Тут вопрос что ваше ретроградство нашло на его раздолбайство. Человек использует вполне адекватный инструмент, но через жопу.
Нюанс - если история случилась до ноября 2025, когда вышли Codex 5.2 и Claude Opus 4.5 - тогда да, и инструмент был говном.
До ноября 2025 нейронки лепили пирожки с говном стабильно. Сейчас, на высших моделях, только если быть раздолбаем.
Дима ваш идиот, потому тот же Кодекс прекрасно мог бы обучить его, объясняя паттерны в вашем коде - он их прекрасно ловит. Но видимо Дима был лентяй и / или сидел еще на дешевом тарифе.
Нейронка в умелых руках зверь. Она истребляет потребность в команде.
Надеюсь сотрудникам Open AI платят достаточно, чтобы хозяин бота не повесился.
Скорее всего да, иначе бы он и не давал боту денег. Эти боты - тупейшие создания, и весь ажиотаж по их поводу напоминает мне сюсюканье молодых родителей - тю, какой славный малыш, накакал мне на лицо и потратил все мои деньги.
По теме поста - есть тест в котором LLM управляют торговыми автоматами. Тесты идут в виртуальном мире, не в настоящем, но что внушает - что многим уже удается управлять в серьезный плюс. Осталось только перейти на настоящие торговые точки и выжить в реальном мире.
Вы плодите бешеное количество постов на Хабре и большинство из них можно было бы уложить в одну строчку. Эту даже в строчку не уложишь - потому что где результаты эксперимента?
Если это качество ваших нейронок, то вы создаёте себе антирекламу. Ботхаб - гнездо тупейших ботов.
Чувак, без обид, ну вот как тебя поддержать подпиской на канал, если ты пропускаешь важные детали. Ты канал не о ноготках ведешь, тут детали важны. В оригинале было 5.4 pro, а ты где написал, что это прошка решал.
Я смотрел твой канал, он примерно такого уровня постоянно - вроде бы по новостям пишешь, а суть постоянно роняешь.
Такие как ты позорят нейродвиж
в оригинале новости идет речь о долгом сеансе на 5.4 Pro. Это совсем не то, с чем мы имеем дело с обычным 5.4
просто перепечатник новости - пишет на дешевой нейронке за 5 секунд и три копейки, роняя кал и детали на ходу
update - в статье речь идет о 5.4 Pro. Это совсем не то, с чем мы имеем дело с обычным 5.4
Автор, научись точно писать новости.
старый коммент
в целом интересно, но не верится, потому что как сказали выше - отмечено, что очень тяжело нейронкам даются нормальные абстракции, а уж точность вычислений в математике, если нужны - без инструментов вообще полный швах
очень странный опыт, мы как будто в разных вселенных
мне нейронка не ищет лживые баги, пишет "код нормальный"
я не знаю, вы с чатом работаете? Я на Codex 5.3 high сижу
но по поводу высокоуровневых абстракций и алгоритмов - опыт похожий, нейронке очень тяжело придумать нормальную абстракцию, особенно что-то уникальное
или математик сумел в компьютер
Какие бонусы по жизни получил от такого поведения?
Повторить с кем-то круче затюканного лектора удалось?
Так в 3 или в 6 ???
в таких статьях, разбирающих ошибки предсказаний, есть такой же изъян, как у статей, которе фокусируются на сбывшихся предсказаниях.
Эффект критики как бы делает вашу статью чуть умнее безоговорочного восхищения пророками, но если приглядеться, вы предлагаете точно такой же подход с черри-пикингом, только с обратным знаком
Действительно умный разбор заключался бы в том, чтобы составить таблицу прогнозов со столбцами, что сбылось, что не сбылось, что задерживается, далее возможно, сделать какие-то выводы. Тогда бы у нас была карта мощности предсказателя, как своего рода поверочный документ прибора с указанием диапазона и погрешностей.
Тю, не сбылось. Да мы, милок, и так видим, что не сбылось. Но есть вещи, которые сбылись или, в случае с Илоном, были сделаны. Именно благодаря этим вещам некоторые люди продолжают сохранять авторитет и отличаются от бабок-гадалок и диванных критиков.
Клеточный автомат?
Обьясните почему звездочки ухудшают, а собственно набор - то есть нажатие клавиш не ухудшает? Я хочу сказать, в чем смысл? Если кто-то стоит рядом, чтобы считать звездочки - он тем более сможет увидеть нажатия клавиш.
синхронно с постом - автор того ЖЖ объявил, что устал отвлекаться на блог и сказал что временно покидает нас. Не вру, такое было заявление, я еще подумал - ну гад, подгадал )))
В постах было описание, как он сделал прототип для себя, не финтех, не высокая ответственность или нагрузка. Но он был впечатлен, что изменилось в программировании за последние полгода с Codex и Opus последних моделей
вайбкодить - по определению "бездумно" кодить, если вы читали тот пост Карпаты - поэтому ему в принципе пока не место в 2025-2026
Чтобы вникнуть в специфику - можно натравить Codex на любой говнокод и попросить представить
- схемы
- объяснение понятным языком
Не один раз натравить. Несколько раз и на extrahigh режиме - но это все равно вопрос 1 вечера.
Я не секу в Питоне, но я два раза уже предлагал бэкендерам правки их багов, они обалдевали и принимали - потому что я постоянно гоняю Codex с промптом в стиле "Объясни что изменилось в API за последние несколько дней, что там опять сделали бэкендеры". Правда я подумал и решил больше фиксы свои не предлагать.
Я заметил, что в компаниях, одобряющих LLM, не особо ценят, что ты работаешь как команда - скорее ты получишь больше нагрузки за тот же прайс. Поэтому сейчас я шифруюсь как могу
Я в agents.md записал - сначала создаём файл задачи с описанием, анализом существующего кода и пишем два варианта решения - одно предельно KISS с минимальными правками, второе по уму
И знаете, ни разу не было, чтобы он в Kiss варианте предложил какой-то ООП головного мозга. Часто, особенно с багами, в первом варианте он дает реально решения в несколько строчек
Пользуйтесь.
Ps это уже не гворя о том, что оба варианта я с ним обсуждаю, прежде чем разрешить работать.
В отзывах на редите жалуются что удивительно глючный и тормозной. Что гораздо лучше использовать обычный мобильный SSH терминал
Цвет волшебства из иных миров
Самый дорогой налог - стоимость смены места проживания и укоренения в новом - его тоже не забудьте посчитать.
Не знаю на чем сидел Дима, подозреваю он просто раздолбай, но Codex 5.3 exhigh вполне эффективно ищет баги по симптомам, да и без симптомов тоже
Тут вопрос что ваше ретроградство нашло на его раздолбайство. Человек использует вполне адекватный инструмент, но через жопу.
Нюанс - если история случилась до ноября 2025, когда вышли Codex 5.2 и Claude Opus 4.5 - тогда да, и инструмент был говном.
До ноября 2025 нейронки лепили пирожки с говном стабильно. Сейчас, на высших моделях, только если быть раздолбаем.
Дима ваш идиот, потому тот же Кодекс прекрасно мог бы обучить его, объясняя паттерны в вашем коде - он их прекрасно ловит. Но видимо Дима был лентяй и / или сидел еще на дешевом тарифе.
Нейронка в умелых руках зверь. Она истребляет потребность в команде.
Почитайте отзывы практикующих
https://staerum.livejournal.com/70482.html
https://staerum.livejournal.com/72388.html#comments
https://snake-d-ha.livejournal.com/1962797.html#comments
Надеюсь сотрудникам Open AI платят достаточно, чтобы хозяин бота не повесился.
Скорее всего да, иначе бы он и не давал боту денег. Эти боты - тупейшие создания, и весь ажиотаж по их поводу напоминает мне сюсюканье молодых родителей - тю, какой славный малыш, накакал мне на лицо и потратил все мои деньги.
По теме поста - есть тест в котором LLM управляют торговыми автоматами. Тесты идут в виртуальном мире, не в настоящем, но что внушает - что многим уже удается управлять в серьезный плюс. Осталось только перейти на настоящие торговые точки и выжить в реальном мире.
https://andonlabs.com/evals/vending-bench-2
Где результаты эксперимента?
Вы плодите бешеное количество постов на Хабре и большинство из них можно было бы уложить в одну строчку. Эту даже в строчку не уложишь - потому что где результаты эксперимента?
Если это качество ваших нейронок, то вы создаёте себе антирекламу. Ботхаб - гнездо тупейших ботов.