Обновить
81

Пользователь

0,3
Рейтинг
18
Подписчики
Отправить сообщение

Чувак, без обид, ну вот как тебя поддержать подпиской на канал, если ты пропускаешь важные детали. Ты канал не о ноготках ведешь, тут детали важны. В оригинале было 5.4 pro, а ты где написал, что это прошка решал.

Я смотрел твой канал, он примерно такого уровня постоянно - вроде бы по новостям пишешь, а суть постоянно роняешь.

Такие как ты позорят нейродвиж

в оригинале новости идет речь о долгом сеансе на 5.4 Pro. Это совсем не то, с чем мы имеем дело с обычным 5.4

просто перепечатник новости - пишет на дешевой нейронке за 5 секунд и три копейки, роняя кал и детали на ходу

update - в статье речь идет о 5.4 Pro. Это совсем не то, с чем мы имеем дело с обычным 5.4

Автор, научись точно писать новости.

старый коммент
в целом интересно, но не верится, потому что как сказали выше - отмечено, что очень тяжело нейронкам даются нормальные абстракции, а уж точность вычислений в математике, если нужны - без инструментов вообще полный швах

очень странный опыт, мы как будто в разных вселенных
мне нейронка не ищет лживые баги, пишет "код нормальный"
я не знаю, вы с чатом работаете? Я на Codex 5.3 high сижу

но по поводу высокоуровневых абстракций и алгоритмов - опыт похожий, нейронке очень тяжело придумать нормальную абстракцию, особенно что-то уникальное

или математик сумел в компьютер

Какие бонусы по жизни получил от такого поведения?

Повторить с кем-то круче затюканного лектора удалось?

в таких статьях, разбирающих ошибки предсказаний, есть такой же изъян, как у статей, которе фокусируются на сбывшихся предсказаниях.

Эффект критики как бы делает вашу статью чуть умнее безоговорочного восхищения пророками, но если приглядеться, вы предлагаете точно такой же подход с черри-пикингом, только с обратным знаком

Действительно умный разбор заключался бы в том, чтобы составить таблицу прогнозов со столбцами, что сбылось, что не сбылось, что задерживается, далее возможно, сделать какие-то выводы. Тогда бы у нас была карта мощности предсказателя, как своего рода поверочный документ прибора с указанием диапазона и погрешностей.

Тю, не сбылось. Да мы, милок, и так видим, что не сбылось. Но есть вещи, которые сбылись или, в случае с Илоном, были сделаны. Именно благодаря этим вещам некоторые люди продолжают сохранять авторитет и отличаются от бабок-гадалок и диванных критиков.

Клеточный автомат?

Обьясните почему звездочки ухудшают, а собственно набор - то есть нажатие клавиш не ухудшает? Я хочу сказать, в чем смысл? Если кто-то стоит рядом, чтобы считать звездочки - он тем более сможет увидеть нажатия клавиш.

синхронно с постом - автор того ЖЖ объявил, что устал отвлекаться на блог и сказал что временно покидает нас. Не вру, такое было заявление, я еще подумал - ну гад, подгадал )))

В постах было описание, как он сделал прототип для себя, не финтех, не высокая ответственность или нагрузка. Но он был впечатлен, что изменилось в программировании за последние полгода с Codex и Opus последних моделей

вайбкодить - по определению "бездумно" кодить, если вы читали тот пост Карпаты - поэтому ему в принципе пока не место в 2025-2026

Чтобы вникнуть в специфику - можно натравить Codex на любой говнокод и попросить представить
- схемы
- объяснение понятным языком

Не один раз натравить. Несколько раз и на extrahigh режиме - но это все равно вопрос 1 вечера.

Я не секу в Питоне, но я два раза уже предлагал бэкендерам правки их багов, они обалдевали и принимали - потому что я постоянно гоняю Codex с промптом в стиле "Объясни что изменилось в API за последние несколько дней, что там опять сделали бэкендеры". Правда я подумал и решил больше фиксы свои не предлагать.

Я заметил, что в компаниях, одобряющих LLM, не особо ценят, что ты работаешь как команда - скорее ты получишь больше нагрузки за тот же прайс. Поэтому сейчас я шифруюсь как могу

Я в agents.md записал - сначала создаём файл задачи с описанием, анализом существующего кода и пишем два варианта решения - одно предельно KISS с минимальными правками, второе по уму

И знаете, ни разу не было, чтобы он в Kiss варианте предложил какой-то ООП головного мозга. Часто, особенно с багами, в первом варианте он дает реально решения в несколько строчек

Пользуйтесь.

Ps это уже не гворя о том, что оба варианта я с ним обсуждаю, прежде чем разрешить работать.

В отзывах на редите жалуются что удивительно глючный и тормозной. Что гораздо лучше использовать обычный мобильный SSH терминал

Цвет волшебства из иных миров

Самый дорогой налог - стоимость смены места проживания и укоренения в новом - его тоже не забудьте посчитать.

Не знаю на чем сидел Дима, подозреваю он просто раздолбай, но Codex 5.3 exhigh вполне эффективно ищет баги по симптомам, да и без симптомов тоже

Тут вопрос что ваше ретроградство нашло на его раздолбайство. Человек использует вполне адекватный инструмент, но через жопу.

Нюанс - если история случилась до ноября 2025, когда вышли Codex 5.2 и Claude Opus 4.5 - тогда да, и инструмент был говном.

До ноября 2025 нейронки лепили пирожки с говном стабильно. Сейчас, на высших моделях, только если быть раздолбаем.

Дима ваш идиот, потому тот же Кодекс прекрасно мог бы обучить его, объясняя паттерны в вашем коде - он их прекрасно ловит. Но видимо Дима был лентяй и / или сидел еще на дешевом тарифе.

Нейронка в умелых руках зверь. Она истребляет потребность в команде.

Почитайте отзывы практикующих

Надеюсь сотрудникам Open AI платят достаточно, чтобы хозяин бота не повесился.

Скорее всего да, иначе бы он и не давал боту денег. Эти боты - тупейшие создания, и весь ажиотаж по их поводу напоминает мне сюсюканье молодых родителей - тю, какой славный малыш, накакал мне на лицо и потратил все мои деньги.

По теме поста - есть тест в котором LLM управляют торговыми автоматами. Тесты идут в виртуальном мире, не в настоящем, но что внушает - что многим уже удается управлять в серьезный плюс. Осталось только перейти на настоящие торговые точки и выжить в реальном мире.

https://andonlabs.com/evals/vending-bench-2

Где результаты эксперимента?

Вы плодите бешеное количество постов на Хабре и большинство из них можно было бы уложить в одну строчку. Эту даже в строчку не уложишь - потому что где результаты эксперимента?

Если это качество ваших нейронок, то вы создаёте себе антирекламу. Ботхаб - гнездо тупейших ботов.

1
23 ...

Информация

В рейтинге
2 702-й
Откуда
Россия
Зарегистрирован
Активность