Pull to refresh

Comments 64

это можно целый день смотреть сериалы

А потом неделю разгребать результаты кодинга

То есть вводишь "хочу игру где можно грабить корованы" и через 7 часов она готова?

Для теста как просил игру от денди для браузера с другими картинками сделать элементарную , минут 30 потратил так и не заработала. Причем в разных чатах.

Мне GPT5 смогла собрать прототип танков без спрайтов, заработал 1 из трёх

типичный китайский автопромт

Мне doom собрали несколько чатов и даже заработали, но был больше похож на примитивный wolf без текстур. И змейку ещё собрали.

Мне doom собрали несколько чатов и даже заработали, но был больше похож на примитивный wolf без текстур. И змейку ещё собрали.

Простите, а кто собрал Вам этот комментарий? А то ничего не понятно.

Игра где можно грабить корованы была создана нейросетями еще пару лет назад. Эталонно простая и винтажная

Кто там говорил что надо аккуратно ревьюить все что там навайбкодили? Такой объем кода проревьюить нет ни возможности ни смысла.

Оно само ревьюит :) заставьте вайбкодить чатжэпэтэ, а когдау настройте в режим "токсичного синьора", и посадите ревьюить написанное

Думаю отклонит все коммиты :)

Нейросеть ревьюит нейросеть. Что может пойти не так?

На самом деле в несколько слоев неплохо справляются, особенно если проект максимально покрыт юнит/интеграционными тестами.

Мы пробовали ради интереса навернуть два слоя независимых, отлично находят и ошибки, и описки и даже несоответствия в вызываемых параметрах и их типах. Жрет очень много денег, но справляется отлично.

Но при этом очень сильно деградирует в качестве на старых проектах, где много легаси. Контекстное окно пока что это то, что сильно ограничивает в "запустил и забыл".

Мы пробовали ради интереса навернуть два слоя независимых, отлично находят и ошибки, и описки и даже несоответствия в вызываемых параметрах и их типах. Жрет очень много денег, но справляется отлично.

Это ошибки которые не имеют значения.

Я про нормальные ошибки. Вида: Каждое третье полнолуние метод обновления обновляет не то. Или баланс какой не сходится. Сборка баланса вон те 10 тысяч строк. Или атомарность нарушена там где она должна быть, стреляет пару раз в месяц. И все такое.

Но при этом очень сильно деградирует в качестве на старых проектах, где много легаси.

Любой достаточно развитой проект становится легаси. Вопрос только через сколько лет это произойдет.

Я про нормальные ошибки

Ну будем откровенны, такие ошибки и рядовой разработчик не правит. Для этого наворачиваются метрики, трейсы, телеметрия и тд и тп и на долгой дистанции тестовой эксплуатации эти проблемы фиксируются.

Далеко не каждый архитектор сможет учесть все нюансы, описанные вами. Более того, при проектировании нейронка не редко тоже помогает выявлять слабые места.

Не то что бы я за вайбкодинг, по мне это на данном этапе развития технологий даже вредная практика, тк она не учит пониманию. Но в целом с анализом нейронки уже справляются неплохо, основная проблема именно в контексте и деградации понимания контекста при его росте.

А кто их правит, если не разработчик? Учесть все ньюансы надо стараться, но на практике учесть все невозможно и надо править ошибки.

Кодревью от LLMок это хорошая штука без вопросов. Оно в 90 процентов случае бесполезно, но ошибки иногда находит. А понять что тебе дичь сетка предлагает очень просто и быстро. Время человека почти не тратится. Ничего не имею против, это как раз та штука которую стоит массово внедрять.

Но ведь речь не про это. А про генерацию вагона кода за 7 часов. В такой массе кода уже ошибки кто-то должен найти и поправить.

GPT 5 плохо ревьюит, лучше гемини

Такие ошибки кожаные мешки только в комментариях бодро исправляют

Так а в реальном софте кто их исправляет?

люди и исправляют, но после длительного анализа

Отлично. А кто будет исправлять в навайбкоженном коде? Вводные: кодовую базу никто не знает, сеньоры разбежались не делать фичи, а только править баги им не нравится.

Если вы себе сами отбили молотком все пальцы, то по хорошему, вас еще и по линии ПБОТОС надо нахлобучить, а не только по профнепригодности

Я так и не понял кто будет исправлять баги в навайбкоженном коде.

Сейчас схема работает за счет множества людей разбирающихся в кодовой базе, понимающих кто на чем стоит и куда смотреть / что логировать надо.

В навайбкоженной кодовой базе не будет разбираться никто. Куда смотреть в десятках тысяч строк кода вообще непонятно.

Идею что сеньоры будут годами ревьюить и читать сгенеренный код так чтобы разбираться в нем не хуже чем сейчас в существующем коде стоит откинуть как невозможную. Нормальный сеньор посмотрев на такую кодовую базу скажет что надо переписывать все. Аккуратно, по частям и тому подобное. Сеньор, разберется. Но один раз.

нет там никаких десяток тысяч навайбкоженных строк кода. Все LLM которые сейчас можно использовать, они тухнут на 3-4 итерации. Ни одна LLM сейчас не в состоянии сама нагенерить много кода. Их приходится за ручку вести от начала и до конца каждой итерации, так что в целом непонятна причина тряски.

Так буквально вал статей (в том числе и эта) что 90 процентов кода вот-вот будет вайбкодится и все мы пойдем под мост жить.

Стоит сразу подумать о том как с такой кодовой базой жить потом.

Курсы войти в ИТ уже не приносят того дохода, теперь вот эта новая тема появилась

Любой достаточно развитой проект становится легаси. Вопрос только через сколько лет это произойдет.

Вы хотели сказать — «недель».

Жрет очень много денег, но справляется отлично.

(Задумчиво:) Ну и чем оно тогда отличается от кожаного программиста?

Хотелось бы посмотреть на результат того, что оно там за 7 часов накодило.

оплату рабочего дня программиста

новая модель, которая автономно программирует до 7 часов

.. а после 7 часов объявляет, что рабочий день окончен, идёт в бар и напивается!

нет - наконец семи-часовой сон даже у гентушников

Потом заходит в бар ковбой, еврей и терминатор. )))

А как потом понять, что в этом коде, который был создан за 7 часов, нет логических ошибок, уязвимостей и подобного? Кто будет его просматривать? Это же должен быть такой достаточно большой объём, судя по времени генерации.

А как это понять относительно кода, который тебе джун за 7 часов написал?

Джун физически столько не напишет, сколько нейросеть. Кроме этого джуну никто не даст писать код для каких-то ответственных/сложных частей системы, а нейросеть за 7 часов сама будет принимать решения что и где писать.

Это все детали. Джун будет писать медленнее и хуже. И в том и в другом случае необходимы тесты + пристальное ревью

Покажите того человека который будет ревьюить тысячи генеренных строк в одном ПР.

Джун напишет меньше по объему и хуже по качеству

у меня и гпт пишет рабочий, но быстрее чем люди пишет тот же самый рабочий код

Пусть пишут сразу сколько часов потом это говно исправлять.

зачем - просто выпустят следующую версию

новая модель автономно программирует до 7 часов

- 1000 знаков в минуту!
- Ого, так быстро и так много?
- Правда такая ерунда получается...

Интересно, а что именно происходит через 7 часов? Отключение по таймеру, критический сбой, достижение условно-допустимой массы глюков...

Это новая метрика, которая сейчас набрала популярность. Оценивает нейросети по возможность выполнять задачи которые требуют у программиста Икс часов времени, с вероятностью успешного завершения задачи в 50% или выше. Т.е если человек решит задачу Икс в течении 7 часов, то ГПТ справится с ней с 50% вероятность. А вот с задачей на 8 часов вероятность ниже 50%

с вероятностью успешного завершения задачи в 50% или выше.

Чтой-то блондинистыми динозаврами повеяло...

Подскажите, кто с ней работал, если я хочу сгенерировать сайт с картинками, она может сама их генерировать? Модель же универсальная. Аналогично для анализа изображений, чтобы в цикле генерировала и проверяла. Это всё только через MCP делается? Для Gemini CLI добавлял MCP сервера, но хотелось бы боле целостное решение.

Пока ни один ии не справился с простой программой 3d моделирования. Да, некоторые программу пишут полностью, но она не рабочая. И многодневные попытки ее исправить с помощью ии ни к чему работающему не привели. С вебом такая же беда. Ничего сложнее hello world получить не удалось. Быстрее самому написать. У ии разве что рыбу получить для модификации можно.

Писал инжектор кода на ассамблере в свое же ПО. Все получилось. Правда я ему давал более детальные задачи, а не вайбкодил. Вайбкодить это анрил

Без чёткого ТЗ - результат ХЗ. Ищите проблему не в нейро, а в собственных способностях чётко выстроить логику донесения информации для её обработки и исполнения задания.

Такого рода комментарии обычно дают те, кто вообще не в теме.

Учитывая относительно невысокое качество работы агента Gpt 5, напоминает шутку про максимальную скорость набора текста. 600 знаков в минуту но получается полная фигня.

Солидарен, codex на о3 был намного лучше.

А чем именно лучше? У меня полностью противоположный опыт.

О, наконец-то кто-то решился попробовать повторить qwen code

Sign up to leave a comment.

Other news