Comments 64
Это командная строка или интерфейс?
То есть вводишь "хочу игру где можно грабить корованы" и через 7 часов она готова?
Для теста как просил игру от денди для браузера с другими картинками сделать элементарную , минут 30 потратил так и не заработала. Причем в разных чатах.
Игра где можно грабить корованы была создана нейросетями еще пару лет назад. Эталонно простая и винтажная
Кто там говорил что надо аккуратно ревьюить все что там навайбкодили? Такой объем кода проревьюить нет ни возможности ни смысла.
Оно само ревьюит :) заставьте вайбкодить чатжэпэтэ, а когдау настройте в режим "токсичного синьора", и посадите ревьюить написанное
Думаю отклонит все коммиты :)
Нейросеть ревьюит нейросеть. Что может пойти не так?
На самом деле в несколько слоев неплохо справляются, особенно если проект максимально покрыт юнит/интеграционными тестами.
Мы пробовали ради интереса навернуть два слоя независимых, отлично находят и ошибки, и описки и даже несоответствия в вызываемых параметрах и их типах. Жрет очень много денег, но справляется отлично.
Но при этом очень сильно деградирует в качестве на старых проектах, где много легаси. Контекстное окно пока что это то, что сильно ограничивает в "запустил и забыл".
Мы пробовали ради интереса навернуть два слоя независимых, отлично находят и ошибки, и описки и даже несоответствия в вызываемых параметрах и их типах. Жрет очень много денег, но справляется отлично.
Это ошибки которые не имеют значения.
Я про нормальные ошибки. Вида: Каждое третье полнолуние метод обновления обновляет не то. Или баланс какой не сходится. Сборка баланса вон те 10 тысяч строк. Или атомарность нарушена там где она должна быть, стреляет пару раз в месяц. И все такое.
Но при этом очень сильно деградирует в качестве на старых проектах, где много легаси.
Любой достаточно развитой проект становится легаси. Вопрос только через сколько лет это произойдет.
Я про нормальные ошибки
Ну будем откровенны, такие ошибки и рядовой разработчик не правит. Для этого наворачиваются метрики, трейсы, телеметрия и тд и тп и на долгой дистанции тестовой эксплуатации эти проблемы фиксируются.
Далеко не каждый архитектор сможет учесть все нюансы, описанные вами. Более того, при проектировании нейронка не редко тоже помогает выявлять слабые места.
Не то что бы я за вайбкодинг, по мне это на данном этапе развития технологий даже вредная практика, тк она не учит пониманию. Но в целом с анализом нейронки уже справляются неплохо, основная проблема именно в контексте и деградации понимания контекста при его росте.
А кто их правит, если не разработчик? Учесть все ньюансы надо стараться, но на практике учесть все невозможно и надо править ошибки.
Кодревью от LLMок это хорошая штука без вопросов. Оно в 90 процентов случае бесполезно, но ошибки иногда находит. А понять что тебе дичь сетка предлагает очень просто и быстро. Время человека почти не тратится. Ничего не имею против, это как раз та штука которую стоит массово внедрять.
Но ведь речь не про это. А про генерацию вагона кода за 7 часов. В такой массе кода уже ошибки кто-то должен найти и поправить.
Такие ошибки кожаные мешки только в комментариях бодро исправляют
Так а в реальном софте кто их исправляет?
люди и исправляют, но после длительного анализа
Отлично. А кто будет исправлять в навайбкоженном коде? Вводные: кодовую базу никто не знает, сеньоры разбежались не делать фичи, а только править баги им не нравится.
Если вы себе сами отбили молотком все пальцы, то по хорошему, вас еще и по линии ПБОТОС надо нахлобучить, а не только по профнепригодности
Я так и не понял кто будет исправлять баги в навайбкоженном коде.
Сейчас схема работает за счет множества людей разбирающихся в кодовой базе, понимающих кто на чем стоит и куда смотреть / что логировать надо.
В навайбкоженной кодовой базе не будет разбираться никто. Куда смотреть в десятках тысяч строк кода вообще непонятно.
Идею что сеньоры будут годами ревьюить и читать сгенеренный код так чтобы разбираться в нем не хуже чем сейчас в существующем коде стоит откинуть как невозможную. Нормальный сеньор посмотрев на такую кодовую базу скажет что надо переписывать все. Аккуратно, по частям и тому подобное. Сеньор, разберется. Но один раз.
Любой достаточно развитой проект становится легаси. Вопрос только через сколько лет это произойдет.
Вы хотели сказать — «недель».
Жрет очень много денег, но справляется отлично.
(Задумчиво:) Ну и чем оно тогда отличается от кожаного программиста?
Хотелось бы посмотреть на результат того, что оно там за 7 часов накодило.
новая модель, которая автономно программирует до 7 часов
.. а после 7 часов объявляет, что рабочий день окончен, идёт в бар и напивается!
А как потом понять, что в этом коде, который был создан за 7 часов, нет логических ошибок, уязвимостей и подобного? Кто будет его просматривать? Это же должен быть такой достаточно большой объём, судя по времени генерации.
А как это понять относительно кода, который тебе джун за 7 часов написал?
Джун физически столько не напишет, сколько нейросеть. Кроме этого джуну никто не даст писать код для каких-то ответственных/сложных частей системы, а нейросеть за 7 часов сама будет принимать решения что и где писать.
Джун напишет меньше по объему и хуже по качеству
Пусть пишут сразу сколько часов потом это говно исправлять.
новая модель автономно программирует до 7 часов
- 1000 знаков в минуту!
- Ого, так быстро и так много?
- Правда такая ерунда получается...
Интересно, а что именно происходит через 7 часов? Отключение по таймеру, критический сбой, достижение условно-допустимой массы глюков...
Это новая метрика, которая сейчас набрала популярность. Оценивает нейросети по возможность выполнять задачи которые требуют у программиста Икс часов времени, с вероятностью успешного завершения задачи в 50% или выше. Т.е если человек решит задачу Икс в течении 7 часов, то ГПТ справится с ней с 50% вероятность. А вот с задачей на 8 часов вероятность ниже 50%
Подскажите, кто с ней работал, если я хочу сгенерировать сайт с картинками, она может сама их генерировать? Модель же универсальная. Аналогично для анализа изображений, чтобы в цикле генерировала и проверяла. Это всё только через MCP делается? Для Gemini CLI добавлял MCP сервера, но хотелось бы боле целостное решение.
Пока ни один ии не справился с простой программой 3d моделирования. Да, некоторые программу пишут полностью, но она не рабочая. И многодневные попытки ее исправить с помощью ии ни к чему работающему не привели. С вебом такая же беда. Ничего сложнее hello world получить не удалось. Быстрее самому написать. У ии разве что рыбу получить для модификации можно.
Писал инжектор кода на ассамблере в свое же ПО. Все получилось. Правда я ему давал более детальные задачи, а не вайбкодил. Вайбкодить это анрил
Без чёткого ТЗ - результат ХЗ. Ищите проблему не в нейро, а в собственных способностях чётко выстроить логику донесения информации для её обработки и исполнения задания.
Учитывая относительно невысокое качество работы агента Gpt 5, напоминает шутку про максимальную скорость набора текста. 600 знаков в минуту но получается полная фигня.
О, наконец-то кто-то решился попробовать повторить qwen code
Представлена GPT-5-Codex — новая модель, которая автономно программирует до 7 часов