Pull to refresh

Comments 36

...ведь пока вы доказали только то, что агенты могут выдавать миллионы токенов, но всё равно не способны создать нечто по-настоящему работающее.

«Экспериментальный браузер» не обязан конкурировать с Chrome. Вполне достаточно минимума: чтобы он компилировался в поддерживаемом тулчейне и мог рендерить тривиальный файл HTML.

по вашей же ссылке скриншот главной страницы wikipedia https://github.com/wilsonzlin/fastrender/issues/98#issuecomment-3761559718

Автор поста на хабре только перевел статью.

"It quickly crashes" (в том же комменте).

Отсутствие доказательства - не доказательство отсутствия.

Тут скорее отсутствие доказательства - это доказательство неподкрепленности заявления, как я понял

Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный

Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный

На первых порах вообще никто не мог собрать код. Затем выяснилось, что вполне возможно всё собрать, если самостоятельно исправить ошибки (их оказалось не так много, как ожидалось). После этого Cursor исправили эти ошибки (причем, как предполагают внимательные граждане, исправление было сделано не "агентами", а человеком), после чего сборка стала возможна без танцев с бубном. Автор оригинальной статьи, который тоже активно во всем этом расследовании, просто не обновил статью и не добавил эти детали (впрочем, учитывая, насколько печальна ситуация с этим "браузером" даже после исправлений, в обновлении статьи не сказать что есть нужда)

Отсутствие доказательства - не доказательство отсутствия

Бремя доказательства на утверждающем [всякую дичь]

Я в последнее время постоянно вижу статьи о том, как ИИ заменил программистов и программирует теперь сам, но ещё ни разу я не увидел примера напрограммированного, чтобы это было сложнее того, что я в состоянии сам написать за пару выходных.

ИИ очень полезен в работе, постоянно использую его как умный автокомплишен, для рефакторинга, как ревьювера кода, как написателя/редактора комментариев, даже как писателя небольших изолированных кусков кода. Но всё меньше верю в сказки про то, что LLM способна нормально написать что-то, действительно, сложное.

А что это за рефакторинги?

Я валидирую результат работы и если мне нужно сделать какое-то преобразование: вынести поля в базовый класс, перенести функцию и т.д. я использую решарпер, потому что его результату я доверяю, а результат ИИ отревьюить, всё равно что новый код прочитать, потому что код может измениться где угодно.

Пишите вы, например, приложение на Ангуляре и вам нужно некоторую сущность переименовать в Typescript коде компонента, в HTML и CSS. Как ваш решарпер это сделает?

Переименовать сущность? Название класса сменить? Shift + F6 и меняете название. Предложит сменить название файла, поискать по тексту, комментариям и пр. Отследит использование по импортам и переименует. Если где-то не уверен, то предложит выбрать, где переименовать. Как-то так ±

Мне не класс переименовать, а, например, компонент целиком, включая аттрибуты hlml тегов и имена css свойств. Не получится у вас ничего без llm. Ну, ещё руками можно, конечно.

Я просто привёл пример инструмента, который даёт железный результат.

За работу на фронте не скажу.

Если задача поменять одно свойство - проблем нет. Если перенести функцию, то у меня уже начинается паранойя, а точно та ли это функция?

Бог, может быть, и есть (этот аргумент чаще всего в этом контексте упоминается), но точно не production-ready long-running autonomous coding.

Мне вот всегда интересно - когда говорят про длительную разработку с ИИ - они вообще никогда не перезапускают чат, или как вообще им пользуются? В последнее время очень плотно игнорируется один факт - каждый новый запрос в любимую ИИ это отдельная новая сущность, связанная с предыдущим только промптом. При этом всегда есть провал внимания в середине данных, если их больше 20к токенов.
+ почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?

почему до сих пор никто не сделал агента

Мы сделали вам X, чтобы вы могли X, пока вы X!

там есть history chat compression. Очень неплохо позволяет "наследовать" от одного к другому

+ почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?

Думаю потому, что агента именно так обучают разработке: он должен дать правильное продолжение собственной цикличной цепи рассуждений, включая способность планировать и баллансировать процесс. Если начать выдергивать у него информацию или добавлять с помощью другого агента, тогда придется обучать их обоих оптимально действовать именно в такой схеме. А до этого пока не добрались - нужно больше мощностей и материала.

Это RAG. Для кода работает плохо.

Если же вызывать полноценного оркестратора после каждого запроса кодера - денег не хватит. Только сжимать почаще (а не как Cursor).

20k для SOTA давно семечки. Вот 200k проблема - видят далеко не все.

Те кто говорят про длительную разработку с ИИ - они не используют чат. Это осталось в 2023/2024.

они используют (скорее всего именно) CLI агентов: Claude code, Codex CLI, … У них проактивный сбор контекста - они stateless, без индексации кодовой базы. Сами ходят по ней, сами смотрят, берут что надо.

Сверху этого ваяется какой то оркестратор чтобы выполнять какой то флоу. Так оно работает долго / часы, сутки.

Мотивация команды курсор понятна.

Тут понятно, что в качестве доказательства полезности курсора пойдет любой мусор. Тем более, что публичной критики нет. Кто будет критиковать сильно рискует карьерой.

В прошлой статье про этот проект я писал: для доказательства корректности браузера прод качества есть огромное количество тестов, порядка 3 млн. Такая задача здесь не ставилась.

Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Кто я? Зачем я здесь? Не надо было вчера так нажираться
Кто я? Зачем я здесь? Не надо было вчера так нажираться

Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Это вы ещё Виталика Бутерина не видели.

Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Наверное, чтобы он запустил продукт? Если опустить неудачу в продукте, его выражение лица на этом фото никак не влияет на что бы то ни было.

С таким же успехом можно прикрепить фото Эйнштейна с языком и спросить, почему мы пользуемся его исследованиями.

Ммм, сотни агентов генерировали слоп и размешивали его до однородного cостояния продукта кодосодержащего, сжигая триллионы токенов, гигаватты энергии и испаряя тонны воды 🤯

Кодосодержащий продукт©

Можно еще оценить результат по качеству документации к разработанному продукту. Где-то должно быть руководство пользователя, руководство разработчика, спецификации, и прочее. Чистый код продуктом не является.

Чистый код продуктом не является

Если бы можно было скомпилить и использовать (открывать сайты) и оно бы жрало мало памяти - я бы использовал. Документация мне не нужна.

только потому что это написано агентами? памяти оно жрать точно мало не будет - об этом же никто вообще не думал, зачем) не для людей писалось, а чтобы сделать очередное громкое заявление

только потому что это написано агентами?

Ну какая разница мне как пользователю кем оно написано? Просто скачиваю, ввожу адрес сайта и смотрю. Пока оно не работает - возможно пофиксят.

памяти оно жрать точно мало не будет - об этом же никто вообще не думал, зачем

Ну посмотрим. Может быть была поставлена такая задача.

На сегодня - да. Возможно через лет 5 что и изменится.

И сколько людей делают проекты без всего этого....

а сколько людей подключается к таким проектам в процессе? без документации и спецификации

Эвона замахнулись.

Тут в комментариях на хабре как-то проскакивало, что браузер - это самая сложная сущность, которую делало человечество ever. С т. зр. совокупно потраченных человеко-часов.

Зато не будет тейков типа - ну текстовый редактор написать не так сложно, - а вы попробуйте браузер написать!

Попробовали. Респект

ну да, а ядро OS - это шутка

там попроще, все стандартизировано. а спецификация html и css это что- то с чем то

Вот у меня возникает вопрос. Дальше чатов не заходил. Не знаю как там с агентами дела обстоят. Как они учитывают версии библиотек? Вот допустим в Rust уже несколько раз сталкивался что чаты не знают свежие версии библиотек и пишут по старому.

Sign up to leave a comment.

Articles