Comments 36
...ведь пока вы доказали только то, что агенты могут выдавать миллионы токенов, но всё равно не способны создать нечто по-настоящему работающее.
«Экспериментальный браузер» не обязан конкурировать с Chrome. Вполне достаточно минимума: чтобы он компилировался в поддерживаемом тулчейне и мог рендерить тривиальный файл HTML.
по вашей же ссылке скриншот главной страницы wikipedia https://github.com/wilsonzlin/fastrender/issues/98#issuecomment-3761559718
Отсутствие доказательства - не доказательство отсутствия.
Тут скорее отсутствие доказательства - это доказательство неподкрепленности заявления, как я понял
Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный
Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный
На первых порах вообще никто не мог собрать код. Затем выяснилось, что вполне возможно всё собрать, если самостоятельно исправить ошибки (их оказалось не так много, как ожидалось). После этого Cursor исправили эти ошибки (причем, как предполагают внимательные граждане, исправление было сделано не "агентами", а человеком), после чего сборка стала возможна без танцев с бубном. Автор оригинальной статьи, который тоже активно во всем этом расследовании, просто не обновил статью и не добавил эти детали (впрочем, учитывая, насколько печальна ситуация с этим "браузером" даже после исправлений, в обновлении статьи не сказать что есть нужда)
Отсутствие доказательства - не доказательство отсутствия
Бремя доказательства на утверждающем [всякую дичь]
Я в последнее время постоянно вижу статьи о том, как ИИ заменил программистов и программирует теперь сам, но ещё ни разу я не увидел примера напрограммированного, чтобы это было сложнее того, что я в состоянии сам написать за пару выходных.
ИИ очень полезен в работе, постоянно использую его как умный автокомплишен, для рефакторинга, как ревьювера кода, как написателя/редактора комментариев, даже как писателя небольших изолированных кусков кода. Но всё меньше верю в сказки про то, что LLM способна нормально написать что-то, действительно, сложное.
А что это за рефакторинги?
Я валидирую результат работы и если мне нужно сделать какое-то преобразование: вынести поля в базовый класс, перенести функцию и т.д. я использую решарпер, потому что его результату я доверяю, а результат ИИ отревьюить, всё равно что новый код прочитать, потому что код может измениться где угодно.
Пишите вы, например, приложение на Ангуляре и вам нужно некоторую сущность переименовать в Typescript коде компонента, в HTML и CSS. Как ваш решарпер это сделает?
Переименовать сущность? Название класса сменить? Shift + F6 и меняете название. Предложит сменить название файла, поискать по тексту, комментариям и пр. Отследит использование по импортам и переименует. Если где-то не уверен, то предложит выбрать, где переименовать. Как-то так ±
Я просто привёл пример инструмента, который даёт железный результат.
За работу на фронте не скажу.
Если задача поменять одно свойство - проблем нет. Если перенести функцию, то у меня уже начинается паранойя, а точно та ли это функция?
Бог, может быть, и есть (этот аргумент чаще всего в этом контексте упоминается), но точно не production-ready long-running autonomous coding.
Мне вот всегда интересно - когда говорят про длительную разработку с ИИ - они вообще никогда не перезапускают чат, или как вообще им пользуются? В последнее время очень плотно игнорируется один факт - каждый новый запрос в любимую ИИ это отдельная новая сущность, связанная с предыдущим только промптом. При этом всегда есть провал внимания в середине данных, если их больше 20к токенов.
+ почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?
почему до сих пор никто не сделал агента
Мы сделали вам X, чтобы вы могли X, пока вы X!
там есть history chat compression. Очень неплохо позволяет "наследовать" от одного к другому
+ почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?
Думаю потому, что агента именно так обучают разработке: он должен дать правильное продолжение собственной цикличной цепи рассуждений, включая способность планировать и баллансировать процесс. Если начать выдергивать у него информацию или добавлять с помощью другого агента, тогда придется обучать их обоих оптимально действовать именно в такой схеме. А до этого пока не добрались - нужно больше мощностей и материала.
Это RAG. Для кода работает плохо.
Если же вызывать полноценного оркестратора после каждого запроса кодера - денег не хватит. Только сжимать почаще (а не как Cursor).
20k для SOTA давно семечки. Вот 200k проблема - видят далеко не все.
Те кто говорят про длительную разработку с ИИ - они не используют чат. Это осталось в 2023/2024.
они используют (скорее всего именно) CLI агентов: Claude code, Codex CLI, … У них проактивный сбор контекста - они stateless, без индексации кодовой базы. Сами ходят по ней, сами смотрят, берут что надо.
Сверху этого ваяется какой то оркестратор чтобы выполнять какой то флоу. Так оно работает долго / часы, сутки.
Мотивация команды курсор понятна.
Тут понятно, что в качестве доказательства полезности курсора пойдет любой мусор. Тем более, что публичной критики нет. Кто будет критиковать сильно рискует карьерой.
В прошлой статье про этот проект я писал: для доказательства корректности браузера прод качества есть огромное количество тестов, порядка 3 млн. Такая задача здесь не ставилась.
Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Мотивация команды курсор понятна
— надо ж того слона продать!
Зачем вообще инвесторы отдали деньги человеку который выглядит так?
Это вы ещё Виталика Бутерина не видели.
Зачем вообще инвесторы отдали деньги человеку который выглядит так?
Наверное, чтобы он запустил продукт? Если опустить неудачу в продукте, его выражение лица на этом фото никак не влияет на что бы то ни было.
С таким же успехом можно прикрепить фото Эйнштейна с языком и спросить, почему мы пользуемся его исследованиями.
Ммм, сотни агентов генерировали слоп и размешивали его до однородного cостояния продукта кодосодержащего, сжигая триллионы токенов, гигаватты энергии и испаряя тонны воды 🤯
Можно еще оценить результат по качеству документации к разработанному продукту. Где-то должно быть руководство пользователя, руководство разработчика, спецификации, и прочее. Чистый код продуктом не является.
Чистый код продуктом не является
Если бы можно было скомпилить и использовать (открывать сайты) и оно бы жрало мало памяти - я бы использовал. Документация мне не нужна.
только потому что это написано агентами? памяти оно жрать точно мало не будет - об этом же никто вообще не думал, зачем) не для людей писалось, а чтобы сделать очередное громкое заявление
только потому что это написано агентами?
Ну какая разница мне как пользователю кем оно написано? Просто скачиваю, ввожу адрес сайта и смотрю. Пока оно не работает - возможно пофиксят.
памяти оно жрать точно мало не будет - об этом же никто вообще не думал, зачем
Ну посмотрим. Может быть была поставлена такая задача.
На сегодня - да. Возможно через лет 5 что и изменится.
И сколько людей делают проекты без всего этого....
Эвона замахнулись.
Тут в комментариях на хабре как-то проскакивало, что браузер - это самая сложная сущность, которую делало человечество ever. С т. зр. совокупно потраченных человеко-часов.
Вот у меня возникает вопрос. Дальше чатов не заходил. Не знаю как там с агентами дела обстоят. Как они учитывают версии библиотек? Вот допустим в Rust уже несколько раз сталкивался что чаты не знают свежие версии библиотек и пишут по старому.
Нет никаких доказательств успешности «браузерного эксперимента» Cursor