PatientZero Jan 23 at 10:34

Нет никаких доказательств успешности «браузерного эксперимента» Cursor

Easy

4 min

15K

Artificial IntelligenceProgramming * GitHub * Debugging * Browsers

Review

Translation

+58

Comments 37

poruchik Jan 23 at 10:56

...ведь пока вы доказали только то, что агенты могут выдавать миллионы токенов, но всё равно не способны создать нечто по-настоящему работающее.
«Экспериментальный браузер» не обязан конкурировать с Chrome. Вполне достаточно минимума: чтобы он компилировался в поддерживаемом тулчейне и мог рендерить тривиальный файл HTML.

по вашей же ссылке скриншот главной страницы wikipedia https://github.com/wilsonzlin/fastrender/issues/98#issuecomment-3761559718

Lippiece Jan 24 at 12:17

Автор поста на хабре только перевел статью.

"It quickly crashes" (в том же комменте).

Munafiqun Jan 23 at 11:12

Отсутствие доказательства - не доказательство отсутствия.

steel835 Jan 23 at 13:05

Тут скорее отсутствие доказательства - это доказательство неподкрепленности заявления, как я понял

Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный

ArZr Jan 23 at 14:15

Но у кого-то реально собралось, почему не у каждого собирается - вопрос конечно интересный

На первых порах вообще никто не мог собрать код. Затем выяснилось, что вполне возможно всё собрать, если самостоятельно исправить ошибки (их оказалось не так много, как ожидалось). После этого Cursor исправили эти ошибки (причем, как предполагают внимательные граждане, исправление было сделано не "агентами", а человеком), после чего сборка стала возможна без танцев с бубном. Автор оригинальной статьи, который тоже активно во всем этом расследовании, просто не обновил статью и не добавил эти детали (впрочем, учитывая, насколько печальна ситуация с этим "браузером" даже после исправлений, в обновлении статьи не сказать что есть нужда)

Dhwtj Jan 23 at 15:49

Отсутствие доказательства - не доказательство отсутствия

Бремя доказательства на утверждающем [всякую дичь]

RulenBagdasis Jan 23 at 19:12

Я в последнее время постоянно вижу статьи о том, как ИИ заменил программистов и программирует теперь сам, но ещё ни разу я не увидел примера напрограммированного, чтобы это было сложнее того, что я в состоянии сам написать за пару выходных.

ИИ очень полезен в работе, постоянно использую его как умный автокомплишен, для рефакторинга, как ревьювера кода, как написателя/редактора комментариев, даже как писателя небольших изолированных кусков кода. Но всё меньше верю в сказки про то, что LLM способна нормально написать что-то, действительно, сложное.

Gromilo Jan 26 at 09:31

А что это за рефакторинги?

Я валидирую результат работы и если мне нужно сделать какое-то преобразование: вынести поля в базовый класс, перенести функцию и т.д. я использую решарпер, потому что его результату я доверяю, а результат ИИ отревьюить, всё равно что новый код прочитать, потому что код может измениться где угодно.

RulenBagdasis Jan 26 at 13:49

Пишите вы, например, приложение на Ангуляре и вам нужно некоторую сущность переименовать в Typescript коде компонента, в HTML и CSS. Как ваш решарпер это сделает?

vcKomm Jan 27 at 00:12

Переименовать сущность? Название класса сменить? Shift + F6 и меняете название. Предложит сменить название файла, поискать по тексту, комментариям и пр. Отследит использование по импортам и переименует. Если где-то не уверен, то предложит выбрать, где переименовать. Как-то так ±

RulenBagdasis Jan 27 at 00:35

Мне не класс переименовать, а, например, компонент целиком, включая аттрибуты hlml тегов и имена css свойств. Не получится у вас ничего без llm. Ну, ещё руками можно, конечно.

Gromilo Jan 27 at 05:03

Я просто привёл пример инструмента, который даёт железный результат.

За работу на фронте не скажу.

Если задача поменять одно свойство - проблем нет. Если перенести функцию, то у меня уже начинается паранойя, а точно та ли это функция?

Lippiece Jan 24 at 12:19

Бог, может быть, и есть (этот аргумент чаще всего в этом контексте упоминается), но точно не production-ready long-running autonomous coding.

Qwest_Prozto Jan 23 at 13:01

Мне вот всегда интересно - когда говорят про длительную разработку с ИИ - они вообще никогда не перезапускают чат, или как вообще им пользуются? В последнее время очень плотно игнорируется один факт - каждый новый запрос в любимую ИИ это отдельная новая сущность, связанная с предыдущим только промптом. При этом всегда есть провал внимания в середине данных, если их больше 20к токенов.
+ почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?

Wesha Jan 23 at 18:27

почему до сих пор никто не сделал агента

Мы сделали вам X, чтобы вы могли X, пока вы X!

JerryI Jan 23 at 21:18

там есть history chat compression. Очень неплохо позволяет "наследовать" от одного к другому

amazingname Jan 24 at 09:41

+ почему до сих пор никто не сделал агента - фильтра, который умеет подсовывать в ИИшку только нужные файлы и куски, чтобы не размывать ее фокус?

Думаю потому, что агента именно так обучают разработке: он должен дать правильное продолжение собственной цикличной цепи рассуждений, включая способность планировать и баллансировать процесс. Если начать выдергивать у него информацию или добавлять с помощью другого агента, тогда придется обучать их обоих оптимально действовать именно в такой схеме. А до этого пока не добрались - нужно больше мощностей и материала.

verticalacid Jan 24 at 10:17

Это RAG. Для кода работает плохо.

Если же вызывать полноценного оркестратора после каждого запроса кодера - денег не хватит. Только сжимать почаще (а не как Cursor).

20k для SOTA давно семечки. Вот 200k проблема - видят далеко не все.

deksden Jan 26 at 08:11

Те кто говорят про длительную разработку с ИИ - они не используют чат. Это осталось в 2023/2024.

они используют (скорее всего именно) CLI агентов: Claude code, Codex CLI, … У них проактивный сбор контекста - они stateless, без индексации кодовой базы. Сами ходят по ней, сами смотрят, берут что надо.

Сверху этого ваяется какой то оркестратор чтобы выполнять какой то флоу. Так оно работает долго / часы, сутки.

Dhwtj Jan 23 at 15:46

Мотивация команды курсор понятна.

Тут понятно, что в качестве доказательства полезности курсора пойдет любой мусор. Тем более, что публичной критики нет. Кто будет критиковать сильно рискует карьерой.

В прошлой статье про этот проект я писал: для доказательства корректности браузера прод качества есть огромное количество тестов, порядка 3 млн. Такая задача здесь не ставилась.

Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Кто я? Зачем я здесь? Не надо было вчера так нажираться

Wesha Jan 23 at 18:28

Мотивация команды курсор понятна

— надо ж того слона продать!

atomlib Jan 24 at 08:45

Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Это вы ещё Виталика Бутерина не видели.

Lippiece Jan 24 at 12:21

Зачем вообще инвесторы отдали деньги человеку который выглядит так?

Наверное, чтобы он запустил продукт? Если опустить неудачу в продукте, его выражение лица на этом фото никак не влияет на что бы то ни было.

С таким же успехом можно прикрепить фото Эйнштейна с языком и спросить, почему мы пользуемся его исследованиями.

Dorfix Feb 10 at 08:36

Это внучатый племянник, тещи брата мужа подруги CEO. ©

Elendiar1 Jan 23 at 18:28

Ммм, сотни агентов генерировали слоп и размешивали его до однородного cостояния продукта кодосодержащего, сжигая триллионы токенов, гигаватты энергии и испаряя тонны воды 🤯

Dhwtj Jan 24 at 11:38

LinkToOS Jan 23 at 18:54

Можно еще оценить результат по качеству документации к разработанному продукту. Где-то должно быть руководство пользователя, руководство разработчика, спецификации, и прочее. Чистый код продуктом не является.

codecity Jan 24 at 07:21

Чистый код продуктом не является

Если бы можно было скомпилить и использовать (открывать сайты) и оно бы жрало мало памяти - я бы использовал. Документация мне не нужна.

winkyBrain Jan 25 at 03:49

только потому что это написано агентами? памяти оно жрать точно мало не будет - об этом же никто вообще не думал, зачем) не для людей писалось, а чтобы сделать очередное громкое заявление

codecity Jan 25 at 10:41

только потому что это написано агентами?

Ну какая разница мне как пользователю кем оно написано? Просто скачиваю, ввожу адрес сайта и смотрю. Пока оно не работает - возможно пофиксят.

памяти оно жрать точно мало не будет - об этом же никто вообще не думал, зачем

Ну посмотрим. Может быть была поставлена такая задача.

На сегодня - да. Возможно через лет 5 что и изменится.

Vedomir Jan 24 at 11:51

И сколько людей делают проекты без всего этого....

winkyBrain Jan 25 at 03:50

а сколько людей подключается к таким проектам в процессе? без документации и спецификации

AnyKey80lvl Jan 24 at 08:21

Эвона замахнулись.

Тут в комментариях на хабре как-то проскакивало, что браузер - это самая сложная сущность, которую делало человечество ever. С т. зр. совокупно потраченных человеко-часов.

deksden Jan 26 at 08:24

Зато не будет тейков типа - ну текстовый редактор написать не так сложно, - а вы попробуйте браузер написать!

Попробовали. Респект

breninsul Jan 26 at 11:02

ну да, а ядро OS - это шутка

gabirx Jan 26 at 12:55

там попроще, все стандартизировано. а спецификация html и css это что- то с чем то

amniso Jan 26 at 18:40

Вот у меня возникает вопрос. Дальше чатов не заходил. Не знаю как там с агентами дела обстоят. Как они учитывают версии библиотек? Вот допустим в Rust уже несколько раз сталкивался что чаты не знают свежие версии библиотек и пишут по старому.