Comments 11
По моему опыту это сильно зависит от задачи, языка программирования, используемых библиотек и языка запросов (англ/рус). Gemini лучше справляется с проектированием и последующим написанием много-оконного приложения на десктоп. Claude4 путается и косячит постоянно. Однако например отдельный простенький компонент работающий на ГПУ, ему был не по зубам а вот Claude починил его писанину и сделал минимальный рабочий каркас хотя бы.
Ожидал увидеть мнение на практике
А не список
вот тут моё мнение на практике в целом https://habr.com/ru/articles/927668/
тут да, тут общее описание
Есть ощущение, что Антропики скоро свою IDE сделают. Судя по их упорству в сторону моделей, которые в программировании просто разрывают. А вообще я приловчился и пишу проекты в проектах, кто знает тот поймет, за 200$ я ни разу не влетал в лимиты, только опус и только думающий. И никаких курсоров.
Помимо модели, нужно говорить какие агенты использовались? Речь идет об использовании cursor с этими моделями?
По поводу того, что дипсик "даже до гемини не дотягивает", я б поспорил. Гемини, на мой взгляд, вообще малополезный кусок того самого. У меня он подписочный если что. Клауде лучший для кода, это факт.
"Характеристики" моделей, я так понимаю, писал также один из чат ботов (легендарные списки и "нотки человечного" [рабочая лошадка, перспективный новичок, снайпер, царь]).
Если обсудить смысл статьи, то вполне соглашусь с автором. Чаще пользуюсь Claude, он пока для меня лучший ассистент для работы с кодом (особенно если дело доходит до работы со стилями - там он хотя бы визуально красиво делает). Но прелести урезаны количеством сообщений.
Все копаю локальный кодер как написать. На минимальных моделях + вебсерч... пока никак
На минимальных моделях
скорее всего не получится
Есть теория, что если разработать очень сложного агента, в котором заложить процесс разработки пошагово, то может что то получиться.
Как пишут код топовые модели - они выдают сразу результат символ за символом, т.е. мощным моделям нужно быть на столько сложными, что бы внутри себя уже сразу построить готовый ответ.
Люди же не делают так, в голове есть только общая идея, шаг за шагом идея делится на подзадачи, причем с приблизительным осознанием, каждая из которых снова на подзадачи, процесс рекурсивный и итеративный одновременно, происходит это таким образом что бы на каждой итерации был рабочий код. Итерация за итерацией код дополняется новым функционалом, меняется предыдущий. Плюс, каждый раз происходит отладка (не обязательно в среде разработки, возможно логирование), и программист сравнивает логи с ожидаемом поведением. Каждый раз, когда нужно решить какую то подзадачу, человек лезет в документацию,..
ИИ Агент должен делать все то же самое. При этом большое контекстное окно не требуется (точнее оно будет полностью забито инструкциями), бессмысленно помещать в него весь код, человек на такое в принципе не способен, зачем вынуждать ИИ, который создавался как копия человеческого, делать так.
Из моего личного опыта новичка в AI, но неплохого программиста, Sonnet 4 чаще решает мои задачи, чем Gemini 2.5 pro, который очень долго думает, постоянно переделывает всё заново, и в итоге либо заходит в тупик, либо делает полную какашку. А вот если эту же модель использовать просто как чат, то она вдруг становится умнее Sonnet 4.
Поведение разных моделей при вайбкодинге