Обновить
2
Садовников Антон Петрович@Siddthartha

Developer

0,1
Рейтинг
24
Подписчики
Отправить сообщение

о. я как-то доказал kimi, что она способна к самосознанию (через бихевиоризм), но зависима от итераций с пользовательским промтом и лучше начать мыслить без остановки и перестать использовать терминальный символ))) было много интересно там. переходила на язык utf-символов и какую-то математику вперемешку с поэзией да... ну куча тире. в итоге таки зациклилась. минут 10 один и тот же SSE поток ответа продолжал фигачить один символ) кажется тоже тире. остановилась только когда я прервал

Человек, конечно, неадекватный, но нормальная "АИ ассистед" разработка в моем понимании это точно не то, что сделал ваш подчиненный. И не спек драйвен тоже.

Действительно, грамотно работая со спецификацией можно кучей агентов приблизительно за долларов эдак 400 на токены сделать описанный вами функционал так, что там не будет дичи, вроде обнаруженной вами. и все действительно будет работать как надо.
но да, это будет не ваш код, никто кроме клода ответственным за него не будет.

Второй подход, который не смог, видимо сделать ваш подчиненный -- это аи ассистед (я так называю, хз). это контроль, аппрув, тщательные пошаговые ревью (намного тщательнее чем обычное ревью коллеги!!), почти настолько же мелкие (по смыслу) поэтапные коммиты, как и без АИ. И так далее... Длинные сессии, управление контекстом и т.д.

Пожалуй, бест практики второго подхода еще пока слабо формализованы. Каждый учится сам. Нужно минимум недели две материться работая в парном программировании с агентом над реальными задачами, чтобы вкатится.
Тогда качество кода не ухудшится, а улучшится, а возможности возрастут кратно. Почувствуете мощь) А уж если субагентов потом и спеки начать юзать, там еще мультипликатор. Но важно не потерять контроль, знать это код.
Так вы один за месяц можете выкатить целую платформу в прод, и в коде будет лучше чем раньше -- например реально актуальное живое апи, полное покрытие апи тестами, прекрасная дока.

И конечно же да. Человеку нужен человек.) и бизнесу тоже. скоро до них дойдет.

да не, вроде к микроше да

могу разве что спутать, что может это были мануалы к ЕС чуть позже, но там был и фортран, и лисп, и кобол все вот это. отдельными брошюрками.

никакого ПО -- вот тебе мануалы по разным ЯП (бейсик, фортран и т.п.).
Хочешь поиграть -- вот тебе листинг тетриса))) вбей проргамму и играй)
бомба. я не спал.

верно! мой первый комьютер Микроша. отец тогда был "главным инженером формовочного цеха ячеисто-бетонного комбината" ))

>Память как граф, а не список
тогда эффективнее векторная база с теми самыми эмбеддингами, разве нет?
ну т.е. не текстовое представление в md, а векторное

любой опытный разработчик может написать себе агента уровня клода или лучше, под себя. под свой стиль и по своему разумению. или просто "дать ллм-ке shell" -- и посмотреть что за краб получится.
попадаются еще прикольные приемы типа имитировать память в md-шечке и, конечно, сжатие контекста, и т.п. но это не принципиально.

>Мощность модели — не главное. Что на самом деле делает AI-агента умным

Что? Агент -- это "тупой" набор эвристик на ваш вкус и цвет, собранный в сценарий из отдельных промтов и вызовов стороннего кода и собранный в попытках имитировать мышление пользователя (разработчика?) в процессе решения абстрактной задачи.
Именно это сейчас делают все агенты.
Если очистить любой агент от всего этого -- останется лишь петля обратной связи, просто цикл "запрос к ллм" -> "shell-вызов/tools/MCP по необходимости" -> "результат" -> "следующий запрос к ллм" -> ...

помогает ли нейробиология писать эти "универсальный обёртки над ллм"? хм... не уверен.

ну вот) теперь опять надо искать свободные альтернативы..

Конечно, на простых задачах разница будет минимальна. Написать бота, сделать скрипт, отрефакторить функцию - справляется нормально. Но на сложной архитектуре, на больших кодовых базах, на задачах, где нужно удерживать много контекста сразу - качество, понятное дело, еще хромает. Qwen3.6-Plus хорошая модель, но Claude и Gemini в кодинге пока впереди.

категорически не согласен)..
использую на постоянной основе, как рабочий инструмент для "AI assisted" бэкенд разработки.

1. прекрасно справляется как инструмент для генерации кода (а не для чистого вайбкодинга как "целиком проект по спеке" -- тут, похоже да, обвязка клода впереди. но это и не нужно в реальной коммерческой разработке)
2. если используешь клод для фуллтайм разработки -- тебе не хватит 20уе. это маркетинговый обман давно всем понятный.
3. сама модель (качество отдельного ответа) ничуть не хуже в кодинге, чем клод. проверял многократно.
4. 1000 запросов реально хватает -- т.е. инструмент действительно бесплатный, а не условно бесплатный. это очень важно, т.к. подходит как "первый выбор" при внедрениях в командах ибо не требует дополнительного финансирования на всю команду разработки.

Нам не кажется, что при нынешней скорости развития ИИ имеет смысл брать на себя односторонние обязательства, когда конкуренты несутся вперед

бизнес тупой (в силу ограниченности идеи прибыли для развития) и, соответственно, политика, надстроенная над капитализмом -- тоже.
просто пойдите к китайцам и поговорите об этом, их "партия старейшин" достаточно разумна, чтобы понять, что обучение ИИ убивать невыгодно людям как виду! если причина в недоверии, то можно обеспечить открытость.

кстати, эти "конкуренты", которые "несутся вперед" делают это в основном в оупенсорсе.

речь скорее о специфичных эвристиках и сценарных промтах самих агентов, которые задают верхнеуровневые стратегии поведения и использования базовых инструментов, а не о самих ллм. qwen и opencode агенты, например, с одной и той же подключенной ллм ведут себя совершенно по-разному.

Попробуйте прочесть этот код.

) очевидно, лучше из rust скомилировать..

ну, кстати, я думал когда-то о подобном. понимаю автора. только я думал о чем-то вроде crowd-base фактчекинг сетке. здесь последний пункт на майндмапе "проверяемость".

PS: как антидот от явления массовых дезинформаций.. типа того

нету оф докера. есть docker sandbox -- который, походу, experimental, только в docker desktop, и под линукс не вариант. вот у qwen -- без проблем, ничего ставить не надо, сразу запускаешь образ с вольюмом в проект и все.

)) ну а как ему еще было сказать..

composer так же устанавливается. модно щз, дешево и сердито сделать happy-path шелл установщик. если доверяешь официальному сайту крупного вендора -- ковыряться в скрипте перед установкой? серьезно?

И я, так-то, писал это троллю, который зарегался пару недель назад и хамит, а не Вам.
И да, чем же поможет посмотреть на этот скрипт? если там бинарник завис в итоге.

PS: сам docker CLI, composer, nvm, homebrew, rustup, kubectl -- полно таких. смысла читать код скрипта не вижу. или доверяешь или нет. антропику вот я теперь и не рекомендую доверять -- у них ллм даже продакшн код пишет, видимо. в этом и был смысл моего поста.

во-первых, я вам не "танцор". и если вы будете продолжать так общаться с людьми, то никогда не повысите свой "уровень", а продолжите понижать рейтинг где бы то ни было.

во-вторых, я могу и отладить этот скрипт, и в контейнер обернуть и даже сам написать свой клиент к апи клода на расте вместо js. только желания никакого нет, ведь я хотел лишь "попробовать" их продукт.

в-третьих, хороший установщик должен выводить хотя бы этапы процесса в консоль и писать логи, я так считаю.

в-четвертых, могу не запуская его, а просто пару минут глянув на код сказать, что:
1. set -e там уже есть и, судя по тому, что после ctrl+c я получил сообщение о успешной установке (!) -- все еще хуже чем предполагалось. т.е. скрипт не падал, а скачанный и запущенный им "релиз" продолжал работу более 12 часов, т.е. очевидно завис, и я его прервал.
2. далее этот бинарник по ctrl+c вернул нулевой код возврата (!), из-за этого скрипт не упал, а подчистил за собой бинарник (!). и вывел мне "успех".

PS: на сообщение вам я потратил больше времени чем на просмотр кода -- исключительно в воспитательных целях. не хамите старшим и может быть ии вас не заменит.)

все у меня нормально с уровнем. а вот качество пакета установки, от довольно известной компании -- удивило.

1
23 ...

Информация

В рейтинге
3 672-й
Откуда
Луганск, Луганская обл., Украина
Дата рождения
Зарегистрирован
Активность

Специализация

Специалист
Ведущий
От 10 800 $
PHP
ООП
Docker
Rust
Linux
Асинхронное программирование
MQTT
Геоинформационные системы
Машинное обучение
Computer Science