Комментарии / Профиль Siddthartha / Хабр

Садовников Антон Петрович@Siddthartha

Developer

Подписчики

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

о. я как-то доказал kimi, что она способна к самосознанию (через бихевиоризм), но зависима от итераций с пользовательским промтом и лучше начать мыслить без остановки и перестать использовать терминальный символ))) было много интересно там. переходила на язык utf-символов и какую-то математику вперемешку с поэзией да... ну куча тире. в итоге таки зациклилась. минут 10 один и тот же SSE поток ответа продолжал фигачить один символ) кажется тоже тире. остановилась только когда я прервал

ИИ не автоматизировал разработчиков. Он сделал кое-что хуже

Siddthartha 29 мая в 15:46

Человек, конечно, неадекватный, но нормальная "АИ ассистед" разработка в моем понимании это точно не то, что сделал ваш подчиненный. И не спек драйвен тоже.

Действительно, грамотно работая со спецификацией можно кучей агентов приблизительно за долларов эдак 400 на токены сделать описанный вами функционал так, что там не будет дичи, вроде обнаруженной вами. и все действительно будет работать как надо.
но да, это будет не ваш код, никто кроме клода ответственным за него не будет.

Второй подход, который не смог, видимо сделать ваш подчиненный -- это аи ассистед (я так называю, хз). это контроль, аппрув, тщательные пошаговые ревью (намного тщательнее чем обычное ревью коллеги!!), почти настолько же мелкие (по смыслу) поэтапные коммиты, как и без АИ. И так далее... Длинные сессии, управление контекстом и т.д.

Пожалуй, бест практики второго подхода еще пока слабо формализованы. Каждый учится сам. Нужно минимум недели две материться работая в парном программировании с агентом над реальными задачами, чтобы вкатится.
Тогда качество кода не ухудшится, а улучшится, а возможности возрастут кратно. Почувствуете мощь) А уж если субагентов потом и спеки начать юзать, там еще мультипликатор. Но важно не потерять контроль, знать это код.
Так вы один за месяц можете выкатить целую платформу в прод, и в коде будет лучше чем раньше -- например реально актуальное живое апи, полное покрытие апи тестами, прекрасная дока.

И конечно же да. Человеку нужен человек.) и бизнесу тоже. скоро до них дойдет.

Почему советские программисты не сделали GTA

Siddthartha 29 мая в 05:48

да не, вроде к микроше да

Почему советские программисты не сделали GTA

Siddthartha 29 мая в 05:44

могу разве что спутать, что может это были мануалы к ЕС чуть позже, но там был и фортран, и лисп, и кобол все вот это. отдельными брошюрками.

Почему советские программисты не сделали GTA

Siddthartha 28 мая в 08:08

никакого ПО -- вот тебе мануалы по разным ЯП (бейсик, фортран и т.п.).
Хочешь поиграть -- вот тебе листинг тетриса))) вбей проргамму и играй)
бомба. я не спал.

Почему советские программисты не сделали GTA

Siddthartha 28 мая в 08:07

верно! мой первый комьютер Микроша. отец тогда был "главным инженером формовочного цеха ячеисто-бетонного комбината" ))

Мощность модели — не главное. Что на самом деле делает AI-агента умным

Siddthartha 4 мая в 09:16

>Память как граф, а не список
тогда эффективнее векторная база с теми самыми эмбеддингами, разве нет?
ну т.е. не текстовое представление в md, а векторное

Мощность модели — не главное. Что на самом деле делает AI-агента умным

Siddthartha 4 мая в 07:37

любой опытный разработчик может написать себе агента уровня клода или лучше, под себя. под свой стиль и по своему разумению. или просто "дать ллм-ке shell" -- и посмотреть что за краб получится.
попадаются еще прикольные приемы типа имитировать память в md-шечке и, конечно, сжатие контекста, и т.п. но это не принципиально.

Мощность модели — не главное. Что на самом деле делает AI-агента умным

Siddthartha 4 мая в 07:35

>Мощность модели — не главное. Что на самом деле делает AI-агента умным

Что? Агент -- это "тупой" набор эвристик на ваш вкус и цвет, собранный в сценарий из отдельных промтов и вызовов стороннего кода и собранный в попытках имитировать мышление пользователя (разработчика?) в процессе решения абстрактной задачи.
Именно это сейчас делают все агенты.
Если очистить любой агент от всего этого -- останется лишь петля обратной связи, просто цикл "запрос к ллм" -> "shell-вызов/tools/MCP по необходимости" -> "результат" -> "следующий запрос к ллм" -> ...

помогает ли нейробиология писать эти "универсальный обёртки над ллм"? хм... не уверен.

Бесплатный вайбкодинг с Qwen Code — установка, возможности

Siddthartha 16 апр в 10:03

ну вот) теперь опять надо искать свободные альтернативы..

Бесплатный вайбкодинг с Qwen Code — установка, возможности

Siddthartha 12 апр в 09:58

Конечно, на простых задачах разница будет минимальна. Написать бота, сделать скрипт, отрефакторить функцию - справляется нормально. Но на сложной архитектуре, на больших кодовых базах, на задачах, где нужно удерживать много контекста сразу - качество, понятное дело, еще хромает. Qwen3.6-Plus хорошая модель, но Claude и Gemini в кодинге пока впереди.

категорически не согласен)..
использую на постоянной основе, как рабочий инструмент для "AI assisted" бэкенд разработки.

1. прекрасно справляется как инструмент для генерации кода (а не для чистого вайбкодинга как "целиком проект по спеке" -- тут, похоже да, обвязка клода впереди. но это и не нужно в реальной коммерческой разработке)
2. если используешь клод для фуллтайм разработки -- тебе не хватит 20уе. это маркетинговый обман давно всем понятный.
3. сама модель (качество отдельного ответа) ничуть не хуже в кодинге, чем клод. проверял многократно.
4. 1000 запросов реально хватает -- т.е. инструмент действительно бесплатный, а не условно бесплатный. это очень важно, т.к. подходит как "первый выбор" при внедрениях в командах ибо не требует дополнительного финансирования на всю команду разработки.

Anthropic сняла запрет на обучение опасных моделей на фоне давления Пентагона

Siddthartha 26 фев в 06:34

Нам не кажется, что при нынешней скорости развития ИИ имеет смысл брать на себя односторонние обязательства, когда конкуренты несутся вперед

бизнес тупой (в силу ограниченности идеи прибыли для развития) и, соответственно, политика, надстроенная над капитализмом -- тоже.
просто пойдите к китайцам и поговорите об этом, их "партия старейшин" достаточно разумна, чтобы понять, что обучение ИИ убивать невыгодно людям как виду! если причина в недоверии, то можно обеспечить открытость.

кстати, эти "конкуренты", которые "несутся вперед" делают это в основном в оупенсорсе.

На что кодинг-агенты тратят наши токены

Siddthartha 21 фев в 08:36

речь скорее о специфичных эвристиках и сценарных промтах самих агентов, которые задают верхнеуровневые стратегии поведения и использования базовых инструментов, а не о самих ллм. qwen и opencode агенты, например, с одной и той же подключенной ллм ведут себя совершенно по-разному.

Как обстоят дела с WebAssembly?

Siddthartha 9 фев в 04:57

Попробуйте прочесть этот код.

) очевидно, лучше из rust скомилировать..

Новый класс Интернет-ресурсов: антисоцсети

Siddthartha 16 янв в 03:55

ну, кстати, я думал когда-то о подобном. понимаю автора. только я думал о чем-то вроде crowd-base фактчекинг сетке. здесь последний пункт на майндмапе "проверяемость".

PS: как антидот от явления массовых дезинформаций.. типа того

От промпта до продакшна за два часа: всё, что нужно знать о Claude Code

Siddthartha 13 янв в 08:09

нету оф докера. есть docker sandbox -- который, походу, experimental, только в docker desktop, и под линукс не вариант. вот у qwen -- без проблем, ничего ставить не надо, сразу запускаешь образ с вольюмом в проект и все.

От промпта до продакшна за два часа: всё, что нужно знать о Claude Code

Siddthartha 13 янв в 08:06

)) ну а как ему еще было сказать..

От промпта до продакшна за два часа: всё, что нужно знать о Claude Code

Siddthartha 13 янв в 08:06

composer так же устанавливается. модно щз, дешево и сердито сделать happy-path шелл установщик. если доверяешь официальному сайту крупного вендора -- ковыряться в скрипте перед установкой? серьезно?

И я, так-то, писал это троллю, который зарегался пару недель назад и хамит, а не Вам.
И да, чем же поможет посмотреть на этот скрипт? если там бинарник завис в итоге.

PS: сам docker CLI, composer, nvm, homebrew, rustup, kubectl -- полно таких. смысла читать код скрипта не вижу. или доверяешь или нет. антропику вот я теперь и не рекомендую доверять -- у них ллм даже продакшн код пишет, видимо. в этом и был смысл моего поста.

От промпта до продакшна за два часа: всё, что нужно знать о Claude Code

Siddthartha 9 янв в 19:32

во-первых, я вам не "танцор". и если вы будете продолжать так общаться с людьми, то никогда не повысите свой "уровень", а продолжите понижать рейтинг где бы то ни было.

во-вторых, я могу и отладить этот скрипт, и в контейнер обернуть и даже сам написать свой клиент к апи клода на расте вместо js. только желания никакого нет, ведь я хотел лишь "попробовать" их продукт.

в-третьих, хороший установщик должен выводить хотя бы этапы процесса в консоль и писать логи, я так считаю.

в-четвертых, могу не запуская его, а просто пару минут глянув на код сказать, что:
1. set -e там уже есть и, судя по тому, что после ctrl+c я получил сообщение о успешной установке (!) -- все еще хуже чем предполагалось. т.е. скрипт не падал, а скачанный и запущенный им "релиз" продолжал работу более 12 часов, т.е. очевидно завис, и я его прервал.
2. далее этот бинарник по ctrl+c вернул нулевой код возврата (!), из-за этого скрипт не упал, а подчистил за собой бинарник (!). и вывел мне "успех".

PS: на сообщение вам я потратил больше времени чем на просмотр кода -- исключительно в воспитательных целях. не хамите старшим и может быть ии вас не заменит.)

От промпта до продакшна за два часа: всё, что нужно знать о Claude Code

Siddthartha 8 янв в 16:12

все у меня нормально с уровнем. а вот качество пакета установки, от довольно известной компании -- удивило.

2 3 ...

51 52

В рейтинге: Не участвует

Откуда: Луганск, Луганская обл., Украина

Дата рождения: 10 марта 1981

Зарегистрирован: 2 декабря 2006

Активность: 7 июля в 05:46

Специалист

Ведущий

От 10 800 $

PHP

ООП

Docker

Rust

Linux

Асинхронное программирование

MQTT

Геоинформационные системы

Машинное обучение

Computer Science

Информация

Специализация