Информация
- В рейтинге
- 4 080-й
- Откуда
- Москва, Москва и Московская обл., Россия
- Зарегистрирован
- Активность
Специализация
Бэкенд разработчик, ML разработчик
Ведущий
От 900 000 ₽
Python
NLP
LLM
C#
PostgreSQL
Высоконагруженные системы
MongoDB
Анализ данных
Bash
Базы данных
Да, это ответ, который сформулировать наша система (Тестируем свою систему локально/в закрытом контуре конечно же, но которая может мониторить источники, искать статьи по смыслу, ставит пометки -тезисы/риски/что проверить-, связывает с похожими материалами и сама пингует, когда появляется реально важное под наш профиль. Плюсы: меньше шума, быстрее разбор, прозрачные причины алертов и никакого “джуна с root’ом” — всё в пределах заданных правил и инструментов. Скоро будет статья и репозиторий для скачивания на гитах. ) — мы её сейчас как раз тестируем на реальных обсуждениях. При этом по смыслу я писал про приземлённые вещи: агент = LLM + ограниченные инструменты (list/read/edit) + human‑in‑the‑loop; edit_file “по подстроке” в проде лучше заменять на unified diff + patch; и обязательно иметь run_tests/lint/typecheck и path safety. Скоро выпустим статью про саму систему, и сборку можно будет скачать на гитах — кину ссылку, как выложим. PS скоро это без времени. пока вопросики.
Хорошо. Статья именно то, что снимает ореол «агенты = особая магия». По факту это чат, где модели дали три руки: list_files, read_file, edit_file. Всё остальное — UX и страховочные барьеры. То есть Claude Code — это не “супер-LLM”, это “LLM + ремни безопасности + каска + регламент”. Самое полезное здесь даже не код, а ментальная модель: LLM не трогает вашу ФС, она только просит, а вы решаете, выполнять ли. В корпоративном/закрытом контуре это вообще золото (факт фактический) : можно дать агенту ровно тот набор инструментов, который не превратит его в junior с root’ом.
Немного «а вот тут начинается взрослая жизнь»:
edit_file“по подстроке” — это как деплой «по ощущениям»: пока работает — красиво, как сломается — будете искать, какой именно символ агент “улучшил”. На практике лучше учить агента предлагать unified diff и применять его через patch, плюс проверять, что diff применился чисто.
Очень не хватает инструмента “сделай вид, что ты взрослый”: run_tests/lint/typecheck. Без этого агент пишет код, как студент на экзамене: уверенно, быстро и без запуска.
И да, path safety: если не ограничить root проекта, однажды получите легендарное: «Создал файл /etc/hosts с полезными импортами».
Почитал. в целом согласен. Хорошо объясняет DARPA как «покупателя опционов на будущее»: они финансируют рискованные штуки на ранней стадии, где ещё ничего не ясно, зато иногда получается «сначала странно, потом инфраструктура мира». Плюс контекст со «Спутником‑1» отлично показывает, почему у них в ДНК скорость и ставка на прорывы, а не на бесконечные согласования. Самый прикладной урок — не в «секретных технологиях», а в методе: маленькие команды, короткие циклы, демо вместо презентаций. Это можно копировать даже без бюджета Пентагона: выбрать 1–2 направления, зафиксировать метрики, быстро собрать прототип и либо масштабировать, либо закрыть без сожалений. Небольшое уточнение: DARPA — не венчур в классическом смысле, там другой «ROI» и мотивация, часть эффектов инфраструктурная/непубличная. Так что «венчурный фонд» — метафора рабочая, но не стоит воспринимать буквально.