Можно тут пояснить, вроде как $5 / $25? Потом, по подписке получаются гораздо более низкие “эквивалентные” цены…
С другой стороны, Deep Seek тоже демпингует: $3.48 $0.87 (75% off(3))
Ну и по ссылке, как достигнут мега-контекст. Иновационный метод таков: DeepSeek’s innovation was to make the model more selective about what it pays attention to. Instead of treating all earlier text as equally important, V4 compresses older information and focuses on the parts most likely to matter in the present moment, while still keeping nearby text in full so it does not miss important details.
сразу пойду заниматься гомосексуализмом, сатанизмом, квадроберством и донатить фашистам
Тут не совсем однородные члены предложения, КМК. Было бы интересно узнать, каково Ваше определение понятия “фашисты”. Потому что, например, “фашистский режим Бенито Муссолини в Италии придерживался враждебного отношения к гомосексуализму, основываясь на идеологии культа силы, мужества и традиционных семейных ценностей”.
Вы же, кстати, за мужество и традиционные семейные ценности?
В своё время я уже присматривался к OpenSpec, но остались несколько неясностей, из-за которых мы тогда не стали его внедрять. Хотелось бы поделиться наблюдениями.
В README.md /opsx:propose и /opsx:apply подаются как ключевые команды, однако в спеках их описания нет. Зато присутствуют specs/ai-tool-paths/spec.md и artifact-graph/spec.md, которые, на мой взгляд, относятся скорее к внутренним контрактам, чем к user-facing.
В целом, складывается впечатление, что у OpenSpec пока есть сложности с тем, чтобы отразить собственный functional design.
Что касается technical design - я не нашёл, где можно посмотреть текущую архитектуру: какие есть компоненты, кто кого вызывает, как устроены границы. README.md предлагает выполнить npm install -g @fission-ai/openspec@latest, но мотивация именно такого шага на этом этапе для меня не вполне очевидна.
В текущем виде, для задач моей области, этого, к сожалению, оказывается недостаточно.
С агентами вот такая штука, по моей практике (системный архитектор вот тут).
Составление спецификаций (ТЗ) занимает процентов 80% времени, и агент составить её самостоятельно не может, тут польза в “парном проектировании”. На этапе construction надо смотреть, что эти агенты делают, причём детально, иначе накапливается Comprehension Debt.
По моему опыту для прототипа или MVP все эти привлечения “команд агентов” хороши. Для продукта в активной эксплуатации использовании ИИ более напоминает использование экзоскелета, чем использование дополнительной команды агентов-инженеров.
GitHub Copilot ввёл свой стандарт Agent Skills, Anthropic, OpenAI и Google сошлись на похожем формате.
Можно подробнее про “GitHub Copilot ввёл свой стандарт”? Они разве не используют open standart?
И еще вопрос - непонятно, как SKILL передаётся при использовании: “Все четыре — через OpenRouter, одним API-ключом, одинаковый формат запросов, temperature=0. Ключевые обращения — по 20 повторов, остальные — по 5. Итого 480 запусков со скиллом”.
То, что хранится в .claude/commands/. В начале прошлого года уже можно было делать, вот tutorial весны 2025 года.
Второй пример. Вызов с оборудования определённых функций, получение данных, передача в калькулятор и пересчёт различных параметров с выдачей на гора результата. Например пересчёт из количества секторов в пуле массива в терабайты или тибибайты.
Можете пояснить, как эту задачу решает skill? MCP, вызов какого-то cli? Пока непонятно, в чём преимущество перед командами.
Во-вторых, запрос должен попасть туда, где это начало уже успело прогреться. В single-node setup это почти не заметно. В multi-replica это уже отдельная инженерная проблема.
Можно вот тут подробнее? Вроде как кэшируется по API-ключу, если на репликах один ключ, то проблем быть не должно, или…?
Похожее утверждение можно найти здесь: Anthropic: Claude models (e.g., Claude 3.5 Sonnet) offer explicit control using API parameters to mark specific blocks of content for caching.
Automatic caching is the simplest way to enable prompt caching. Instead of placing cache_control on individual content blocks, add a single cache_control field at the top level of your request body. The system automatically applies the cache breakpoint to the last cacheable block.
Попробовал тоже на разных модельках: “напиши простой пример формы на effector-hook-form(s) v4 с полями email и password”. Да, claude не подкачал. В отличие от gemini, deepseek и chatgpt…
Прочитав слова "фундаментальной теории тестирования" ожидал увидеть далее какие-то расшифровки, ссылки, но как-то то потерялось среди прочего, что ли. Сразу с архитектуры. А как же парадокс пестицида и прочие принципы тестирования? 😉
У меня нет MacBook. Совсем. А для сборки iOS-приложения нужен Xcode, который работает только на macOS. Весь процесс — от коммита до появления билда в TestFlight — полностью автоматический.
С TestFlight понятно. В как версия появляется в App Store, если нет MacBook?
В каждой из этих областей Агенты работают как усилитель. Усиливается, в том числе, и глупость (например, по незнанию). Более близкая мне аналогия - экзоскелет. Если не знаешь, как грамотно колоть дрова - наломаешь дров, на все деньги. А если знаешь - будет быстрее, чем руками топором махать.
Можно тут пояснить, вроде как $5 / $25? Потом, по подписке получаются гораздо более низкие “эквивалентные” цены…
С другой стороны, Deep Seek тоже демпингует:
$3.48$0.87 (75% off(3))Ну и по ссылке, как достигнут мега-контекст. Иновационный метод таков: DeepSeek’s innovation was to make the model more selective about what it pays attention to. Instead of treating all earlier text as equally important, V4 compresses older information and focuses on the parts most likely to matter in the present moment, while still keeping nearby text in full so it does not miss important details.
Тут не совсем однородные члены предложения, КМК. Было бы интересно узнать, каково Ваше определение понятия “фашисты”. Потому что, например, “фашистский режим Бенито Муссолини в Италии придерживался враждебного отношения к гомосексуализму, основываясь на идеологии культа силы, мужества и традиционных семейных ценностей”.
Вы же, кстати, за мужество и традиционные семейные ценности?
Интересно. Можно поподробнее про понимание? Вот после agentic tool, чем тут хуже?
Судя по ap - правильно понимаю, что работа с AI идёт через браузер, а не через agentic tools типа claude code?
В своё время я уже присматривался к OpenSpec, но остались несколько неясностей, из-за которых мы тогда не стали его внедрять. Хотелось бы поделиться наблюдениями.
В README.md
/opsx:proposeи/opsx:applyподаются как ключевые команды, однако в спеках их описания нет. Зато присутствуют specs/ai-tool-paths/spec.md и artifact-graph/spec.md, которые, на мой взгляд, относятся скорее к внутренним контрактам, чем к user-facing.В целом, складывается впечатление, что у OpenSpec пока есть сложности с тем, чтобы отразить собственный functional design.
Что касается technical design - я не нашёл, где можно посмотреть текущую архитектуру: какие есть компоненты, кто кого вызывает, как устроены границы. README.md предлагает выполнить
npm install -g @fission-ai/openspec@latest, но мотивация именно такого шага на этом этапе для меня не вполне очевидна.В текущем виде, для задач моей области, этого, к сожалению, оказывается недостаточно.
Очень круто🔥 Если есть возможность, сделайте кнопку (или ещё как), как задонатить.
Касательно AI-Driven - как организована работа c AI? Какие-то инструменты, типа spec-driven framework, использовали?
С агентами вот такая штука, по моей практике (системный архитектор вот тут).
Составление спецификаций (ТЗ) занимает процентов 80% времени, и агент составить её самостоятельно не может, тут польза в “парном проектировании”. На этапе construction надо смотреть, что эти агенты делают, причём детально, иначе накапливается Comprehension Debt.
По моему опыту для прототипа или MVP все эти привлечения “команд агентов” хороши. Для продукта в активной эксплуатации использовании ИИ более напоминает использование экзоскелета, чем использование дополнительной команды агентов-инженеров.
Можно подробнее про “GitHub Copilot ввёл свой стандарт”? Они разве не используют open standart?
И еще вопрос - непонятно, как SKILL передаётся при использовании: “Все четыре — через OpenRouter, одним API-ключом, одинаковый формат запросов, temperature=0. Ключевые обращения — по 20 повторов, остальные — по 5. Итого 480 запусков со скиллом”.
Интересная статья, воспользуюсь, при случае.
Однако ж…:
Это не вайбокодинг, если смотреть на исходное определение:
Вот это настоящее искусство☝️. А то, что Вы описали - ну каждый ведь может. Кто способен глянуть diff и оценить “нормальность”.
Автор термина, кстати, сейчас предлагает использовать понятие agentic engineering.
То, что хранится в .claude/commands/. В начале прошлого года уже можно было делать, вот tutorial весны 2025 года.
Можете пояснить, как эту задачу решает skill? MCP, вызов какого-то cli? Пока непонятно, в чём преимущество перед командами.
Впрочем, прочитал внимательнее - в статье это отражено, чуть дальше.
Тут, видимо, точнее будет сказать, что проблема не в порядке запуска, а в возможном одновременном запуске, т.е. может иметь место Cache Stampede or Dogpile Problem in System Design
Можно вот тут подробнее? Вроде как кэшируется по API-ключу, если на репликах один ключ, то проблем быть не должно, или…?
Похожее утверждение можно найти здесь: Anthropic: Claude models (e.g., Claude 3.5 Sonnet) offer explicit control using API parameters to mark specific blocks of content for caching.
Однако, статья датируется Oct 1, 2025.
Актуальная документация гласит:
Спасибо, технически “вкусно” (ну, на мой вкус).
Можно подробее про положительное влияние силлов? Я, конечно, слышал про них, но use case не очень понятны. Чем они лучше commands?
Попробовал тоже на разных модельках: “напиши простой пример формы на effector-hook-form(s) v4 с полями email и password”. Да, claude не подкачал. В отличие от gemini, deepseek и chatgpt…
Приветствую!
Прочитав слова "фундаментальной теории тестирования" ожидал увидеть далее какие-то расшифровки, ссылки, но как-то то потерялось среди прочего, что ли. Сразу с архитектуры. А как же парадокс пестицида и прочие принципы тестирования? 😉
С TestFlight понятно. В как версия появляется в App Store, если нет MacBook?
Любопытно. А можно подробнее про "классическое понимание"? Вот есть, например, Guide to the Software Engineering Body of Knowledge
Содержание
Software requirements
Software architecture
Software design
Software construction
Software testing
Software engineering operations
Software maintenance
Software configuration management
Software engineering management
Software engineering process
Software engineering models and methods
Software quality
Software security
Software engineering professional practice
Software engineering economics
Computing foundations
Mathematical foundations
Engineering foundations
В каждой из этих областей Агенты работают как усилитель. Усиливается, в том числе, и глупость (например, по незнанию). Более близкая мне аналогия - экзоскелет. Если не знаешь, как грамотно колоть дрова - наломаешь дров, на все деньги. А если знаешь - будет быстрее, чем руками топором махать.