Комментарии / Профиль vadisun / Хабр

Пользователь

Выбираем лучшую нейросеть для видео 2026

Для такого сравнения не хватает числа повторов. Одна лучшая генерация показывает потолок модели, но не её стабильность. Было бы полезно сравнить долю удачных дублей и стоимость одного пригодного результата.

Как я делаю нейромультик про Михалыча

vadisun 9 июл в 11:47

очень круто, можно еще фиксировать настройки и стоимость каждой попытки. После нескольких генераций уже сложно вспомнить, какой промпт, качество и длительность реально дали нормальный результат.

Что перестаёт работать в тестировании, когда приходит LLM

vadisun 3 июл в 08:08

Да, с LLM классический баг-репорт быстро разваливается. Без сохранения промпта, контекста, версии модели и ожидаемого критерия качества потом сложно даже повторить проблему, не то что нормально её исправить.

Evals: что должен знать каждый AI-инженер в 2026

vadisun 1 июл в 09:05

Хорошая мысль, что оценивать надо не модель, а всю систему. Без evals под реальные сценарии легко принять красивое демо за рабочий продукт.

Агенты удаляют файлы, сливают данные и сами себя взламывают: как устроена безопасность ИИ‑систем в 2026 году

vadisun 30 июн в 12:31

Спасибо, хороший разбор. Для себя вынес простую мысль: агенту лучше ограничивать не только промптом, но и реальными правами.

Если он не должен трогать файлы, сеть или отправку данных, то этих действий у него просто не должно быть в инструментах. Было бы интересно увидеть отдельный чек-лист минимальных прав для таких систем.

Автоматизация рутины нейросетями: как поручить ИИ повторяющиеся задачи

vadisun 30 июн в 05:39

Хороший разбор. особенно близко про критерии остановки, когда агент должен не сам продолжать, а вернуть задачу человеку. А обычно это задается через список запретов или отдельным шагом проверки перед самим действием?

Информация

Специализация