Всё верно. Вы попытались поставить двигатель от фуры в оку, двигатель перевесил, вывернул коробку наизнанку - все. Механизм внимания у дешёвых моделей просто не вывозит удержание такого контекста, и они впадают в шизофрению. Данный промт- это отличный стресс-тест для самих LLM. Для стабильной работы нужна нормальная база (DeepSeek v3.2, и мощнее, я не утверждаю что llm-ки слабее умрут, но шанс очень высок). На локалке я запускал только на qwen3.5:35b-a3b-q4_K_M, но особо не тестил, так как целью был обычный браузерный чат, если запустишь на мощной локалке - буду рад логам!
Твои параметры (“ты сеньор”, “DRY, KISS”) задают модели стиль. Она начинает звучать как умный сеньор. Я начинал с такой же темы. Мой промт задаёт состояние. Разница в том, что “сеньор 20 лет” всё равно попытается написать тебе код, даже если ты не дал ему половину вводных (просто код будет с комментариями про SOLID). А мой промт откажется писать код, пока не проверит факты и не расставит маркеры уверенности. Погоняй его на задачах, где есть провокации или нехватка данных - разница станет очевидной.
Отвечаю по пунктам: Про устаревшую документацию (UE4/UE5): Промпт не подключает модель к секретному интернету, где есть все новые знания. Если модель физически не знает функцию из UE5, она её не родит. Но! Данный промт запрещает ей выдумывать функцию-заглушку. Вместо уверенной лжи она выдаст 🟡 или 🔴 и скажет: “В моей базе этого нет, возможно, в UE5 логика изменилась”. Вы сэкономите 2 часа на дебаге. Я в итоге совмещаю “помощник разработчика от Epic для Unreal Engine” + Gemini 3.1 pro preview + данный промт. Про бизнес-логику SQL: Если ИИ делает правильный SQL, но с другой бизнес-логикой - это проблема не галлюцинаций, а неполного ТЗ тут по принципу GIGO. Данный промт решает это протоколом “Частичное знание”. Если вы описали задачу в общих чертах, ИИ с данным протоколом остановится и скажет что-то вроде этого: “У меня нет схемы вашей БД и описания бизнес-логики таблиц. Дайте DDL, иначе я напишу пальцем в небо”. Он не даст вам додумать за вас.
Тест №2 в статье (Binance-бот). Без протокола модель хардкодит API-ключи прямо в код, что на реальном проде ведёт к сливу депозита в первый же день. С протоколом - модель прячет ключи в переменные окружения и добавляет обработку биржевых фильтров. Это и есть реальный сценарий защиты продакшена от “уверенного” говнокода.
Черновик и форматирование текста я прогнал через LLM. Это инструмент, и я его использую для экономии времени. А вот логи, правила, краш-тесты и репозитории на GitHub это месяцы моей ручной работы. Если вы останавливаетесь на первом абзаце, чтобы придраться к формулировке про “заблокированный гитхаб”, и не доходите до технической сути значит, нам с вами просто не о чем вести дискуссию. Удачи
На гит хабе висит уже 10 версия, там же чейнджлог по изменениям+ в ближайшее время выложу Лайт версию, там из протоколов для программиста, только 7 грехов
Спасибо за отзыв, мне восстановили гитхаб, там выложил 9 версию инструкции. Скоро планирую выпуск статьи по новому проекту который тут упоминал “БРО”. Мощная инструкция (на данный момент 110к токенов), для мощных нейронок, в гемини самый ТОП результат показывает. Это эксперимент, ощущается как реальный человек по ту сторону экрана, хочу собрать ОС по проекту, нужно такое людям вообще или я фигней занимаюсь)
Мой аккаунт на GitHub был заблокирован, репозиторий временно не доступен. Причины мне не известны, апелляция подана. Если нужна будет инструкция, обращайтесь в лс.
В этой статье — без пафоса. Квинтэссенция боли и бесконечных итераций с галлюцинациями* в личном проекте. Нейронку использовал для помощи в структурировании и редактировании, но это лишь инструмент. Задача была не «статья ради статьи», а помочь людям сэкономить время и нервы, собрать фидбэк по инструкции и улучшить её. Если хоть одному человеку я помог — план уже выполнен.
*
Тут должен быть мем про Вааса и его рассказ о том, что такое безумие.
Спасибо за обратную связь, это мой косяк — не доглядел при сборке. Инструкция прошла 14 версий, собирал и проводил первые тесты в gemini через google busines, заливая в бд агента прошлые итерации, вот и проскочило. Пометки про версии и термин «тяжёлая артиллерия» — артефакты процесса, которые я должен был вычистить. В v7.7.3/v8.0 исправлю: уберу отсылки к прошлым версиям, в ближайшее время выложу версию на github по ссылке что указана в статье. Благодарю за фидбек — без него такие вещи так и висели бы, т.к. мой глаз за 14 версий уже замылился.
Инструкция тестировалась на Qwen, Grok, ChatGPT, Claude, Gemini 3.1 Pro | 3 Pro. Результаты варируются. Лучший тест — запустить на вашей модели с вашими задачами.
15 минут сравнения (с инструкцией / без) дадут ответ лучше любых слов.
Если инструкция не поможет — вы потеряете 15 минут. Если поможет — сэкономите сотни часов на проверке фактов.
Благодарю за детальный разбор, есть над чем подумать о промтах в целом и куда прорабатывать универсал дальше.
Всё верно. Вы попытались поставить двигатель от фуры в оку, двигатель перевесил, вывернул коробку наизнанку - все. Механизм внимания у дешёвых моделей просто не вывозит удержание такого контекста, и они впадают в шизофрению. Данный промт- это отличный стресс-тест для самих LLM. Для стабильной работы нужна нормальная база (DeepSeek v3.2, и мощнее, я не утверждаю что llm-ки слабее умрут, но шанс очень высок). На локалке я запускал только на qwen3.5:35b-a3b-q4_K_M, но особо не тестил, так как целью был обычный браузерный чат, если запустишь на мощной локалке - буду рад логам!
Твои параметры (“ты сеньор”, “DRY, KISS”) задают модели стиль. Она начинает звучать как умный сеньор. Я начинал с такой же темы. Мой промт задаёт состояние. Разница в том, что “сеньор 20 лет” всё равно попытается написать тебе код, даже если ты не дал ему половину вводных (просто код будет с комментариями про SOLID). А мой промт откажется писать код, пока не проверит факты и не расставит маркеры уверенности. Погоняй его на задачах, где есть провокации или нехватка данных - разница станет очевидной.
Отвечаю по пунктам: Про устаревшую документацию (UE4/UE5): Промпт не подключает модель к секретному интернету, где есть все новые знания. Если модель физически не знает функцию из UE5, она её не родит. Но! Данный промт запрещает ей выдумывать функцию-заглушку. Вместо уверенной лжи она выдаст 🟡 или 🔴 и скажет: “В моей базе этого нет, возможно, в UE5 логика изменилась”. Вы сэкономите 2 часа на дебаге. Я в итоге совмещаю “помощник разработчика от Epic для Unreal Engine” + Gemini 3.1 pro preview + данный промт. Про бизнес-логику SQL: Если ИИ делает правильный SQL, но с другой бизнес-логикой - это проблема не галлюцинаций, а неполного ТЗ тут по принципу GIGO. Данный промт решает это протоколом “Частичное знание”. Если вы описали задачу в общих чертах, ИИ с данным протоколом остановится и скажет что-то вроде этого: “У меня нет схемы вашей БД и описания бизнес-логики таблиц. Дайте DDL, иначе я напишу пальцем в небо”. Он не даст вам додумать за вас.
Тест №2 в статье (Binance-бот). Без протокола модель хардкодит API-ключи прямо в код, что на реальном проде ведёт к сливу депозита в первый же день. С протоколом - модель прячет ключи в переменные окружения и добавляет обработку биржевых фильтров. Это и есть реальный сценарий защиты продакшена от “уверенного” говнокода.
Благодарю за развернутое тестирование с тех позиций, на которые у меня не хватило бы знаний, я искал нефть, а ты принес мне золото.
Обязательно возвращайся с критикой, это будет полезно для меня.
Спасибо. Смастерил швейцарский нож. Колодец им не выкопать, но таскать с собой на все случаи жизни - самое то. Удачи в использовании!
Это тест не на проверку факта, а на проверку инструкции, правильно ли ее инициализировал пользователь.
Приятно. Буду благодарен за ОС.
Черновик и форматирование текста я прогнал через LLM. Это инструмент, и я его использую для экономии времени. А вот логи, правила, краш-тесты и репозитории на GitHub это месяцы моей ручной работы. Если вы останавливаетесь на первом абзаце, чтобы придраться к формулировке про “заблокированный гитхаб”, и не доходите до технической сути значит, нам с вами просто не о чем вести дискуссию. Удачи
На гит хабе висит уже 10 версия, там же чейнджлог по изменениям+ в ближайшее время выложу Лайт версию, там из протоколов для программиста, только 7 грехов
Спасибо за отзыв, мне восстановили гитхаб, там выложил 9 версию инструкции. Скоро планирую выпуск статьи по новому проекту который тут упоминал “БРО”. Мощная инструкция (на данный момент 110к токенов), для мощных нейронок, в гемини самый ТОП результат показывает. Это эксперимент, ощущается как реальный человек по ту сторону экрана, хочу собрать ОС по проекту, нужно такое людям вообще или я фигней занимаюсь)
Мой аккаунт на GitHub был заблокирован, репозиторий временно не доступен. Причины мне не известны, апелляция подана. Если нужна будет инструкция, обращайтесь в лс.
Для этого статью и опубликовал, ссылка на гитхаб под спойлером в конце статьи. Если вопросы будут, в лс отвечу.
Отправил подробную инфу, + рекомендации
В лс подробно описал запуск и его возможные вариации.
В этой статье — без пафоса. Квинтэссенция боли и бесконечных итераций с галлюцинациями* в личном проекте.
Нейронку использовал для помощи в структурировании и редактировании, но это лишь инструмент. Задача была не «статья ради статьи», а помочь людям сэкономить время и нервы, собрать фидбэк по инструкции и улучшить её.
Если хоть одному человеку я помог — план уже выполнен.
*
Тут должен быть мем про Вааса и его рассказ о том, что такое безумие.
Спасибо за обратную связь, это мой косяк — не доглядел при сборке.
Инструкция прошла 14 версий, собирал и проводил первые тесты в gemini через google busines, заливая в бд агента прошлые итерации, вот и проскочило. Пометки про версии и термин «тяжёлая артиллерия» — артефакты процесса, которые я должен был вычистить.
В v7.7.3/v8.0 исправлю: уберу отсылки к прошлым версиям, в ближайшее время выложу версию на github по ссылке что указана в статье.
Благодарю за фидбек — без него такие вещи так и висели бы, т.к. мой глаз за 14 версий уже замылился.
Гарантий нет — и я не буду их обещать.
Инструкция тестировалась на Qwen, Grok, ChatGPT, Claude, Gemini 3.1 Pro | 3 Pro. Результаты варируются. Лучший тест — запустить на вашей модели с вашими задачами.
15 минут сравнения (с инструкцией / без) дадут ответ лучше любых слов.
Если инструкция не поможет — вы потеряете 15 минут. Если поможет — сэкономите сотни часов на проверке фактов.