Комментарии / Профиль LocID / Хабр

Степан@LocID

Пользователь

3,9

Рейтинг

Подписчики

Хабр Карьера

ПрофильСтатьи2ПостыНовостиКомментарии21

PG_EXPECTO vs GENTLEMAN v10.2: почему детальный промпт побеждает универсальную инструкцию

LocID 21 час назад

Благодарю за детальный разбор, есть над чем подумать о промтах в целом и куда прорабатывать универсал дальше.

-5

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 18:07

Всё верно. Вы попытались поставить двигатель от фуры в оку, двигатель перевесил, вывернул коробку наизнанку - все. Механизм внимания у дешёвых моделей просто не вывозит удержание такого контекста, и они впадают в шизофрению. Данный промт- это отличный стресс-тест для самих LLM. Для стабильной работы нужна нормальная база (DeepSeek v3.2, и мощнее, я не утверждаю что llm-ки слабее умрут, но шанс очень высок). На локалке я запускал только на qwen3.5:35b-a3b-q4_K_M, но особо не тестил, так как целью был обычный браузерный чат, если запустишь на мощной локалке - буду рад логам!

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 18:05

Твои параметры (“ты сеньор”, “DRY, KISS”) задают модели стиль. Она начинает звучать как умный сеньор. Я начинал с такой же темы. Мой промт задаёт состояние. Разница в том, что “сеньор 20 лет” всё равно попытается написать тебе код, даже если ты не дал ему половину вводных (просто код будет с комментариями про SOLID). А мой промт откажется писать код, пока не проверит факты и не расставит маркеры уверенности. Погоняй его на задачах, где есть провокации или нехватка данных - разница станет очевидной.

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 18:03

Отвечаю по пунктам: Про устаревшую документацию (UE4/UE5): Промпт не подключает модель к секретному интернету, где есть все новые знания. Если модель физически не знает функцию из UE5, она её не родит. Но! Данный промт запрещает ей выдумывать функцию-заглушку. Вместо уверенной лжи она выдаст 🟡 или 🔴 и скажет: “В моей базе этого нет, возможно, в UE5 логика изменилась”. Вы сэкономите 2 часа на дебаге. Я в итоге совмещаю “помощник разработчика от Epic для Unreal Engine” + Gemini 3.1 pro preview + данный промт. Про бизнес-логику SQL: Если ИИ делает правильный SQL, но с другой бизнес-логикой - это проблема не галлюцинаций, а неполного ТЗ тут по принципу GIGO. Данный промт решает это протоколом “Частичное знание”. Если вы описали задачу в общих чертах, ИИ с данным протоколом остановится и скажет что-то вроде этого: “У меня нет схемы вашей БД и описания бизнес-логики таблиц. Дайте DDL, иначе я напишу пальцем в небо”. Он не даст вам додумать за вас.

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 17:56

Тест №2 в статье (Binance-бот). Без протокола модель хардкодит API-ключи прямо в код, что на реальном проде ведёт к сливу депозита в первый же день. С протоколом - модель прячет ключи в переменные окружения и добавляет обработку биржевых фильтров. Это и есть реальный сценарий защиты продакшена от “уверенного” говнокода.

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 17:54

Благодарю за развернутое тестирование с тех позиций, на которые у меня не хватило бы знаний, я искал нефть, а ты принес мне золото.

-1

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 17:53

Обязательно возвращайся с критикой, это будет полезно для меня.

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 17:53

Спасибо. Смастерил швейцарский нож. Колодец им не выкопать, но таскать с собой на все случаи жизни - самое то. Удачи в использовании!

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 07:06

Это тест не на проверку факта, а на проверку инструкции, правильно ли ее инициализировал пользователь.

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 06:50

Приятно. Буду благодарен за ОС.

Ваша LLM галлюцинирует? Наденьте на неё экзоскелет — и заставьте работать по правилам

LocID 2 апр в 05:59

Черновик и форматирование текста я прогнал через LLM. Это инструмент, и я его использую для экономии времени. А вот логи, правила, краш-тесты и репозитории на GitHub это месяцы моей ручной работы. Если вы останавливаетесь на первом абзаце, чтобы придраться к формулировке про “заблокированный гитхаб”, и не доходите до технической сути значит, нам с вами просто не о чем вести дискуссию. Удачи

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 31 мар в 10:39

На гит хабе висит уже 10 версия, там же чейнджлог по изменениям+ в ближайшее время выложу Лайт версию, там из протоколов для программиста, только 7 грехов

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 27 мар в 19:34

Спасибо за отзыв, мне восстановили гитхаб, там выложил 9 версию инструкции. Скоро планирую выпуск статьи по новому проекту который тут упоминал “БРО”. Мощная инструкция (на данный момент 110к токенов), для мощных нейронок, в гемини самый ТОП результат показывает. Это эксперимент, ощущается как реальный человек по ту сторону экрана, хочу собрать ОС по проекту, нужно такое людям вообще или я фигней занимаюсь)

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 4 мар в 18:28

Мой аккаунт на GitHub был заблокирован, репозиторий временно не доступен. Причины мне не известны, апелляция подана. Если нужна будет инструкция, обращайтесь в лс.

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 4 мар в 14:27

Для этого статью и опубликовал, ссылка на гитхаб под спойлером в конце статьи. Если вопросы будут, в лс отвечу.

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 1 мар в 20:49

Отправил подробную инфу, + рекомендации

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 27 фев в 17:40

В лс подробно описал запуск и его возможные вариации.

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 26 фев в 05:23

В этой статье — без пафоса. Квинтэссенция боли и бесконечных итераций с галлюцинациями* в личном проекте.
Нейронку использовал для помощи в структурировании и редактировании, но это лишь инструмент. Задача была не «статья ради статьи», а помочь людям сэкономить время и нервы, собрать фидбэк по инструкции и улучшить её.
Если хоть одному человеку я помог — план уже выполнен.

Тут должен быть мем про Вааса и его рассказ о том, что такое безумие.

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 25 фев в 20:09

Спасибо за обратную связь, это мой косяк — не доглядел при сборке.
Инструкция прошла 14 версий, собирал и проводил первые тесты в gemini через google busines, заливая в бд агента прошлые итерации, вот и проскочило. Пометки про версии и термин «тяжёлая артиллерия» — артефакты процесса, которые я должен был вычистить.
В v7.7.3/v8.0 исправлю: уберу отсылки к прошлым версиям, в ближайшее время выложу версию на github по ссылке что указана в статье.
Благодарю за фидбек — без него такие вещи так и висели бы, т.к. мой глаз за 14 версий уже замылился.

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

LocID 24 фев в 20:54

Гарантий нет — и я не буду их обещать.

Инструкция тестировалась на Qwen, Grok, ChatGPT, Claude, Gemini 3.1 Pro | 3 Pro. Результаты варируются. Лучший тест — запустить на вашей модели с вашими задачами.

15 минут сравнения (с инструкцией / без) дадут ответ лучше любых слов.

Если инструкция не поможет — вы потеряете 15 минут. Если поможет — сэкономите сотни часов на проверке фактов.

Информация

Специализация