Обновить

История о том, как я устал от галлюцинаций ИИ и собрал инструкцию для нейронки

Время на прочтение6 мин
Охват и читатели10K
Всего голосов 14: ↑13 и ↓1+12
Комментарии24

Комментарии 24

жениться тебе надо, Степан

Хорошее дело, браком не назовут 😄. А если серьезно, буду благодарен за обратную связь по теме статьи.

когда ИИ не умел правильно перемножать два числа - я ему давал разные инструкции и алгоритмы перемножения, но он всё равно перемножал неправильно, где гарантия что ваши инструкции работают, а не жрут зря токены ?

Гарантий нет — и я не буду их обещать.

Инструкция тестировалась на Qwen, Grok, ChatGPT, Claude, Gemini 3.1 Pro | 3 Pro. Результаты варируются. Лучший тест — запустить на вашей модели с вашими задачами.

15 минут сравнения (с инструкцией / без) дадут ответ лучше любых слов.

Если инструкция не поможет — вы потеряете 15 минут. Если поможет — сэкономите сотни часов на проверке фактов.

Жаль я не имею достаточно кармы чтобы повышать твои ответы.

Инструкция чисто визуально полезна, если сам ассистент макрирует каждый факт даже в "простой" версии то проверить его просто

в инструкции постоянные отсылки к другим версиям, например 7.7.2 в самом начале

Никогда не применять тяжёлую артиллерию без необходимости. (v7.6.0)

что это даёт? в текущей версии нет ни 7.6.0, ни других версий, ни определение тяжести артиллерии.

Спасибо за обратную связь, это мой косяк — не доглядел при сборке.
Инструкция прошла 14 версий, собирал и проводил первые тесты в gemini через google busines, заливая в бд агента прошлые итерации, вот и проскочило. Пометки про версии и термин «тяжёлая артиллерия» — артефакты процесса, которые я должен был вычистить.
В v7.7.3/v8.0 исправлю: уберу отсылки к прошлым версиям, в ближайшее время выложу версию на github по ссылке что указана в статье.
Благодарю за фидбек — без него такие вещи так и висели бы, т.к. мой глаз за 14 версий уже замылился.

В этой статье — без пафоса. Только честный текст от нейронки.

В этой статье — без пафоса. Квинтэссенция боли и бесконечных итераций с галлюцинациями* в личном проекте.
Нейронку использовал для помощи в структурировании и редактировании, но это лишь инструмент. Задача была не «статья ради статьи», а помочь людям сэкономить время и нервы, собрать фидбэк по инструкции и улучшить её.
Если хоть одному человеку я помог — план уже выполнен.

*

Тут должен быть мем про Вааса и его рассказ о том, что такое безумие.

Отличная статья, особенно для неофита в работе с нейронками по типу меня. И особенно для таких как я, у которых лингвистические проблемы с постановкой правильного промта для нейронки, очень автоматизировано на уровне click&use, но при этом позволяет тонкую настройку с версиями и параметрами внутри версий.

Буду тестить, но даже за сам светофор уже спасибо как минимум

При работе с deepseek нет варианта загрузить и файл инструкции с гитхаба и включить поиск по интернету, так что фактчекинг сильно зависит от актуальности бд ии-чата. Думаю для теста попробую упоминаемые gemini, gpt, grok, а также Алису потестить и сравнить ответы

При работе с дипсик - нормально прикрепляется файл инструкции. Это текстовый формат же. ...сам так использую

Начал пользоваться и возможно неправильно. Качая .md файлы с гитхаба, потом вставляю копипаст из этого поста, в конце в [] текст запроса и файл прикрепляю. Если задумано использование так, то наверное в инструкции стоит убрать смайлики. Также для UX полезно будет сразу прошить в каждую версию промт начальный. Ускорит процесс обращения к ии-ассистенту.

Если я применял как-то иначе, то можешь мои ошибки для обратной связи учесть.

В лс подробно описал запуск и его возможные вариации.

привет! можешь мне тоже отправить инструкцию, тк столкнулся с такой же проблемой

Отправил подробную инфу, + рекомендации

Можно попробовать?

Для этого статью и опубликовал, ссылка на гитхаб под спойлером в конце статьи. Если вопросы будут, в лс отвечу.

Мой аккаунт на GitHub был заблокирован, репозиторий временно не доступен. Причины мне не известны, апелляция подана. Если нужна будет инструкция, обращайтесь в лс.

Жеееесть

Прошел месяц, как скачал эту вашу инструкцию.

Иногда пользуюсь. Спс.

Я не программист. У меня стройка и бизнес-планирование.

Сегодня снова обратился к инструкции. И прошу дипсик переписать ее: под меня и мои задачи. Мне программирование почти не нужно. Долой!.….)))

А обратился от того, что из-за галлюцинации дипсика - потерял 2е суток времени...

Сейчас со смартфона работаю в режиме 2 окна частенько: вверху Квин3.5, снизу Дипсик.

Квин, кстати, тоже сгаллюцинировал по началу, в этом же вопросе. Но, он потом смог сам без подсказок исправиться. А дипсика понадобилось тыкать носом.

Простые сметы у Квина лучше получаются, если кому пригодся. Он 40+ источников обрабатывает, и, вроде как даже реально их читает вникая.

Спс автор, за инструкцию. Иногда стоит к ней обращаться.

Спасибо за отзыв, мне восстановили гитхаб, там выложил 9 версию инструкции. Скоро планирую выпуск статьи по новому проекту который тут упоминал “БРО”. Мощная инструкция (на данный момент 110к токенов), для мощных нейронок, в гемини самый ТОП результат показывает. Это эксперимент, ощущается как реальный человек по ту сторону экрана, хочу собрать ОС по проекту, нужно такое людям вообще или я фигней занимаюсь)

Я хз, нужно ли это людям... )) Опишу, что я делаю, как использую.

Ваша версия 9 имеет вес ~30к символов (не путать с токенами). Я переделал ее в свою версию на ~13к символов. (Попрошу не серчать: я убрал обе "личности", убрал специфику работы именно для программиста, заменив на: строительство, юриспруденцию, фин планирование и анализ. ...Пока скелет, без ручного наполнения. ... И, даже не читал, что за инструкция получилась)

В приложении Квин - прикрепил ее файлом к Проекту. (Интерфейс позволяет диалоги с ии - группировать, задать общий контекст ~1к символов и прикрепить общие файлы). В окне общего контекста Я прямо прописал использовать этот файл инструкции. ...плюсом есть ещё один общий контекст - постоянный индивидуальный контекст в приложении...

Пока не знаю, как это будет работать. Но тестирую на реальном своем проекте. Проект движется , надстройки эти, периодически - меняются. ... Ожидаю, позитивного результата: в минимализации глюков, упрощении миграции в новые диалоги, и попытке упорядочить логику. (Объясню проблему: есть управляющий диалог. Есть файл со списком диалогов. Сейчас диалогов 10+ шт. Уже легко запутаться и упустить важное... По-дее, наверное, ии-агент нужен. Но, это для меня темный лес. Я просто юзер)

На гит хабе висит уже 10 версия, там же чейнджлог по изменениям+ в ближайшее время выложу Лайт версию, там из протоколов для программиста, только 7 грехов

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации