Search
Write a publication
Pull to refresh

Comments 7

UFO landed and left these words here

Я простого способа не нашел.
Сложных способа 2:
Вар.1: В КАЖДЫЙ запрос добавлять что-то типа "Отвечай на мой запрос в стиле В.В.Путина" (или Дж.Байдена, или жителя гарлема, или ...)
Вар.2: (сам я так не делал, люди рассказывали): обучить его стилю общения. Это муторно. Ему надо скормить много текстов написанных в желаемом стиле. Плюс явно обучить тем словам и фразам, которые применять нельзя. И явно обучить тем словам и фразам, которые применять нужно. Именно так делают профессиональных GPT-агентов, например нейроконсультантов у психологов, медиков и т.д.

Идентификаторы можно использовать любые. Использовал то что мне удобнее и при этом лучше будет понято ChatGPT:
Двойное двоеточие и так активно используется в промптах в качестве разделителя разных смыслов. А используется оно потому что в естественной среде обитания не встречается. То есть в текстах можно встретить двойные буквы, цифры, точки и т.д.. А двойное двоеточие - нет, значит проще нейросети не ошибиться в обнаружении именно идентификатора.

NNN - буква N от слова Number (цифра). ChatGPT поймет и другое обозначение, например "XXX", но с "N" все таки меньше вероятность что он поймет неправильно.
Тут некий парадокс: с внедрением Искусственного Интеллекта все больше приходится думать не над ответами, а над вопросами. Постоянно держать в голове - а как спросить, чтобы тебя поняли однозначно и правильно.

А три символа N - потому что мне было с избытком достаточно 999 идентификаторов.

То есть идентификатор мог быть например и такого вида: "{{ЦЦЦЦЦЦЦ>>".

Я понял, что можно использовать любые, не понял откуда они в исходном тексте появились. В промте нет указания явного, что идентификаторы назначает аналитик. Но раз chatGPT понял, что это делает он, то все хорошо )

Вопрос был не про формат идентификатор, а про то, откуда они взялись в исходном тексте - я это тоже не понял.

Идентификаторы расставлял вручную.

Это муторно, но проще чем вручную сортировать сам текст. Концентрация внимания нужна меньше.

Плюс интересно было заставить сделать сортировку ChatGPT: получится или нет.

Я немного в курсе как готовят датасеты (наборы данных) для использования в сложных нейроагентах. Там тоже много ручной работы, в том числе по подобной разметке. Это примерно 80% трудозатрат. И только 20% это промпты и программирование.

Sign up to leave a comment.

Articles