Комментарии / Профиль N3VERZzz / Хабр

Как стать автором

Темченко Сергей @N3VERZzz

Пользователь

Профиль Публикации 2Комментарии 33Закладки 5

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

N3VERZzz 11 мая в 07:41

Могли бы вы попробовать сгруппировать все пункты по общей природе? Кажется, что тут не так много вариантов:

1) недостаточный или предвзятый датасет
2) дефекты в самом обучении
3) а все остальное ошибки как-будто когнитивные искажения людей, которые верят в правдивость всего что происходит в чат-бот

Как вы считаете?

+2

Посмотреть

Первый официальный музыкальный клип, сделанный с помощью OpenAI Sora

N3VERZzz 4 мая в 08:51

модель Sora училась только на видео с пролетами??

0

Посмотреть

Фундамент AI: обратное распространение ошибки простыми словами

N3VERZzz 30 апр в 10:27

ладно, я все-таки спрошу. кот преподаватель, НО только один ученик кот, все остальные люди. поч?

+1

Посмотреть

Безопасность и контроль: Как GPT-агенты на основе узлов преодолевают ограничения AutoGPT

N3VERZzz 16 апр в 21:22

походу no-code LangChain

0

Посмотреть

Почему много агентов лучше чем один?

N3VERZzz 16 апр в 21:17

привет, я сейчас пишу цепочку на автогене, которая на вход принимают алгоритмическую задачку и пробует через разных агентов по разному решать, засекая время и память и записывая процесс. Может быть у тебя есть какие-то наработки, которые ты можешь дать глянуть?

0

Посмотреть

Как обнаружить галлюцинации в LLM?

N3VERZzz 13 апр в 07:17

Спасибо за статью, это интересно, попробую поиграться с этим

0

Посмотреть

Заменят ли LLM людей в разметке данных для AI?

N3VERZzz 13 апр в 07:06

А русские модели умеют считать?

0

Посмотреть

Как заменить фотостоки на нейронки в коммерческих проектах: личный опыт и промпты

N3VERZzz 21 мар в 11:28

недавно трестировали как люди определяют видео сделанное SORA, и там было типо 50 на 50, хотя для людей в теме явно видны артефакты. Что касается этих картинок, то если бы ты не знал что это сгенерино, то не понял бы

0

Посмотреть

В Китае молодёжь использует заблокированный в стране Tinder, чтобы искать работу

N3VERZzz 21 мар в 10:03

это называется получить работу через постель

+1

Посмотреть

Российские сайты начали удалять статьи о VPN

N3VERZzz 23 фев в 14:26

То есть, читать статьи про VPN можно будет только через VPN или из-за рубежа.

прикол

0

Посмотреть

Разговариваем с BI на естественном языке

N3VERZzz 22 фев в 13:00

Вы правильно меня поняли, но, мне кажется, проблема сложнее.

Мы отказались от первого варианта, потому что в колонке может быть слишком много значений. Возможно, стоит запрашивать количество, и, если оно находится в приемлемом коридоре, передавать в контекст. Однако, поскольку этот вариант не покрывает все случаи, мы пока что остановились на поиске без регистра. GPT хорошо обрабатывает склонения и в целом часто делает правильные предположения о том, где может находиться значение. Но здесь тоже есть некоторые проблемы.

Во-первых, когда делают поиск по словосочетанию "найди все платежи от Альфа-Банка", пользователь на естественном языке не ставит дефис, и мы не можем найти это в базе. Во-вторых, представьте, что у нас есть колонки "контрагент" и "организация", и там и там может храниться ООО, и GPT может запросить не тот столбец.

Скажите, рассматривали ли вы варианты поиска:
1) нечеткую логику (pg_trgm в Postgres)
2) полнотекстовый поиск?

По-моему, без решения этой проблемы невозможно достичь 95 процентов правильных ответов.

0

Посмотреть

Разговариваем с BI на естественном языке

N3VERZzz 16 фев в 12:08

Мне кажется, самое сложное в задаче text2sql — это поиск в базах данных со свободным вводом. В статье вы говорите про это, приводя пример 'мужчина/женщина или male/female'. 1) Могли бы вы рассказать, как вы реализуете этот поиск? 2) Можно ли гипотетически добиться результата в 99% правильных ответов, если одно и то же значение легко может находиться в двух или более столбцах?

0

Посмотреть

Можно ли научить чат-бота всегда говорить правду

N3VERZzz 16 фев в 11:49

Это интересно, спасибо за статью. Я интуитивно подозревал что модель не может сама себя проверять, так как находится на том же уровне. И да, более развитой моделью имеет больше смысла проверять, и если ответ модели не текст, а json, код, sql, то можно ранить/проверять валидность, и при не удачи просить переделать.

+1

Посмотреть

Показалось, что ИИ уже ворвался в нашу жизнь, но нет

N3VERZzz 23 янв в 14:48

про кучеров, мне кажется, надо понимать что ИИ революция отличается от индустриальной, это совершенно новый прецендент. Поскольку ИИ предлагает оптимизацию, новые рабочие места не будут появляться с такой же скоростью с которой исчезают старые.

+1

Посмотреть

Генерация ответов с расширенным поиском в техподдержке на основе YandexGPT, ChatGPT

N3VERZzz 1 янв в 12:41

Было бы круто, если бы вы показали пак стандартных вопрос в техподдержку, и те ответы, которые дает YandexGPT

0

Посмотреть

Почему важно тестировать промпты и как это делать

N3VERZzz 17 дек 2023 в 16:19

Большое спасибо, что не забыли мою просьбу и прочитали.

Если я вас правильно понял, вы говорите, что достаточно дешево можно сгенерировать 1-2 тыс. тестов. Это да, но запустить их выйдет в нормальную сумму. (Я проверял промпт размером в 5 тыс. токенов.)
Хорошо, ознакомлюсь.
Я был бы очень рад, мне интересно услышать мнение людей, у которых был реальный опыт в этом. Это помогло бы мне понять, правильный ли у меня сейчас ход мысли. (лекцию посмотрю)

0

Посмотреть

ChatGPT не любит работать в декабре

N3VERZzz 12 дек 2023 в 23:43

Надо вот что попробовать, скинуть фотку хорошенькой девочки и сказать gpt, что при хороших ответах можно устроить тет-а-тет с ней

-1

Посмотреть

Почему важно тестировать промпты и как это делать

N3VERZzz 10 дек 2023 в 18:05

Читаю нескольких людей которые понимают в этой тематике больше моего и их мнение в том что промпт-инжиниринг это сомнительная идея.

Можешь дать ссылки на этих людей? Для меня идея промптинга не является сумасшедшей, и я не слышал прям явных противников. Хотелось бы ознакомиться с их позицией, если это и правда распространённое мнение, то можно было бы написать

0

Посмотреть

OpenAI: ChatGPT начал «лениться» и иногда не отвечает на вопросы

N3VERZzz 10 дек 2023 в 17:27

Однако пользователи указывают на более широкий спектр проблем, в том числе на ошибочные ответы, которые чат-бот выдаёт даже на простые вопросы — как на картинке выше.

Это не простой вопрос, поскольку LLMки работают с токенами, которые больше, чем отдельные буквы, они плохо справляются с подобными задачами. По этой же причине стихи, созданные ими, получаются школярскими.

+2

Посмотреть

Почему важно тестировать промпты и как это делать

N3VERZzz 10 дек 2023 в 16:49

моделей очень много и работа с каждой из них уникальна и никакого универсального способа работы нет и быть не может.

Я хотел опровергнуть именно эту позицию, сложно отвечать на все, при этом ничего не опуская. Постараюсь в ближайшее время посмотреть подобные исследования и собрать какое-то количество скринов, как тот, который я показал раньше. Это сможет вас убедить в том, что есть универсальные способы работы с LLM?

0

Посмотреть

1