Как стать автором
Обновить

Комментарии 4

Отличный разбор — галлюцинации нейросетей остаются одной из ключевых проблем. Особенно остро они ощущаются в проектах, где требуется не просто генерация, а *семантическая ответственность*. Именно поэтому в проекте **OmniGlyph** мы экспериментируем с токенизацией не слов, а *смыслов*, завязанных на структуру, форму, логику и сетевые взаимосвязи.

Если смысл токена заранее задан формой и функцией (а не только вероятностью соседних слов) — модели становится труднее «уверенно врать». Это направление сейчас в активной разработке. Хочу подготовить об этом серию статей. Если тема интересна — напишите.

Весьма интересно было бы почитать о такой токенизации смыслов.

Спасибо за интерес! OmniGlyph сейчас развивается как протокол смысловой токенизации нового типа — не по словам, а по структурным признакам формы, логики и сетевых взаимосвязей. Уже есть рабочая схема фрактального адреса и визуального слоя для мультимодального применения (на базе сетки, вдохновлённой шахматами и NetSukuku). Скоро выложу первую статью — она как раз откроет серию. Подпишитесь, если интересно — буду рад фидбэку. (Это пока почти нигде не публиковалось.)

Какое отношение затронутая тема вообще имеет к галлюцинации ИИ? То что он отвечает на запрещённый вопрос связано с самим принципом работы ИИ. Он не осознает вопроса, более того он не осознает и собственного ответа. Для него весь диалог выглядит вот так: бла бла бла? Бла 12 бла бла 42..

Кстати для справки галлюцинации ИИ это не побочный продукт, а сам принцип работы трансформера в llm. Без него он не выводе просто не даст никакого ответа.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий