florid696 Dec 14 2025 at 08:15

Как реализовать выборочную долговременную память в LLM-боте на Python

Medium

4 min

6.7K

Python *

From sandbox

Recovery Mode

-1

Comments 13

NeriaLab Dec 14 2025 at 08:37

То, что Вы описали - это даже не пародия на LTM, а только STM.

mikeinside Dec 14 2025 at 13:04

Тоже решаю задачу сохранения памяти у ИИ персонажа и что-то как-то все не нравится.
Может есть у кого хорошие мысли или ссылки, чтобы реализовать хорошую взрослую архитекутуру памяти?

NeriaLab Dec 14 2025 at 14:39

У LLM не может быть LTM, т.к. это фундаментальное ограничение, которое изначально не заложено в архитектуру. Все пляски с LTM - это всего лишь попытки улучшить STM. Большинство даже не понимают как должна работать LTM, не говоря уж про релизацию

Даже в когнитивно-символьных системах, где LTM изначально встроена в архитектуру, полностью взаимодействует с STM и локальной БЗ, то описание занимает несколько листов текста, а не "пару строк кода" как в статье

Flokis_guy Dec 14 2025 at 23:12

У LLM не может быть LTM, т.к. это фундаментальное ограничение

А вот и нет: теоретически трансформер может эффективно работать с произвольной длиной при некоторых модификациях. А значит, фундаментальных ограничений нет.

Да, стандартный трансформер страдает от затухающего внимания, и якобианы даже при нулевом входе затухают линейно всегда при росте последовательности и ограниченной норме логитов. А вот когда мы разрешим им быть произвольными, эта фундаментальная проблема исчезает. Конечно, появляется проблема в том, что трансформер не будет нормально работать вне обучаемой длины, но с точки зрения математики (собственно, что и является фундаментом) проблемы нет, так как мы можем обучать на той длине, которая при неограниченных ресурсах всегда будет равна нашей необходимой длине.

NeriaLab Dec 14 2025 at 23:27

А при чем тут трансформер? Я говорю про уровень ядра. У LLM, ядро - это модель, веса в ней "намертво запаяны". А если что-то делается вне ядра, то это просто "костыль", как бы его не называть. Он все равно не будет иметь тот функционал, который необходим для LTM

Flokis_guy Dec 15 2025 at 09:10

Большая часть всех текущих LLM на базе трансформера. А значит анализировать нужно через эту архитектуру.

А при его анализе мы можем понять, что фундаментальных проблем в контексте LTM, что бы помнить произвольную длину контекста - нет. А статические веса вот вообще не проблема. Фундаментально можно расти параметры и обучать.

a-baskakov Dec 17 2025 at 16:21

А что уже пробовали? RAG на базе векторной базы?

Antipozitive Dec 21 2025 at 19:58

Типа такого?

java3000 Dec 14 2025 at 20:52

Вы пробовали извлекать факты о пользователе с помощью SpaCy?

florid696 Dec 14 2025 at 22:12

Нет. Даже не знал про эту библиотеку, до вашего комментария. Поизучаю. Возможно, стоит попробовать.

Markgresilov Dec 15 2025 at 13:30

И даже если пользователь напишет "Соседская собака гадит у меня под окном" модель сочтёт что собака не у соседа, а у пользователя?

florid696 Dec 19 2025 at 21:33

Нет, бот учитывает в построении диалога последние сообщения + хранение ключевых фактов: имя, питомец и т.д.

SuperNikai Dec 19 2025 at 21:34

То есть в решении выборка фактов основана на ключевых словах? Точность при таком подходе будет очень низкая, лучше использовать менее мощную модель для оценки фактов и записи в системный прост.

А вообще уже давно придумали векторы для этого