Память для ИИ и роботов / Хабр

Как онтологии превращаются в операционную систему знаний

До этого момента мы говорили в основном о данных. Но у этой темы есть ещё один слой, возможно самый важный. Он начинается там, где онтология перестаёт восприниматься просто как удобный формат для ответа на вопросы по базе знаний и превращается в основу памяти.

Проблема памяти — один из самых слабых и одновременно самых недооценённых элементов современных LLM-систем. Пока диалог короткий, пока задача локальная, пока пользователь задаёт вопрос и сразу получает ответ, об этом можно почти не думать. Но стоит попытаться построить действительно полезного агента, обучающего бота, цифрового ассистента, корпоративного консультанта или тем более робота, как выясняется, что одно из главных ограничений — не генерация текста и не точность формулировок, а именно неспособность стабильно удерживать контекст во времени.

Языковая модель хорошо оперирует тем, что находится у неё “перед глазами” в текущем окне контекста. Она может красиво обобщить, объяснить, сформулировать и даже выстроить цепочку рассуждений. Но когда взаимодействие становится длинным, накопительным, многосессионным, связанным с историей решений, персональными особенностями пользователя или изменяющимся состоянием среды, модель начинает демонстрировать свою временную природу. Она живёт текущим контекстом. Всё, что не подано заново, оказывается либо забытым, либо пересобранным по косвенным признакам.

Именно здесь появляется мысль, которая ещё недавно казалась слишком амбициозной: а что, если память ИИ должна быть не текстовой, а онтологической? Ведь долговременное знание о мире, пользователе, задаче и среде по своей природе лучше выражается не в сплошном потоке текста, а в сети сущностей, событий, отношений и изменений состояния.

Представим простой пример. Есть обучающий бот, который ведёт студента не один день, а несколько месяцев. Если хранить историю общения только в виде логов диалога, то при каждом новом обращении нужно либо подгружать большой кусок переписки, либо строить поверх неё очередной summarization pipeline, либо надеяться, что из краткого пересказа не потеряются важные детали. Но реальное знание о процессе обучения состоит не только из текста переписки. Оно состоит из структуры: какие темы уже освоены, где были ошибки, какие навыки устойчивы, какие понятия связаны между собой, к каким примерам студент лучше откликается, на каких типах задач систематически спотыкается, какие объяснения уже давались и с каким эффектом.

Если всё это превращать в онтологию, мы начинаем хранить не просто разговор, а модель обучающего процесса. Тогда новая сессия не требует заново перечитывать весь текст. Система может обратиться к структуре памяти: у этого пользователя есть такой-то профиль, такие-то освоенные концепты, такие-то пробелы, такие-то успешные стратегии объяснения. Это уже не чат с историей, а накопительное знание о взаимодействии.

Тот же принцип работает и в клиентских, и в корпоративных системах. В обычной поддержке история общения с клиентом быстро разрастается до такой степени, что даже человеку трудно удерживать её целиком. Возникают повторяющиеся запросы, недосказанные детали, важные обстоятельства, которые всплывают через неделю или месяц. Если хранить всё только как переписку, агент всё время будет начинать почти с нуля. Если же коммуникация преобразуется в знания — о компании, контактах, договорённостях, проблемах, статусах, ограничениях, прошлых решениях, взаимосвязях между сущностями — появляется не просто архив разговоров, а оперативная память взаимодействия.

Но, пожалуй, самый наглядный пример — робототехника. Когда мы смотрим демонстрации, где робот видит на столе яйца, сковороду, ложку и плиту и “рассуждает”, что из этого можно приготовить яичницу, кажется, что магия уже состоялась. На самом деле там часто происходит следующее: модель извлекает из своих статистических знаний о мире вероятные функции предметов и на этой основе формирует правдоподобную последовательность действий. Для демо этого достаточно. Для реального мира — нет.

Роботу недостаточно уметь красиво комментировать наблюдаемую сцену. Ему нужна устойчивая модель мира, в которой предметы, действия, ограничения, риски, цели и правила связаны не только языково, но и онтологически. Сковорода — это не просто слово, часто встречающееся рядом с яйцом. Это объект с функцией, свойствами, допустимыми сценариями использования, связями с другими объектами и правилами взаимодействия. Если робот действует в новом помещении, на новом складе, в новой производственной зоне, ему нужна не просто языковая догадка о назначении объектов, а дообучаемая карта мира, которую можно расширять и корректировать.

Именно поэтому онтологии так важны для embodied AI и для всего направления, где ИИ должен не только отвечать на вопросы, но и действовать. Онтология может стать мостом между нынешними LLM и будущим incremental learning, то есть способностью системы накапливать знания. Пока сами модели всё ещё плохо обучаются “на лету”, онтология даёт промежуточную архитектуру, в которую можно добавлять знания без полного переобучения основного движка.

Это имеет и ещё одно, очень практическое следствие. Благодаря внешнему "знаниевому" слою можно использовать не только крупнейшие облачные модели, но и гораздо более компактные локальные LLM. Вопрос on-prem AI сегодня волнует почти все серьёзные компании: финансовые организации, промышленность, корпоративные контуры с чувствительными данными, инфраструктурные предприятия. Почти везде есть один и тот же конфликт. С одной стороны, хочется использовать мощные языковые модели. С другой — данные нельзя или нежелательно выносить наружу. Локальные модели же обычно уступают по качеству. И вот здесь онтология оказывается усилителем. Она позволяет маленькой модели отвечать лучше, потому что часть “интеллекта” переносится из статистического веса модели во внешнюю структуру знаний.

Это особенно важно для закрытых контуров. Если компания работает с внутренними финансовыми данными, технической документацией, инженерными спецификациями, нормативами, производственными схемами, то сама возможность построить знаниевую систему без выхода во внешний интернет становится стратегическим преимуществом. Но если ограничиться только простым локальным RAG, потолок качества быстро станет заметен. А вот если поверх локальной модели поднять онтологический слой, то можно компенсировать часть слабости модели за счёт хорошо организованной памяти.

На этом месте становится видно, что онтология — это уже не просто “база знаний нового типа”. Она начинает играть роль, похожую на операционную систему знаний. Через неё можно подключать новые домены, объединять разные источники, расширять предметную область, связывать исторические данные с текущими событиями, держать в памяти не только документы, но и процессы. Более того, в таком подходе появляется возможность работы не только с текстами, но и с таблицами, изображениями, событиями и сенсорными данными — если у них есть описание, сущности и отношения.

Здесь же меняется и смысл explainable AI. В классической LLM объяснимость часто пытаются получить через цепочки рассуждения или через ссылки на источники. Это полезно, но не всегда достаточно. Онтология даёт другой тип объяснимости: система может показать, через какие узлы и связи она пришла к выводу. То есть объяснение перестаёт быть просто красивым текстом “я подумала так-то”, а может опираться на видимую структуру знаний. Для корпоративных систем, где важны проверяемость и доверие, это может оказаться даже важнее, чем чистый рост точности.

Есть и более глубокий уровень этого разговора — почти философский. Если смотреть шире, онтология по сути является попыткой формализовать картину мира. Не просто список фактов, а образ того, как вещи связаны между собой. В этом смысле тема неожиданно пересекается с вопросом об эйдосах, образах и структурных единицах знания. Когда разные локальные графы начинают сшиваться, когда предметные области соединяются друг с другом, возникает идея не просто корпоративной базы, а общей онтологии мира. Пусть не в полном философском смысле, но как направления развития: всё новые навыки, данные, правила и связи добавляются в единую структуру, не разрушая уже накопленного.

Возможно, именно здесь лежит одна из наиболее реалистичных траекторий развития AI в ближайшие годы. Не ждать, что сама языковая модель внезапно станет идеальной долговременной памятью, а строить гибридную архитектуру, где LLM отвечает за интерпретацию, генерацию и языковой reasoning, а онтология — за устойчивое удержание мира, фактов, связей и эволюции знаний. Тогда вопрос “умеет ли модель помнить” заменяется более точным вопросом: “в какой форме система хранит и обновляет свою картину мира”.

Если посмотреть на всё это с инженерной позиции, получается очень трезвый вывод. RAG был необходимым шагом, потому что он позволил подключить внешние данные к LLM. Но для настоящей памяти этого недостаточно. Следующий шаг — не просто улучшать поиск, а менять единицу знания. От документа — к факту. От фрагмента текста — к сущности и связи. От архива — к модели мира. От контекста — к памяти.

Именно поэтому разговор об онтологиях сегодня уже не выглядит академической экзотикой. Он становится разговором о будущем прикладного ИИ: о роботах, которые не просто видят предметы, а понимают их место в мире; о корпоративных ассистентах, которые не просто ищут по файлам, а удерживают структуру бизнеса; об обучающих системах, которые не просто пересказывают материал, а действительно накапливают модель прогресса ученика; о локальных моделях, которые становятся сильнее не за счёт гигантских весов, а за счёт хорошей памяти.

Если формулировать совсем прямо, то можно сказать так. RAG дал языковым моделям доступ к данным. Онтологии могут дать им память. А память — это уже шаг не просто к более удобному интерфейсу, а к системам, которые начинают удерживать знание не эпизодически, а системно.