Комментарии / Профиль veriga / Хабр

Andrey Veriga@veriga

AI R&D

Подписчики

ПрофильСтатьи7ПостыНовостиКомментарии27

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 6 июл в 06:30

добавил

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 20 июн в 17:21

добавил

Еще один шаг в сторону объяснимого ИИ. Anthropic научилась читать скрытые состояния LLM

veriga 11 июн в 06:52

стартап "Anthropic" запускался как исследовательская группа по созданию understandable AI, кажется и термин этот они придумали. Возможно, тоже сначала думали, что быстро на линейной алгебре всё порешают, там же математика уровня 2 курса бакалавров, просто никто не брался

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 10 июн в 07:12

добавил

Почему мы выбрали рекурсивные SQL-запросы вместо GraphQL для графа знаний

veriga 7 июн в 09:08

я смотрел на него, но для AlloyDB нет готового рсширения apache age. Возможно, это политика гугла, и на голый postgres оно ставится, но я решил вообще пока не заморачиваться с графовыми запросами, а посмотреть как это работает на чисто реляционных отношениях. Эта субд хвалится новыми индексами, хочется понять, что там на самом деле происходит

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 7 июн в 08:59

Добавил.
Интересно, а как получилось, что у меня два ваших аккаунта в гитхабе отображается на один ник?

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 6 июн в 16:48

вообще правильнее было бы делать полноценные triples subject-predicat-object на входе и писать классическую онтологию, но это уже вообще другая задача. Здесь связи классифицируются только чтобы расставить веса для ранжирования выдачи, и эти веса не вносят очень большого вклада. Больше урона здесь наносит то, что все связи направленные, а функция классификации выбирает концепты как source и target в порядке их следования, и только потом начинает классифицировать связи между ними конечным списком классов отношений. То есть, если название технологии попадет в source а автор попадет в target, то связь "authored_by" там ляжет правильно, а если они зайдут в функцию наоборот, то связи "author_of" там нет.
Ну это всё будем допиливать, пока и так ищется, просто хопов в контекст попадает больше, токены лишние тратятся

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 6 июн в 09:58

пригласил

Почему мы выбрали рекурсивные SQL-запросы вместо GraphQL для графа знаний

veriga 6 июн в 09:56

согласен. Хотя рекурсивные запросы на SQL тоже не легкое чтение

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 5 июн в 18:19

Да, именно так — двухэтапный retrieval. Вот механика:

Seed: Запрос - эмбеддинг - cosine similarity находит top-K (стоит хардкодом 5) страниц из graph_nodes. Это seed-ноды.

Hop : Каждая seed-нода раскрывается через graph_edges — прямые соседи (hop1) и соседи соседей (hop2). Глубина по умолчанию 1.

Дедупликация: SELECT DISTINCT ON (wp.path) — если одна и та же страница пришла и как seed, и как hop, остаётся seed (приоритет по relevance: seed > hop1 > hop2).

Веса: заранее заданная таблица внутри SQL-функции:

depends_on = 0.95, develops = 0.9, part_of = 0.85,
based_on = 0.8, alternative_to = 0.75, contradicts = 0.7,
authored_by = 0.5, tagged = 0.4, mentions = 0.3

Rank: rank_score = similarity × edge_weight / (depth + 1). У seed-нод rank = чистый cosine (edge_weight=1, depth=0). У hop-нод — discount по типу ребра и глубине.

Контент для LLM: страницы, обрезанные по relevance:

Общий лимит max_chars = 8000 символов на весь результат.

seed: left(content, max_chars / top_k)
hop1: 500 символов
hop2: 200 символов

Если нужен код, скажите ваш гитхаб аккаунт, я вас добавлю

Wiki-MCP-Server с распределённым графом знаний и авторизацией

veriga 5 июн в 18:18

Да, именно так — двухэтапный retrieval. Вот механика:

Seed: Запрос - эмбеддинг - cosine similarity находит top-K (стоит хардкодом 5) страниц из graph_nodes. Это seed-ноды.

Веса: заранее заданная таблица внутри SQL-функции:

depends_on = 0.95, develops = 0.9, part_of = 0.85,
based_on = 0.8, alternative_to = 0.75, contradicts = 0.7,
authored_by = 0.5, tagged = 0.4, mentions = 0.3

Контент для LLM: страницы, обрезанные по relevance:

Общий лимит max_chars = 8000 символов на весь результат.

seed: left(content, max_chars / top_k)
hop1: 500 символов
hop2: 200 символов

Если нужен код, скажите ваш гитхаб аккаунт, я вас добавлю

Еще один шаг в сторону объяснимого ИИ. Anthropic научилась читать скрытые состояния LLM

veriga 17 мая в 05:29

steering vector, не стирлинг. Правдоподобность вы, конечно, уронили, учитывая, что это пересказ статьи от авторов метода с описанием результатов применения

Еще один шаг в сторону объяснимого ИИ. Anthropic научилась читать скрытые состояния LLM

veriga 14 мая в 17:10

а, я понял, спасибо, исправлю

Еще один шаг в сторону объяснимого ИИ. Anthropic научилась читать скрытые состояния LLM

veriga 14 мая в 16:57

все картинки из оригинальной статьи
https://transformer-circuits.pub/2026/nla/#misreported-tool-calls

Вам не нужен OpenClaw — напишите свой

veriga 14 мая в 08:07

но у OpenClaw уже есть десктоп под MacOS, и голосовой интерфейс тоже реализован

Огромный гайд: продвинутые советы и хитрости для работы с Gemini CLI и другими AI CLI утилитами

veriga 11 мар в 08:41

Вроде заработало. Я с ним давно вожусь, и это было прямо больно -- через впн к моделям обращаться с большим контекстом. А недавно случайно зашел без впн и оно работает. Уже несколько дней работает, не знаю как будет дальше

Как мы с моим ботом OpenClaw сделали ему семантическую память на AlloyDB Omni за полчаса

veriga 18 фев в 18:33

качество ответов зависти от модели LLM. Здесь на SQL сохраняется онтология фактов, причем делается это для того, чтобы сохранять факты, которых нет в интернете, а следовательно нет в памяти модели. Так что сравнивать "с памятью -- без памяти" вообще не получится. Система будет предсказуемо галлюцинировать о тех вещах, которых не знает. Измерять можно качество ответов существующей базы знаний и вновь создаваемой. А тут существующей базы по моим фактам еще нет. Следующую версию уже будет с чем сравнивать

Как мы с моим ботом OpenClaw сделали ему семантическую память на AlloyDB Omni за полчаса

veriga 17 фев в 19:54

На чем перфоманс, на сервере VPS c 8Гб ОЗУ с пингом в 150мс? С клиента, который к LLM через впн ходит? Ну вот потому наверное и не сравнил

Как мы с моим ботом OpenClaw сделали ему семантическую память на AlloyDB Omni за полчаса

veriga 15 фев в 07:37

Ой, только заметил, у меня опечатка: " чем меньше угол, тем больше расстояние между точками в семантическом пространстве". Правильно будет , чем меньше значение косинуса, тем больше косинусное расстояние, тем меньше они похожи.

Как мы с моим ботом OpenClaw сделали ему семантическую память на AlloyDB Omni за полчаса

veriga 15 фев в 07:34

Все правильно, на гитхабе есть скрипт на SQL для создания базы. Но я не пробовал его на стандартном postgres, а в AlloyDB уже встроены нужные расширения, там есть индексы для поиска приблизительным ближайшим соседям, которых не будет в postgres. AlloyDB Omni опенсорс, ставится на локальную машину, никаких проблем с ним нет, но его надо сначала ставить. А в скилл добавлять установку СУБД так себе идея)

Информация

Специализация