Comments 7
А вы ведь наверно свою задачу решали…, может вы уже написали готовый экстенш к MediaWiki?
Пока нет :) Эту задачу решал в отрыве от MediaWiki, скорее как универсальный пример на PHP, а затем мы её имплементировали для нашей базы знаний в Confluence и в GitBook. Но при желании этот же подход несложно упаковать и в экстенш к MediaWiki - там главное правильно вытащить текст страниц и обновлять индексацию, благо сам фреймворк позволяет работать с разными типами документов.
Спасибо за статью, давно уже размышляю, как прикрутить ии -агента для поиска по домашней базе статей и заметок
Мне это напоминает использование кувалды в качестве мухобойки :)
А локальные ии можно для генерации ембедингов использовать?
Да, конечно можно - и многие так делают, чтобы не зависеть от облака, снизить стоимость или обеспечить приватность данных. Например: Jina Embeddings (локально + Docker) - docker run -p 8000:8000 jinaai/jina-embeddings-v2
Запускаем в отдельном контейнере, делаем доступ через определённый раут и стучимся туда из PHP обычным HTTP-запросом.
В результате будет что-то вроде
$response = file_get_contents("http://localhost:8000/embed?text=Привет");
$emb = json_decode($response, true)["embedding"];`
Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер