Комментарии 2
А нельзя было написать ма-а-а-аленькую прослоечку на FastAPI или Flask которая принимает запросы по одному порту, меняет в запросе имя модели и шлёт запрос ollama, получает обратно ответ, меняет его если необходимо и шлёт обратно?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как подключить AFFiNE к Ollama?