Pull to refresh

Comments 2

А нельзя было написать ма-а-а-аленькую прослоечку на FastAPI или Flask которая принимает запросы по одному порту, меняет в запросе имя модели и шлёт запрос ollama, получает обратно ответ, меняет его если необходимо и шлёт обратно?

Все еще дороже по времени выйдет (в плане, писать что либо свое всегда дольше, чем взять и вызвать cli)

Sign up to leave a comment.

Articles