Как стать автором
Обновить

Комментарии 2

А нельзя было написать ма-а-а-аленькую прослоечку на FastAPI или Flask которая принимает запросы по одному порту, меняет в запросе имя модели и шлёт запрос ollama, получает обратно ответ, меняет его если необходимо и шлёт обратно?

Все еще дороже по времени выйдет (в плане, писать что либо свое всегда дольше, чем взять и вызвать cli)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации