Pull to refresh

Comments 7

#5279 — Triton inference server metrics is not supported

Тут are not supported должно быть, не палИтесь )

За статью спасибо.

Писал на эмоциях тот ишью))) сейчас поправлю, спасибо!

интересно! а почему решили остановиться на Seldon, а не KServe?

Kserve мы используем в другом нашем продукте - https://selectel.ru/services/cloud/mlops/

В целом он также покрывает потребность в инференс графе и работает с istio.

Но решили попробовать seldon, так как он дает больше ручек по построению графов, умеет в стратегии деплоя и под капотом имеет автоскейлер. Также поддерживал triton nvidia server как отдельную сущность. При этом в итоге отказались от такого решения и в статье описывал почему.

Следующая часть статьи выйдет совсем скоро - там как раз я расскажу про техническое мясо платформы - как мы сами доработали инференс граф, стратегии деплоя и автоскейлинг уже без Seldon, а другими opensource решениями

Спасибо за статью. Интересно, как и прошлые. Почему решили брать FluxCD, а не ArgoCD? Из-за нативной работы с Helm CRD?

Где граница того, чем управляет Terraform, а чем FluxCD?

Какое ускорение даёт использование общего файлового кэша относительно S3-совместимого хранилища?

Какую задачу решает Istio в вашем решении кроме канареечного деплоя?

Привет!

  1. Взяли fluxcd из-за нескольких причин. У него есть терраформ и хелм контроллеры, которые мы хотим взять в качестве основы для оператора. Нативные манифесты куберенетеса (ui в целом нам не нужен). Хорошая статья про отличия арго от flux тут https://habr.com/ru/companies/aenix/articles/796833/

    также в смежной команде используется flux - поэтому мы хотим переиспользовать наработки

  2. На самом деле границу сложно построить. До Flux cd мы примерно также деплоили платформы через gitlab cicd и terraform. Так же декадой происходил через git, но не было автосинка. То есть если руками изменить инфру- в репозитории изменений не произойдет. Flux же поддерживает синк изменений и может откатить ручные до деофлтных

  3. Использование NFS хранилища дает больше пропускной способности, подробнее с метриками можно ознакомиться здесь https://selectel.ru/services/cloud/file-storage/?ysclid=m5peyvc7at108237462. Также влияет скорость сети - с s3 до 1гбит, с файловым хранилищем до 3гбит

  4. Является service mesh. Маршрутизирует запросы до инференса

Sign up to leave a comment.