Myskat_90 12 мая в 11:35Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка KubernetesУровень сложностиСложныйВремя на прочтение14 минКоличество просмотров2.7KБлог компании ФлантБлог компании Московский кредитный банкИскусственный интеллектKubernetes*DevOps*ТуториалВсего голосов 30: ↑30 и ↓0+38Добавить в закладки61Комментарии0
Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes