Обновить

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели11K
Всего голосов 7: ↑7 и ↓0+12
Комментарии8

Комментарии 8

Это старое железо на хабе антиквариат даёт прикурить любому новому.

Гоняю v100s на cuda в fp64 раза в полтора только слабее h100. Чистая геометрическая математика, не ии, но какая разница под капотом ии тот же самый cuda.

При этом в чистую уделывает 5090

FP64 насколько я понимаю применяется в научных расчетах. NVIDIA в современных архитектурах сосредоточена на увеличении вычислительной мощности в FP4, FP8 и FP16, которые используются в современных нейросетях, при этом жертвуя производительностью в FP64.

Так я и писал чисто для математики. В fp64 flops значительно меньше но на v100s уже достаточно чтобы отказаться от компромиссов в сторону fp32

А если у меня GTX 2080 Super и 12 котлов, я смогу завести своего маленького друга без фильтров? ;)

Спасибо, познавательно. А не пробовали вы запускать что-то графическое, типа stable diffusion? Мне собсно хочется заюзать это для ретуши фото и генерации изображений... Или локальные языковые модели это тоже позволяют?

Локальные языковые модели не могут генерировать растровое изображение, только простые векторные, например в формате svg. Для генерации растровых изображений я использую portable версию ComfyUI, которая работает с версией CUDA 12.6. В модели stable diffusion 1.5 растровые изображения генерируются быстро, базовый шаблон "бутылки с космосом" с настройками по умолчанию примерно за 2-3 секунды. Более подробно тема работы в ComfyUI на Tesla V100 разобрана в видео на ютубе: канал "Этот Компьютер" - запуск нейросетей локально.

SD 1.5 это уже каменный век по меркам картинкогенераторов. Современные локальные модели уже приспособили LLM в качестве текстовых энкодеров, например те же Anima и Z-Image Turbo используют Qwen3-0.6B и Qwen3-4B для этого соответственно.

Попробовал Z-Image turbo в ComfyUI. Да, изображение по тексту намного качественнее генерируется, чем в SD1.5. Спасибо за информацию.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации