Yuiy7825 мая в 15:04

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ

Средний

12 мин

11K

Искусственный интеллектВидеокартыНастольные компьютерыСтарое железоКомпьютерное железо

Обзор

+12

Комментарии 8

Timick 25 мая в 16:29

Это старое железо на хабе антиквариат даёт прикурить любому новому.

Гоняю v100s на cuda в fp64 раза в полтора только слабее h100. Чистая геометрическая математика, не ии, но какая разница под капотом ии тот же самый cuda.

При этом в чистую уделывает 5090

Yuiy78 25 мая в 16:44

FP64 насколько я понимаю применяется в научных расчетах. NVIDIA в современных архитектурах сосредоточена на увеличении вычислительной мощности в FP4, FP8 и FP16, которые используются в современных нейросетях, при этом жертвуя производительностью в FP64.

Timick 25 мая в 17:34

Так я и писал чисто для математики. В fp64 flops значительно меньше но на v100s уже достаточно чтобы отказаться от компромиссов в сторону fp32

LsdMax 25 мая в 17:34

А если у меня GTX 2080 Super и 12 котлов, я смогу завести своего маленького друга без фильтров? ;)

Dex6 26 мая в 09:03

Спасибо, познавательно. А не пробовали вы запускать что-то графическое, типа stable diffusion? Мне собсно хочется заюзать это для ретуши фото и генерации изображений... Или локальные языковые модели это тоже позволяют?

Yuiy78 26 мая в 09:19

Локальные языковые модели не могут генерировать растровое изображение, только простые векторные, например в формате svg. Для генерации растровых изображений я использую portable версию ComfyUI, которая работает с версией CUDA 12.6. В модели stable diffusion 1.5 растровые изображения генерируются быстро, базовый шаблон "бутылки с космосом" с настройками по умолчанию примерно за 2-3 секунды. Более подробно тема работы в ComfyUI на Tesla V100 разобрана в видео на ютубе: канал "Этот Компьютер" - запуск нейросетей локально.

dvrpd вчера в 04:09

SD 1.5 это уже каменный век по меркам картинкогенераторов. Современные локальные модели уже приспособили LLM в качестве текстовых энкодеров, например те же Anima и Z-Image Turbo используют Qwen3-0.6B и Qwen3-4B для этого соответственно.

Yuiy78 20 часов назад

Попробовал Z-Image turbo в ComfyUI. Да, изображение по тексту намного качественнее генерируется, чем в SD1.5. Спасибо за информацию.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий