72 ГБ VRAM – это много, хоть и не рекорд
72 ГБ VRAM – это много, хоть и не рекорд

72 ГБ видеопамяти. Еще пару лет назад такая цифра казалась абсурдной даже для серверных GPU. Топовые GeForce обходились 24 ГБ, а профессиональные карты держались в районе 48. Казалось бы, наращивать объемы сейчас, когда рынок изнывает от дефицита памяти, – не лучшее время. Но NVIDIA это не помешало взять и выкатить новую карточку RTX PRO 5000 с 72 ГБ GDDR7. Вопрос напрашивается сам собой: кому вообще может понадобиться столько памяти? И главное, что можно делать с таким объемом?

Характеристики RTX PRO 5000

Начнем с того, что RTX PRO, как следует из названия, – это видеокарты профессиональной линейки. Они заточены исключительно под рабочие задачи: AI-вычисления, CAD, 3D-рендеринг, научные симуляции. Поэтому и требования к таким карточкам другие: стабильность под длительной нагрузкой, большой объем памяти и наличие сертифицированных драйверов для профессионального софта.

RTX PRO 5000 построена на архитектуре Blackwell, как и игровая RTX 5090, но остальные спецификации у профессиональной карточки совсем другие:

Характеристика

RTX PRO 5000 72 GB

GPU-чип

GB202

CUDA-ядра

14 080

Tensor Core

440 (5-го поколения)

AI-производительность

~2064 TOPS (INT8)

Память

72 ГБ GDDR7

Шина памяти

384 бит

Пропускная способность

~1.34 ТБ/с

ECC

Да

TDP

300 Вт

Интерфейс

PCIe 5.0 x16

Слоты

2

В отличие от модели предыдущего поколения, главный козырь RTX PRO 5000 — не столько в архитектуре Blackwell, сколько в объеме памяти и ее пропускной способности. 

72 ГБ GDDR7 дает свои преимущества
72 ГБ GDDR7 дает свои преимущества

GDDR7 дает прирост пропускной способности почти в 50% по сравнению с GDDR6. Эта цифра критична для обучения AI-моделей, потому им важнее не вычисления как таковые, а именно скорость чтения весов из памяти. Чем быстрее GPU может подтягивать данные, тем меньше будет простой, и тем выше окажется реальная производительность в инференсе и файнтюне.

Еще один важный момент — Tensor Core пятого поколения. Они добавили поддержку FP4 и FP6, позволяя видеокарте гораздо эффективнее работать с квантизованными моделями без критичной потери точности. 

Простой пример: Llama 3.1 на 70 миллиардов параметров в FP16 занимает около 140 ГБ только для весов. Квантизация до 4 бит сжимает ее до 35-40 ГБ, но для дообучения нужно оставить мес��о под градиенты, состояние оптимизатора Adam и промежуточные активации. То есть объема памяти RTX 5090 не хватит просто физически.

Значит, надо будет задействовать CPU через оперативку. А это неминуемые потери в скорости инференса, причем сразу в 3-4 раза. Все-таки PCIe 5.0 x16 дает около 128 ГБ/с пропускной способности, тогда как GPU-память работает на порядок быстрее. И вот тут RTX PRO 5000 со своими 72 ГБ начинает выглядеть как вполне нормальное решение под такие нагрузки. 

Зачем нужна видеокарта RTX PRO 5000

Если смотреть на реальные сценарии, а не на сухие спецификации, у карты есть несколько очевидных родных зон применения.

Новинка чувствует себя заметно лучше во всех ИИ-задачах
Новинка чувствует себя заметно лучше во всех ИИ-задачах
  • Во‑первых, это локальные LLM‑ассистенты и агентные системы, которые живут прямо на рабочей станции. Когда в одном процессе уживаются большая модель, эмбеддинги, RAG и куча инструментов, 72 ГБ перестают выглядеть избыточно.

  • Во‑вторых, тяжелый 3D и виртуальный продакшн. Большие сцены в Unreal или Blender, пачки ассетов, нейроденойзеры, генеративные текстуры — все это требует так много ресурсов, что 24–32 ГБ VRAM может оказаться недостаточно. 

  • В‑третьих, инженерные задачи и научные симуляции. CFD, FEA, топологическая оптимизация — везде, где нужно держать в памяти сетки, матрицы и результаты итераций, плюс иногда еще и ML‑надстройку сверху, RTX PRO 5000 приде��ся очень кстати. Карточка сработает как универсальный ускоритель: и численку посчитать, и модель обучить, и результат визуализировать.

И главное — все это в форм‑факторе обычной рабочей станции с TDP 300 Вт. На минуточку, это даже меньше, чем у RTX 5090. То есть для этой видеокарты не нужно городить отдельный серверный шкаф и шаманить с питанием. Просто ставишь карточку в нормальный корпус и получаешь настольный мини‑кластер, который не упирается в память на каждом шагу.

Цена и альтернативы RTX PRO 5000

Самый неприятный момент в этой истории — ценник. Поскольку RTX PRO 5000 на 72 ГБ официально относится к профессиональной линейке, это непременно отразится на прайсе, который скорее всего окажется где-то в районе 700 тысяч рублей.

Да, дорого. Но не надо забывать, что в цену входит не только железка, но и сертифицированные драйверы для профессионального софта, ECC-память и приоритетная техподдержка. Так что доплата должна окупить себя достаточно быстро.

А, что касается альтернатив, то их, по сути, всего две:

  • GeForce RTX 5090. Максимум FPS и приличная ИИ‑производительность за свои деньги, но всего 32 ГБ VRAM и без ECC. Отличный вариант, если ИИ для вас скорее побочное направление, а не основная работа. Как только в дело вступают большие модели, длинные контексты и несколько нейросетей одновременно, именно объем памяти становится главным ограничением.​ Цена – около 300 тысяч рублей.

  • RTX 6000 Ada 48 ГБ. Профессиональная линейка, сертифицированные драйверы, 48 ГБ GDDR6, но архитектура прошлого поколения и меньше VRAM. Для классического 3D, CAD и инженерки этого часто достаточно, но под тяжелые LLM и агентные пайплайны 48 ГБ уже выглядят тесновато на фоне 72 ГБ GDDR7.​ Цена – 700 тысяч рублей.

На этом фоне RTX PRO 5000 72 ГБ занимает довольно понятное место: если вам важны именно LLM, локальный ИИ‑стек и тяжелые сцены, а не максимальный FPS в играх, она дает больше свободы по памяти и по ИИ‑нагрузкам, чем RTX 5090 и RTX 6000 Ada, и при этом не уезжает в ценник и форм‑фактор серверных GPU.