Asus выпустила топовую версию компактного Ascent GX10 (150 × 150 × 51 мм). Девайс «тянет» большие языковые модели локально. В Китае такую конфигурацию с 128 ГБ памяти и 4 ТБ SSD оценили в 36 999 юаней (примерно $5 500). Машинка недешевая, конечно, но это все-таки настольная ИИ-станция на базе NVIDIA GB10 Grace Blackwell.

Мини-ПК ASUS Ascent GX10.
ASUS Ascent GX10 AI. Источник.

Что внутри

В основе — суперчип NVIDIA GB10 Grace Blackwell:

  • 20-ядерный Arm-процессор Grace;

  • интегрированная графика Blackwell с тензорными ядрами пятого поколения и поддержкой FP4-вычислений;

  • 128 ГБ унифицированной LPDDR5X-памяти (общая и когерентная для процессора и графики).

Связь между частями чипа идет через NVLink-C2C — это дает в разы большую пропускную способность, чем обычный PCIe. Заявленная производительность в ИИ-задачах — до 1 петафлопса (FP4). Этого хватает, чтобы комфортно работать с моделями на 200+ млрд параметров.

Накопитель — до 4 ТБ NVMe PCIe 5.0 SSD. Охлаждение — несколько тепловых трубок + два крупных вентилятора с точным управлением. Система остается относительно тихой даже под нагрузкой и эффективнее многих аналогов в таком форм-факторе.

Для чего это

Это часть экосистемы NVIDIA DGX Spark — компактные решения, которые легко масштабировать и при необходимости переносить задачи в облако или дата-центр.

Главный сценарий — локальная работа с большими моделями. Здесь можно дообучать модели, запускать генерацию ответов и автономных агентов, проводить эксперименты с приватными данными и прототипировать новые решения, не тратя постоянно деньги на токены.

Поставляется это чудо техники с предустановленной Ubuntu на основе DGX OS и полным набором инструментов от NVIDIA. Сразу доступны PyTorch, TensorFlow, среда Jupyter для экспериментов, Ollama для удобного запуска моделей, TensorRT для ускоренной генерации ответов, а также готовые примеры решений и сценариев от NVIDIA.

Если одной машины мало — можно соединить две Ascent GX10 через высокоскоростной NVIDIA ConnectX-7. В таком тандеме уже реально работать с моделями вроде Llama 3.1 405B. Плюс есть обычный 10-гигабитный Ethernet и Wi-Fi 7.

Каталог готовых ИИ-моделей

Сервис для запуска и управления LLM в облаке Selectel. Выберите модель, конфигурацию и получите готовый эндпоинт для работы с ней.

Подробнее →

Цена

В США базовые версии стартуют от ~$4 000, в Китае топовая конфигурация с максимальной памятью и накопителем стоит ближе к $5 500. Устройство позиционируют как персональный ИИ-суперкомпьютер для разработчиков, исследователей и всех, кому нужно держать большие модели под рукой.