
Asus выпустила топовую версию компактного Ascent GX10 (150 × 150 × 51 мм). Девайс «тянет» большие языковые модели локально. В Китае такую конфигурацию с 128 ГБ памяти и 4 ТБ SSD оценили в 36 999 юаней (примерно $5 500). Машинка недешевая, конечно, но это все-таки настольная ИИ-станция на базе NVIDIA GB10 Grace Blackwell.

Что внутри
В основе — суперчип NVIDIA GB10 Grace Blackwell:
20-ядерный Arm-процессор Grace;
интегрированная графика Blackwell с тензорными ядрами пятого поколения и поддержкой FP4-вычислений;
128 ГБ унифицированной LPDDR5X-памяти (общая и когерентная для процессора и графики).
Связь между частями чипа идет через NVLink-C2C — это дает в разы большую пропускную способность, чем обычный PCIe. Заявленная производительность в ИИ-задачах — до 1 петафлопса (FP4). Этого хватает, чтобы комфортно работать с моделями на 200+ млрд параметров.
Накопитель — до 4 ТБ NVMe PCIe 5.0 SSD. Охлаждение — несколько тепловых трубок + два крупных вентилятора с точным управлением. Система остается относительно тихой даже под нагрузкой и эффективнее многих аналогов в таком форм-факторе.
Для чего это
Это часть экосистемы NVIDIA DGX Spark — компактные решения, которые легко масштабировать и при необходимости переносить задачи в облако или дата-центр.
Главный сценарий — локальная работа с большими моделями. Здесь можно дообучать модели, запускать генерацию ответов и автономных агентов, проводить эксперименты с приватными данными и прототипировать новые решения, не тратя постоянно деньги на токены.
Поставляется это чудо техники с предустановленной Ubuntu на основе DGX OS и полным набором инструментов от NVIDIA. Сразу доступны PyTorch, TensorFlow, среда Jupyter для экспериментов, Ollama для удобного запуска моделей, TensorRT для ускоренной генерации ответов, а также готовые примеры решений и сценариев от NVIDIA.
Если одной машины мало — можно соединить две Ascent GX10 через высокоскоростной NVIDIA ConnectX-7. В таком тандеме уже реально работать с моделями вроде Llama 3.1 405B. Плюс есть обычный 10-гигабитный Ethernet и Wi-Fi 7.

Каталог готовых ИИ-моделей
Сервис для запуска и управления LLM в облаке Selectel. Выберите модель, конфигурацию и получите готовый эндпоинт для работы с ней.
Цена
В США базовые версии стартуют от ~$4 000, в Китае топовая конфигурация с максимальной памятью и накопителем стоит ближе к $5 500. Устройство позиционируют как персональный ИИ-суперкомпьютер для разработчиков, исследователей и всех, кому нужно держать большие модели под рукой.
