Китайская компания Moore Threads на конференции разработчиков MDC 2025 представила Huashan — ИИ-ускоритель для обучения и инференса, который, по заявлениям компании, превзойдёт серию Nvidia Hopper (H100, H200) и приблизится к производительности Blackwell. Чип назван в честь одной из пяти священных гор Китая и должен выйти в массовое производство в 2026 году.

Huashan построен на новой архитектуре Huagang и использует чиплетный дизайн: два вычислительных чиплета и восемь модулей памяти HBM. Компания заявляет, что по пропускной способности памяти чип сопоставим с Nvidia B200, а по объему памяти — превосходит и Hopper, и Blackwell. Ускоритель поддерживает вычисления от FP4 до FP64, а также проприетарные форматы смешанной точности MTFP4, MTFP6 и MTFP8.

Для масштабирования Moore Threads разработала интерконнект MTLink 4.0 с пропускной способностью до 1314 ГБ/с. По словам компании, технология позволит объединять более 100 000 ускорителей в кластеры — до 1024 GPU на ноду. Заявлена совместимость с Ethernet и поддержка технологии SHARP для коллективных операций.

На конференции компания продемонстрировала работу другого чипа — MTT S5000 — на модели DeepSeek R1 с 671 миллиардом параметров. Ускоритель показал 4000 токенов в секунду на этапе Prefill и 1000 токенов в секунду на этапе Decode. Moore Threads утверждает, что это превосходит показатели серии Nvidia Hopper, хотя независимых подтверждений пока нет.

Moore Threads основал в 2020 году Чжан Цзяньчжун — бывший вице-президент Nvidia и глава ее китайского подразделения, проработавший в компании 14 лет. В 2023 году стартап попал под санкции США, но в декабре 2025-го провел IPO на шанхайской бирже, привлек $1,13 млрд и достиг капитализации около $40 млрд. Среди инвесторов — Tencent и ByteDance.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.