Meta* представила четыре поколения чипов для искусственного интеллекта, призванных снизить затраты на обработку данных / Хабр

Компания Meta* представила четыре новых поколения специализированных чипов для искусственного интеллекта - MTIA 300, 400, 450 и 500, - разработанных для того, чтобы сделать эксплуатацию ИИ на своих платформах более экономичной.

Эти чипы разрабатываются в партнерстве с Broadcom и призваны сделать ИИ более экономически эффективными для миллиардов пользователей платформы. Meta* заявляет, что цикл разработки каждого поколения чипов составляет примерно шесть месяцев. При переходе от MTIA 300 к MTIA 500 пропускная способность памяти (HBM) увеличивается в 4,5 раза, а вычислительная мощность возрастает в 25 раз.

Согласно Meta*, MTIA 300 оптимизирован для моделей ранжирования и рекомендаций (R&R) и уже находится в производстве . MTIA 400 - это первое поколение, которое, по словам компании, может конкурировать с ведущими коммерческими продуктами по производительности. Стойка из 72 чипов образует единый масштабируемый домен. MTIA 400 прошел лабораторные испытания и в настоящее время внедряется в центры обработки данных.

MTIA 450 и 500 нацелены на вывод результатов генеративного ИИ

MTIA 450 и 500 специально оптимизированы для вывода генеративного ИИ. По данным Meta*, MTIA 450 вдвое увеличивает пропускную способность HBM по сравнению с MTIA 400, превосходя существующие коммерческие продукты. Чипы поддерживают форматы данных с низкой точностью, такие как MX4 и MX8, что снижает вычислительную мощность, необходимую для вывода, без существенного ухудшения качества модели. MTIA 500 добавляет еще 50 процентов пропускной способности HBM и до 80 процентов большей емкости HBM. Серийное производство обоих чипов запланировано на 2027 год.

Метрическая система	MTIA 300	MTIA 400	MTIA 450	MTIA 500
Фокусировка рабочей нагрузки	Обучение R&R	Общий	Вывод GenAI	Вывод GenAI
Модуль TDP	800 Вт	1200 Вт	1400 Вт	1700 Вт
Полоса пропускания HBM	6,1 ТБ/с	9,2 ТБ/с	18,4 ТБ/с	27,6 ТБ/с
Емкость HBM	216 ГБ	288 ГБ	288 ГБ	384-512 ГБ
Производительность MX4	-	12 PFLOPs	21 PFLOPs	30 PFLOPs
Производительность FP8/MX8	1,2 PFLOPs	6 PFLOPs	7 PFLOPs	10 PFLOPs
Производительность BF16	0,6 PFLOPs	3 PFLOPs	3,5 PFLOPs	5 PFLOPs
Увеличение размера домена	16	72	72	72
Масштабируемая сеть(однонаправленная полоса пропускания*)	1 ТБ/с	1,2 ТБ/с	1,2 ТБ/с	1,2 ТБ/с
Масштабируемая сеть(однонаправленная полоса пропускания*)	200 ГБ/с**	100 ГБ/с	100 ГБ/с	100 ГБ/с

Что касается программного обеспечения, Meta* разработала чипы на основе отраслевых стандартов, таких как PyTorch, vLLM и Triton. Разработчики могут портировать существующие модели на MTIA без специальных адаптаций и запускать их одновременно на графических процессорах и MTIA. Более подробная техническая информация доступна в блоге Meta*.

Компания Meta* также продолжает сотрудничать с AMD и Nvidia в области графических процессоров. В начале февраля 2026 года Meta объявила о сделке с AMD на миллиард долларов, предусматривающей предоставление до шести гигаватт вычислительной мощности графических процессоров AMD Instinct для рабочих нагрузок Meta в области искусственного интеллекта.

_{Meta* - деятельность организации запрещена на территории РФ.}

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник

Meta* представила четыре поколения чипов для искусственного интеллекта, призванных снизить затраты на обработку данных

MTIA 450 и 500 нацелены на вывод результатов генеративного ИИ

Другие новости

Информация