
Компания Meta* представила четыре новых поколения специализированных чипов для искусственного интеллекта - MTIA 300, 400, 450 и 500, - разработанных для того, чтобы сделать эксплуатацию ИИ на своих платформах более экономичной.
Эти чипы разрабатываются в партнерстве с Broadcom и призваны сделать ИИ более экономически эффективными для миллиардов пользователей платформы. Meta* заявляет, что цикл разработки каждого поколения чипов составляет примерно шесть месяцев. При переходе от MTIA 300 к MTIA 500 пропускная способность памяти (HBM) увеличивается в 4,5 раза, а вычислительная мощность возрастает в 25 раз.
Согласно Meta*, MTIA 300 оптимизирован для моделей ранжирования и рекомендаций (R&R) и уже находится в производстве . MTIA 400 - это первое поколение, которое, по словам компании, может конкурировать с ведущими коммерческими продуктами по производительности. Стойка из 72 чипов образует единый масштабируемый домен. MTIA 400 прошел лабораторные испытания и в настоящее время внедряется в центры обработки данных.
MTIA 450 и 500 нацелены на вывод результатов генеративного ИИ
MTIA 450 и 500 специально оптимизированы для вывода генеративного ИИ. По данным Meta*, MTIA 450 вдвое увеличивает пропускную способность HBM по сравнению с MTIA 400, превосходя существующие коммерческие продукты. Чипы поддерживают форматы данных с низкой точностью, такие как MX4 и MX8, что снижает вычислительную мощность, необходимую для вывода, без существенного ухудшения качества модели. MTIA 500 добавляет еще 50 процентов пропускной способности HBM и до 80 процентов большей емкости HBM. Серийное производство обоих чипов запланировано на 2027 год.
Метрическая система | MTIA 300 | MTIA 400 | MTIA 450 | MTIA 500 |
|---|---|---|---|---|
Фокусировка рабочей нагрузки | Обучение R&R | Общий | Вывод GenAI | Вывод GenAI |
Модуль TDP | 800 Вт | 1200 Вт | 1400 Вт | 1700 Вт |
Полоса пропускания HBM | 6,1 ТБ/с | 9,2 ТБ/с | 18,4 ТБ/с | 27,6 ТБ/с |
Емкость HBM | 216 ГБ | 288 ГБ | 288 ГБ | 384-512 ГБ |
Производительность MX4 | - | 12 PFLOPs | 21 PFLOPs | 30 PFLOPs |
Производительность FP8/MX8 | 1,2 PFLOPs | 6 PFLOPs | 7 PFLOPs | 10 PFLOPs |
Производительность BF16 | 0,6 PFLOPs | 3 PFLOPs | 3,5 PFLOPs | 5 PFLOPs |
Увеличение размера домена | 16 | 72 | 72 | 72 |
Масштабируемая сеть(однонаправленная полоса пропускания*) | 1 ТБ/с | 1,2 ТБ/с | 1,2 ТБ/с | 1,2 ТБ/с |
Масштабируемая сеть(однонаправленная полоса пропускания*) | 200 ГБ/с** | 100 ГБ/с | 100 ГБ/с | 100 ГБ/с |
Что касается программного обеспечения, Meta* разработала чипы на основе отраслевых стандартов, таких как PyTorch, vLLM и Triton. Разработчики могут портировать существующие модели на MTIA без специальных адаптаций и запускать их одновременно на графических процессорах и MTIA. Более подробная техническая информация доступна в блоге Meta*.
Компания Meta* также продолжает сотрудничать с AMD и Nvidia в области графических процессоров. В начале февраля 2026 года Meta объявила о сделке с AMD на миллиард долларов, предусматривающей предоставление до шести гигаватт вычислительной мощности графических процессоров AMD Instinct для рабочих нагрузок Meta в области искусственного интеллекта.
Meta* - деятельность организации запрещена на территории РФ.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
