В начале года появилась информация о том, что корпорация Microsoft почти закончила разработку собственного чипа, предназначенного для работы в ИИ-отрасли. Проект получил название Athena, а основное его предназначение — обеспечение работы чат-ботов с ИИ.
Саму разработку компания вела с 2019 года, причём тайно (ну почти, ведь иногда допускались почти что случайные утечки информации о проекте). О том, что в итоге получилось, какие у компании планы на чипы плюс какое всё это будет иметь значение для ИИ-отрасли, — под катом.
Они существуют!
В том, что компания решила разработать собственные чипы, особого сюрприза нет. Ведь Microsoft в партнёрстве с другими компаниями создавала чипы для Xbox и Surface, о чём рассказал Рани Боркар, руководитель направления аппаратных систем и инфраструктуры Azure в Microsoft.
Да, ИИ-процессоры от Microsoft вполне реальны, более того, работают. Причём, насколько можно судить, именно так, как задумывалось. Корпорация разработала не один процессор, а два: один — для обучения больших языковых моделей, чтобы не зависеть от поставщиков чипов, второй — для дата-центров, обеспечивающих работу облачных сервисов компании. Что один, что другой чипы предназначаются для удовлетворения как собственных потребностей компании, ЦОД Azure, так и для предоставления корпоративным клиентам.
Чипы называются Azure Maia и Azure Cobalt. Оба базируются на архитектуре ARM и станут более-менее массово использоваться в дата-центрах компании. Насколько можно понять, компания планирует и заработать, поставляя чипы корпоративным клиентам. Вероятно, заработать можно неплохо, судя по успехам Nvidia, которая также поставляет высокопроизводительные чипы для ИИ-сервисов. Графические чипы от Nvidia быстро стали дефицитным товаром, сейчас в рознице цены на них достигают $60 000 США и даже выше.
Сколько будут стоить чипы редмондской корпорации, пока неясно, но понятно, что много. Что касается Azure Maia 100, то эта разработка предназначена для оптимизации работы с большими языковыми моделями, которые являются основой для самых разных ИИ-приложений. Чип изготовлен по 5-нм техпроцессу, он содержит 105 млрд транзисторов, что примерно на 30% меньше, чем у чипа AMD MI300X AI. Он поддерживает первую в компании реализацию восьмибитных типов данных (типов данных MX) для совместного проектирования аппаратного и программного обеспечения.
Maia — первый серверный процессор с жидкостным охлаждением от Microsoft. Он позволит обеспечить более высокую плотность серверов. По словам Microsoft, это не просто оптимизация, компания перерабатывает концепцию всей своей IT-инфраструктуры.
Сейчас корпорация тестирует этот процессор как с поисковой системой Bing и её ИИ-элементами, так и с продуктами Office AI. Кроме того, этот же чип тестирует и компания Open AI, о которой в последнее время пишут очень много. И не в последнюю очередь в связи со взаимодействием Open AI c Microsoft.
Процессор Cobalt 100, как и говорилось выше, предназначен для оптимизации работы облачных сервисов на платформе Azure. Это 128-ядерный чип, построенный на базе дизайна Arm Neoverse CSS и адаптированный для Microsoft. Корпорация планирует массово задействовать этот ARM-чип в своих дата-центрах, что позволит повысить общую производительность плюс снизить энергопотребление.
«Мы много думали не только о том, как добиться высокой производительности, но и об управлении энергопотреблением, — объясняет Боркар. — Мы приняли несколько тщательно продуманных решений в дизайне, которые добавили возможность контролировать производительность и энергопотребление на ядро на каждой отдельной виртуальной машине».
Чип также тестируется в первую очередь в Microsoft Teams и Microsoft SQL Server. В 2024 году корпорация планирует начать продажу доступа к виртуальным машинам на Cobalt корпоративным клиентам. По словам представителей компании, системы на базе нового процессора на 40% производительнее в некоторых задачах, чем системы, которые используются в ЦОД Microsoft на текущий момент.
Кроме работы над самими чипами компания занимается глубокой оптимизацией своего стека облачных серверов для повышения производительности и мощности с одновременным снижением стоимости эксплуатации таких систем. Разработчики компании заявили, что продумали возможность контроля производительности и энергопотребления для каждого из ядер и каждой отдельной виртуальной машины.
Ну процессоры и процессоры, что такого?
Компания работает в ИИ-отрасли не сама, она — часть группы вместе с такими гигантами, как AMD, Arm, Intel, Meta, Nvidia и Qualcomm. Вместе участники пытаются стандартизировать следующее поколение форматов данных для ИИ-моделей. Как и раньше, Microsoft использует в работе Open Compute Project (OCP).
Благодаря новым чипам и системам на их основе компания планирует быстро разворачивать серверы, обеспечивающие работу ИИ-сервисов без необходимости выделять отдельное место в ЦОД по всему миру. Специально для этого оборудования разработана и своя стойка, в которой есть индивидуальный охладитель теплоносителя.
Оборудование на базе Maia уже тестируется в работе с GPT 3.5 Turbo (та же модель, что и в ChatGPT), рабочие нагрузки Bing AI и GitHub Copilot. Все наработки, полученные компанией в ходе тестирования, будут предоставлены и партнёрам вместе с данными о серверном оборудовании, параметрах работы и т. п.
К сожалению, пока что нет данных тестирования в общем доступе — туда поступает только та информация, которую предоставляет корпорация Microsoft. Но уже известно, что прямо сейчас ведётся работа и над вторым поколением чипов.
Если проект с новой IT-инфраструктурой будет двигаться, как и запланировано, то всё это может оказать сильное и продолжительное влияние на будущее технологий искусственного интеллекта. Это подкрепляется и тем, что корпорация очень тесно связана с OpenAI, которая сейчас является одним из лидеров по ИИ-решениям.