Глава Microsoft AI Мустафа Сулейман заявил Bloomberg, что компания намерена выпустить передовые модели во всех модальностях — текст, изображения и аудио — к 2027 году. На текущий момент созданная им команда суперинтеллекта, представила первые три модели: MAI-Transcribe-1 для транскрипции речи, MAI-Voice-1 для генерации голоса и MAI-Image-2 для создания изображений. Все они уже доступны через Microsoft Foundry и новую площадку MAI Playground.

Главный козырь релиза — транскрипция. MAI-Transcribe-1 показала средний уровень ошибок (Word Error Rate) в 3,8% на бенчмарке FLEURS по 25 самым используемым языкам. По данным Microsoft, модель обходит Whisper-large-v3 от OpenAI на всех 25 языках, а Gemini 3.1 Flash от Google — на 22 из 25. При этом команда подчеркивает, что добилась результата малыми силами: узкая специализация, меньше обучающих данных и меньше GPU, чем у конкурентов.

Еще год назад Сулейман открыто называл стратегию Microsoft off-frontier — то есть сознательное отставание от OpenAI на три-шесть месяцев ради экономии. Теперь риторика изменилась радикально. «Мы абсолютно точно будем выпускать передовые модели во всех модальностях, — сказал он. — Наша миссия — обеспечить, чтобы Microsoft в любой момент мог получить лучший результат по лучшей эффективности, по самой низкой цене и был полностью независимым».

Для этого компания наращивает вычислительную базу. С октября Microsoft использует кластер чипов NVIDIA GB200, а в ближайшие 12–18 месяцев планирует выйти на frontier-уровень вычислительных мощностей. Сатья Наделла лично прилетел на выездное собрание команды суперинтеллекта в Майами, чтобы обсудить дорожную карту на ближайшие годы.

Заявление прозвучало на фоне худшего квартала Microsoft с 2008 года — инвесторы все настойчивее требуют доказательств, что сотни миллиардов долларов, вложенных в ИИ-инфраструктуру, окупятся. Собственные модели, оптимизированные под конкретные задачи и снижающие себестоимость, — первый ответ Сулеймана на это давление. А для OpenAI, чей крупнейший партнер теперь открыто строит конкурирующую лабораторию, расклад становится все менее комфортным.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.