Новые тесты Apple показывают, что её ИИ-модели всё ещё отстают от лидеров рынка / Хабр

Apple опубликовала новые данные о производительности двух своих моделей искусственного интеллекта и открыла доступ к меньшей по размеру системе для сторонних разработчиков. Тесты показывают, что технология LLM от Apple по-прежнему уступает конкурентам.

Apple разработала две модели: компактную версию с 3 миллиардами параметров для использования на устройствах и более крупную серверную модель. По результатам собственных тестов Apple, модель 3B превосходит модели аналогичного размера, такие как Qwen-2.5-3B, и приближается к Qwen-3-4B и Gemma-3-4B. Apple объясняет сокращение разрыва повышением эффективности, но небольшая разница в размерах делает эти заявления менее убедительными.

Человеческие оценки показывают, что модели Apple на устройствах и серверах значительно отстают от GPT-4 от OpenAI — одна из причин партнёрства Apple с ChatGPT

Серверная модель работает наравне с Llama-4-Scout. Хотя Apple не раскрывает количество параметров, она утверждает, что модель по размеру аналогична Meta* Scout, которая содержит 109 миллиардов параметров и 17 миллиардов активных.

Эта серверная модель использует архитектуру «параллельной смеси экспертов» (MoE), которая позволяет нескольким небольшим системам ИИ работать параллельно. Несмотря на это, она не может конкурировать с более крупными моделями, такими как Qwen-3-235B или GPT-4o.

Архитектура параллельной передачи данных Apple позволяет подсетям обрабатывать токены независимо, синхронизируя только каждые четыре уровня, что сокращает коммуникацию на 87,5%

Apple использует агрессивное сжатие для эффективной работы модели устройства на iPhone и iPad, в то время как в серверной модели применяется специализированная технология сжатия графики.

Распознавание изображений: эффективно, но не лидер в этой области

В области распознавания изображений модель Apple конкурирует с InternVL-2.5-4B, Qwen-2.5-VL-3B-Instruct и Gemma-3-4B. По данным Apple, она превосходит InternVL и Qwen, но уступает только Gemma-3-4B. Серверная модель превосходит Qwen-2.5-VL-32B менее чем в половине тестовых случаев и по-прежнему уступает Llama-4-Scout и GPT-4o.

По результатам оценки людьми модели искусственного интеллекта Apple (версии для устройств и серверов) сравниваются с конкурирующими системами в плане понимания изображений

Apple использует разные системы распознавания изображений для каждой модели: серверная модель работает на искусственном интеллекте с 1 миллиардом параметров, а модель для устройств — на версии с 300 миллионами параметров. Обе модели были обучены на более чем десяти миллиардах пар «изображение — текст» и 175 миллионах документов со встроенными изображениями.

Разработчики получают уменьшенную модель

Теперь разработчики имеют доступ к модели с 3 миллиардами параметров через новую платформу Apple Foundation Models Framework. Apple утверждает, что эта модель лучше всего подходит для таких задач, как обобщение, извлечение информации и понимание текста, а не для чат-ботов с открытым кодом. Более мощная серверная модель предназначена для Apple и используется в функциях Apple Intelligence.

Фреймворк предлагает бесплатные функции искусственного интеллекта и интегрирован с языком программирования Apple Swift. Разработчики могут помечать структуры данных для автоматического получения релевантных результатов, а API инструмента позволяет расширять возможности модели.

Чтобы улучшить многоязычную производительность, Apple расширила словарный запас моделей со 100 000 до 150 000 слов. Компания провела тесты с учётом культурных особенностей на 15 языках, чтобы обеспечить корректную реакцию в разных регионах. Данные для обучения получены из «сотен миллиардов страниц», собранных Applebot, веб-сканером Apple.

По данным компании, Applebot соблюдает правила robots.txt и не использует пользовательские данные для обучения. Вопр��с о том, можно ли считать отсутствие отказа согласием на обучение ИИ, остаётся спорным.

Последние тесты Apple подтверждают то, о чём уже подозревали перед конференцией WWDC в этом году: модели искусственного интеллекта компании всё ещё отстают от конкурентов, таких как Google и OpenAI. Результаты ясно показывают, что системы Apple не могут сравниться по техническим характеристикам с лидерами рынка.

Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Источник

Новые тесты Apple показывают, что её ИИ-модели всё ещё отстают от лидеров рынка

Распознавание изображений: эффективно, но не лидер в этой области

Разработчики получают уменьшенную модель

Другие новости

Информация