Как стать автором
Обновить
395.62
BotHub
Агрегатор нейросетей: ChatGPT, Claude, Midjourney

Grok 3 Mini накаляет обстановку, поскольку ценовые войны AI еще больше снижают стоимость моделей

Время на прочтение3 мин
Количество просмотров5.4K

xAI делает рывок в сторону эффективного AI с выпуском Grok 3 Mini, своей новейшей языковой модели. И Grok 3, и его собрат Mini доступны через API xAI. В настоящее время семейство Grok 3 включает шесть вариантов: Grok 3, Grok 3 Fast и четыре версии Grok 3 Mini, доступные в медленном и быстром вариантах, каждый из которых обладает либо низкой, либо высокой способностью к рассуждению.

По данным xAI, Grok 3 Mini был специально разработан для обеспечения скорости и доступности, при этом сохраняя встроенный процесс рассуждений — заметное отличие от более крупного Grok 3, который работает без явных рассуждений.

xAI утверждает, что Grok 3 Mini лидирует в рейтингах по математике, программированию и научным тестам на уровне колледжа, при этом он в пять раз дешевле других моделей рассуждений. Несмотря на меньший размер, xAI утверждает, что он даже превосходит более дорогие флагманские модели в нескольких областях.

Сравнительная таблица: модели ИИ с ценами и показателями производительности в тестах, включая AIME, GPQA, LiveCodeBench и MMLU-Pro.
Grok 3 Mini сочетает в себе высокую производительность в тестах с низкой стоимостью, набрав 93% баллов по математике (AIME 2024) и демонстрируя стабильно высокие результаты в тестах | Изображение: xAI

Давление на ценообразование в сфере ИИ не ослабевает, особенно после недавнего снижения цен Google на Gemini 2.5 Flash. Grok 3 Mini только подогревает обстановку. Одна примечательная особенность: xAI отправляет полный след рассуждений с каждым ответом API. Это призвано дать разработчикам больше прозрачности в поведении модели, хотя, как показывают текущие исследования, эти кажущиеся «мыслительные процессы» иногда могут вводить в заблуждение .

Хотя Grok 3 Mini является новым дополнением к модельному ряду, обе модели — Grok 3 и Mini — теперь доступны разработчикам через API xAI с интеграцией в существующие инструментальные цепочки для упрощения процесса внедрения.

Grok 3 по-прежнему нацелен на сложные задачи, требующие глубоких знаний мира и экспертных знаний в предметной области, а xAI называет его самой мощной моделью, доступной без специального компонента рассуждения.

Команда Artificial Analysis провела сравнительный анализ семейства Grok 3 и выделила Grok 3 Mini Reasoning (high) за его соотношение цена/производительность. Согласно их «Индексу интеллекта в области искусственного анализа», Grok 3 Mini Reasoning (high) фактически превосходит такие модели, как Deepseek R1 и Claude 3.7 Sonne t (бюджет рассуждений 64k) — и все это при сохранении значительного преимущества в стоимости.

С ценой $0,3 за миллион входных токенов и $0,5 за миллион выходных токенов, это почти на порядок ниже таких моделей, как o4-mini от OpenAI или Gemini 2.5 Pro от Google . Для тех, кому нужна большая скорость, доступна более быстрая версия по цене $0,6/$4 за миллион токенов.

Диаграмма рассеяния: модели ИИ, построенные на основе индекса и цены искусственного интеллекта, Grok 3 mini выделен в зеленом оптимальном квадранте.
Grok 3 Mini обеспечивает индекс интеллекта около 67 при низкой стоимости. | Изображение: Искусственный анализ

Результаты здесь сосредоточены на метрике «интеллект», которая объединяет шесть различных тестов. Подробная разбивка для каждого из них уже в пути, хотя — как всегда — результаты тестов не обязательно отражают реальную производительность. Меньшие модели особенно могут выдавать впечатляющие цифры, которые не всегда переносятся на повседневное использование.

Что касается чистой скорости, Grok 3 превосходит своего более ориентированного на рассуждения аналога Mini: на стандартных конечных точках Grok 3 генерирует 500 токенов примерно за 9,5 секунд, тогда как Grok 3 Mini Reasoning занимает 27,4 секунды.

Artificial Analysis помещает Grok 3 и Grok 3 Mini Reasoning (high) в пятерку лучших в своих категориях — без рассуждений и с рассуждениями — и отмечает, что с этими релизами xAI прочно занял место среди лидеров в текущем ландшафте моделей AI.

Источник

Теги:
Хабы:
+2
Комментарии6

Другие новости

Информация

Сайт
bothub.chat
Дата регистрации
Дата основания
Численность
11–30 человек
Местоположение
Россия
Представитель
veseluha