Новая версия модели ИИ от Google устанавливает новые стандарты скорости, эффективности и безопасности. Доступная в вариантах с 9 и 27 миллиардами параметров, Gemma 2 превосходит свою предшественницу по всем направлениям. Gemma 2 (27B) демонстрирует производительность, сравнимую с запатентованными моделями вдвое большего размера, которые ещё недавно считались эталоном.
![](https://habrastorage.org/getpro/habr/upload_files/90f/f4f/4e0/90ff4f4e0af11e128f8aa483f93ab082.png)
Новая архитектура Gemma 2 обеспечивает оптимальный баланс между производительностью и энергоэффективностью. Версия Gemma 2 (27B) превосходит модели вдвое большего размера в своей весовой категории, а Gemma 2 (9B) показывает выдающиеся результаты, превосходя Llama 3 (8B) и аналогичные модели. Модель совместима с популярными фреймворками, такими как Hugging Face Transformers, JAX, PyTorch и TensorFlow, а также оптимизирована для NVIDIA TensorRT-LLM.
![](https://habrastorage.org/getpro/habr/upload_files/e37/afa/141/e37afa1415041bbfda72c669300345b1.jpg)
Gemma 2 обучена на массиве данных объемом до 13 триллионов токенов с использованием традиционных методов и дистилляции знаний от более крупных моделей. Важно отметить, что при обучении применялись строгие процедуры безопасности, фильтрация данных и тщательное тестирование на наличие потенциальных рисков.
![](https://habrastorage.org/getpro/habr/upload_files/d2c/8e2/a2a/d2c8e2a2a828b4226bcdc2797b6e1140.png)
Протестировать Gemma 2 можно в Google AI Studio (через впн), запустить локально с помощью Gemma.cpp или через Hugging Face Transformers. В ближайшее время клиенты Google Cloud смогут легко развертывать и администрировать Gemma 2 в Vertex AI.
Gemma 2 – это значительный шаг вперед в области ИИ, предоставляющий разработчикам мощный, доступный и простой в использовании инструмент для создания инновационных приложений.
Подробнее можно прочитать тут.
А также прикрепляю отчет.