
Google выпустила TranslateGemma, новую открытую модель машинного перевода на базе Gemma 3. Внутри используется дообучение на синтетических данных от флагманской Gemini с последующей полировкой через reinforcement learning. Компания продолжает стратегию «тихих» сайд-релизов, выкладывая мощные инструменты без громких презентаций.
Так как основой стала Gemma 3, модель умеет работать с текстом прямо на изображениях. OCR и перевод встроены «из коробки», без внешних пайплайнов и дополнительных модулей. Это делает TranslateGemma удобным инструментом для задач вроде перевода скриншотов, документов и фото с текстом.
Google заявляет гарантированное качество на 55 языках, но также отмечает, что модель видела данные еще по примерно 500 языкам. На практике это означает, что на редких диалектах возможны заметные галлюцинации и ошибки, однако даже такой охват выглядит впечатляюще для открытой модели.
Линейка включает три версии: 4B, 12B и 27B параметров. В официальных бенчмарках Google показывает, что версия на 12B превосходит базовую Gemma 3 на 27B именно в задачах перевода. При этом компания в основном сравнивает новинку с собственными моделями, а не с классическими специализированными решениями вроде NLLB, поэтому реальное положение TranslateGemma на рынке еще предстоит оценить.
Веса уже доступны на Hugging Face и Kaggle. Версия на 12B выглядит как «золотая середина» по соотношению качества и ресурсов, но для максимального уровня перевода старшая модель все равно потребует железо уровня H100.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
