✴️ Представлены модели TranslateGemma
Google DeepMind выпустила семейство открытых моделей для перевода TranslateGemma. Они построены на архитектуре Gemma 3 и официально поддерживают 55 языков.
— Доступны три размера: 4B (для мобильных устройств), 12B (для потребительских ноутбуков) и 27B (для работы на GPU H100/TPU).
— Обучение проходило методом дистилляции знаний из Gemini с использованием SFT и Reinforcement Learning.
— Версия 12B превосходит базовую Gemma 3 27B по метрикам качества (MetricX на WMT24++).
— Сохранены мультимодальные функции: модель способна переводить текст, распознанный на изображениях.
— Экспериментально поддерживается около 500 дополнительных языковых пар.
Веса моделей уже выложены на Hugging Face и Kaggle.


Добавить комментарий