Представлены модели TranslateGemma Google DeepMind выпустила семейство открытых моделей для перевод

✴️ Представлены модели TranslateGemma

Google DeepMind выпустила семейство открытых моделей для перевода TranslateGemma. Они построены на архитектуре Gemma 3 и официально поддерживают 55 языков.

— Доступны три размера: 4B (для мобильных устройств), 12B (для потребительских ноутбуков) и 27B (для работы на GPU H100/TPU).
— Обучение проходило методом дистилляции знаний из Gemini с использованием SFT и Reinforcement Learning.
— Версия 12B превосходит базовую Gemma 3 27B по метрикам качества (MetricX на WMT24++).
— Сохранены мультимодальные функции: модель способна переводить текст, распознанный на изображениях.
— Экспериментально поддерживается около 500 дополнительных языковых пар.

Веса моделей уже выложены на Hugging Face и Kaggle.

@ThePerceptronChannel

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *