⚡️ Вышла GLM-5V-Turbo
Z.ai выпустили мультимодальную модель для визуального программирования GLM-5V-Turbo. Она анализирует скриншоты, макеты дизайна, структуру документов и видео, превращая их в рабочий код.
— Глубоко интегрирована с ИИ-агентами Claude Code и OpenClaw для выполнения многошаговых задач разработки.
— Базируется на новом визуальном энкодере CogViT с точным пространственным восприятием и оптимизированной MTP-структурой для быстрого инференса.
— Обучена методом RL одновременно на 30+ типах задач, включая STEM, видеоанализ и навигацию по интерфейсам.
— Задействует синтетические PRM-данные для снижения галлюцинаций при управлении графическими оболочками.
— Лидирует в тестах навигации AndroidWorld и WebVoyager. При этом добавление зрения не снижает качество текстового кодинга (подтверждено на CC-Bench-V2).
— Поддерживает мультимодальный поиск, генерацию графики и чтение веб-страниц напрямую из коробки.
Попробовать бесплатно можно здесь: клик.


Добавить комментарий