Google наделила Gemini 3 Flash агентным зрением Google представила Agentic Vision для Gemini 3 Flas

✴️ Google наделила Gemini 3 Flash агентным зрением

Google представила Agentic Vision для Gemini 3 Flash. Теперь ИИ не просто пассивно смотрит на статичное изображение, а проводит активное расследование, используя написание кода как инструмент восприятия.

— Модель пишет и исполняет Python-скрипты, чтобы взаимодействовать с картинкой.
— Умеет самостоятельно приближать мелкие детали, обрезать нужные участки и накладывать визуальную разметку, чтобы избежать ошибок при подсчете объектов.
— При работе с графиками и таблицами модель считывает визуальные данные, переводит их в код и строит точные диаграммы, вместо того чтобы галлюцинировать с цифрами.

Функция уже доступна разработчикам в Google AI Studio и через API, а также начинает появляться в Gemini App в режиме Thinking.

@ThePerceptronChannel

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *