⚡️ Завтра выходит ARC-AGI-3 — новый тест на «человеческое мышление» ИИ
Запускают ARC-AGI-3 — новый бенчмарк, который пытается проверить не просто знания модели, а её способность думать как человек.
Главная идея — убрать привычные подсказки и заставить модель самой разбираться в задачах.
Что внутри:
🟡 более 1000 уровней
🟡 150+ окружений
🟡 задачи в формате видеоигр без инструкций
🟡 требуется исследование, планирование и адаптация
На прошлых версиях ARC:
🟡 ARC-AGI-1 → лидер Gemini 3.1 Pro (~98%)
🟡 ARC-AGI-2 → лидер Gemini 3 Deep Think (~84.6%)

Добавить комментарий