⚡️ ARC-AGI-3 вышел
Запустили новый бенчмарк ARC-AGI-3, который проверяет, может ли ИИ сам понимать задачи и учиться на лету.
Результаты:
🟡 Gemini 3.1 Pro — 0.37%
🟡 GPT-5.4 — 0.26%
🟡 Claude Opus 4.6 — 0.25%
🟡 Grok-4.20 — 0%
Посмотреть:
ARC-AGI-3 leaderboard

Добавить комментарий