в один вечер, лол 🙂
⚡️ Opus 4.6
https://www.anthropic.com/news/claude-opus-4-6
⚡️ GPT-5.3-codex
https://openai.com/index/introducing-gpt-5-3-codex/
P.S. для контекста — Opus 4.6 проигрывает в SWE Verified Opus 4.5, но побеждает в Terminal Bench с лёгким отрывом (65.4% против 59.8%). В то же время GPT-5.3-codex доминирует и там и там, причем в terminal bench с диким отрывом — 77.3%
Добавить комментарий