в один вечер, лол Opus 4.6 https:www.anthropic.comnewsclaude-opus-4-6 GPT-5.3-codex https:opena

в один вечер, лол 🙂

⚡️ Opus 4.6
https://www.anthropic.com/news/claude-opus-4-6

⚡️ GPT-5.3-codex
https://openai.com/index/introducing-gpt-5-3-codex/

P.S. для контекста — Opus 4.6 проигрывает в SWE Verified Opus 4.5, но побеждает в Terminal Bench с лёгким отрывом (65.4% против 59.8%). В то же время GPT-5.3-codex доминирует и там и там, причем в terminal bench с диким отрывом — 77.3%

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *