Бенчмарки. Краткая сводка статьи: Вышла Claude Opus 4.7 — главное улучшение в сложном кодинге, теперь можно доверять самые трудные задачи без присмотра. Что нового: — Лучше следует инструкциям (старые промпты могут давать неожиданный результат — надо перенастраивать)…По бенчмаркам у Opus 4.7 прирост в кодинге просто огромный — 11% на SWE-Bench Pro это ого-го. У GPT новые модельки прибавляют десятые доли процента, а тут сразу 11! Уже купил Claude Max 20x — буду тестить, очень-очень интересно
При этом Claude всё упорнее забывает обо всём, кроме кодинга. Думаю, скоро их модели по стилю общения будут всё ближе к GPT — видимо, это неизбежно 🙂↕️
Добавить комментарий