Бенчмарки. Краткая сводка статьи: Вышла Claude Opus 4.7 главное улучшение в сложном кодинге, тепер

Написано

Бенчмарки. Краткая сводка статьи: Вышла Claude Opus 4.7 — главное улучшение в сложном кодинге, теперь можно доверять самые трудные задачи без присмотра. Что нового: — Лучше следует инструкциям (старые промпты могут давать неожиданный результат — надо перенастраивать)…По бенчмаркам у Opus 4.7 прирост в кодинге просто огромный — 11% на SWE-Bench Pro это ого-го. У GPT новые модельки прибавляют десятые доли процента, а тут сразу 11! Уже купил Claude Max 20x — буду тестить, очень-очень интересно

При этом Claude всё упорнее забывает обо всём, кроме кодинга. Думаю, скоро их модели по стилю общения будут всё ближе к GPT — видимо, это неизбежно 🙂‍↕️

Бенчмарки. Краткая сводка статьи: Вышла Claude Opus 4.7 главное улучшение в сложном кодинге, тепер

Комментарии

Добавить комментарий Отменить ответ

Больше записей

Универы РФ открыли второй фронт против VPN:

Пивное пузо миф, заявили эндокринологи. Врачи непоколебимы: пенное не вызывает никаких гормональных

Что новенького в Mastra и чем это вам может быть полезно если вы пилите агентов + анонс стрима. В и

Не опять, а снова обновы у Антропик, в этот раз Claude Design Я посмотрел: слева чат, справа канв