Тем временем, Z.ai выпустили GLM 5.1, которая обошла GPT 5.4 и Opus 4.6 в SWE-Bench Pro (на агентный

Написано

Тем временем, Z.ai выпустили GLM 5.1, которая обошла GPT 5.4 и Opus 4.6 в SWE-Bench Pro (на агентный кодинг)

То что китайцы что-то там обгоняли на SWE-Bench — пофиг, ибо сам бенчмарк был очень посредственным, OpenAI делали про это статью. Но тут обогнали на SWE-Bench Pro, и совсем не могу понять как, ведь бенчмарк этот очень даже показателен

Тут либо GLM 5.1 реально разнос, либо китайцы опять наобучили модель ради хороших бенчмарков. В таком случае больше подобным результатам в SWE-Bench Pro от китайцев верить не будем)) Погнал тестить, кароч 👀

Блог-пост

Тем временем, Z.ai выпустили GLM 5.1, которая обошла GPT 5.4 и Opus 4.6 в SWE-Bench Pro (на агентный

Комментарии

Добавить комментарий Отменить ответ

Больше записей

РКН задали загадку Жака Фреско, на ответ 5 секунд:

Снизились цены на Veo 3.1 Fast Google обновила тарифы на генерацию видео в API: Секунда видео в 7

Владельцы бизнеса, мастхев: мощная платформа для ваших команд, в которой есть ВСЁ. И мессенджер, и п

Облако Mail теперь бустит память вашего телефона сервис запустил кликер, который нужно тапать и пол