В Opus 4.7 расход токенов умножается на 1.35х?
Хороший скриншот мне прислал подписчик!
Разбираемся, что тут в интернетах понанаписали. Берем прямо оригинал статьи: https://www.anthropic.com/news/claude-opus-4-7
И читаем:
The tradeoff is that the same input can map to more tokens—roughly 1.0–1.35× depending on the content type.
Перевод:
Компромисс заключается в том, что один и тот же ввод может преобразовываться в большее количество токенов — примерно в 1,0–1,35 раза, в зависимости от типа контента.
И конечно, если вы не хотите глубоко погружаться в тему, а вы ведь не хотите. То вы это переведете так:
Но новый токенизатор – один и тот же вход теперь может превращаться в 1.0–1.35x больше токенов в зависимости от типа контента.
А читатели делают выводы, что Антропик — делают все, что бы сдоить как можно больше денег с наивных пользователей. Алчные и бездушные заокеанские капиталисты.
Но вот вопрос, если задача достаточно сложная: кто потратит больше токенов — 4.6 с переделками или 4.7 с одного раза?
Короткий ответ: почти всегда 4.7 выходит дешевле, даже с учётом нового токенизатора и более глубокого «размышления». Экономия — от 8% на простых задачах до 55–77% в рабочих сценариях.
Три силы тянут расход вверх у 4.7:
• Новый токенизатор: тот же ввод → +0–35% токенов
• На высоких уровнях усилий модель думает дольше (больше вывода)
• В Claude Code по умолчанию теперь стоит xhigh
Четыре силы тянут расход вниз:
• Выше доля решений с первой попытки (pass@1) → меньше повторов
• Меньше ошибок при работе с инструментами (Notion: треть от прежнего)
• Меньше зацикливаний (Genspark: 4.6 уходил в цикл на 1 запросе из 18)
• Можно снизить уровень усилий на ступень (Hex: low-4.7 ≈ medium-4.6)
Цифры из реальных внедрений от ранних тестировщиков:
— Box: −30% AI Units, −56% обращений к модели, −50% вызовов инструментов (единственный публичный показатель в денежном выражении)
— Rakuten: втрое больше решённых рабочих задач
— Cursor: 70% против 58% на CursorBench (+12 процентных пунктов)
— Replit: «та же работа — дешевле»
— Anthropic официально: «итоговый эффект благоприятный — расход токенов улучшился на всех уровнях усилий»
Когда 4.6 всё-таки дешевле: только если задача настолько простая, что 4.6 решает её с первой попытки (pass@1 > 85%), вы не настраиваете уровень усилий у 4.7, а содержимое — насыщенный код с максимальной раздувкой токенизатора. Для долгих многошаговых задач с агентами в разработке — 4.7 побеждает почти всегда.
Практический совет: начинайте с high или xhigh; max — только когда замеры показывают реальный прирост качества; для жёсткого контроля бюджета используйте новые лимиты задач (task budgets, открытая бета).

Добавить комментарий