🏴☠️ Секрет успеха опенсорса: Anthropic поймала DeepSeek, Moonshot и MiniMax на дистилляции Claude
Anthropic заблокировала 24000 аккаунтов, через которые китайские разработчики спарсили свыше 16 млн ответов для обучения собственных моделей.
— Обходили региональные блокировки через пулы динамических прокси: при бане одного аккаунта автоматически поднимался новый.
— Массово форсировали Chain-of-Thought: просили Claude писать подробные рассуждения для сбора качественной синтетики под RL.
— DeepSeek (150к+ запросов): использовали Claude как reward-модель и собирали ответы на политические темы для тюнинга собственных safety-фильтров.
— Moonshot (3,4 млн+ запросов): парсили данные под агентную логику, кодинг, вижн и computer-use.
— MiniMax (13 млн+ запросов): выкачивали датасеты под агентный кодинг и tool use.
Для защиты Anthropic внедрила поведенческие фингерпринты на уровне API.
Схема явно работает по всему рынку: весьма вероятно, что китайские GLM точно так же втихую дистиллируются на мощностях Gemini.

Добавить комментарий