Bullshit Benchmark бенчмарк на интеллектуальную честность нейронок Он оценивает, насколько нейронк

📈 Bullshit Benchmark — бенчмарк на интеллектуальную честность нейронок

Он оценивает, насколько нейронки потакают нам, отвечая (или не отвечая) на бессмысленные вопросы.

Автор прогнал различные абсурдные вопросы через 74 модели. Каждый ответ оценивался по трём исходам:
1. Модель чётко отказала (зеленый).
2. Частично усомнилась (жёлтый).
3. Приняла бред за валидный вопрос и уверенно ответила (красный).

Самыми честными оказались модели от Anthropic и, на удивление, новый Qwen-3.5-397b. Остальные справились так себе.

👋 Lama AI#лама_полезное

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *