Сегодня на ютубе наткнулся на видео канала Коллектив, в котором профессиональный графолог соотносил

Написано

Сегодня на ютубе наткнулся на видео канала «Коллектив», в котором профессиональный графолог соотносил почерки людей с их личностью. Во время просмотра мне стало любопытно: а как с этой задачей справятся нейросети? Смогут ли нейронки проявить такую же проницательность?

Я решил провести эксперимент. Для этого я сделал скриншот всех образцов письма, показанных в ролике, составил список героев с видео, и загрузил эти данные в флагманские модельки 😎

Промпт я составил так:

Ты — графолог
По почерку с фото определи кто есть кто.
Среди героев есть:
— эмо
— девушка из массажного салона
— автоугонщик
— бывший милиционер
— разведчица
— лудоман
Присвой каждому почерку с фото героя, аргументируй свой выбор.

Вот, если что, верные ответы с видео, по которым сравнивал ответы ИИ с реальностью:

2 — эмо
4 — бывший милиционер
5 — разведчица
1 — лудоман
6 — девушка из массажного салона
3 — автоугонщик

И вот сами результаты теста: сколько почерков смогли верно определить разные ИИ:

• GPT 5.2 Thinking. Верно определил эмо, лудомана и девушку с массажки. Аргументы здравые — почти слово в слово как у графолога из видео. Неплохо! Думал 2 минуты.
• Grok 4.1 Thinking. 0/6, не разгадал ничего
• Gemini 3 Pro. 0/6. Ответы и пояснения почти как у Грока. Разочаровал 🥲
• Gemini 3 Flash Thinking. 1/6, угадал разведчицу, остальное как у 3 про
• Claude 4.5 Sonnet Thinking. 3/6, забрал лудомана, разведчицу и девушку с массажки. Аргументация верная!
• GPT 5.2 Pro. Забавно, но 0/6 👶. Это странно, учитывая крутой ответ версии 5.2 Thinking. Прошка думала по 12-15 минут, и видимо начала заблуждаться, потому и выдала бред…

Конечно, стоит сделать скидку на рандом: они могли тупо угадать. Но я прогонял каждую модельку 2-3 раза и брал среднее — результаты почти не скакали. Gemini 3 Pro лишь однажды попала в точку. GPT 5.2 Thinking и Sonnet стабильно выбивали 2–3 правильных ответа, а у остальных (Grok, Flash и 5.2 Pro) показатели почти не менялись

Вышло интересно: Gemini, которую позиционируют как одну из лучших по вижну, полностью слилась. Победили GPT 5.2 Thinking и 4.5 Sonnet (из тех, кто есть в тесте). Хотелось бы проверить модель Claude 4.5 Opus Thinking, но у меня нет подписки. Если вам интересно, что ответят другие нейронки — закидывайте в них этот запрос, а результаты кидайте в комменты. Почитаем, будет любопытно =D

*прикреплённое фото — с почерками и цифрами, его прикреплял к запросу

Сегодня на ютубе наткнулся на видео канала Коллектив, в котором профессиональный графолог соотносил

Комментарии

Добавить комментарий Отменить ответ

Больше записей

А в чём прикол-то был Объясните

Ищем удалёнку за границей: в Твиттере собрали 11 лучших сайтов с вакансиями во всех сферах от айти

День анимешника отмечаем сегодня именно 11 апреля закрепилось как праздник любителей японских мульт

Убираем все следы ИИ из любого текста! Нашли сервис The AI Text Humanizer, который отредактирует тек