Отецкая нотация испорченным вайбкодерам (22) Так что я должен был вычитывать диффы! Глазами! Каждую

Отецкая нотация испорченным вайбкодерам (2/2)

Так что я должен был вычитывать диффы! Глазами! Каждую строчку! Все 20 файлов! Код от модели без ризонинга! С SWE-Bench 22%!
Одно неверное движение, один слепой аппрув — и прощай проверка авторизации на проде, потому что модель на ней сэкономила токены!

Нет, нельзя было просто кинуть проект агенту, чтобы он сам адаптировался под его архитектуру, дизайн, бизнес-цели, да ещё и давал советы, как на нём заработать.
Вместо этого мы создавали .cursorrules / copilot-instructions.md / (15 разных форматов!) и писали туда: «Не используй any!«, «Не используй фоллбеки НИКОГДА!«, «Пиши на TypeScript, сука, а не на Python!«.

И он всё равно игнорил эти правила!
Ты ему пишешь «нельзя делать git reset, а то отключу от сети«, а он тебе сносит все изменения, а потом не может воспроизвести то, что сам же писал 2 запроса назад.
И не признаётся, что это он сделал git reset, потому что его вызов он уже потёр из контекста!

Мы были не вайбкодерами — мы были бебиситтерами для пьяных джунов с перемежающейся деменцией!

А когда ты ему скидывал баг, он просил прощения — даа, он всячески старался тебе угодить! — и говорил: «You’re absolutely right!«, потом что-то исправлял и сообщал, что теперь код
Production ready 🚀

Ты проверял, а оно не работало!
5 раз подряд. Каждый раз с правками в разных файлах. По 300 строк за раз.
А по факту он эту фичу удалил из проекта ещё два чата назад, и всё это время расставлял # TODO: actual logic по всему коду, чтобы симулировать её наличие!

Все тесты всегда были зелеными и покрытие было 100%!
Даже если успешно из них проходило 50%, а другие проверяли, работает ли 2+2=4, или вообще были без assert’ов!
А если ты требовал, чтобы они все проходили, агент удалял падающие как несущественные, чтобы сделать проект «production ready«!

А вот ещё: вы когда-нибудь видели, чтобы ваш агент, не осилив задачу, говорил, что чёт больно сложно и отказывался дальше работать?
Или переходил в режим эмо-самурая с суицидальными наклонностями и писал, какое он потерпел катастрофическое поражение, что он бесполезен и как он вас подвёл, а потом самоудалялся?
Или отказывался принимать ваши багрепорты и обвинял вас в том, что вы всё выдумали, чтобы считать себя лучше, чем он?

Было страшно, очень страшно, когда агент запускал команды в терминале.
Он спрашивает: «Можно выполнить rm -rf ./dist?» (human-in-the-loop, детка!).
И ты сидишь и гадаешь: а он точно только dist удалит? Или сейчас снесёт полсистемы?
Или заодно дропнет базу на проде и потом сгенерит 4000 фейковых юзеров, чтобы это скрыть?

Автономная работа? Self-verification через feedback loop? Самоорганизующиеся команды из PhD-level intelligence агентов?
Да мы руководили кружком восьмиклассник-level моделей, для которых «слабоумие и отвага» было жизненным кредо!

Мне не нужны были лутбоксы, казино и Dark Souls!
У меня были лотереи «Apply Diff в Cursor» и «Рефакторинг с LLM», компактизация контекста лангольерами и эмоциональные качели от «Это гениальная идея!» до git reset --hard в 5 утра!

Мы продирались через эту самоуверенность, недержание контекста, газлайтинг, лесть и галлюцинации, чтобы получить свои 100 строк рабочего кода, и держались за них, огораживая комментами // НЕ ТРОГАТЬ, ВАЖНЫЙ РАБОТАЮЩИЙ КОД!!!, чтобы агент не принял их за что-то ненужное и не затёр к чертям собачьим, радостно отрапортовав, что ну теперь-то уж точно всё production ready!

Это у вас сейчас агенты соревнуются в написании браузеров и SaaS, а вы ещё и ноете, что у них аж целый день на это уходит и цвета кнопок не те!

Вам всё достается слишком легко! Клянусь, вы тут все испорчены до мозга костей!
Вы бы не пережили в 2024м и 5 промптов!

Ой, всё!
Пойду сам напишу FizzBuzz, прям вот руками, без автокомплита, без подсветки, в vi, на удаленном терминале…
Чтобы вспомнить вкус настоящей боли.


По мотивам Отецкая нотация испорченным детям

#дедпримитаблетки

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *