Сдвиг 2025 → 2026. Забавное наблюдение с моих консультаций:
Во второй половине 25го года ко мне стали часто приходить компании с просьбой поревьюить их AI системы.
И почти всегда консультация шла по следующему сценарию:
1. Рассказывают/показывают свой сложный комбайн:
— Кастомный процессинг pdf в текст
— sparse/dence индексация
— RAG на эмбеддингах + bm25
— Всякие HyDE, context enrichment, query expansion, etc
— Каскад из вызовов LLM
— Какой-то хитрый трюк для извлечения референсов
— Опционально fuzzy мэтчинг референсов в изначальной PDF-ке для хайлайта (чтобы human-in-the-loop мог проверить)
2. Как один из советов я стабильно предлагаю попробовать Gemini Flash/Pro, которые нативно работает с PDF’ками, еще и умеют bounding boxes отдавать. В связке с правильно прописанной схемой Structured Output, весь пайплайн схлопывается в один-два запроса.
3. В 50% случаев в течение пары недель мне прилетает благодарность за кардинальное упрощение системы. Или повышение качества. Или и то и то.
Еще в ~30% – оказывается, что в проде использовать не получилось, но получили крутой внутренний baseline, об который тестируют прод систему. Еще в паре случаев рассказывают, что когда заказчик увидел разницу в качестве результата или стоимости/скорости дальнейшей разработки, требование на локальные модели – исчезало 🙂
———
Так вот, я все чаще замечаю, что в 2026 у меня тоже появился универсальный совет/вопрос, который я задаю почти всем, прежде чем перейти к более специфичным:
А вы пробовали тупо взять Claude Code, добавить туда все релевантные файлы, написать Skill как с ними работать, послать в него типичный user input вашей системы и посмотреть, что получится?
Часто можно не городить свою AI систему, а тупо взять готовую, подсунуть нужные данные, и в некоторых случаях обернуть в веб-интерфейс, от которого не будут плеваться пользователи.
Это часто не только наиболее дешевое решение с т.з. разработки, поддержки и инференса, но и более точное за счет отточенного агентского цикла
Пользуйтесь:)
———
P.s. в связи с этим закрадываются мысли, что профессия AI engineer может законсервироваться, так и не сформировавшись. Сейчас поясню.
Ну вот, например, есть всего пара десятков известных бд и кучка инженеров, которые ими занимаются, а остальные просто их используют.
Так и небольшое количество инженеров будут создавать десяток популярных LLM агентов, а остальные просто будут интегрировать их в свои продукты, а не костылить самостоятельно.
Вы же не пишите свои бд, верно?
Ваш, @ai_grably
Добавить комментарий