Сдвиг 2025 2026. Забавное наблюдение с моих консультаций: Во второй половине 25го года ко мне стал

Написано

Сдвиг 2025 → 2026. Забавное наблюдение с моих консультаций:

Во второй половине 25го года ко мне стали часто приходить компании с просьбой поревьюить их AI системы.

И почти всегда консультация шла по следующему сценарию:

1. Рассказывают/показывают свой сложный комбайн:
— Кастомный процессинг pdf в текст
— sparse/dence индексация
— RAG на эмбеддингах + bm25
— Всякие HyDE, context enrichment, query expansion, etc
— Каскад из вызовов LLM
— Какой-то хитрый трюк для извлечения референсов
— Опционально fuzzy мэтчинг референсов в изначальной PDF-ке для хайлайта (чтобы human-in-the-loop мог проверить)

2. Как один из советов я стабильно предлагаю попробовать Gemini Flash/Pro, которые нативно работает с PDF’ками, еще и умеют bounding boxes отдавать. В связке с правильно прописанной схемой Structured Output, весь пайплайн схлопывается в один-два запроса.

3. В 50% случаев в течение пары недель мне прилетает благодарность за кардинальное упрощение системы. Или повышение качества. Или и то и то.

Еще в ~30% – оказывается, что в проде использовать не получилось, но получили крутой внутренний baseline, об который тестируют прод систему. Еще в паре случаев рассказывают, что когда заказчик увидел разницу в качестве результата или стоимости/скорости дальнейшей разработки, требование на локальные модели – исчезало 🙂

———

Так вот, я все чаще замечаю, что в 2026 у меня тоже появился универсальный совет/вопрос, который я задаю почти всем, прежде чем перейти к более специфичным:

А вы пробовали тупо взять Claude Code, добавить туда все релевантные файлы, написать Skill как с ними работать, послать в него типичный user input вашей системы и посмотреть, что получится?

Часто можно не городить свою AI систему, а тупо взять готовую, подсунуть нужные данные, и в некоторых случаях обернуть в веб-интерфейс, от которого не будут плеваться пользователи.

Это часто не только наиболее дешевое решение с т.з. разработки, поддержки и инференса, но и более точное за счет отточенного агентского цикла

Пользуйтесь:)

———

P.s. в связи с этим закрадываются мысли, что профессия AI engineer может законсервироваться, так и не сформировавшись. Сейчас поясню.

Ну вот, например, есть всего пара десятков известных бд и кучка инженеров, которые ими занимаются, а остальные просто их используют.

Так и небольшое количество инженеров будут создавать десяток популярных LLM агентов, а остальные просто будут интегрировать их в свои продукты, а не костылить самостоятельно.

Вы же не пишите свои бд, верно?

Ваш, @ai_grably

Сдвиг 2025 2026. Забавное наблюдение с моих консультаций: Во второй половине 25го года ко мне стал

Комментарии

Добавить комментарий Отменить ответ

Больше записей

OpenAI убивают лимиты Codex Раньше в Codex были часовые и недельные лимиты на запросы. Теперь OpenA

Telegram разрешил ботам создавать ботов что это значит для OpenClaw Telegram выпустил крупнейшее о

Создаём дизайн как у Apple за один файл гений дропнул файл для обучения ИИ на основе дизайнов 30 то

Эволюция интерфейсов взаимодействия с AI-инструментами. К чему всё идёт Сперва был чат. Тот, которы