Начнем год со стрима по топ решениям с ERC3! В гостях Алексей (топ1) и Илья топ 2 (топ 1 локал) По

Начнем год со стрима по топ решениям с ERC3!

В гостях Алексей (топ1) и Илья топ 2 (топ 1 локал)

Почитать что такое платформа ERC3 можно тут
Отдельное спасибо Ринату за его труды по ее созданию!

Короче, пока все праздновали новый год, я собрал победителей ERC3 на стрим

Лидерборд ERC3

Мы с вами строим агентов в РФ и всех волнует один вопрос: как строить агентов в продакшене когда у тебя нет Opus и половина API заблокирована?

Алексей взял первое место в общем зачете с результатом 71.8% на Opus 4.5 через Anthropic SDK
Архитектура простой ReAct 2022 года 20 тулов в контекст плюс 80 итераций эволюции промпта через трех агентов
Никаких графов, никаких оркестраторов
Просто методичная прокачка промпта под модель которая отлично умеет работать с тулами

Репо: Github

Илья в 2024 году занял первое место в ERC2(RAG), а в ERC3(Agent) первое место в локальном зачете и второе в общем с результатом 62.1% на gpt-oss-120b через Cerebras
Архитектура PlanReAct agent с набором вспомогательных техник
Локальная модель слабее Opus, значит архитектура компенсирует
И главное это локальная модель которую можно поднять на своем железе без зависимости от API

Репо: Github

Трейсы

Я занял третье место в локальном зачете с результатом 46.6% на Qwen3-235B локально на кластере из H100
Потратил три часа на сам таск, остальное время на настройку кластера
Базовый SGR Agent Core без validators и enrichment
Спустя две недели долелал улучшенную версию до 68.3% score

На стриме разберем практические вопросы:

Насколько тяжело было решить задачи?
Что бы сделали по другому?
Сколько реально времени потратили и сколько написали кода сами?
Куда понесете опыт и есть ли реальные продукты где применяете техники?
И главное как строить на локальных моделях в продакшене?
Почему все забывают про eval?

Для рынка РФ критично владеть локальным моделями потому что Opus нет, западные API блочат, риски по безопасности высоки и единственный реальный вариант локальные модели типа Qwen3 и gpt-oss

Приходите на стрим если хотите задать свой вопрос и увидеть живой разбор

Топ-1 общего на Opus через API плюс топ-1 и топ-3 локального на gpt-oss и Qwen

Практические вопросы, конкретные ответы, реальный опыт как строить на локальных и API моделях в продакшене

Дата и время 11.01.2026 в 11:00 по мск, стрим будет на ютуб/тг(запись будет)

Добавляйтесь в календарь чтобы не пропустить

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *