Context engineering для enterprise-агентов: почему промпта недостаточно
Большинство агентских проектов ломается не потому, что модель слабая. Они ломаются потому, что система дает модели неправильный контекст: слишком широкий, устаревший, непроверенный или такой, который текущий пользователь вообще не должен видеть.
Поэтому context engineering для меня — это архитектура, а не прием с промптом.
Что такое контекст
В enterprise-агенте контекст — это все, на что модель опирается, когда отвечает или вызывает tool:
- Task context: что пользователь пытается сделать сейчас.
- Business context: правила, политики, продукты, цены, договоры, внутренние определения.
- User context: роль, права, регион, аккаунт, состояние текущего процесса.
- Tool context: какие tools доступны, что они делают и какие side effects создают.
- Memory context: что можно хранить между сессиями, а что нужно забывать.
- Evaluation context: как выглядит правильный ответ или действие в этом workflow.
Если эти слои смешаны, систему сложно отлаживать и легко атаковать.
Production-паттерн
Я предпочитаю скучный и явный паттерн:
- классифицировать намерение пользователя;
- доставать только минимально нужные знания;
- фильтровать данные по правам до того, как их увидит модель;
- добавлять инструкции по tools только когда tool доступен в текущем состоянии;
- разделять краткосрочную и долгосрочную память;
- логировать context package, который реально ушел в модель;
- проверять evals не только по финальному ответу, но и по качеству контекста.
Так система становится наблюдаемой. Когда агент ошибается, можно понять, где причина: retrieval, policy, tool choice, prompt design, model behavior или недостающая продуктовая логика.
Что проверять
В аудитах агентской архитектуры я обычно ищу такие проблемы:
- prompt содержит слишком много постоянных правил;
- RAG возвращает релевантные, но бесполезные для действия документы;
- sensitive context достается до проверки прав;
- descriptions tools написаны слишком общо и провоцируют misuse;
- memory копит неподтвержденные факты;
- никто не считает стоимость и загрязнение context window;
- evals проверяют tone of voice, но не корректность workflow.
Главный вопрос
Не спрашивайте: “как нам написать промпт лучше?”
Спрашивайте:
Какой именно контекст должна получить модель, из какого источника, с какими правами, для какой задачи, и как мы поймем, что это сработало?
Этот вопрос переводит агентские системы из vibe-driven экспериментов в инженерную дисциплину.
Есть похожая AI-задача?
Отправьте короткий бриф, и я предложу минимальный платный следующий шаг: консультацию, аудит, security review или разработку.