Context engineering для enterprise-агентов: почему промпта недостаточно

2026-05-19·2 min read

Большинство агентских проектов ломается не потому, что модель слабая. Они ломаются потому, что система дает модели неправильный контекст: слишком широкий, устаревший, непроверенный или такой, который текущий пользователь вообще не должен видеть.

Поэтому context engineering для меня — это архитектура, а не прием с промптом.

Что такое контекст

В enterprise-агенте контекст — это все, на что модель опирается, когда отвечает или вызывает tool:

Task context: что пользователь пытается сделать сейчас.
Business context: правила, политики, продукты, цены, договоры, внутренние определения.
User context: роль, права, регион, аккаунт, состояние текущего процесса.
Tool context: какие tools доступны, что они делают и какие side effects создают.
Memory context: что можно хранить между сессиями, а что нужно забывать.
Evaluation context: как выглядит правильный ответ или действие в этом workflow.

Если эти слои смешаны, систему сложно отлаживать и легко атаковать.

Production-паттерн

Я предпочитаю скучный и явный паттерн:

классифицировать намерение пользователя;
доставать только минимально нужные знания;
фильтровать данные по правам до того, как их увидит модель;
добавлять инструкции по tools только когда tool доступен в текущем состоянии;
разделять краткосрочную и долгосрочную память;
логировать context package, который реально ушел в модель;
проверять evals не только по финальному ответу, но и по качеству контекста.

Так система становится наблюдаемой. Когда агент ошибается, можно понять, где причина: retrieval, policy, tool choice, prompt design, model behavior или недостающая продуктовая логика.

Что проверять

В аудитах агентской архитектуры я обычно ищу такие проблемы:

prompt содержит слишком много постоянных правил;
RAG возвращает релевантные, но бесполезные для действия документы;
sensitive context достается до проверки прав;
descriptions tools написаны слишком общо и провоцируют misuse;
memory копит неподтвержденные факты;
никто не считает стоимость и загрязнение context window;
evals проверяют tone of voice, но не корректность workflow.

Главный вопрос

Не спрашивайте: “как нам написать промпт лучше?”

Спрашивайте:

Какой именно контекст должна получить модель, из какого источника, с какими правами, для какой задачи, и как мы поймем, что это сработало?

Этот вопрос переводит агентские системы из vibe-driven экспериментов в инженерную дисциплину.