Разобрать задачу
Назад к блогу

Context engineering для enterprise-агентов: почему промпта недостаточно

2026-05-19·2 min read
LLMАгентыContext EngineeringEnterprise AIRAG

Большинство агентских проектов ломается не потому, что модель слабая. Они ломаются потому, что система дает модели неправильный контекст: слишком широкий, устаревший, непроверенный или такой, который текущий пользователь вообще не должен видеть.

Поэтому context engineering для меня — это архитектура, а не прием с промптом.

Что такое контекст

В enterprise-агенте контекст — это все, на что модель опирается, когда отвечает или вызывает tool:

  1. Task context: что пользователь пытается сделать сейчас.
  2. Business context: правила, политики, продукты, цены, договоры, внутренние определения.
  3. User context: роль, права, регион, аккаунт, состояние текущего процесса.
  4. Tool context: какие tools доступны, что они делают и какие side effects создают.
  5. Memory context: что можно хранить между сессиями, а что нужно забывать.
  6. Evaluation context: как выглядит правильный ответ или действие в этом workflow.

Если эти слои смешаны, систему сложно отлаживать и легко атаковать.

Production-паттерн

Я предпочитаю скучный и явный паттерн:

  • классифицировать намерение пользователя;
  • доставать только минимально нужные знания;
  • фильтровать данные по правам до того, как их увидит модель;
  • добавлять инструкции по tools только когда tool доступен в текущем состоянии;
  • разделять краткосрочную и долгосрочную память;
  • логировать context package, который реально ушел в модель;
  • проверять evals не только по финальному ответу, но и по качеству контекста.

Так система становится наблюдаемой. Когда агент ошибается, можно понять, где причина: retrieval, policy, tool choice, prompt design, model behavior или недостающая продуктовая логика.

Что проверять

В аудитах агентской архитектуры я обычно ищу такие проблемы:

  • prompt содержит слишком много постоянных правил;
  • RAG возвращает релевантные, но бесполезные для действия документы;
  • sensitive context достается до проверки прав;
  • descriptions tools написаны слишком общо и провоцируют misuse;
  • memory копит неподтвержденные факты;
  • никто не считает стоимость и загрязнение context window;
  • evals проверяют tone of voice, но не корректность workflow.

Главный вопрос

Не спрашивайте: “как нам написать промпт лучше?”

Спрашивайте:

Какой именно контекст должна получить модель, из какого источника, с какими правами, для какой задачи, и как мы поймем, что это сработало?

Этот вопрос переводит агентские системы из vibe-driven экспериментов в инженерную дисциплину.

Есть похожая AI-задача?

Отправьте короткий бриф, и я предложу минимальный платный следующий шаг: консультацию, аудит, security review или разработку.