security offer / агенты, tools, данные

LLM / Agent Security Audit

Практический security review для LLM-приложений, агентных систем, MCP/A2A-интеграций, RAG и AI-workflows, которые работают с чувствительными данными или production-действиями.

Заполнить security-бриф Написать в Telegram

Когда подходит

Агент вызывает tools, читает внутренние данные или может запускать внешние действия.

Есть риск prompt injection, data leakage, слишком широких permissions или unsafe tool use.

Security, legal, product или руководство хотят понятную картину рисков до запуска.

Нужен backlog конкретных исправлений, а не абстрактные разговоры про AI safety.

Что проверяю

Пути prompt injection через документы, тикеты, письма, страницы, чаты и tool outputs.

Права tools, identity model, side effects, confirmations и auditability.

Границы RAG и контекста: sensitive data, access control, memory и retrieval filtering.

Риски MCP/A2A: tool manifests, schemas, untrusted outputs и supply-chain exposure.

Evals, tracing, guardrails, human review и воспроизводимость инцидентов.

Что на выходе

Threat model для LLM / agent workflow.

Карта attack surface и risk register.

Prompt injection и tool misuse test cases.

Рекомендации по guardrails, approvals, observability и access control.

Приоритизированный remediation backlog для product, engineering и security.

process

Как проходит

Фиксируем scope системы, классы данных, tools и production-риски.
Смотрим prompts, retrieval, tool schemas, permissions, traces и deployment assumptions.
Прогоняем adversarial-сценарии и карту вероятных failure modes.
Выдаю security review с конкретными исправлениями и next-step архитектурой.

Релевантный опыт: публикация по LLM injection и AI security, production AI-platform в банкинге, MCP/A2A и tool integrations, evals, tracing, guardrails и агентная архитектура.