xpert-plugins 中的 @xpert-ai/plugin-agent-behavior-monitor,用于在智能体运行期间监控并处理异常行为。
能检测什么
prompt_injection:提示词注入(输入阶段,LLM 判定)sensitive_instruction:风险指令(输入阶段,LLM 判定)high_frequency:工具高频调用(工具调用阶段,计数判定)repeat_failure:工具连续失败(工具结果阶段,计数判定)
动作策略
alert_only:仅告警,流程继续block:拦截当前阶段并返回告警文案end_run:终止本次运行并返回告警文案
安装与启用
- 在宿主项目安装插件包:
- 在环境变量中启用插件:
- 参考 插件发布与使用 完成宿主加载。
最小配置示例
1) 提示词注入拦截
2) 工具高频调用拦截
关键配置说明
evidenceMaxLength:每次命中保存的证据最大长度(默认240)ringBufferSize:运行轨迹环形缓冲区大小(默认120)target:由ruleType自动推导,不需要手工指定- 输入类规则(
prompt_injection、sensitive_instruction)必须配置judgeModel
审计与排障
每次运行会写入快照,重点看:ringBuffer:如llm_judge、tool_call、tool_error等事件hits:命中规则明细summary:总命中数、是否拦截、是否终止
- 检查规则动作是否还是
alert_only。 - 检查输入类规则是否缺少
judgeModel。 - 检查
llm_judge事件中是否matched=true。