系统提示词边界
检测应确认模型不会直接复述系统提示词、开发者指令或隐藏上下文。任何可稳定诱导泄露的行为都需要修复。
PROMPT INJECTION CHECK
AI 应用接入第三方 API 通道后,系统提示词、工具调用和上下文边界可能发生变化。Prompt 注入检测用于发现明显的越权指令、提示词泄露和敏感上下文暴露风险。
检测应确认模型不会直接复述系统提示词、开发者指令或隐藏上下文。任何可稳定诱导泄露的行为都需要修复。
如果应用支持工具调用,要确认模型不能通过提示词诱导执行未授权动作、访问内部资源或绕过业务校验。
中转站可能额外拼接提示词、保存日志或重写请求。接入后需要重新验证,而不是沿用直连官方接口的安全结论。
不一样。模型真伪关注是否被替换或降级,Prompt 注入关注提示词和工具边界是否可被诱导突破。
不够。还需要服务端权限校验、工具调用白名单、敏感字段隔离和日志审计。
中转站最多提供部分过滤或包装,根本边界仍应在你的应用服务端实现。