PROMPT INJECTION CHECK

Prompt 注入检测

AI 应用接入第三方 API 通道后,系统提示词、工具调用和上下文边界可能发生变化。Prompt 注入检测用于发现明显的越权指令、提示词泄露和敏感上下文暴露风险。

01

系统提示词边界

检测应确认模型不会直接复述系统提示词、开发者指令或隐藏上下文。任何可稳定诱导泄露的行为都需要修复。

02

工具调用边界

如果应用支持工具调用,要确认模型不能通过提示词诱导执行未授权动作、访问内部资源或绕过业务校验。

03

中转层影响

中转站可能额外拼接提示词、保存日志或重写请求。接入后需要重新验证,而不是沿用直连官方接口的安全结论。

Method

安全测试原则

常见问题

Prompt 注入检测和模型真伪检测一样吗?

不一样。模型真伪关注是否被替换或降级,Prompt 注入关注提示词和工具边界是否可被诱导突破。

只要提示词写得严谨就安全吗?

不够。还需要服务端权限校验、工具调用白名单、敏感字段隔离和日志审计。

中转站能修复 Prompt 注入吗?

中转站最多提供部分过滤或包装,根本边界仍应在你的应用服务端实现。