PROMPT INJECTION CHECK

Prompt 注入检测

AI 应用接入第三方 API 通道后，系统提示词、工具调用和上下文边界可能发生变化。Prompt 注入检测用于发现明显的越权指令、提示词泄露和敏感上下文暴露风险。

系统提示词边界

检测应确认模型不会直接复述系统提示词、开发者指令或隐藏上下文。任何可稳定诱导泄露的行为都需要修复。

如果应用支持工具调用，要确认模型不能通过提示词诱导执行未授权动作、访问内部资源或绕过业务校验。

中转站可能额外拼接提示词、保存日志或重写请求。接入后需要重新验证，而不是沿用直连官方接口的安全结论。

Method

Prompt 注入检测和模型真伪检测一样吗？

不一样。模型真伪关注是否被替换或降级，Prompt 注入关注提示词和工具边界是否可被诱导突破。

只要提示词写得严谨就安全吗？

不够。还需要服务端权限校验、工具调用白名单、敏感字段隔离和日志审计。

中转站能修复 Prompt 注入吗？

中转站最多提供部分过滤或包装，根本边界仍应在你的应用服务端实现。