Question 1

对于 AI 构建的应用，我能现实地声称哪些安全保证？

Accepted Answer

把任何“保证”都当作有范围限制的声明。问清楚： - 哪些数据路径在保障范围内（提示、文件、日志、嵌入、备份）？ - 需要开启哪些配置才能让声明成立？ - 保留期是多少，有书面说明吗？ - 责任如何划分（供应商 vs. 你）？ 如果你不能 测量 它（通过日志、策略、文档化的边界），那它就不是一个真正的保证。

Question 2

安全特性与安全结果有什么区别？

Accepted Answer

安全特性（SSO、加密、审计日志、秘密扫描）是 能力 。结果才是你能实际承诺的东西（例如：无跨租户访问、无秘密泄露、无未授权导出）。 只有当特性被： - 正确配置， - 应用于正确的系统（包括日志和工具），且 - 持续监控防止配置漂移或回归， 你才可能实现那些安全结果。

Question 3

如何为 AI 辅助开发创建轻量的威胁模型？

Accepted Answer

做一个快速的轻量威胁建模： 1. 列出参与者（开发者、代理/AI、用户、攻击者、供应商）。 2. 列出资产（PII、秘密、代码、提示、日志、模型输出）。 3. 列出入口点（聊天/UI、API、Webhook、文件上传、集成）。 4. 问：“如果输入被攻击者控制，会怎样？” 尤其是当其能触发工具调用时。 5. 为该功能决定回滚/停止机制。 通常这已经足以在改动还便宜时发现最高风险的前提假设。

Question 4

LLM 生成代码最常见的安全问题是什么？

Accepted Answer

常见失败往往很普通而非高深莫测： - 缺失对象级授权（IDOR）和租户隔离。 - 信任客户端提供的字段（例如 ）而非服务器端校验。 - 输入校验薄弱与不安全的查询构造。 - 加密误用（自造加密、错误模式、硬编码密钥）。 缓解方法：使用安全模板、对安全关键代码强制人工审查，并在 CI 中加入自动化检查（SAST/DAST + 目标化授权测试）。

Question 5

如何在 AI 构建的应用中减少依赖与供应链风险？

Accepted Answer

从可强制执行的控制开始： - 用 lockfile 固定版本。 - 在每个 PR 和定期运行依赖扫描（SCA）。 - 在 CI 中生成 SBOM，以便在事件中回答“我们在运行什么？”。 - 在可能的情况下优先使用已签名/验证的制品（镜像、CI actions、发布者）。 同时设定补丁节奏（例如每周；关键 CVE 同日处理），并为每个服务指定命名负责人。

Question 6

什么是提示注入，如何防止工具被误用？

Accepted Answer

提示注入是 不受信任的内容引导模型 去无视你的意图。当模型能使用工具（数据库查询、发邮件、退款、部署）时，风险就会放大。 实用防御： - 最小权限的工具许可。 - 优先使用白名单化、参数化的操作（例如 ）而非自由形式的动作（任意 SQL/Shell）。 - 在执行前对工具调用做校验（批准域名、最大金额、安全查询模板）。 - 对不可逆或高风险动作要求人工审批。

Question 7

在 LLM 应用中，除了提示本身之外，隐私泄露还会在哪里发生？

Accepted Answer

最大的泄露通常来自间接途径： - 聊天历史/记忆被无限期存储； - 应用日志和错误跟踪记录原始提示/工具输出； - APM/追踪默认记录请求体； - 分析/会话回放工具捕获文本字段； - 嵌入/向量存储在删除请求时被遗忘。 降低暴露的方法：数据最小化、在记录前积极脱敏、严格的访问控制，并为每个系统记录明确的保留策略（包括备份的可行性）。

Question 8

在多租户应用中实现租户隔离的最安全方式是什么？

Accepted Answer

在服务端强制隔离： - 每个查询都应按 进行限定。 - 来源于认证会话，而不是请求体。 - 在读/写/删上添加对象级的归属检查。 要做 IDOR 测试：验证用户即便猜到有效 ID 也不能访问其他租户的 。

Question 9

在使用 copilots 和 agents 时，我们应该如何处理秘密？

Accepted Answer

遵循三条规则： - 不要把秘密放进提示、源码或浏览器中。 - 使用 secrets manager，并在运行时注入秘密。 - 优先使用短期凭证（轮换的 token），并具备快速撤销路径。 在运营上，记录秘密的访问（审计轨迹）、按计划轮换，并在怀疑泄露时立即撤销/轮换。

Question 10

在上线前我们需要哪些监控和事故准备？

Accepted Answer

最低限度的生产监控信号： - 可搜索的审计轨迹，包含认证事件、授权决策、工具调用和数据访问（对敏感字段进行脱敏）。 - 对突发情况的告警：批量读取/导出、重复拒绝、异常工具使用、权限变更。 - 一份运行手册：如何禁用高风险工具、轮换密钥、撤销会话、回滚发布。 如果你不能快速回答“谁用哪个工具对哪些数据做了什么”，事后响应将会缓慢且猜测性强。

AI 构建应用的安全：能承诺的、盲点与防护

本文涵盖内容（以及不涵盖的内容）

本文面向谁

你将从本文获得什么

本文不做什么

安全保证：你能现实地期待什么

人们常假设的保证

为什么保证几乎总是有范围限制

安全特性 vs 安全结果

一个简单规则

AI 构建应用的简单威胁模型

1) 识别行为者（谁能影响结果）

2) 绘制核心资产（你必须保护的东西）

3) 描述典型入口点（风险从哪里进入）

4) 可复用的威胁建模检查表（10 分钟）

盲点 #1：生成代码质量与不安全默认值

生成代码出错的常见方式

复制粘贴风险与过时片段

真正能降低风险的防护

真正重要的测试（并保持它们有效）

常见问题