2025年10月21日·1 分钟

首次 SaaS 构建者的公共 API 设计：基础

Q: 我第一次发布公共 API 应该开放多少端点？

从 5–10 个端点 开始，这些端点应映射到真实的客户动作。 一个好规则是：如果你无法用一句话解释一个资源（它是什么、谁拥有、如何使用），那就暂时把它保留为内部接口，等通过使用数据学到更多再公开。

Q: SaaS API 我应该从哪些资源开始？

选择一组 小而稳定的名词 （资源），这些名称应当是客户在交流中已经使用的词，并在公开后保持稳定，即使你的数据库结构改变也不要重命名它们。 SaaS 常见的起点包括 、 、 和 ——只有在有明确需求时才增加更多。

Q: 我应该使用哪些 HTTP 方法，为什么这很重要？

使用标准语义并保持一致： - = 读取（无副作用） - = 创建或启动动作 - = 局部更新 - = 删除或禁用 主要好处是可预测性：客户端不应去猜测某个方法会做什么。

Q: 我的 API 应该在 URL 里版本化还是通过 Header？

默认采用 URL 版本化 ，例如 。 这样在日志和截屏里更容易看清版本，也更方便在需要破坏性变更时同时运行 v1 和 v2 以便调试。

Q: API 中什么算是破坏性变更？

如果一个正确实现的客户端在不修改代码的情况下会失败，则该变更就是破坏性的。常见示例包括： - 重命名字段 - 改变字段类型或含义 - 删除字段或端点 - 将原本可选的输入变为必需 - 改变认证规则或默认权限 添加新的 可选 字段通常是安全的。

Q: 对于 v1 API，现实可行的弃用策略是什么？

保持简单： - 提前宣布弃用 - 在响应中返回明确的警告（或在文档中说明） - 设定一个结束日期 一个实用的默认值是为首次 API 提供 90 天窗口 ，让客户有时间迁移而不至于惊慌。

Q: 我应使用基于页的分页还是基于游标的分页？

在所有列表端点中 选一个 分页模式并保持一致。 - 当数据集较小且用户可能跳到第 N 页时，使用 page/limit 。 - 当列表可能很大或经常变化时，使用 cursor 。 始终定义默认排序并增加一个决定性字段（例如 + ），以避免结果在请求间跳动。

Q: 我该设置什么速率限制，429 响应里应该返回什么？

先定一个清晰的每键限额（例如 60 次请求/分钟 加上小幅突发允许），然后根据实际流量调整。 当触发限制时返回 ，并包含： - - - - 这样能让重试变得可预测并减少支持工单。

Q: 好的 API 错误响应应该是什么样子？

在所有地方使用统一的错误格式（包括 500）。一个实用的结构是： - （稳定标识） - （易读文本） - （字段级问题） - （用于支持查询） 同时保持状态码一致（400/401/403/404/409/429/500），让客户端能干净地处理错误。

Q: 我怎样不把事情搞得过度工程化就发布文档和一个小 SDK？

如果你快速生成了许多端点（例如使用 Koder.ai），把 公共表面保持小 ，并将其视为长期合约。 发布前要做的事： - 为每个端点写一个现实的请求 + 响应示例 - 锁定分页和错误格式 - 为重要的 操作加入幂等性键 - 用“假客户端”内部测试以发现混淆点 然后发布一个小型 SDK，帮助处理认证、超时、对安全请求的重试和分页——但不要把 HTTP 工作细节完全隐藏起来。

为首次 SaaS 构建者实用的公共 API 设计：选择版本控制、分页、速率限制、文档，以及可快速交付的小型 SDK。

真正的问题：发布一个你能维护的 API

公共 API 不只是你的应用暴露出的某个端点。它是对团队外部人的一种承诺：即使产品发生变化，这个契约也会继续生效。

困难的不是写出 v1，而是当你修复 bug、添加功能并在学习客户真实需求时，保持它的稳定。

早期的决策会在以后以支持工单的形式显现出来。如果响应结构在没有通知的情况下改变，如果命名不一致，或者客户端无法判断请求是否成功，你就在制造摩擦。那种摩擦会变成不信任，而不信任会让人停止基于你的平台构建。

速度也很重要。大多数首次 SaaS 构建者需要快速交付一些有用的东西，然后再逐步改进。权衡很简单：越快发布但不设规则，等真实用户来了你就越花时间去撤销这些决定。

对 v1 来说“足够好”通常意味着一小组映射到真实用户操作的端点、命名和响应形状的一致性、一个清晰的变更策略（即便只是 v1）、可预测的分页和合理的速率限制，以及能准确展示应发送什么和会收到什么的文档。

一个具体例子：想象客户构建了一个每晚创建发票的集成。如果你后来重命名了字段、改变了日期格式，或悄悄开始返回部分结果，他们在凌晨两点的作业就会失败。他们会归咎于你的 API，而不是自己的代码。

如果你使用像 Koder.ai 这样的聊天驱动工具生成端点，很容易快速产出很多接口。那没问题，但把公共表面保持小。你可以在学习哪些应该成为长期契约时把内部端点保持私有。

从小而清晰的 API 表面开始

好的公共 API 设计从选择一小组与客户表达方式相匹配的名词（资源）开始。即便内部数据库变化，也要保持资源名称稳定。添加功能时，优先添加字段或新端点，而不是重命名核心资源。

很多 SaaS 产品的实用起点是：users、organizations、projects 和 events。如果你无法在一句话内解释一个资源，那它可能还没准备好公开。

让 HTTP 用法保持乏味且可预测：

GET 读取数据（无副作用）
POST 创建某物（或启动一个动作）
PATCH 更新少量字段
DELETE 删除或禁用某物

认证在第一天不需要花哨。如果你的 API 主要是服务器间调用（客户从其后端调用），API key 往往足够。如果客户需要以个人终端用户身份操作，或你预期第三方集成需要用户授权，OAuth 通常更合适。用简单语言写下决定：谁是调用方，他们被允许访问谁的数据？

及早设定期望。明确说明哪些是支持的，哪些是尽力而为。例如：列表端点是稳定且向后兼容的，但搜索过滤可能会扩展且不保证穷尽。这样能减少支持工单并让你自由改进。

如果你在像 Koder.ai 这样的即兴编码平台上构建，把 API 当作一个产品契约：先把契约缩小，然后基于真实用量扩展，而不是基于猜测。

在不把自己逼入死角的情况下进行版本管理

版本化主要是关于期望。客户端想知道：我的集成会在下周被弄坏吗？你想要有空间在不恐慌的情况下改进。

URL 版本化 vs Header 版本化

基于 Header 的版本化看起来更干净，但它很容易在日志、缓存和支持截屏中被隐藏。URL 版本化通常是最简单的选择：/v1/...。当客户发来失败请求时，你可以立即看到版本信息，也更容易并行运行 v1 和 v2。

什么才是真正的破坏性变更？

如果一个守规矩的客户端在不改动代码的情况下可能停止工作，那么该变更就是破坏性的。常见示例：

重命名字段（例如把 customer_id 改为 customerId）
改变字段类型（字符串到数字）或其含义
删除端点或响应字段，客户端可能依赖这些字段
收紧校验规则（原本可选，现在变为必需）
改变认证要求或默认权限

安全的变更是旧客户端可以忽略的变更。添加新的可选字段通常是安全的。例如，在 GET /v1/subscriptions 的响应中添加 plan_name，不会破坏仅读取 status 的客户端。

一个实用规则：不要在同一主版本内移除或重新利用字段。添加新字段，保留旧字段，只有在准备弃用整个版本时才移除它们。

一个可执行的弃用策略

保持简单：提前宣布弃用，在响应中返回清晰的警告信息，并设定结束日期。对于第一个 API，90 天的窗口通常是现实的。在这段时间内，保持 v1 可用，发布简短的迁移说明，并确保支持团队能指向一句话：v1 在此日期前有效；v2 改动在这里。

如果你在像 Koder.ai 这样的平台上构建，把 API 版本看作快照：在新版本中发布改进，保持旧版稳定，并在给客户足够迁移时间后再停止旧版。

可预测的分页模式

分页是建立或破坏信任的地方。如果结果在请求间跳动，人们就会停止信任你的 API。

当数据集较小、查询简单且用户常常需要第 3 页时，使用 page/limit。当列表可能增长很大、新项目频繁到达或用户会大量排序过滤时，使用基于游标的分页。游标分页在新记录被加入时能保持顺序稳定。

有几条规则可保持分页可靠：

始终定义默认排序（例如：created_at desc）。
加上决胜字段（例如：id），以保证顺序确定性。\n- 将分页视为契约的一部分：日后改变排序是破坏性变更。\n- 返回继续所需的最小信息：items 加上 next cursor（或下一页）。

总数（totals）比较棘手。total_count 在有过滤条件的大表上可能代价很高。如果能廉价提供就加上，否则省略或通过查询标志使其可选。

这里有几个简单的请求/响应示例。

// Page/limit
GET /v1/invoices?page=2limit=25sort=created_at_desc

{
  "items": [{"id":"inv_1"},{"id":"inv_2"}],
  "page": 2,
  "limit": 25,
  "total_count": 142
}

// Cursor-based
GET /v1/invoices?limit=25cursor=eyJjcmVhdGVkX2F0IjoiMjAyNi0wMS0wOVQxMDozMDowMFoiLCJpZCI6Imludl8xMDAifQ==

{
  "items": [{"id":"inv_101"},{"id":"inv_102"}],
  "next_cursor": "eyJjcmVhdGVkX2F0IjoiMjAyNi0wMS0wOVQxMDoyNTowMFoiLCJpZCI6Imludl8xMjUifQ=="
}

速率限制与友好的重试策略

防止重复写入

通过生成的服务器代码实现 Idempotency-Key 处理，你可以编辑并掌控它。

添加幂等性

速率限制的目的不在于严苛，而是在于保持在线。它们保护你的应用免受流量冲击，保护数据库免于被代价高昂的查询频繁命中，也保护你的账单不被意外撑高。限制也是一种契约：客户端知道什么是正常使用。

先从简单开始并随后调优。选择一个覆盖典型使用场景并允许运行短暂突发的配额，然后观察真实流量。如果你还没有数据，一个安全的默认是每个 API key 每分钟 60 次请求加上一点突发允许。如果某个端点特别重（例如搜索或导出），对它单独设定更严格的限制或单独计费，而不是惩罚所有请求。

当你强制限流时，让客户端易于正确处理。返回 429 Too Many Requests 并包含几个标准头：

X-RateLimit-Limit: 窗口内允许的最大值
X-RateLimit-Remaining: 剩余可用次数
X-RateLimit-Reset: 窗口何时重置（时间戳或秒数）
Retry-After: 在重试前应等待多长时间

客户端应把 429 视为正常情况，而不是要对抗的错误。一个礼貌的重试模式能让双方都满意：

如果返回了 Retry-After 就等待该时长
否则使用指数退避（例如 1s、2s、4s）
加入少量随机性（抖动），避免大量客户端同时重试
对等待时间设上限（例如 30–60s）

举例：如果客户做每晚同步导致大量请求触达你的 API，他们的任务可以把请求分散到一分钟内，并在遇到 429 时自动减速，而不是让整个任务失败。

错误、状态码与安全写入策略

如果你的 API 错误难以阅读，支持工单会迅速堆积。选一个错误格式并在所有地方坚持（包括 500）。一个简单标准是：code、message、details，以及用户可以粘贴到支持聊天中的 request_id。

这是一个小而可预测的格式：

{
  "error": {
    "code": "validation_error",
    "message": "Some fields are invalid.",
    "details": {
      "fields": [
        {"name": "email", "issue": "must be a valid email"},
        {"name": "plan", "issue": "must be one of: free, pro, business"}
      ]
    },
    "request_id": "req_01HT..."
  }
}

始终一致地使用 HTTP 状态码：400 表示输入错误，401 表示缺少或无效认证，403 表示已认证但无权限，404 表示资源未找到，409 表示冲突（如重复唯一值或错误状态），429 表示速率限制，500 表示服务器错误。稳定性比聪明更重要。

让校验错误易于修复。字段级提示应指向文档中使用的确切参数名，而不是内部数据库列名。如果有格式要求（日期、货币、枚举），说明你接受的格式并给出示例。

重试是很多 API 无意中制造重复数据的地方。对于重要的 POST 操作（付款、发票创建、发送邮件），支持幂等键以便客户端安全重试。建议做法：

在选定的 POST 端点接受 Idempotency-Key 头。
将该键与结果一并保存一个短窗口（例如 24 小时）。
对于重复的键，返回与第一次请求相同的响应。
如果第一次请求仍在处理中，返回明确的“稍后重试”响应，而不是创建第二个资源。

这个头能避免在网络不稳定或客户端超时情况下产生很多棘手的边缘情况。

示例场景：一个小型 SaaS 计费 API 的实操

假设你运行一个简单的 SaaS，它有三个主要对象：projects、users 和 invoices。一个 project 有许多 users，每个 project 每月生成发票。客户端希望将发票同步到他们的会计工具，并在自己应用中展示基本计费信息。

一个干净的 v1 可能像这样：

GET  /v1/projects/{project_id}
GET  /v1/projects/{project_id}/invoices
POST /v1/projects/{project_id}/invoices

现在发生了一个破坏性变化。在 v1 中，你以分整数（以美分为单位）存储发票金额：amount_cents: 1299。后来你需要多币种和小数，因此你想要 amount: "12.99" 和 currency: "USD"。如果你覆盖旧字段，所有现有集成都将崩溃。版本化可以避免恐慌：保持 v1 稳定，发布带新字段的 /v2/...，并在客户端迁移前同时支持两者。

对于发票列表，使用可预测的分页结构。例如：

GET /v1/projects/p_123/invoices?limit=50cursor=eyJpZCI6Imludl85OTkifQ==

200 OK
{
  "data": [ {"id":"inv_1001"}, {"id":"inv_1000"} ],
  "next_cursor": "eyJpZCI6Imludl8xMDAwIn0="
}

有一天某客户在循环中导入发票并触及你的速率限制。与其出现随机失败，他们会得到明确的响应：

429 Too Many Requests
Retry-After: 20
一个小的错误体，例如 { "error": { "code": "rate_limited" } }

在客户端，他们可以暂停 20 秒，然后从同一个 cursor 继续，而无需重新下载全部或创建重复发票。

步骤分解：你的 v1 API 的简单发布计划

设定友好的速率限制

添加速率限制和 429 处理，并提供清晰的头部，便于客户端礼貌重试。

添加限制

把 v1 发布当作一次小型产品发布，而不是一堆端点堆在一起来做，会更顺利。目标很简单：人们能基于它构建，而你可以在不惊慌的情况下持续改进它。

一个实用的 1 周计划（即使是小团队）

先写一页解释你的 API 用来做什么、不做什么。把表面面积控制在你能在一分种内口头解释清楚的范围内。

按下列顺序执行，且在每一步达到“足够好”前不要前进：

起草单页规范，列出核心资源和你将支持的前几组端点（想想 5–10 个）。包括基础 URL 模式、认证方法和必需头。
为每个端点写一个真实的请求和一个真实的响应。使用你计划发布的实际字段名。这些示例将成为你的首批文档和首批测试。
添加简短的规则部分：错误的表现形式、分页如何工作（若存在列表端点）、速率限制是什么，以及哪些字段是稳定的、哪些可能会改变。
做一次内部假客户端测试。假装你是客户，在一个新仓库中构建集成。计时从第一次成功调用到完成花了多久，记录让你困惑的地方。
发布你的 v1 合约：哪些改动是安全的（可加字段）、哪些改动需要新版本、以及你会提前多久通知破坏性变更。

如果你使用代码生成工作流（例如使用 Koder.ai 来脚手架端点和响应），仍然要做假客户端测试。生成的代码可能看起来正确，但使用体验上仍会让人尴尬。

回报是更少的支持邮件、更少的热修复发布，以及一个你真正能维护的 v1。

发布一个小型 SDK 而不至于过度设计

第一版 SDK 不是第二个产品。把它当作对 HTTP API 的一个精薄友好包装。它应让常见调用变得简单，但不应掩盖 API 的工作方式。如果有人需要你尚未封装的功能，他们仍应能直接发起原始请求。

选一种语言开始，基于客户实际使用的语言。对于许多 B2B SaaS API 来说，首选往往是 JavaScript/TypeScript 或 Python。发布一个成熟的 SDK 胜过同时发布三个半成品。

一个小型 SDK 应包含的内容

一个好的起始集合包括：

集中处理认证（API key 或 OAuth token）
合理的超时和对安全请求（GET）的自动重试，带退避策略
返回迭代器或 next page 函数的分页辅助工具
清晰的请求/响应模型（即便是基础类型）
用于自定义头和原始 HTTP 调用的逃生舱

你可以手写这些，或从 OpenAPI 规范生成。生成在规范准确且你想要一致类型时很棒，但通常会产出大量代码。早期手写一个最小客户端加一份用于文档的 OpenAPI 文件通常已足够。只要公开的 SDK 接口保持稳定，你可以以后切换到生成客户端而不破坏用户体验。

把 SDK 版本与 API 版本分开管理

API 版本应遵循你的兼容性规则。SDK 版本应遵循打包发布规则。

如果你添加了新的可选参数或新端点，那通常是 SDK 的次要版本更新。只在 SDK 本身破坏性改动（方法重命名、默认值改变）时发布主版本，即便 API 本身未改变。这种分离能让升级过程平稳并减少支持工单。

导致大量支持问题的常见错误

先规划你的 v1 API

使用 Koder.ai 的 Planning Mode 在生成代码前映射资源、端点和示例。

开始规划

大多数 API 支持工单不是关于 bug，而是关于惊喜。公共 API 设计大部分是让它变得乏味且可预测，这样客户端代码才能在月复一月地正常工作。

失去信任最快的方法是未经告知地改变响应。如果你重命名字段、改变类型或开始返回 null（而原来是值），你会以难以诊断的方式破坏客户端。如果确实必须改变行为，要进行版本化，或添加新字段并在一段时间内保留旧字段并说明退役计划。

分页也是重复发生问题的来源。当一个端点使用 page/pageSize，另一个使用 offset/limit，第三个使用游标并且每个都有不同的默认值时，问题就出现了。为 v1 选择一种模式并在所有地方坚持。也要保持排序稳定，避免在有新记录到来时下一页跳过或重复项。

错误不一致会引发大量往返。一种常见失败模式是一个服务返回 { "error":"..." }，另一个返回 { "message":"..." }，并且对相同问题使用不同的 HTTP 状态码。结果是客户端构建了凌乱且针对端点的处理逻辑。

以下五个错误会产生最长的邮件线程：

未经通知就悄然更改字段（名字、类型、含义）而不进行版本升级或给出弃用窗口
各端点的分页规则不一致或随时间改变默认值
错误格式、状态码或校验消息在端点间不一致
缺少 request_id，导致双方都无法快速在日志中找到确切失败调用
突然触发的速率限制却没有头部、没有清晰的重试指引，也没有示例退避策略

一个简单习惯能带来很大帮助：每个响应都应包含 request_id，每个 429 都应说明何时重试。

快速清单与下一步

在你发布任何东西之前，做一次面向一致性的最终检查。大多数支持工单发生是因为端点、文档和示例之间的小细节不匹配。

能抓到最多问题的快速检查：

命名：资源名一致、复数形式、字段命名风格一致（选一个并遵守）。
示例：每个端点都有一个现实的请求和响应示例，包括分页。
错误：清晰的错误形状、稳定的错误码以及针对常见失败的帮助信息。
限制：文档说明了速率限制行为且响应包含你预期的头。
安全：对创建类操作支持幂等性，以应对超时重试带来的风险。

发布后，关注用户实际调用的接口，而不是你希望他们使用的接口。早期一个小仪表盘和每周审查已足够。

先监控这些信号：

429 峰值（谁被限制，为什么）
每个端点的 p95 延迟（慢端点常隐藏 N+1 查询）
热门端点和参数（你的真实 API 表面）
按状态码统计的错误率（400 vs 401 vs 500）
超时和重试（客户端可能在无意识中循环重试）

收集反馈但不要重写一切。在文档中添加一条简短的提交问题路径，并为每条报告标注端点、request id 和客户端版本。修复时，优先采用增量式改动：新字段、新可选参数或新端点，而不是破坏现有行为。

下一步：写一页 API 规范，列出你的资源、版本计划、分页规则和错误格式。然后生成文档并做一个涵盖认证和 2–3 个核心端点的小型入门 SDK。如果你想更快，可以先用像 Koder.ai 这样的聊天计划起草规范、文档和入门 SDK（它的规划模式是在生成代码前映射端点和示例的好帮手）。

常见问题

我第一次发布公共 API 应该开放多少端点？

从 5–10 个端点 开始，这些端点应映射到真实的客户动作。

一个好规则是：如果你无法用一句话解释一个资源（它是什么、谁拥有、如何使用），那就暂时把它保留为内部接口，等通过使用数据学到更多再公开。

SaaS API 我应该从哪些资源开始？

选择一组 小而稳定的名词（资源），这些名称应当是客户在交流中已经使用的词，并在公开后保持稳定，即使你的数据库结构改变也不要重命名它们。

SaaS 常见的起点包括 users、organizations、projects 和 events——只有在有明确需求时才增加更多。

我应该使用哪些 HTTP 方法，为什么这很重要？

使用标准语义并保持一致：

GET = 读取（无副作用）
POST = 创建或启动动作
PATCH = 局部更新
DELETE = 删除或禁用

主要好处是可预测性：客户端不应去猜测某个方法会做什么。

我的 API 应该在 URL 里版本化还是通过 Header？

默认采用 URL 版本化，例如 /v1/...。

这样在日志和截屏里更容易看清版本，也更方便在需要破坏性变更时同时运行 v1 和 v2 以便调试。

API 中什么算是破坏性变更？

如果一个正确实现的客户端在不修改代码的情况下会失败，则该变更就是破坏性的。常见示例包括：

重命名字段
改变字段类型或含义
删除字段或端点
将原本可选的输入变为必需
改变认证规则或默认权限

添加新的可选字段通常是安全的。

对于 v1 API，现实可行的弃用策略是什么？

保持简单：

提前宣布弃用
在响应中返回明确的警告（或在文档中说明）
设定一个结束日期

一个实用的默认值是为首次 API 提供 90 天窗口，让客户有时间迁移而不至于惊慌。

我应使用基于页的分页还是基于游标的分页？

在所有列表端点中选一个分页模式并保持一致。

当数据集较小且用户可能跳到第 N 页时，使用 page/limit。
当列表可能很大或经常变化时，使用 cursor。

始终定义默认排序并增加一个决定性字段（例如 created_at + id），以避免结果在请求间跳动。

我该设置什么速率限制，429 响应里应该返回什么？

先定一个清晰的每键限额（例如 60 次请求/分钟 加上小幅突发允许），然后根据实际流量调整。

当触发限制时返回 429，并包含：

X-RateLimit-Limit
X-RateLimit-Remaining
X-RateLimit-Reset

好的 API 错误响应应该是什么样子？

在所有地方使用统一的错误格式（包括 500）。一个实用的结构是：

code（稳定标识）
message（易读文本）
details（字段级问题）
request_id（用于支持查询）

同时保持状态码一致（400/401/403/404/409/429/500），让客户端能干净地处理错误。

我怎样不把事情搞得过度工程化就发布文档和一个小 SDK？

如果你快速生成了许多端点（例如使用 Koder.ai），把公共表面保持小，并将其视为长期合约。

发布前要做的事：

为每个端点写一个现实的请求 + 响应示例
锁定分页和错误格式
为重要的 POST 操作加入幂等性键
用“假客户端”内部测试以发现混淆点

然后发布一个小型 SDK，帮助处理认证、超时、对安全请求的重试和分页——但不要把 HTTP 工作细节完全隐藏起来。