Postgres 架构设计规划模式：逐步方法

Q: 如何在不被图表卡住的情况下快速开始架构规划？

写 2–3 句描述应用必须记住的内容以及用户必须能做的事情。 然后列出： - 会创建/修改数据的动作（动词） - 用户会使用的屏幕/报表（读取路径） - 非功能需求如审计历史、软删除、多租户和隐私 这会给你足够的清晰度去设计表，而不会过度建模。

Q: 在 Postgres 中我应该使用 UUID 还是 bigint 作为 ID？

在整个 schema 中保持一个一致的 ID 策略。 - ：适合记录可能来自很多地方（web、mobile、后台任务）或不希望 ID 可预测的场景 - ：体积更小、性能略好，适合所有记录由服务器创建的情况 如果需要面向人的可读标识符，单独增加一个唯一列（例如 ），不要把它当作主键。

Q: 如何为外键选择合适的删除行为（CASCADE vs RESTRICT）？

按关系决定，基于用户预期和需要保留的数据。 常见默认： - 保留历史：当删除父记录会导致重要记录丢失时，用 / （例如 customer → orders） - 安全级联：当子行没有父行就没有意义时，用 （例如 order → line items） 早点做出决定，因为这会影响 API 行为和边界情况。

Q: 第一天我应该添加哪些约束？

把永久性规则放进数据库，这样所有写入者（API、脚本、导入、管理工具）都会遵守。 优先考虑： - 每个表的 - 每个“belongs to”列的 - 会造成真实问题的 （如 email，或 join 表上的 ） - 简单规则用 （非负金额、允许的状态等） - 对于必须存在的字段使用

Q: 如何在不滥用索引的情况下挑选合适的索引？

从真实查询模式出发，而不是凭空猜测。 写下 5–10 个用例（过滤 + 排序），然后为这些用例建立索引： - 用于连接的外键列 - 常用过滤列，例如 、 、 - 一两个匹配稳定模式的复合索引（例如 ） 避免把所有列都索引；每个索引都会增加 INSERT/UPDATE 的开销。

Q: 多对多关系应该如何建模？

把多对多关系建成连接表，包含两列外键并加上复合唯一约束。 示例模式： - - 添加 防止重复 这能避免“为什么这个用户出现两次”这类隐蔽的错误，并让查询更清晰。

Q: 哪些类型和列模式是 Postgres 的良好默认？

默认设置： - 时间戳用 （避免时区问题） - 金额用 或以分为单位的整数（避免浮点数） - 状态值通过 Postgres 枚举或 约束来强制执行 在表之间对相同概念保持一致的类型，这样连接和校验更可预测。

Q: 什么样的迁移策略可以避免后来破坏生成的代码？

使用小而可审查的迁移，避免一次性破坏性更改。 安全流程示例： - 先增加新列（必要时可为 nullable），然后回填数据 - 如果应用必须保持可用，短期内同时写入旧列和新列（dual-write） - 把读取切换到新列，最后在后续迁移中删除旧列 还要提前决定如何处理种子/参考数据，确保每个环境一致。

登录开始使用

Postgres 架构设计规划模式：逐步方法 | Koder.ai

在生成代码前，为什么要先规划 Postgres 模式

如果你在数据库结构尚未明确时就先构建端点和模型，通常会发现自己把相同的功能重写了两次。应用为演示可用，但当真实数据和边界情况到来时，一切会变得脆弱。

大多数重写都来自三类可预测的问题：

实体不清晰（命名或分组不当）。
规则没有被强制（缺少约束）。
性能问题来得太晚（索引在用户抱怨后才添加）。

每一项都会引发需要改动代码、测试和客户端应用的连锁反应。

规划 Postgres 模式意味着先决定数据契约，然后生成与之匹配的代码。实际流程通常是把实体、关系和几条关键查询写下来，然后在任何工具搭建表和 CRUD 之前确定约束、索引和迁移策略。

当你使用像 Koder.ai 这样的即写即生成平台时，这一点尤其重要：快速生成很好，但只有在模式稳定的情况下才更可靠。生成的模型和端点之后需要的修改会更少。

跳过规划时常见的问题包括：

一个 “User” 表悄悄演变成混合了用户、管理员和团队的数据。
由于没有强制唯一性，出现重复记录。
删除操作破坏历史，因为引用行为未被决定。
一个常用的列表页面变慢，因为没有提前规划合适的索引。

一个好的模式规划很简单：用通俗语言描述实体、草拟表和列、列出关键约束和索引，并制定一个在产品增长时能安全变更的迁移策略。

从数据需求开始，而不是直接画表

最佳的模式规划从应用需要记住什么以及用户需要如何使用这些数据开始。用两到三句通俗的话写出目标。如果你不能简单地解释它，很可能会创建不必要的表。

接着，关注那些会创建或修改数据的动作。这些动作才是真正产生行的来源，也揭示了必须校验的内容。用动词来思考，而不是名词。

例如，一个预订应用可能需要创建预订、改期、取消、退款并向客户发送消息。这些动词会很快提示需要存储什么（时间槽、状态变更、金额），然后你才给表命名。

也要记录读取路径，因为读取会驱动后续的结构和索引。列出用户实际使用的界面或报表以及他们如何切分数据：按日期排序并按状态筛选的 “我的预订”，按客户名或预订编号的管理员搜索、按地点的每日收入以及谁在何时修改了数据的审计视图。

最后，注意会影响模式选择的非功能需求，比如审计历史、软删除、多租户隔离或隐私规则（例如限制谁能看到联系方式）。

如果你打算在这之后生成代码，这些笔记会成为强有力的提示。它们说明了哪些是必需的、哪些可能会变、更需要可搜索。如果你使用 Koder.ai，先把这些写清楚再生成会让规划模式更有效，因为平台是基于真实需求而非猜测工作。

用通俗语言定义实体和关系

在动手建表前，用通俗语言写出应用保存的内容。先列出重复出现的名词：user、project、message、invoice、subscription、file、comment。每个名词都是候选实体。

然后为每个实体补充一句话回答：它是什么，为什么存在？例如：“Project 是用户用来分组工作并邀请他人的工作空间。”这可以避免出现模糊的表名如 data、items 或 misc。

归属是下一个重要决策，会影响几乎每个查询。对每个实体决定：

谁创建它，
谁可以看到它，
谁可以修改它，
当所有者被删除时会怎样（保留、转移或删除）。

再决定如何标识记录。UUIDs 在记录可能由多种途径创建（web、mobile、后台任务）或你不想要可预测 ID 时很有用。bigint 更小更快。如果你需要面向人的标识符，单独保留一个字段（例如在账户内唯一的短 project_code），不要把它强制做主键。

最后，在画图前用句子写出关系：user has many projects，project has many messages，users can belong to many projects。把每条连接标记为必需或可选，例如 “message 必须属于 project” vs “invoice 可能属于 project”。这些句子将在生成代码时成为事实依据。

把实体翻译成表和列

当实体用通俗语言足够清楚后，把每个实体变成一个表，列出匹配需要存储的真实字段。

从可以坚持的命名和类型开始。选定一致的模式：snake_case 的列名、相同概念使用相同类型、可预测的主键。时间戳推荐使用 timestamptz，以免时区问题惊扰你。金额使用 numeric(12,2)（或以分为整数存储），不要用浮点数。

对于状态字段，使用 Postgres 枚举或 text 列加上 CHECK 约束来控制允许的值。

通过把规则翻译成 NOT NULL 来决定哪些字段是必需的。如果一个值对该行的存在是必要的，就设为必需；如果真的是未知或不适用，就允许为 null。

一个实用的默认列集合：

id（uuid 或 bigint，选一种并保持一致）
created_at 和 updated_at
只有在确实需要软删除和恢复时才加 deleted_at
当需要明确审计是谁操作时加 created_by

多对多关系几乎总是应该变成连接表。例如，如果多个用户可以协作一个应用，创建 app_members，包含 app_id 和 user_id，并在两列上强制唯一性以防止重复。

提前考虑历史记录。如果你知道需要版本控制，规划一个不可变表，例如 app_snapshots，每行是保存的版本，通过 app_id 关联到 apps，并带上 created_at。

添加保护数据的约束

从模式到 Go 和 Postgres

从你真正信任的模式生成 Go + PostgreSQL 后端。

构建后端

约束是模式的护栏。决定哪些规则必须在任何服务、脚本或管理工具操作数据库时都成立。

从身份和关系开始。每个表都需要主键，任何 “belongs to” 的字段都应该是真正的外键，而不是你希望能匹配的整数。

然后添加在重复会造成真实损害的唯一性约束，比如两个账户有相同 email，或 (order_id, product_id) 重复的行项。

值得早期规划的高价值约束：

主键（Primary keys）：选定一种一致的风格（UUID 或 bigint），以便连接可预测。
外键（Foreign keys）：把关系显式化，防止孤立行。
唯一约束（Unique constraints）：用于业务身份（email、username）以及“仅允许一个”的规则。
检查约束（Check constraints）：廉价规则，例如 amount >= 0、status IN ('draft','paid','canceled') 或 rating BETWEEN 1 AND 5。
NOT NULL：要求那些在真实世界中必须存在的字段。

级联行为是规划最能节省后期工时的地方。问一问人们实际上希望发生什么。如果删除客户会导致订单消失，通常应该使用 restrict 删除并保留历史。对于像订单行项这样的依赖数据，从订单到行项使用 cascade 可以合理，因为行项离开父记录就没有意义。

当你生成模型和端点时，这些约束会变成明确的需求：哪些错误需要处理、哪些字段是必需的、以及哪些边界情况从设计上就是不可能发生的。

根据真实查询来规划索引

为真实页面规划索引

用你最重要的 5 个查询模式来指导索引，避免性能事故。

开始构建

索引应该回答一个问题：哪些操作需要对真实用户来说是快速的。

从你预计先发布的页面和 API 调用开始。一个按状态过滤并按最新排序的列表页面，与加载关联记录的详情页所需不同。

在选择索引前，用通俗语言写下 5 到 10 个查询模式。例如：“显示我最近 30 天的发票，按已付/未付过滤，按 created_at 排序”，或“打开项目并按 due_date 列出其任务”。这能让索引选择基于真实使用场景。

一个好的首批索引通常包括用于连接的外键列、常见的过滤列（如 status、user_id、created_at），以及一两个用于稳定多条件查询的复合索引，例如当你总是按 account_id 过滤然后按时间排序时，用 (account_id, created_at)。

复合索引的顺序很重要。把你更常用且更具区分度的过滤列放在前面。如果你每次请求都按 tenant_id 过滤，它通常应该位于很多索引的最前面。

避免“以防万一”而把每列都索引。每个索引都会在 INSERT 和 UPDATE 时增加额外工作，有时这比偶尔的慢查询更有害。

对文本搜索要单独规划。如果只需要简单的“包含”匹配，ILIKE 可能起初足够。如果搜索是核心需求，就早期规划全文搜索（tsvector），以免之后不得不重设计。

在生成代码前决定迁移策略

模式在创建第一批表后并不是“完成”的。每次你添加功能、修复错误或对数据有新认识时，都会变更模式。如果你提前决定迁移策略，就可以避免在代码生成后痛苦的重写。

保持一个简单规则：以小步改动数据库，每次只做一项功能。每个迁移都应该易于审查并能在每个环境安全运行。

如何安全处理破坏性变更

大多数破坏来自重命名或删除列，或更改类型。不要一次性把所有事情做完，而是规划一条安全路径：

先添加新列（必要时设为 nullable），然后回填数据。
如果应用必须在变更期间继续工作，短期内使用双写（写入旧字段和新字段）。
把读取切换到新字段，然后在后续迁移中清理旧字段。

这需要更多步骤，但在实际中更快，因为它减少了宕机和紧急修复。

种子数据也是迁移的一部分。决定哪些参考表是“必须存在”的（roles、statuses、countries、plan types），并把这些插入和更新放在专门的迁移中，以便每个开发者和每次部署都得到相同结果。

本地、开发与生产环境的一致性规则

及早设定期望：

相同的迁移，以相同的顺序在每个环境运行。
生产中不要进行没有对应迁移的手工热修复。
每个迁移都有明确的向前说明和可行的回滚计划。

回滚并不总是完美的 “down migration”。有时最好的回滚是恢复备份。如果你使用 Koder.ai，也值得决定在执行高风险更改前何时依赖快照与回滚，特别是在风险操作之前。

常见问题

为什么我在生成模型和端点前要先规划 Postgres 模式？

先规划 schema。它设定了一个稳定的数据契约（表、键、约束），这样生成的模型和端点就不需要不断重命名和重写。

实践建议：写下实体、关系和核心查询，然后在生成代码前确定约束、索引和迁移。

如何在不被图表卡住的情况下快速开始架构规划？

写 2–3 句描述应用必须记住的内容以及用户必须能做的事情。

然后列出：

会创建/修改数据的动作（动词）
用户会使用的屏幕/报表（读取路径）
非功能需求如审计历史、软删除、多租户和隐私

这会给你足够的清晰度去设计表，而不会过度建模。

我怎么知道哪些是核心实体？

从你经常重复的名词开始列举（user、project、invoice、task）。对每个实体写一句话：它是什么，为什么存在。

如果你无法清楚描述它，你很可能会得到诸如 items 或 misc 这样模糊的表，后面会后悔。

在 Postgres 中我应该使用 UUID 还是 bigint 作为 ID？

在整个 schema 中保持一个一致的 ID 策略。

UUIDs：适合记录可能来自很多地方（web、mobile、后台任务）或不希望 ID 可预测的场景
bigint：体积更小、性能略好，适合所有记录由服务器创建的情况

如果需要面向人的可读标识符，单独增加一个唯一列（例如 project_code），不要把它当作主键。

如何为外键选择合适的删除行为（CASCADE vs RESTRICT）？

按关系决定，基于用户预期和需要保留的数据。

常见默认：

保留历史：当删除父记录会导致重要记录丢失时，用 RESTRICT/NO ACTION（例如 customer → orders）
安全级联：当子行没有父行就没有意义时，用 CASCADE（例如 order → line items）

早点做出决定，因为这会影响 API 行为和边界情况。

第一天我应该添加哪些约束？

把永久性规则放进数据库，这样所有写入者（API、脚本、导入、管理工具）都会遵守。

优先考虑：

每个表的

如何在不滥用索引的情况下挑选合适的索引？

从真实查询模式出发，而不是凭空猜测。

写下 5–10 个用例（过滤 + 排序），然后为这些用例建立索引：

用于连接的外键列
常用过滤列，例如 status、user_id、created_at
一两个匹配稳定模式的复合索引（例如 (account_id, created_at)）

避免把所有列都索引；每个索引都会增加 INSERT/UPDATE 的开销。

多对多关系应该如何建模？

把多对多关系建成连接表，包含两列外键并加上复合唯一约束。

示例模式：

team_members(team_id, user_id, role, joined_at)
添加 UNIQUE (team_id, user_id) 防止重复

这能避免“为什么这个用户出现两次”这类隐蔽的错误，并让查询更清晰。

哪些类型和列模式是 Postgres 的良好默认？

默认设置：

时间戳用 timestamptz（避免时区问题）
金额用 numeric(12,2) 或以分为单位的整数（避免浮点数）
状态值通过 Postgres 枚举或 CHECK 约束来强制执行

在表之间对相同概念保持一致的类型，这样连接和校验更可预测。

什么样的迁移策略可以避免后来破坏生成的代码？

使用小而可审查的迁移，避免一次性破坏性更改。

安全流程示例：

先增加新列（必要时可为 nullable），然后回填数据
如果应用必须保持可用，短期内同时写入旧列和新列（dual-write）
把读取切换到新列，最后在后续迁移中删除旧列

还要提前决定如何处理种子/参考数据，确保每个环境一致。

PRIMARY KEY