2025年6月12日·1 分钟

与 AI 的持续对话式应用开发

将应用开发视为人与 AI 的持续对话——通过不断反馈把目标转化为规格、原型、代码与改进，保持责任与质量的实用工作流。

为什么应用开发正在变成一场对话

构建软件本来就是一种来回互动：产品负责人说明需求，设计师勾勒方案，工程师问“如果……会怎样？”，每个人都在协商“完成”意味着什么。把它称为对话很有帮助，因为这强调了真正推动进展的东西——共同理解——而不是某个单一成果（规格、图表或工单）。

对话把想法变成意图

大多数项目失败并不是因为没人会写代码；而是因为人们构建了错误的东西，或者在错误的假设下构建了正确的东西。对话是澄清意图的方式：

目标：我们要创造什么结果？
约束：预算、时间、合规、现有系统、性能上限。
权衡：速度 vs. 精致、灵活性 vs. 简单、成本 vs. 可靠性。

一次良好的对话会尽早把这些点说清楚，并随着现实变化不断回到这些前提上。

当 AI 加入团队会改变什么（和什么不会）

AI 增加了一类新的参与者——能够快速起草、总结、提出选项并生成代码的参与者。这改变了工作的节奏：问题能更快得到回答，原型也会更早出现。

不会改变的是责任。人类仍然决定要构建什么、可以接受哪些风险、以及对用户而言什么是质量。AI 可以提出建议，但不能承担后果。

本文将讲述的工作流预览

本文将沿着对话的全流程讲述：定义问题、把需求变成示例、在设计上迭代、做架构决策、共写并审查代码、用共享的“可用”定义做测试、保持文档更新，以及发布后从真实世界反馈中学习——并在此过程中提供用于信任、安全和质量的实用护栏。

新团队：人类、AI 与明确的职责

应用开发不再只是“业务”向“工程”的交接。团队现在包含一个额外的参与者：AI。这改变了工作的节奏，但也让角色清晰比以往更重要。

谁参与（以及他们为何重要）

健康的交付团队仍然很熟悉：产品、设计、工程、支持和客户。不同的是他们能多频繁“在同一个房间里”——尤其当 AI 能快速总结反馈、起草备选方案或在技术与非技术语言之间翻译时。

客户带来的是真实的使用场景：什么让他们痛苦、什么让他们困惑、什么是他们愿意为之付费的。支持团队带来不那么光鲜的事实：重复出现的问题和边缘用例。产品界定目标和约束。设计把意图变成交互流程。工程确保可行性、性能和可维护性。AI 可以支持这些对话中的每一项，但并不拥有它们。

每方的贡献是什么

人类提供上下文、判断力和问责。他们理解权衡、伦理、客户关系以及组织中的复杂细节。

AI 带来速度和模式记忆。它可以在几分钟内起草用户故事、提出 UI 变体、建议实现方法、提示常见失败模式并生成测试思路。当团队需要选项而非决策时，AI 特别有用。

在不放弃所有权的情况下定义 AI 的角色

可以有意识地给 AI 分配“帽子”，比如：

顾问：提出方法和需要考虑的风险
起草者：生成初稿规格、代码与文案
批评者：挑战假设并审视差距
测试者：生成测试用例并探索边界行为
记录者：把决策变成活文档和示例

为了避免“AI 当老板”，要把决策权写清楚：由人类批准需求、验收设计、合并代码并签发发布。把 AI 的输出当成必须经过审查、测试和清晰推理来赢得信任的草稿——而不是凭语气就信任的结论。

在实践中，这正是“vibe-coding”类平台能发挥作用的地方：结构化的聊天工作流能把意图、约束、草稿和修订统一保存——同时在关键节点强制人类审批。

从想法到意图：共同定义问题

很多项目以功能清单开始：“我们需要一个仪表盘、通知和支付功能。”但功能往往是猜测。尤其是当你把 AI 带进房间时，更好的起点是一个清晰的问题陈述：说明谁遇到了困难、现在的现状如何、以及为什么这很重要。

从问题开始，而不是愿望清单

与其对 AI 工具说“帮我做一个任务应用”，不如说：“我们的支持团队浪费时间，因为客户请求散落在五个地方，且没有端到端的跟踪。”这句话就给出了方向和约束。它也使得人类和 AI 更容易提出符合实际情况的解决方案，而不是常见的通用模式。

提前记录约束（让建议保持现实）

除非你把约束说清楚，否则 AI 会很乐于生成忽略现实边界的选项。把你已知的约束写下来：

预算与时间（哪些是固定的，哪些是灵活的）
合规与安全要求（例如 GDPR、SOC 2 等期望）
平台与集成（Web/移动、SSO、支付提供方、内部工具）

这些约束不是“负担”，而是防止返工的设计输入。

把模糊目标转换成可测的结果

“提高效率”很难作为构建目标。把它转换成可衡量的成功指标：

将平均解决时间从 X 缩短到 Y
将自助完成率提升到 Z%
将手动数据录入步骤从 A 减少到 B

当结果是可测试的，AI 能帮助生成与成功定义一致的验收示例和边缘用例。

一页简报比头脑风暴更合适的时候

在要求解决方案之前，先写一页简报：问题陈述、用户、当前流程、约束和成功指标。然后邀请 AI 挑战假设、提出备选方案并列出风险。这样的顺序能让对话更有根基——并节省数天去“把错误的正确事情做成”的时间。

需求作为对话：用户故事、示例与明确性

需求在像对话一样呈现时效果最好：清晰的意图、对“完成”含义的共同理解，以及一些具体示例。AI 可以加速这一过程——前提是你把它当作起草伙伴，而不是神谕。

向 AI 请求用户故事和验收标准

与其说“为功能 X 写需求”，不如给 AI 一个角色、约束和受众。例如：

“为繁忙的一次性用户配置通知，提出 6 个用户故事，并用普通语言写出验收标准。”
“包含一个用于管理员监管的故事、一个用于无障碍的故事和一个用于数据导出的故事。”

然后审阅它返回的内容并严格编辑。保持故事粒度小到可以在几天内实现，而不是几周。如果一个故事包含多个目标（“而且还要……”），就拆分它。

用示例消除歧义

没有示例的用户故事往往只是礼貌性的猜测。加入真实场景：

典型流程：“用户注册后选择‘每周摘要’，并在其时区的周一上午 9 点收到。”
边缘情况：“用户在周日夜里更改时区——投递是立即生效还是下一个周期？”
失败状态：“邮件服务拒绝发送——用户看到什么，系统如何重试？”

你可以让 AI 生成示例表格并和团队验证：“列出 10 个示例，包括 3 个边缘用例和 2 个失败状态。标注你不得不做出的任何假设。”

轻量但无歧义

追求“薄而可测”。一页简明规则比十页模糊论述更有用。如果某件事影响计费、隐私或用户信任，就要明确写下来。

建立共享术语表

误解常来自词语，而不是代码。维护一个小型术语表——最好和需求放在一起：

“workspace”、“account”和“organization”有何不同？
“member” 是否包含来宾？
“archived” 是指隐藏、只读还是删除？

把术语表反馈到你的 AI 提示中，这样草稿保持一致——你的团队也更容易对齐。

循环中的设计：快速迭代而非仓促

优秀的设计很少一蹴而就。它通过循环被锻造：草图、测试、调整、重复——同时保持最初的意图完整。AI 能让这些循环更快，但目的不是单纯追求速度，而是快速学习且不跳过思考过程。

共创流程、线框与微文案

从流程开始，而不是从屏幕开始。描述用户目标与约束（“移动端首次使用者，单手操作，注意力有限”），然后要求 AI 提出几个流程方案。接着用它来粗略绘制线框级布局并起草与品牌语气一致的微文案（按钮标签、错误提示、辅助文本）。

一个有用的节奏是：人定义意图和语调，AI 生成选项，人选择并编辑，AI 统一各屏的一致性。

多个选项与明确权衡

当你要求“给出三种不同方案”时，要求提供权衡点，而不仅仅是变体。例如：“方案 A 最少步骤，方案 B 降低用户焦虑，方案 C 避免收集敏感数据。”提前比较权衡能防止团队把精力浪费在修饰解决错误问题的设计上。

可及性与包容性要早做，而不是事后补救

在任何东西“定型”之前，做快速检查：颜色对比假设、键盘导航预期、可读的错误状态、包容性语言，以及像屏幕阅读器这样的边缘用例。AI 能指出可能的问题并提出修复建议，但最终是人类决定什么对你的用户可接受。

把反馈变成修订而不丢失“为什么”

反馈常常很混乱：“这个感觉很困惑。”以明白的语言捕捉其深层原因，然后把它变成具体的修订（“重命名这一步”、“添加预览”、“减少选择项”）。要求 AI 把反馈总结成与原始目标相关的短变更清单，这样迭代才不会偏离目标。

架构作为协商：决策，而非法令

带回退计划地迭代

使用快照安全试验，变更需要快速回退时可恢复。

使用快照

架构过去常被当成一次性的蓝图：选模式、画图并强制执行。AI 在场时，更适合作为一个协商过程——在产品需求、交付速度、长期维护和团队实际能力之间的协商。

用 AI 生成选项，而非下命令

一种务实的方法是把人类的架构决策与 AI 生成的替代方案配对。你设定上下文（约束、团队技能、预期流量、合规需求），让 AI 提出 2–3 个可行设计并给出权衡。

然后由人来做决定：选择符合业务与团队的方案。如果某个选项“很酷”但会增加运维复杂度，就说不并继续前进。

提前划界——然后再回顾

大多数架构问题都是边界问题。要定义：

模块与归属（哪些放在一起，哪些不放在一起）
API 与契约（输入/输出、错误行为）
数据模型（真源、迁移、分析需求）
权限与角色（谁可以做什么，为什么）

AI 可以帮忙发现遗漏（“如果用户被删除会发生什么？”），但边界决策应保持明确且可测试。

保持一个简单的决策日志

维护一个轻量的决策日志，记录你做了什么、为什么这么做以及何时会回顾。想象成每个决策的一条短注，存放在代码库附近（例如 /docs/decisions）。

这能防止架构变成口头传说——也让 AI 的帮助更安全，因为系统有书面的意图可供参考。

用一个问题抵制过度设计

当争论开始蔓延时，问自己：“满足今天需求并且不会阻碍明天发展的最简单版本是什么？” 让 AI 提出最小可行架构和可扩展升级路径，这样你可以现在上线并在有证据时演进。

编码即共写：起草、审查、打磨

把 AI 当作一个快速的初级队友：擅长产出草稿，但不对最终形态负责。人类应掌控架构、命名与决策背后的“为什么”，而 AI 加速“如何实现”。目标不是外包思考，而是缩短从意图到清晰、可审查实现的距离。

一个实用循环：起草 → 批评 → 收紧

先让 AI 生成一个小且可测试的切片（一个函数、一个端点、一个组件）。然后立即切换模式：对草稿进行审查，看其清晰性、一致性以及是否符合现有约定。

一些有用的提示模式：

Generate: “Generate a POST /invoices handler using our existing validation helper and repository pattern.”
Refactor: “Refactor this to remove duplication and keep side effects at the edges.”
Explain: “Explain the control flow and where errors are handled. What assumptions are being made?”
Add tests: “Add unit tests for success + validation failure + repository error, matching our test style.”

（注：上面示例中的代码或 API 标识保留为示例用法，不作翻译。）

有意地保持代码可读

AI 可能生成正确但读起来“怪里怪气”的代码。人类应负责：

用与你的领域语言相符的命名（不要用通用的 data/item）
写出能表达意图与权衡的注释，而不是重复显而易见的内容
保持一致的惯例（文件夹结构、lint 规则、错误处理）

如果你维护一个简短的风格快照（几条偏好示例），把它包含进提示里以锚定输出。

解锁阻塞，而不是绕过审查

用 AI 来探索选项和快速修复繁琐问题，但别让它绕过你既有的审查关。保持 PR 小而可审，运行相同的检查，并要求人在合并前确认行为是否与需求一致——尤其是围绕边缘情况和安全敏感代码。

如果你想让这种“共写”循环感觉自然，像 Koder.ai 这样的工具能把对话本身变成工作区：你可以在聊天中规划、搭建并迭代，同时保持源码管理纪律（可审查的 diff、测试与人工审批）。当你想先做快速原型然后逐步推进到生产级别（例如 web 用 React、后端用 Go+PostgreSQL、移动端用 Flutter）时，这类工具特别有效——且不会把流程变成一堆碎片化的提示。

测试作为共享语言：证明它可用

在你的域名上上线

准备好分享时，将应用绑定到自定义域名。

添加域名

测试是把对话具体化的地方。你可以争论意图和设计数日，但一套好的测试套件回答一个更直接的问题：“如果我们上线，它会按我们承诺的那样表现吗？”当 AI 参与写代码时，测试更有价值，因为它们把决策锚定在可观测的结果上。

把验收标准转换为测试用例

如果你已有用户故事与验收标准，让 AI 直接根据它们提出测试用例。关键不在数量，而在覆盖率：边缘用例、边界值，以及“如果用户做了意外的事会怎样？”场景。

一个实用的提示是：“基于这些验收标准，列出测试用例，包含输入、预期输出与失败模式。” 这常常会在仍然廉价澄清时暴露遗漏（超时、权限、错误信息）。

生成单元测试、示例数据与负面测试

AI 能快速起草单元测试，生成现实的示例数据和负面测试（格式无效、超出范围值、重复提交、部分失败）。把这些当作第一稿。

AI 特别擅长：

生成一致的 fixture 和 mock 对象
列举人类常忘记写下的失败路径
把规格转成可重复断言

人类仍对风险与现实负责

人类需要审查测试以确保其正确性与真实行为。测试是在验证需求，还是只是陈述实现？我们是否遗漏了隐私/安全场景？我们是否在合适的层级（单元 vs 集成）测试风险？

把它纳入完成定义

强有力的完成定义不仅仅包含“有测试”。它应包括：测试通过、对验收标准有意义的覆盖，以及更新的文档（即使只是 /docs 或变更日志中的一条短注）。这样，发布不是一场猜测，而是有证明的声明。

保持活着的文档：解释、记录与复用

大多数团队并不是真的讨厌写文档——他们讨厌重复写，或写完后眼睁睁看着文档过时。有了 AI，文档可以从“事后额外工作”转变成“每次重大变更的副产品”。

解释：把决策变成人能读懂的笔记

当一项功能被合并时，AI 可以把变更翻译成人类友好的语言：变更日志、发布说明和短使用指南。关键是给它正确的输入——提交摘要、PR 描述以及一条关于为什么做这项变更的简短说明——然后像审查代码一样审阅输出。

不要用模糊的更新（“提升了性能”），而要写具体陈述（“在按日期筛选时搜索结果更快”）和明确影响（“无需操作” vs “需要重新连接账户”）。

记录：构建能回答真实问题的内部文档

内部文档最有用的时候是它能回答人们在事故凌晨 2 点会问的问题：

假设什么都不知道的安装说明，并包含常见坑
包含“如果发生 X 就做 Y”步骤的运行手册
基于实际工单与事故的排障指南

AI 擅长基于现有材料（支持线程、事故笔记、配置文件）来起草这些内容，但人类应在干净的环境中验证步骤。

复用：把文档更新作为变更的一部分

最简单的规则：每次产品变更都要伴随文档变更。把“文档已更新？”作为 PR 的检查项，并让 AI 通过比较新旧行为来建议编辑。

必要时，把读者链接到支持页面（例如 /blog 用于更深的解释，或 /pricing 用于计划相关的功能）。这样，文档成为一张活的地图，而不是被遗忘的文件夹。

发布与学习：发布后的持续反馈

发布不是对话的结束——而是对话变得更诚实的开始。一旦真实用户接触到产品，你就不再猜测它的表现，而是开始学习它如何真正融入人们的工作流。

生产环境是一个反馈通道

把生产当成另一个输入流，和发现访谈及内部审查并列。发布说明、变更日志，甚至“已知问题”列表都表明你在倾听——并为用户提供一个锚点来反馈。

收集信号，然后把它们连成故事

有用的反馈很少会以整齐的包出现。通常你会从几个来源提取：

支持工单与聊天记录（什么让人痛）
分析数据（大规模下发生了什么）
用户访谈（为什么会发生）

目标是把这些信号连成一个故事：哪个问题最频繁、哪个代价最大、哪个最容易修复。

让 AI 做第一遍整理——人类来决策

AI 可以帮助每周总结支持主题、聚类相似投诉并起草优先修复列表。它还可以提出后续步骤（“添加校验”、“改进上手文案”、“为该事件添加埋点”）并生成补丁的短规格。

但优先级仍是产品决策：影响、风险与时机都重要。用 AI 来减少阅读与排序的工作量——不要把判断外包出去。

安全发布：小范围上线并留有退出方案

以让你保持控制的方式发布更改。功能开关、分阶段发布和快速回滚把发布变成实验而非赌注。如果你想要一个实用基线，请在每次变更时定义回退计划，而不是在出问题后临时拼凑。

这也是平台特性能实质降低风险的场景：快照与回滚、审计友好的变更历史与一键部署把“我们总能回退”从希望变成一种操作习惯。

信任、安全与质量：AI 协作的护栏

掌控你的源代码

需要迁移或本地审查时，通过导出源代码保持掌控。

导出代码

与 AI 协作能加速开发，但也引入了新的失效模式。目标不是“全信模型”或“全面不信模型”——而是建立一个通过检查而不是凭感觉来赢得信任的工作流。

需要规划的常见风险

AI 可能虚构 API、库或关于你代码库的“事实”。它也可能带入隐藏假设（例如“用户总是在线”、“日期为 UTC”、“仅英文 UI”）。此外，它可能生成脆弱的代码：在演示的阳光路径下可运行，但在高负载、奇怪输入或真实数据下失败。

一个简单习惯有帮助：当 AI 提出解决方案时，让它列出假设、边缘情况和失败模式，然后决定哪些要成为显式需求或测试。

数据隐私：不要把什么粘贴到提示里

把提示视为一个共享工作区：不要粘贴密码、API 密钥、私人客户数据、访问令牌、未发布的财务数据或专有源代码，除非你们组织有经过批准的工具与策略。

改用脱敏与综合：用占位符替代真实值、描述模式而不是直接导出表格、并仅分享能复现问题的最小片段。

如果你的组织有数据驻留约束，确保你的工具能合规。一些现代平台（包括 Koder.ai）在全球分布式基础设施上运行并能在不同地区部署应用以帮助满足数据隐私与跨境传输要求——但策略仍应优先。

偏见、公平性与用户影响

面向用户的功能可能编码不公平的默认值——推荐、定价、资格判定、内容审核，甚至表单校验。加入轻量级检查：用多样的姓名与地域测试、审视“谁可能受到伤害”，并在影响到人的决策处提供解释与申诉路径。

实用的护栏措施

让 AI 输出可审查化：要求人工代码审查、对高风险变更设定审批并保留审计轨迹（提示、diff、决策）。把这些与自动化测试与 lint 结合起来，使质量不可谈判——只是更快到达质量的路径可被优化。

接下来 3–5 年可能的样子（不带炒作）

AI 不会“取代开发者”，而更会重新分配关注点。最大变化是工作日更多地用于澄清意图与验证结果，而把把显而易见的决策翻成样板代码的重复工作减少。

角色向意图、UX 与验证倾斜

预计产品与工程角色会围绕更清晰的问题陈述与更紧密的反馈回路融合。开发者会把更多时间花在：

压测假设（“当这个规则与另一个冲突时会怎样？”）
打磨 UX 细节（“这里的‘撤销’具体意味着什么？”）
用示例、测试与监控验证行为

与此同时，AI 会处理更多的初稿：搭建屏幕骨架、连接端点、生成迁移脚本、提出重构建议——然后把工作交回给人类判断。

新的关键技能

能从 AI 中获益的团队会增强沟通能力，而不仅仅是工具使用。重要的技能包括：

把提示写成规格：在请求输出时带上约束、示例与边缘情况
批判与评估：识别自信但可能错误的建议，检查遗漏的需求
领域建模：为概念命名得当，让人类与 AI 保持一致（实体、状态、规则）

这些不只是关于巧妙 prompts，而是关于做到明确。

可复用的对话协议

高绩效团队会标准化他们“如何与系统对话”。一个轻量协议可能是：

陈述意图（目标、用户、非目标）
提供示例（阳光路径 + 边缘用例）
请求选项（权衡、风险、假设）
做出决定（现在做什么 vs 以后再做）
验证（测试、检查、验收标准）
记录（在 /docs 写短注，让下一次迭代有据可循）

今天 AI 最有用的地方——以及接下来会怎样

现在，AI 在加速草稿、总结 diff、生成测试用例和在审查时提出备选项方面最为强大。未来几年，期望会有更好的项目级长上下文记忆、更可靠的工具使用（运行测试、读取日志）以及跨代码、文档与工单的一致性改进。

限制因素仍然是清晰度：能准确描述意图的团队会最先受益。最终获胜的团队不会仅仅拥有“AI 工具”——他们会有一套可重复的对话，把意图变成软件，并配备让速度变得安全的护栏。

如果你正在探索这种转变，考虑尝试一种把对话、规划与实现放在一处的工作流。例如，Koder.ai 支持以聊天驱动的构建：规划模式、源码导出、部署/托管、自定义域名以及快照/回滚——当你想更快迭代但又不放弃控制时，这些特性很有用。（如果你在过程中发布学习成果，像 Koder.ai 的学分与推荐计划这样的项目还能在试验时抵消一部分成本。）