用于缓存、会话与快速查找的键值存储

Q: 为什么键值存储比传统数据库更快？

键值存储针对一个操作进行优化： 给出一个键，返回对应的值 。这种窄化的关注点让实现路径很短，比如内存索引和哈希定位，从而比通用数据库减少查询规划开销。 它们还通过分流重复读（热门页面、常见 API 响应）间接加速系统，使主数据库能够把精力放在写入和复杂查询上。

Q: 键值存储里的“键”和“值”到底是什么？

键是你能精确复现的唯一标识（通常是像 或 这样的字符串）。值就是你想取回的内容——可以是一个小计数器，也可以是一个 JSON blob。 好的键应当 稳定、带作用域且可预测 ，这让缓存、会话和查找更容易操作与排查。

Q: 我应该在键值存储中缓存什么？

缓存那些 被频繁读取 且 能在丢失后被重新生成 的结果。 常见例子： - 公共或半静态的页面片段（分类页、“热门商品”） - 预计算的输出（推荐、汇总、报表片段） - 每次请求都会读取的功能开关和配置 - 可短期复用的第三方 API 响应 避免缓存必须绝对实时的数据（例如金融余额），除非你有强有力的失效策略。

Q: 什么是 cache-aside 模式，何时适用？

Cache-aside（惰性加载）通常是默认选择： 1. 从缓存按键读取。 2. 若未命中，则从数据库/真实来源读取。 3. 将结果放入缓存并设置 TTL。 4. 返回结果。 它退化得很优雅：如果缓存为空或宕机，应用仍可以从数据库提供服务（但需要相应保护措施）。

Q: 读穿（read-through）和写穿（write-through）缓存有什么区别？

Read-through 适用于希望在未命中时由缓存层自动从数据库加载（简化应用读取，但需在缓存层集成加载器）。 Write-through 则表示每次写操作同步写入缓存和数据库，读取通常更一致，但写操作延迟更高。 在能接受缓存层集成复杂性（read-through）或更高写延迟（write-through）的场景下选择它们。

Q: 什么是缓存雪崩，如何防止？

当一个热门键过期后大量请求同时重建它，就会发生缓存雪崩（stampede）。 常见缓解措施： - 请求合并/加锁 ：只有一个请求负责重建，其他请求等待。 - 在重验证期间返回陈旧值 ：短时间内返回上一次的值，同时后台刷新。 - 提前刷新 ：在 TTL 到期前稍早刷新热门键。 这些方法能降低对数据库或外部 API 的突发压力。

Q: 如何用键值存储管理会话？

会话数据非常适合键值存储，因为访问模式简单：按 token 读写并设置过期。 最佳实践： - 使用带作用域的键，例如 （使用版本号如 有助于迁移）。 - 保持会话值精简，只存必要信息。 - 在登出或发现可疑活动时立即删除会话键。 - 在登录或权限变更后旋转 token，以缩短被盗 token 有效期。

Q: 键值存储如何用于限流？

许多键值存储支持 原子自增 ，这让在高并发下计数器安全可用。 典型模式： - → 每次请求递增 - 给该键设置 60 秒过期 计数超阈值时就进行限流或拒绝请求。基于 TTL 的过期机制能自动在时间窗口后重置限制，无需后台作业。

Q: 在采用键值存储前，我需要理解哪些可靠性权衡？

在采用键值存储前需要设计的权衡： - 持久性： 纯内存最快但重启会丢失数据；快照或追加日志能降低数据丢失但增加开销。 - 一致性： 复制可能带来短暂陈旧（复制延迟），尤其在故障切换时。 - 驱逐： 内存满时的驱逐策略（LRU、LFU、随机或不驱逐）决定是丢失缓存条目还是开始出现写失败。 为退化模式做准备：在缓存不可用时回退到数据库、在安全场景下返回略陈旧数据或对敏感操作“关闭失败”。

登录开始使用

用于缓存、会话与快速查找的键值存储 | Koder.ai

为什么使用键值存储来加速

键值存储的主要目标很简单：降低终端用户的延迟并减轻主数据库的负载。与其反复执行相同的昂贵查询或重新计算相同的结果，你的应用可以通过一次可预测的查找直接获取预计算的值。

访问路径简单所以更快

键值存储围绕一个操作进行优化：“给定这个键，返回值”。这种窄化的关注点能使关键路径非常短。

在很多系统中，一次查找通常可以通过：

内存索引（因此无需磁盘寻道）
从键到位置的直接哈希（因此搜索开销小）
比通用数据库查询引擎更少的 CPU 密集特性

结果是低且稳定的响应时间——正是你在做缓存、会话存储和其他高速查找时所希望的。

避免在别处重复工作也很快

即使你的数据库调优得很好，它仍需解析查询、生成执行计划、读取索引并协调并发。如果成千上万的请求都在问相同的“热门商品”列表，这些重复工作会累加。

键值缓存将这些重复的读取流量从数据库中分流出去。这样数据库可以把时间留给真正需要它的请求：写入、复杂联表、报表和对一致性要求高的读取。

并非所有工作负载都适合

速度不是免费的。键值存储通常以牺牲丰富查询（过滤、联表）为代价，并且根据配置在持久性和一致性上有不同保证。

当你可以用明确的键来命名数据（例如 user:123、cart:abc）并且需要快速检索时，它们非常适合。如果你经常需要“查找所有满足 X 的项”，关系型或文档数据库通常是更好的主存储。

键值基础：键、值与查找

键值存储是最简单的一类数据库：你把一个值（要存的数据）存到一个唯一的键（标签）下，以后通过该键取回值。

“键”和“值”到底是什么

把键想象成一个容易精确复现的标识符，值就是你想要取回的东西。

外套寄存：你的票号是键；外套是值。
通讯录："Alice Chen"（或联系人 ID）是键；电话号码和详情是值。
会话：随机的会话 token 是键；用户 ID 和登录状态是值。

键通常是短字符串（如 user:1234 或 session:9f2a...）。值可以很小（计数器）或较大（JSON blob）。

常数时间查找如何工作（高层次）

键值存储为“给我这个键对应的值”查询而建。内部很多实现使用类似哈希表的结构：键被映射到一个可以快速找到值的位置。

这就是为什么你经常会听到常数时间查找（常写作 O(1)）：性能更多取决于你做了多少请求而不是总共有多少条记录。这不是魔法——碰撞和内存限制仍然重要——但对于典型的缓存/会话场景，它非常快。

常见部署：内存、磁盘或混合

内存：读写最快；重启后数据可能丢失，除非做了持久化。
磁盘：比 RAM 慢，但能保存更多数据并在重启后存活。
混合：将热点数据保留在内存，同时写到磁盘以便恢复。

什么是“热点数据”（为什么重要）

热点数据是被反复请求的小部分信息（热门商品页、活跃会话、限流计数器）。把热点数据放在键值存储中——尤其是在内存中——可以避免较慢的数据库查询并在负载下保持可预测的响应时间。

缓存基础：缓存什么以及为什么缓存

缓存就是把常用数据保存在比原始源更快的位置。键值存储是常见选择，因为它可以通过键做一次查找并在毫秒级别返回值。

何时缓存最有帮助

当相同的问题被重复问很多次时，缓存效果最佳：热门页面、重复搜索、常见 API 调用或昂贵计算。若真实来源较慢或受限（比如高负载下的主数据库或按请求收费的第三方 API），缓存也很有帮助。

应缓存的内容（实用示例）

适合缓存的通常是被频繁读取且不必绝对实时的数据：

用户资料摘要（姓名、头像 URL、偏好）
商品列表和分类页
预计算结果（推荐、汇总、报表片段）
每次请求都读的配置和功能开关
可在短期内安全重用的外部 API 响应

一个简单规则：缓存可以在需要时重新生成的输出。避免缓存经常变化或必须在所有读取间保持一致的数据（例如银行余额）。

为什么缓存能减轻数据库和 API 的压力

没有缓存的话，每次页面访问可能触发多个数据库查询或 API 调用。使用缓存后，应用可以从键值存储服务大量请求，只在缓存未命中时回退到主数据库或 API。这会降低查询量，减少连接争用，并在流量高峰期提高可靠性。

风险：陈旧数据和不一致读取

缓存以速度换取新鲜度。如果缓存值更新不够及时，用户可能看到陈旧信息。在分布式系统中，两个请求可能在短时间内读取到同一数据的不同版本。

你可以通过为不同键选择合适的 TTL、决定哪些数据可以“略旧”，并设计应用以容忍偶发的缓存未命中或延迟刷新来管理这些风险。

常见缓存模式以及适用场景

缓存“模式”是应用在涉及缓存时读写数据的可复用工作流。选择合适的模式更多取决于底层数据的变更频率以及你能容忍多少陈旧数据，而不是工具本身（Redis、Memcached 等）。

Cache-aside（惰性加载）

使用 cache-aside 时，应用显式控制缓存：

按键从缓存读取。
若未命中，则从数据库/真实来源读取。
把结果放入缓存并设置 TTL。
返回结果。

最佳场景：读取频繁但变更不频繁的数据（商品页、配置、公开资料）。它也是良好的默认策略，因为失败退化得很优雅：如果缓存为空，你仍可以从数据库读取。

Read-through 与 Write-through

Read-through 表示缓存层在未命中时会去数据库加载（应用读“从缓存”，缓存知道如何加载）。从操作上看，它简化了应用代码，但增加了缓存层的复杂性（需要集成加载器）。

Write-through 表示每次写都会同步写入缓存和数据库。读取通常更快且更一致，但写操作更慢，因为需要完成两次写入。

最佳场景：希望减少缓存未命中并简化读取一致性的场景（用户设置、功能开关），且能接受写入延迟时。

Write-back / Write-behind

使用 write-back 时，应用先写入缓存，缓存随后（通常以批量方式）把更改刷到数据库。

优点：写入非常快并减少数据库负载。

风险：如果缓存节点在刷写前失败，可能丢失数据。仅在可以容忍数据丢失或有强持久化机制时使用。

如何根据变更频率选择

若数据很少变更，使用带合理 TTL 的 cache-aside 通常足够。如果数据频繁变更且陈旧读取代价高，考虑 write-through（或非常短的 TTL 加上显式失效）。若写入量极高且偶发丢失可接受，write-behind 可能值得权衡。

新鲜度控制：TTL、过期与失效

让缓存数据“足够新”主要是为每个键选择合适的过期策略。目标不是完美准确，而是避免陈旧结果让用户惊讶，同时仍能享受缓存带来的速度提升。

TTL 与过期：它们做什么以及如何选择

TTL（生存时间）会在一段持续时间后让键消失或变得不可用。短 TTL 降低陈旧风险但提高未命中率和后端负载；长 TTL 提高命中率但可能返回过时值。

选择 TTL 的实用方法：

与底层数据变动频率匹配。 商品价格可能需要以分钟为单位；用户简介可以是小时级。
考虑业务影响。 点赞数陈旧通常可以接受；账户余额则不行。
加入小范围随机（抖动/jitter）。 若许多键共享同一 TTL，它们可能同时过期，导致流量峰值。

主动失效：在数据变更时删除或更新

TTL 是被动的。当你知道数据已经改变时，通常最好主动失效：删除旧键或立即写入新值。

示例：用户更新邮箱后，删除 user:123:profile 或立即在缓存中更新它。主动失效能减少陈旧窗口，但要求你的应用可靠地执行这些缓存更新。

版本化键：简单、低风险的失效方式

与其删除老键，不如在键名里包含版本号，例如 product:987:v42。当产品变更时，把版本号升级到 v43 并开始读写新键。老版本会自然过期，这避免了某个服务器删除键而另一个尚在写入时产生的竞态。

处理缓存雪崩

当一个热门键过期且大量请求同时重建它时会发生雪崩。

常见解决办法包括：

请求合并/加锁： 仅一个请求负责重建，其他请求等待。
在后台重验证时返回陈旧值： 暂时返回上一次的值同时后台刷新。
提前刷新： 在 TTL 到期前稍早刷新热门键。

使用键值存储保存会话

将学习转化为积分

因创建关于 Koder.ai 的内容或推荐同事尝试而获得积分。

赚取积分

会话数据是应用识别回访浏览器或移动客户端所需的一小束信息。至少包括会话 ID（或 token）对应的服务端状态。根据产品，会话也可以包含用户状态（登录标志、角色、CSRF 随机数）、临时偏好以及如购物车或结账步骤之类的时效性数据。

为什么键值存储适合会话

键值存储天生匹配会话，因为会话的读写很简单：按 token 查找值、更新它并设置过期。它们也便于应用 TTL，使不活跃的会话自动消失，保持存储整洁并在 token 泄露时降低风险。

一个常见流程：

登录时：创建新的随机会话 token 并把会话数据存到该键下。
每次请求时：按 token 读取，若使用滑动过期则刷新 TTL。
登出或可疑活动时：立即删除该键。

会话键设计

使用清晰、有作用域的键并保持值小：

命名： sess:<token> 或 sess:v2:<token>（版本化有助于将来变更）。
用户作用域： 可选择维护 user_sess:<userId> -> <token> 以强制“每用户仅一活跃会话”或按用户撤销会话。
大小限制： 避免把完整资料塞进会话。只存必要数据；把更大的数据放在主数据库并通过引用获取。

注销与旋转

注销应删除会话键和任何相关索引（如 user_sess:<userId>）。对于旋转（建议在登录、权限变更或定期进行），先创建新 token、写入新会话，然后删除旧键。这能缩短被盗 token 有效的窗口期。

除了缓存以外的高速查找场景

缓存是键值存储最常见的用例，但它并非唯一能加速系统的方式。许多应用依赖对小型、频繁引用的状态进行快速读取——这些状态是“真实来源的邻近”，并且几乎每次请求都需要快速检查。

授权数据：权限与配额

授权检查常常处在关键路径上：每个 API 调用可能都要回答“该用户是否被允许执行此操作？”将权限每次都从关系型数据库读取会增加显著延迟与负载。

键值存储可以保存紧凑的授权数据以便快速查找，例如：

perm:user:123 → 权限码的列表/集合
entitlement:org:45 → 启用的计划功能

当你的权限模型以读取为主并且变更相对较少时，这种方式特别有用。权限变更（角色更新、计划升级）时只需更新或失效少量键即可使下一次请求反映新规则。

功能开关与配置读取

功能开关是小且被频繁读取的值，需要在多个服务间快速且一致地可用。

常见模式是存储：

flag:new-checkout → true/false
config:tax:region:EU → JSON blob 或带版本的配置

键值存储在这里表现良好，因为读取简单、可预测且非常快速。你也可以对值做版本化（例如 config:v27:...）以便更安全地发布和回滚。

使用计数器进行限流与节流

限流通常简化为每用户、API key 或 IP 地址的计数器。键值存储通常支持原子操作，允许你在并发大量到达时安全地递增计数器。

你可能会跟踪：

rl:user:123:minute → 每次请求递增，60 秒后过期
rl:ip:203.0.113.10:second → 短窗口突发控制

对每个计数器设置 TTL 后，限制会自动重置，无需后台任务。这是保护登录尝试、昂贵端点或按计划配额的实用基础。

幂等键用于可重试端点

支付等“恰好执行一次”的操作需要保护以防重试（超时、客户端重试或消息重发）。键值存储可以记录幂等键：

idem:pay:order_789:clientKey_abc → 存储的结果或状态

首次请求时你处理并存储结果带上 TTL。后续重试返回存储的结果而不是再次执行操作。TTL 防止无限增长，同时覆盖合理的重试窗口。

这些用法不是经典意义上的“缓存”；它们是为需要速度与原子性的高频读取与协调原语提供支持。

有用的数据结构与原子操作

快速部署限流

使用原子计数器实现节流和配额，无需重写逻辑。

添加限流

“键值存储”并不总意味着“字符串进、字符串出”。许多系统提供更丰富的数据结构，让你直接在存储内建模常见需求——通常比把所有逻辑放到应用代码中更快且更少组件。

哈希/映射：在一个键下存多字段

哈希（也称为映射）适合有多个相关属性的单个“对象”。与其创建许多键如 user:123:name、user:123:plan、user:123:last_seen，不如把它们放在 user:123 下的字段里。

这减少键膨胀并允许你只抓取或修改所需字段——对资料、功能标志或小配置 blob 很有用。

集合与有序集合：成员关系与排名

集合适合“X 是否属于该组？”的问题：

用户是否已兑换优惠券？
哪些商品 ID 属于“夏季促销”集合？

有序集合在此基础上增加了按分值排序，适用于排行榜、前 N 列表以及按时间或热度排序。你可以把分值存为访问量或时间戳，快速读取热门项。

原子递增与条件写入

并发问题常见于小功能：计数器、配额、一次性操作与限流。如果两个请求同时到达而你的应用做“读 → 加 1 → 写”的话，可能会丢失更新。

原子操作通过在存储内部把改动做为单个不可分割的步骤来解决：

原子递增 用于计数器（浏览量、重试、API 调用）
条件写入（仅当不存在时设置，或仅当版本匹配时更新）以防双重处理

为什么原子操作能简化计数器与限额逻辑

通过原子递增，你不需要锁或跨服务器的额外协调。这意味着更少的竞态条件、更简单的代码路径以及在高负载下更可预测的行为——尤其是在限流与使用上限这类“几乎正确就会变成用户问题”的场景中。

面对流量的扩展：复制、分片与可用性

当键值存储开始处理大量流量时，“更快”通常意味着“更宽”：把读写分散到多个节点，同时在故障时保持系统可预测。

扩展读写：复制与分片

复制保留数据的多个副本。

对于读取密集型工作负载（常见于缓存），副本可以并行服务读取。
写入通常到主节点（或 leader）后再复制到副本，这可能导致副本在短时间内不可见最新写入。

分片把键空间拆分到不同节点。

每个节点负责一部分键（例如通过对键做哈希决定）。
分片能增加读取与写入吞吐量，因为工作负载被分散，但也增加运维复杂性（重平衡、处理“热点键”、跟踪哪个节点拥有哪些键）。

许多部署会结合两者：用分片来扩大吞吐量，并为每个分片配置副本以提高可用性。

高可用性与故障切换的实践

“高可用”通常意味着即便某个节点失败，缓存/会话层仍能继续服务请求。

故障切换 是在主节点宕机时自动提升副本为新主节点。
实践中，你的应用应在切换期间容忍短暂错误或重试，并接受某些尚未复制的最新写入可能丢失。

客户端路由 vs 服务器端路由

使用 客户端路由 时，应用（或其库）计算哪个节点拥有某个键（常配合一致性哈希）。这很快，但客户端必须感知拓扑变化。

使用 服务器端路由 时，你把请求发到代理或集群端点，由其转发到正确节点。这简化客户端和发布，但增加一次网络跳转。

容量规划：内存、余量与增长

从总体估算内存需求：

估算工作集大小（你期望保持“热”的数据）以及元数据开销。
留出余量（通常 20–50%）以应对流量突增、重平衡和不均匀键分布。
在负载下验证驱逐策略的行为，以便系统是优雅退化而不是抖动（thrash）。

可靠性与需要理解的权衡

键值存储之所以感觉“瞬时”，是因为它们把热点数据放在内存并为快速读写优化。这种速度有代价：你常常在性能、耐久性和一致性之间做出选择。提前理解这些权衡可以避免后续痛苦的惊喜。

持久性：你能承受丢失多少数据？

许多键值存储可以在不同持久化模式下运行：

无（纯内存）： 最快最简单——直到重启时一切被清空。适用于可以重算的数据。
快照： 定期保存到磁盘。如果节点崩溃，会丢失自上次快照以来的更改。
追加日志（AOF 等）： 写操作按顺序记录。恢复比纯内存慢，但通常能减少数据丢失。

选择与数据用途匹配的模式：缓存可容忍丢失；会话存储通常需要更谨慎的处理。

一致性预期：我的写入真的生效了吗？

在分布式部署中，你可能会看到最终一致性——在写入后的一段短时间内读取到旧值，尤其是在故障切换或复制延迟期间。更强的一致性（例如要求多个节点确认）会减少异常，但会提高延迟并在网络问题时降低可用性。

内存满时：驱逐与压力下的行为

缓存会填满。驱逐策略 决定被移除的是哪些数据：最近最少使用（LRU）、最不常用（LFU）、随机，或“不驱逐”（内存满则写失败）。你要决定在压力下是宁愿丢失缓存条目还是出现错误。

存储不可用时：为降级模式做计划

假设宕机会发生。典型的回退策略包括：

绕过缓存 直接读主数据库（并加上速率限制）。
在可行时返回稍陈旧的数据。
对敏感操作失败关闭（例如认证令牌），同时允许非关键功能降级。

有意地设计这些行为会让系统在用户看来更可靠。

安全、监控与成本要点

构建缓存端点原型

通过聊天原型化缓存端点，提前评估延迟改善。

开始构建

键值存储通常处在应用的“热路径”。这让它既敏感（可能保存会话令牌或用户标识符），又昂贵（通常以内存为主）。早期把基础做对可以避免日后的事故。

安全：保持访问受限

从清晰的网络边界开始：把存储放在私有子网/VPC 段，只允许真正需要的应用服务访问。

如产品支持，启用认证并遵循最小权限原则：为应用、管理员和自动化分配不同凭据；定期轮换密钥；避免共享的“root”令牌。

尽可能在传输中加密（TLS），尤其是跨主机或可用区的流量。是否启用静态加密取决于产品与部署；若支持，在托管服务中启用并验证备份加密。

监控：每天要看什么

一小组关键指标就能告诉你缓存是在帮忙还是在添乱：

命中率（hit rate）：命中率下降可能意味着键设计不佳、TTL 过短或驱逐导致的抖动。
延迟（p95/p99）：延迟激增通常表明饱和、网络问题或大值。
内存使用与驱逐：持续高内存并伴随驱逐通常说明数据不适配或驱逐策略不对。
错误/超时：即便是短暂宕机也能级联成数据库变慢与用户可见故障。

为突变警报而不是仅靠绝对阈值，并仔细记录关键操作（避免记录敏感值）。

成本：账单由什么驱动

最大成本驱动因素包括：

内存占用：大值、过多键或存储“可有可无”的数据。
流量：读写量和跨可用区传输。
副本与高可用性：为弹性而多配节点会增加成本。
保留时间：长 TTL 会保留数据更久，从而增加内存需求。

实际的成本优化手段包括减少值大小与设置现实的 TTL，使存储仅保留实际有用的热数据。

实施清单与下一步

实际上线清单

先标准化键命名，让缓存和会话键可预测、易搜索并且便于批量操作。一个简单的约定如 app:env:feature:id（例如 shop:prod:cart:USER123）有助于避免冲突并加快排查。

在上线前定义好TTL 策略。决定哪些数据可以很快过期（秒/分钟）、哪些需要更长时间（小时），以及哪些绝对不应缓存。如果你缓存数据库行，请将 TTL 与底层数据变更频率对齐。

为每类缓存项写下失效计划：

基于时间的过期（仅 TTL）用于“够用”的新鲜度
在你知道确切变更时进行事件驱动失效（例如商品更新）
版本化键（例如 product:v3:123）用于简单的“全部失效”策略

如何衡量成功

从一开始就选取并跟踪几个成功指标：

按端点的缓存命中率目标（很多应用 70–95% 是有用参考范围）
数据库负载下降（queries/sec、CPU 或只读副本利用率）
延迟变化的 p95/p99，而不仅仅是均值

同时监控驱逐计数与内存使用，以确认缓存大小合适。

常见坑要避免

过大的值会增加网络时间与内存压力——优先缓存更小、预计算的片段。避免漏设 TTL（会导致陈旧数据与内存泄漏）以及无界键增长（例如永久缓存每个搜索查询）。小心不要在共享键下缓存用户专属数据。

下一步

如果你在评估方案，比较本地进程内缓存与分布式缓存并决定哪些场景下一致性更重要。有关实现细节与运维指导，请查看 /docs。如果你在做容量规划或需要定价估算，请参见 /pricing。

如果你在构建新产品（或改造现有系统），从一开始就把缓存与会话存储作为一等公民来设计会很有帮助。在 Koder.ai，团队常用端到端原型（Web 上的 React、Go 服务与 PostgreSQL，可选的移动端 Flutter），然后用 cache-aside、TTL 和限流计数等模式迭代性能。像规划模式、快照与回滚这类功能可以让你安全地尝试缓存键设计与失效策略，并在准备好在自有流水线运行时导出源码。

常见问题

为什么键值存储比传统数据库更快？

键值存储针对一个操作进行优化：给出一个键，返回对应的值。这种窄化的关注点让实现路径很短，比如内存索引和哈希定位，从而比通用数据库减少查询规划开销。

它们还通过分流重复读（热门页面、常见 API 响应）间接加速系统，使主数据库能够把精力放在写入和复杂查询上。

键值存储里的“键”和“值”到底是什么？

键是你能精确复现的唯一标识（通常是像 user:123 或 sess:<token> 这样的字符串）。值就是你想取回的内容——可以是一个小计数器，也可以是一个 JSON blob。

好的键应当稳定、带作用域且可预测，这让缓存、会话和查找更容易操作与排查。

我应该在键值存储中缓存什么？

缓存那些被频繁读取且能在丢失后被重新生成的结果。

常见例子：

公共或半静态的页面片段（分类页、“热门商品”）
预计算的输出（推荐、汇总、报表片段）
每次请求都会读取的功能开关和配置
可短期复用的第三方 API 响应

避免缓存必须绝对实时的数据（例如金融余额），除非你有强有力的失效策略。

什么是 cache-aside 模式，何时适用？

Cache-aside（惰性加载）通常是默认选择：

从缓存按键读取。
若未命中，则从数据库/真实来源读取。
将结果放入缓存并设置 TTL。
返回结果。

它退化得很优雅：如果缓存为空或宕机，应用仍可以从数据库提供服务（但需要相应保护措施）。

读穿（read-through）和写穿（write-through）缓存有什么区别？

Read-through 适用于希望在未命中时由缓存层自动从数据库加载（简化应用读取，但需在缓存层集成加载器）。

Write-through 则表示每次写操作同步写入缓存和数据库，读取通常更一致，但写操作延迟更高。

在能接受缓存层集成复杂性（read-through）或更高写延迟（write-through）的场景下选择它们。

如何为缓存数据选择合适的 TTL？

TTL（生存时间）会在到期后自动让键失效。短 TTL 减少陈旧性但增加未命中率与后端压力；长 TTL 提高命中率但增加返回过期值的风险。

实用建议：

将 TTL 与底层数据变更频率对齐。产品价格可能需要以分钟为单位，用户资料可以以小时为单位。
考虑业务影响：点赞数过期通常可接受，账户余额则不行。
加入小范围随机（jitter），避免大量键同时过期造成流量突增。

当你确切知道数据变更时，优先使用主动失效（删除或更新）而不是仅靠 TTL。

什么是缓存雪崩，如何防止？

当一个热门键过期后大量请求同时重建它，就会发生缓存雪崩（stampede）。

常见缓解措施：

请求合并/加锁：只有一个请求负责重建，其他请求等待。
在重验证期间返回陈旧值：短时间内返回上一次的值，同时后台刷新。
提前刷新：在 TTL 到期前稍早刷新热门键。

这些方法能降低对数据库或外部 API 的突发压力。

如何用键值存储管理会话？

会话数据非常适合键值存储，因为访问模式简单：按 token 读写并设置过期。

最佳实践：

使用带作用域的键，例如 sess:<token>（使用版本号如 sess:v2:<token> 有助于迁移）。
保持会话值精简，只存必要信息。
在登出或发现可疑活动时立即删除会话键。
在登录或权限变更后旋转 token，以缩短被盗 token 有效期。

键值存储如何用于限流？

许多键值存储支持 原子自增，这让在高并发下计数器安全可用。

典型模式：

rl:user:123:minute → 每次请求递增
给该键设置 60 秒过期

计数超阈值时就进行限流或拒绝请求。基于 TTL 的过期机制能自动在时间窗口后重置限制，无需后台作业。

在采用键值存储前，我需要理解哪些可靠性权衡？

在采用键值存储前需要设计的权衡：

持久性： 纯内存最快但重启会丢失数据；快照或追加日志能降低数据丢失但增加开销。
一致性： 复制可能带来短暂陈旧（复制延迟），尤其在故障切换时。
驱逐： 内存满时的驱逐策略（LRU、LFU、随机或不驱逐）决定是丢失缓存条目还是开始出现写失败。