在你的应用中使用 Meilisearch 实现即时服务端搜索

Q: 什么是服务端搜索，什么时候应该使用？

服务端搜索意味着查询在你的后端（或专用搜索服务）上运行，而不是在浏览器内。适用场景包括： - 数据集太大，无法下发到客户端 - 需要跨平台的一致相关性 - 需要访问控制（用户只能看到被允许的记录） - 需要日志/分析和可预测的性能

Q: “即时”搜索需要具备哪些特性才能让用户满意？

用户在搜索体验上会立即注意到四点： - 快速反馈 （输入时延迟低） - 容错拼写 （拼写错误仍然能命中） - 实用控件 （筛选、排序与分面计数） - 相关排序 （最符合意图的结果优先，而不是随意按时间） 只要缺少其中一项，用户就会重写查询、翻得更多页或放弃搜索。

Q: Meilisearch 是数据库的替代品吗？

把 Meilisearch 看作一个 搜索索引 ，而不是你的可信数据源。数据库仍然负责写入、事务和约束；Meilisearch 存储你选择的一份用于快速检索的字段副本。 一个有用的思维模型是： - 数据库： 存储与更新 - Meilisearch： 快速查找

Q: 我应该如何决定使用一个索引还是多个索引？

一个普遍的默认做法是对每种实体类型使用 一个索引 （例如 、 ）。这样可以保持： - 排序规则一致 - 筛选/排序可预测 - 文档字段一致 如果需要“搜索所有内容”，可以在后端查询多个索引并合并结果，或稍后新增一个专门的全局索引。

Q: 如何选择主键，为什么它很重要？

选择一个主键应满足： - 稳定 （极少或几乎不变） - 在索引内唯一 - 已在你的数据库中存在（例如 、 、 ） 稳定的 ID 使索引具备幂等性：如果重试上传，相同主键会以更新（upsert）方式处理，不会产生重复项。

Q: 我该如何决定哪些字段要索引并返回给 UI？

为避免过度索引或遗漏，需要为每个字段明确分工： - Searchable（可搜索） ：用户会输入的文本（title、name、description） - Filterable（可筛选） ：用作约束的属性（category、status、tags、tenantId） - Displayed（展示） ：UI 需要返回的字段（title、thumbnail、snippet） 明确这些角色可以减少噪声结果，并避免索引过大或更新缓慢。

Q: 为什么索引后文档不会立即显示？

索引是 异步 的：文档上传会创建一个任务，只有当任务成功后，文档才会变为可搜索。 一个可靠的流程： 1. 上传文档（通常为 upsert） 2. 查询任务状态直到 或 3. 用索引统计和简单查询进行验证 如果结果看起来是旧的，先检查任务状态再做其他调试。

Q: 索引文档时我应该使用多大的批次？

建议使用 多个较小的批次 而非一次性的大上传。实用起点： - 每批 1,000–10,000 条文档 ，或 - 每次请求大约 5–15 MB 的有效载荷 较小的批次更容易重试、更容易排错（找出坏记录），也不容易超时。

Q: 有哪些最简单的方法可以提升 Meilisearch 的相关性？

两个高影响的调整杠杆是： - ：哪些字段被搜索，以及字段的重要性顺序 - 排名/排序行为 ：是否允许按 、 或 等字段排序 实用方法：取 5–10 个真实查询，记录调整前的前 N 条结果，修改一个设置后再比较“前后”差异。

Q: 为什么我的筛选或排序不生效？

大多数筛选或排序失败来自配置缺失： - 要筛选某字段，它必须在 中 - 要按字段排序，它必须在 中 还要确认文档中该字段的形态与类型（字符串、数组或嵌套对象）。如果筛选失败，检查最近的设置/任务状态，并确认索引文档确实包含预期的字段值。

登录开始使用

在你的应用中使用 Meilisearch 实现即时服务端搜索 | Koder.ai

即时服务端搜索应当实现的内容

服务端搜索意味着查询在你的服务器（或专用搜索服务）上处理，而不是在浏览器内执行。你的应用发送一个搜索请求，服务器在索引上运行该查询，并返回排序后的结果。

当你的数据集过大无法下发到客户端、你需要在各平台间保持一致的相关性，或访问控制不可妥协（例如内部工具，用户只能看到有权限的记录）时，这一点很重要。它也是当你想要分析、日志记录和可预测性能时的默认选择。

用户期望（并会立即感知）

人们不思考搜索引擎本身——他们在评判体验。良好的“即时”搜索流程通常意味着：

快速反馈： 结果在用户输入时快速更新，不会有尴尬的停顿。
容错拼写： 拼写错误、字母颠倒或部分单词仍能找到正确项目。
实用控件： 筛选（类别、状态、价格区间）、排序（最新、最便宜）和分面（每个筛选的计数）感觉自然。
相关排序： “最佳”结果排在前面，而不是仅仅按最新或关键字堆砌排序。

如果任何一项缺失，用户会通过尝试不同查询、更多地滚动或直接放弃搜索来补偿。

本指南能帮助你做什么

本文是使用 Meilisearch 构建上述体验的实用指南。我们将介绍如何安全地进行设置、如何构建和同步索引数据、如何调整相关性与排名规则、如何添加筛选/排序/分面，以及如何考虑安全性与扩展性，从而在应用增长时保持搜索快速。

服务端搜索的优势场景

Meilisearch 非常适合：

文档与知识库（快速定位页面，容忍拼写错误）
商品目录与市场（筛选和排序至关重要）
内部工具（基于权限的记录搜索）
内容站点（跨文章、指南、FAQ 的搜索）

贯穿始终的目标是：结果感觉即时、准确且可信——而不是把搜索变成一个重大工程项目。

用通俗语言介绍 Meilisearch

Meilisearch 是一个与你的应用并行运行的搜索引擎。你把文档（如产品、文章、用户或支持工单）发送给它，它会构建一个为快速搜索优化的索引。然后你的后端（或前端）通过简单的 HTTP API 查询 Meilisearch，并在毫秒级返回排序后的结果。

开箱即用能得到什么

Meilisearch 专注于现代搜索应具备的特性：

容错拼写，使 “iphnoe” 仍能找到 “iPhone”。
相关性控制（排名规则），让你决定业务中的“最佳匹配”意义。
筛选、排序与分面，让用户按照类别、价格区间、可用性或标签等属性缩小结果范围。

它被设计得在查询短、小错或模糊时仍然响应迅速与宽容。

Meilisearch 不是——

Meilisearch 不是替代主数据库。你的数据库仍然是写入、事务和约束的真实来源。Meilisearch 存储你选择的那些字段的副本，用于可搜索、可筛选或可展示的用途。

一个好的心智模型是：数据库用于存储与更新数据，Meilisearch 用于快速查找。

性能预期（影响速度的因素）

Meilisearch 可以非常快，但结果取决于几个实际因素：

数据规模与形态（文档数量、字段数量以及你索引了多少文本）
硬件（CPU、内存、磁盘）
配置（哪些属性可搜索/可筛选/可排序，以及你多频繁重建索引）

对于小到中等的数据集，通常可以在单台机器上运行。随着索引增长，你需要更谨慎地决定索引内容以及如何保持更新——这些将在后续部分讨论。

规划索引与数据模型

在安装任何东西之前，先确定你到底要搜索什么。只有当你的索引与文档匹配用户浏览应用的方式时，Meilisearch 才会感觉“即时”。

将实体映射到索引

从列出可搜索的实体开始——通常是 products（产品）、articles（文章）、users（用户）、help docs（帮助文档）、locations（位置）等。许多应用中，最清晰的方法是每种实体类型一个索引（例如 products、articles）。这能保持排名规则和筛选可预测。

如果你的 UX 希望在一个搜索框中跨类型搜索（“搜索所有”），你仍然可以保持分开的索引并在后端合并结果，或稍后创建一个专门的“全局”索引。不要把所有不同结构强行塞进一个索引，除非字段和筛选确实对齐。

选择主键与文档形态

每个文档都需要一个稳定的标识符（主键）。选择应满足：

从不改变（或极少改变）
在索引内唯一
已在数据库中存在（例如 id、sku、slug）

对于文档形态，尽量偏好扁平字段。扁平结构更易于筛选与排序。嵌套字段在表示紧密且不常变的捆绑数据（例如 author 对象）时是可以的，但要避免深度嵌套成数据库式的完整关系结构——搜索文档应为读优化而非数据库形态。

字段分类：可搜索、可筛选、可展示

设计文档的一个实用方法是为每个字段标注其角色：

Searchable（可搜索）：用户会输入的文本（title、name、description）
Filterable（可筛选）：作为约束使用的属性（category、price range、status、tags）
Displayed（展示）：返回给 UI 的内容（title、thumbnail URL、短摘要）

这可以防止常见错误：把某字段“以防万一”也索引了，后来发现结果噪声太大或筛选变慢。

为多语言内容做计划

“语言”在数据中可能有不同含义：

文档的语言（每篇文章有 lang: "en"）
用户的区域设置（UI 语言）
混合语言字段（产品名有多个语言版本）

尽早决定是使用按语言分开的索引（简单且可预测），还是使用带语言字段的单一索引（索引数更少，但逻辑更复杂）。正确答案取决于用户是否通常在单一语言下搜索以及你如何存储翻译内容。

安全地安装与运行 Meilisearch

运行 Meilisearch 很直接，但“默认安全”需要做出几项决定：部署位置、数据持久化方式以及如何管理主密钥。

部署选项（选择你能运维的方式）

Docker（最常见）：快速启动、易于升级，在各环境更一致。配合持久卷使用。
虚拟机或裸机：当你已有标准的 Linux 部署管道（systemd、日志轮转、备份）时适合。
托管服务：如果团队不想维护服务器，寻找托管 Meilisearch 的提供商或作为附加服务的平台。你会用更少的运维换取更少的灵活性。

环境基础：存储、内存、备份、监控

存储： Meilisearch 会把索引写到磁盘。将数据目录放在可靠的持久存储上（不要放在容器的临时存储里）。为增长规划容量：大文本字段和许多属性会让索引迅速膨胀。

内存： 分配足够的 RAM 以在负载下保持响应。如果发生交换（swapping），性能会下降。

备份： 备份 Meilisearch 数据目录（或在存储层使用快照）。至少测试一次恢复；无法恢复的备份只是文件而已。

监控： 跟踪 CPU、内存、磁盘使用与磁盘 I/O。也要监控进程健康和日志错误。至少在服务停止或磁盘空间不足时告警。

安全存储主密钥

在除本地开发外的任何环境中都应使用 master key（主密钥） 运行 Meilisearch。将其存放在秘密管理器或加密的环境变量存储中（不要放在 Git 中，也不要提交到仓库的明文 .env）。

示例（Docker）：

docker run -d --name meilisearch \
  -p 7700:7700 \
  -v meili_data:/meili_data \
  -e MEILI_MASTER_KEY="$(openssl rand -hex 32)" \
  getmeili/meilisearch:latest

还要考虑网络规则：绑定到私有接口或限制入站访问，使只有你的后端能访问 Meilisearch。

首次启动检查清单

选择部署方法（Docker/VM/托管）并确保配置了持久存储。
使用安全的密钥存储设置 MEILI_MASTER_KEY。
启动服务并确认它可从正确的网络访问。
验证健康/版本响应：

curl -s http://localhost:7700/version

确认日志被收集并有基础告警（进程停止、磁盘不足）。
做一次初始备份（甚至在导入真实数据前）并记录恢复步骤。

索引文档与保持同步

将搜索带到移动端

生成一个 Flutter 客户端，稳定调用你的后端搜索端点。

构建移动端

Meilisearch 的索引是异步的：你发送文档，Meilisearch 将任务入队，只有在任务成功后这些文档才会可搜索。把索引当作一个作业系统，而不是一个单次请求。

简单的索引流程（添加 → 等待 → 验证）

添加文档（确保每个文档都有稳定唯一的 id，通常为 id）。

curl -X POST 'http://localhost:7700/indexes/products/documents?primaryKey=id' \
  -H 'Content-Type: application/json' \
  -H 'Authorization: Bearer YOUR_WRITE_KEY' \
  --data-binary @products.json

等待任务完成。API 响应会包含 taskUid。轮询直到状态为 succeeded（或 failed）。

curl -X GET 'http://localhost:7700/tasks/123' \
  -H 'Authorization: Bearer YOUR_WRITE_KEY'

验证计数与基本搜索。确认索引包含期望数量的文档，并且简单查询能返回结果。

curl -X GET 'http://localhost:7700/indexes/products/stats' \
  -H 'Authorization: Bearer YOUR_WRITE_KEY'

如果计数不匹配，不要盲目猜测——先查看任务的错误详情。

不会让你意外的批量策略

批量的目标是让任务可预测且可恢复。

从 1,000–10,000 条文档/批 或按载荷大小上限开始（许多应用中 5–15 MB/请求是舒适区间）。
偏好 多次较小批 而不是一次巨量上传；这样更易重试，也更容易定位坏数据。
如果变更频繁，按批量持续索引（例如每分钟）而不是重建全部索引。

更新与全量重建

addDocuments 表现为 upsert（插入或更新）：相同主键的文档会被更新，新的会被插入。将其用于常规更新。

当发生以下情形时做 全量重建：

文档形态发生重大变化，
需要重新计算派生字段，
同步出现漂移，需要干净重置。

若要删除文档，请显式调用 deleteDocument(s)；否则旧记录可能会残留。

幂等性：作业失败时安全重试

索引应可重试。关键在于稳定的文档 id。

如果批量上传超时，你可以重发相同批次：upsert + 稳定 id 意味着不会创建重复项。
将返回的 taskUid 与你的批次/作业 id 一并持久化，并基于任务状态来重试。
如果使用队列，使 worker 为“至少一次（at-least-once）”安全：重复不应有害。

用于预生产快速验证的种子数据

在真实数据前，索引一小批符合真实字段的数据（200–500 项）。示例：一个包含 id、name、description、category、brand、price、inStock、createdAt 的 products 集合。这足以验证任务流程、计数以及更新/删除行为——无需等待大规模导入。

你可以控制的相关性与排名规则

“相关性”简单说就是：什么先展示以及为什么。Meilisearch 让你在不重写完整打分系统的情况下进行可调优。

从正确的属性开始

两个设置决定了 Meilisearch 如何处理你的内容：

searchableAttributes：用户输入时 Meilisearch 会查找的字段（例如：title、summary、tags）。顺序很重要：靠前的字段被视为更重要。
displayedAttributes：响应中返回的字段。它关系到隐私与载荷大小——如果字段不在此列，它不会被返回。

实用基线是让少数高信号字段可搜索（title、关键文本），并把展示字段限定为 UI 所需。

排名规则如何影响结果顺序

Meilisearch 使用 排名规则（ranking rules） 把匹配到的文档排序——这是一系列“平手决胜”的管道。概念上，它优先：

与查询匹配良好的结果（包括容错拼写），然后
匹配更强的结果（更接近的词、在更重要属性中的匹配），然后
符合你业务逻辑的结果（按时效或受欢迎程度的自定义排序）。

你无需记住内部细节来有效调优；主要是选择哪些字段更重要以及何时应用自定义排序。

常见调优目标（含示例）

目标：“标题匹配应优先”。把 title 放在最前：

{
  "searchableAttributes": ["title", "subtitle", "description", "tags"]
}

目标："较新的内容优先"。添加可排序属性，并在查询时按时间排序（或设置自定义排名）：

{
  "sortableAttributes": ["publishedAt"],
  "rankingRules": ["sort", "typo", "words", "proximity", "attribute", "exactness"]
}

然后请求：

{ "q": "release notes", "sort": ["publishedAt:desc"] }

目标："提升热门商品"。使 popularity 可排序，并在适当时按此排序。

用一个简单的前后测试评估更改

挑 5–10 个真实查询并保存更改前的前 N 条结果，然后比较更改后的结果。

示例：

之前：查询 "apple" → Apple Watch band, Pineapple slicer, Apple iPhone case
之后（标题优先 + 精确匹配）：查询 "apple" → Apple iPhone case, Apple Watch band, Pineapple slicer

如果“之后”的列表更符合用户意图，就保留设置；若伤害到边缘案例，每次只改变一项（先属性顺序，再排序规则），以便知道改动效果来源。

实际搜索中的筛选、排序与分面

一个好的搜索框不只是“输入单词，得到匹配”。人们也想缩小结果（“只看可用商品”）并按某种规则排序（“最便宜优先”）。在 Meilisearch 中，你用 filters（筛选）、sorting（排序） 与 facets（分面） 来实现这些功能。

筛选与分面（相同概念，不同 UI）

筛选是对结果集施加的规则。分面则是帮助用户构建这些规则的 UI（通常为复选框或带计数的选项）。

非技术示例：

Category（类别）："Shoes", "Jackets", "Accessories"
Price（价格）："Under $50", "$50–$100"
Status（状态）："In stock", "Backorder", "Archived"

用户可能先搜索 “running”，然后筛选 category = Shoes 与 status = in_stock。分面可以显示计数，如 “Shoes (128)”、“Jackets (42)”，让用户了解可用性。

配置可筛选与可排序字段（否则无法工作）

Meilisearch 需要你显式允许用于筛选与排序的字段。

将字段标记为 filterable（可筛选）当你会在筛选中使用它：category、status、brand、price、created_at（如果按时间筛选）、tenant_id（如果需要隔离客户）。
将字段标记为 sortable（可排序）当你会按其排序：price、rating、created_at、popularity。

把列表保持紧凑。把所有字段都设为可筛选/可排序会增加索引大小并减慢更新。

分页与限制以保持搜索快速

即使有 50,000 个匹配，用户也只会看到第一页。使用较小页面（通常 20–50 条），设置合理的 limit，并使用 offset 分页（或使用更新的分页特性）。同时在应用中限制最大页深，防止昂贵的“第 400 页”请求。

同义词与停用词（可选，谨慎使用）

同义词 在不同词语意思相同时有用（例如 “hoodie” ↔ “sweatshirt”）。逐步添加并审查搜索分析——过多同义词会带来意外匹配。
停用词 移除常见词（“the”、“and”）。它们能减少噪声，但也可能影响精确搜索（如乐队名 “The Who”）。只有在遇到明确问题时才自定义停用词。

在应用后端集成 Meilisearch

快速构建搜索

在聊天中创建带服务器端搜索端点的 React 和 Go 应用。

免费开始

一个清晰的方式是把 Meilisearch 当作后端后面的一种专用数据服务。你的应用接收搜索请求，调用 Meilisearch，然后返回给客户端一个经过策划的响应。

一个简单的后端模式

多数团队最终采用如下流程：

客户端调用你的端点（例如 GET /api/search?q=wireless+headphones&limit=20）。
后端验证输入、应用业务规则并决定查询哪个索引。
后端调用 Meilisearch 的 Search API，带上用户查询与筛选/排序参数。
后端对结果做后处理（隐藏私有字段、与数据库数据合并、应用权限）。
后端返回一个稳定的响应格式给客户端。

此模式让 Meilisearch 更易替换，并防止前端依赖索引内部细节。

如果你在构建新应用（或重构内部工具）并想快速实现此模式，一些低代码/脚手架平台可以帮助生成完整流程——React UI、Go 后端与 PostgreSQL——然后在单一 /api/search 端点后接入 Meilisearch，让客户端更简单并把权限控制放在服务端。

前端 vs 后端查询（为什么后端更安全）

Meilisearch 支持客户端直接查询，但后端查询通常更安全，因为：

密钥保持私密：不会暴露有权限的 API 密钥。
授权一致：后端能在返回命中前强制执行用户可见性规则。
你能控制查询复杂度：限制筛选、排序选项与分页以保护性能。

对于公开数据、使用受限键的情况，前端查询仍可行，但如果存在任何基于用户的可见性规则，务必通过服务器路由搜索。

在不破坏相关性的情况下缓存热门查询

搜索流量常有重复（如 “iphone case”、“return policy”）。在 API 层加缓存可提升效率：

对匿名流量短期缓存整个响应（例如 10–60 秒）。
规范化缓存键（去掉空白、小写化、包含筛选/排序）。
小心失效策略：对于变更快的索引，使用短 TTL 而不是频繁主动清除。

速率限制与滥用控制

把搜索视为面向公众的端点：

应用按 IP 或按用户的限流。
设置最大 limit 与最大查询长度。
对明显的爬虫做软禁止，同时仍允许真实用户访问。

安全基础：密钥、访问控制与多租户

Meilisearch 常置于应用“后面”，因为它能快速返回可能包含敏感业务数据的结果。把它像数据库一样锁好，只暴露每个调用者应该看到的内容。

API 密钥：主密钥与范围化密钥（最小权限）

Meilisearch 有一个能做所有事的 master key（主密钥）：创建/删除索引、更新设置、读写文档。仅在服务器端保管它。

为应用生成受限操作与受限索引的 API 密钥。常见模式：

后端作业：能写文档并更新设置，但仅限特定索引的密钥。
应用服务器：只读的搜索密钥。
客户端（若不得不）：严格范围化的仅允许搜索的密钥，并带有限制筛选条件。

最小权限意味着即使密钥泄漏，也无法删除数据或读取无关索引。

多租户：分索引或按 tenantId 筛选

若为多个客户（租户）提供服务，有两种主要方案：

1）每个租户一个索引。

易于推理并降低跨租户访问风险。但缺点是索引数量更多，且需要一致地应用设置更新。

2）共享索引 + tenant filter。

在每个文档上存储 tenantId 字段，并强制所有搜索都带如 tenantId = "t_123" 的筛选。这在你能确保每次请求都应用该筛选时能很好地扩展（最好通过范围化密钥防止调用方移除筛选）。

防止数据泄露：控制可返回的字段

即使搜索逻辑正确，结果也可能泄露你不想显示的字段（邮箱、内部备注、成本价）。配置可检索的字段：

将 displayed/retrievable attributes 限定为安全的允许列表。
仅在绝对必要时才把敏感字段作为索引的一部分——并避免在结果中返回它们。

做一次“最坏情况”测试：搜索一个常见词并确认没有私有字段出现。

基本运维安全措施

限制网络访问：绑定到 localhost 或私有网络，并只允许应用服务器入站访问。
如需 TLS 与限流，可把 Meilisearch 放在反向代理后面。
将密钥存放在秘密管理器中（不要放在源码或前端包中），并定期轮换。

如果不确定某个密钥是否应在客户端使用，默认答案是“否”，把搜索保留在服务端。

在无猜测的情况下做性能与扩展

快速添加筛选与分面

通过一次对话构建带分面、筛选和排序的商品目录搜索。

开始项目

Meilisearch 快的前提是你关注两类工作负载：索引（写） 与 查询（读）。大多数“莫名慢”问题只是这两者在争夺 CPU、内存或磁盘资源。

性能通常的瓶颈点

索引负载 会在你导入大批量、频繁更新或添加许多可搜索字段时激增。索引是后台任务，但仍会消耗 CPU 与磁盘带宽。如果任务队列增长，即便查询量未变，搜索也会变慢。

查询负载 随访问量增长，还受功能影响：更多筛选、更多分面、更大的结果集与更强的容错拼写都会增加每次请求的工作量。

磁盘 I/O 常常是悄无声息的元凶。慢盘（或共享卷上的“噪声邻居”）会把“即时”变为“最终”。生产环境的典型基线是 NVMe/SSD 存储。

实用的扩展步骤

先做简单的容量规划：给 Meilisearch 足够的 内存以保持索引热存 与足够的 CPU 以应对峰值 QPS。然后分离关注点：

若索引干扰读请求，尽量在非高峰期做批量导入，并偏好较大的批次而非许多小更新。
增加副本以提升高可用性与读容量（你的应用可以在副本间做负载均衡）。
分片：Meilisearch 不做自动分布式分片。如果单节点无法承载，可在应用层分区数据（例如按租户、区域或时间范围）到多个索引或集群。

应监控的指标（以免凭感觉操作）

跟踪一组关键信号：

搜索延迟（p50/p95）与吞吐量
任务队列长度 / 任务处理时间（队列上升说明索引跟不上）
CPU、内存、磁盘使用与磁盘 I/O 等待
错误率（超时、4xx/5xx、任务失败）

备份与升级规划

备份应成为例行操作，而非临时抱佛脚。使用 Meilisearch 的 snapshot 功能按计划生成快照，将快照存放到外部，并定期测试恢复。升级前阅读发行说明，在非生产环境演练升级，并预估版本变更是否会影响索引，从而需要重建索引时间。

如果你已经使用平台的环境快照与回滚（例如某些平台提供的 snapshot/rollback 工作流），把搜索的发布流程与同样的纪律对齐：变更前快照、验证健康检查，并保留快速回退到已知良好状态的路径。

故障排查与实用上线清单

即使集成干净，搜索问题通常集中在几个可复现的类别。好消息是：Meilisearch 提供了足够的可视性（任务、日志、确定性设置）来快速调试——前提是你按系统化方式检查。

常见问题（及通常原因）

“我的筛选不起作用”： 字段未添加到 filterableAttributes，或文档中该字段的形态与预期不符（字符串 vs 数组 vs 嵌套对象）。
“结果排序怪异”： 排名规则、同义词、停用词或缺失的 sortableAttributes/rankingRules 调整把“错误”的项排上去了。
“搜索显示旧数据”： 索引任务仍在处理、你向不同索引写入但从另一个索引读取，或你的同步管道丢失了更新/删除。

保持理智的调试工作流

先检查 Meilisearch 是否成功应用了你最近的更改。

检查任务状态：每次设置更改和文档更新都会创建异步任务。如果任务失败，先解决失败原因（错误负载、字段类型错误、过大文档）。
带着一个问题看日志：先问“服务器接收了我的请求吗？”，再问“它完成处理了吗？”。不要一次扫全部日志。
创建最小可复现查询：
- 选一个索引。
- 用一个返回小且稳定结果集的查询。
- 逐步加约束：先 filter，再 sort，然后 facets。

如果无法解释一个结果，暂时剥离你的配置：移除同义词、减少排名规则调整，并用一个小数据集测试。复杂的相关性问题在 50 条文档上比在 500 万条上更容易发现。

上线策略：降低冲击范围

先测试索引： 并行构建 your_index_v2，应用设置并回放一部分生产查询样本。
金丝雀发布： 把小部分搜索流量路由到新索引或新设置，比较点击率与“无结果”率。
回退行为： 决定当搜索变慢或不可用时用户看到什么——缓存结果、简化查询或友好的“请重试”提示。不要让搜索失败破坏整个页面。

后续步骤清单

确认 filterableAttributes 与 sortableAttributes 与 UI 要求一致。
每次部署后确认索引任务成功完成。
增加一个小型“搜索健康”监控（延迟 + 任务失败）。
练习回退：把流量切回到旧索引。

Related guides: /blog (search reliability, indexing patterns, and production rollout tips).

常见问题

什么是服务端搜索，什么时候应该使用？

服务端搜索意味着查询在你的后端（或专用搜索服务）上运行，而不是在浏览器内。适用场景包括：

数据集太大，无法下发到客户端
需要跨平台的一致相关性
需要访问控制（用户只能看到被允许的记录）
需要日志/分析和可预测的性能

“即时”搜索需要具备哪些特性才能让用户满意？

用户在搜索体验上会立即注意到四点：

快速反馈（输入时延迟低）
容错拼写（拼写错误仍然能命中）
实用控件（筛选、排序与分面计数）
相关排序（最符合意图的结果优先，而不是随意按时间）

只要缺少其中一项，用户就会重写查询、翻得更多页或放弃搜索。

Meilisearch 是数据库的替代品吗？

把 Meilisearch 看作一个搜索索引，而不是你的可信数据源。数据库仍然负责写入、事务和约束；Meilisearch 存储你选择的一份用于快速检索的字段副本。

一个有用的思维模型是：

数据库：存储与更新
Meilisearch：快速查找

我应该如何决定使用一个索引还是多个索引？

一个普遍的默认做法是对每种实体类型使用一个索引（例如 products、articles）。这样可以保持：

排序规则一致
筛选/排序可预测
文档字段一致

如果需要“搜索所有内容”，可以在后端查询多个索引并合并结果，或稍后新增一个专门的全局索引。

如何选择主键，为什么它很重要？

选择一个主键应满足：

稳定（极少或几乎不变）
在索引内唯一
已在你的数据库中存在（例如 id、sku、slug）

稳定的 ID 使索引具备幂等性：如果重试上传，相同主键会以更新（upsert）方式处理，不会产生重复项。

我该如何决定哪些字段要索引并返回给 UI？

为避免过度索引或遗漏，需要为每个字段明确分工：

Searchable（可搜索）：用户会输入的文本（title、name、description）
Filterable（可筛选）：用作约束的属性（category、status、tags、tenantId）
Displayed（展示）：UI 需要返回的字段（title、thumbnail、snippet）

明确这些角色可以减少噪声结果，并避免索引过大或更新缓慢。

为什么索引后文档不会立即显示？

索引是异步的：文档上传会创建一个任务，只有当任务成功后，文档才会变为可搜索。

一个可靠的流程：

上传文档（通常为 upsert）
查询任务状态直到 succeeded 或 failed
用索引统计和简单查询进行验证

如果结果看起来是旧的，先检查任务状态再做其他调试。

索引文档时我应该使用多大的批次？

建议使用多个较小的批次而非一次性的大上传。实用起点：

每批 1,000–10,000 条文档，或
每次请求大约 5–15 MB 的有效载荷

较小的批次更容易重试、更容易排错（找出坏记录），也不容易超时。

有哪些最简单的方法可以提升 Meilisearch 的相关性？

两个高影响的调整杠杆是：

searchableAttributes：哪些字段被搜索，以及字段的重要性顺序
排名/排序行为：是否允许按 publishedAt、price 或 popularity 等字段排序

实用方法：取 5–10 个真实查询，记录调整前的前 N 条结果，修改一个设置后再比较“前后”差异。

为什么我的筛选或排序不生效？

大多数筛选或排序失败来自配置缺失：

要筛选某字段，它必须在 filterableAttributes 中
要按字段排序，它必须在 sortableAttributes 中

还要确认文档中该字段的形态与类型（字符串、数组或嵌套对象）。如果筛选失败，检查最近的设置/任务状态，并确认索引文档确实包含预期的字段值。