功能定位：为什么需要“多路向量召回权重”

在豆包企业版里，多路向量召回指同一条用户问题会并行走多条语义索引（如标题向量、段落向量、关键词稀疏向量、实时搜索向量），再把各路结果按权重融合后返回。权重决定哪一路优先，直接影响答案相关度与响应速度；一旦失衡，就可能出现“标题党命中、正文无关”或“搜索实时性好却语义漂移”的两极。

经验性观察：当知识库超过 500 篇长文档、且每日更新频率高于 5% 时，单路向量召回的 top-5 命中率会明显下降；开启多路并动态调节权重后，同一测试集的“答案可溯源率”可见提升。该功能于 2026 年 3 月 v6.3.0 全量开放，仅在企业版“私有知识库”可见，个人版暂不显示入口。

功能定位：为什么需要“多路向量召回权重”

进入配置面板的 3 条最短路径

桌面端（Win & macOS）

打开豆包客户端 → 左侧边栏“智能体工坊” → 选中目标智能体 → 右上角“知识库”标签 → 二级菜单“召回策略” → 即可看到“多路向量权重”折叠面板。

Web Admin（管理员）

浏览器访问 https://doubao.byteenterprise.com/admin → 知识库 → 选择空间 → 召回策略 → 多路向量权重。

移动端（Android/iOS）

由于屏幕限制，移动端仅支持“查看”与“简易模板切换”；如需微调权重数字，请转桌面端或 Web。路径：App → 工作台 → 智能体 → 知识库 → 召回策略（只读）。

理解 5 条默认向量路

路名	索引对象	默认权重	典型场景
title_vector	文档标题	0.35	用户问题短且包含产品名
chunk_vector	512 token 段落	0.30	需要细节定位
sparse_keyword	TF-IDF 关键词	0.20	专业缩写、型号
realtime_search	72h 全网结果	0.10	热点、公告
faq_exact	问答对字面匹配	0.05	标准话术

权重总和无需等于 1，系统内部会做 softmax 归一化；但经验上让“最大单路 ≤0.45”可避免一路过度垄断。

调节步骤：从“模板”到“细调”

在“多路向量权重”面板顶部，先选模板：标题优先、均衡、实时增强。系统会给出对应数值组合，适合快速试错。
点击“自定义”开关，输入框从只读变为可写。建议一次只改 ±0.05，改后点击“预览”可即时看到测试问题集的召回变化（面板右侧会显示 top-5 来源路名与得分）。
若满意，点击“保存并生效”；系统会提示“重建倒排约需 3-5 分钟”，此阶段仍可正常问答，但新权重在后台热加载，不会出现中断。
若结果变差，点击“回退”可立即恢复上一次持久化快照，无需重新建索引。

提示：每次改动系统都会自动生成灰度任务，先对 10% 真实流量生效，30 分钟内无负面报警才全量。该机制不可关闭，但可在“运维日志”里手动加速。

验证与观测：3 个必看指标

1. 命中率@5

在“知识库→诊断工具”输入 20 条历史问题，系统会标注“理想答案所在文档是否出现在 top-5”。若调节后命中率下降 >3%，应回退。

2. 首字符延迟（TTFT）

realtime_search 权重过高会拉高外网检索耗时，可在“监控中心”查看 TTFT 中位数。经验性观察：该路权重从 0.10 提到 0.25，TTFT 约增加 400-600 ms。

3. 答案字符长度

chunk_vector 权重高→模型倾向引用长段落→最终生成答案更长。若企业场景要求“短信式 150 字以内”，需要同步调低该路权重或加后置截断规则。

常见取舍与副作用

标题优先适合 FAQ 型知识库，但容易漏掉“正文细节”；若文档标题写法不规范，会出现大面积漏召回。
实时增强对热点问答友好，但可能引入尚未审阅的网页内容，合规团队需打开“溯源卡片必须人工复核”开关。
把 sparse_keyword 权重降到 0.05 以下，会导致型号、订单号等精确词搜不到；此时可改用“混合精准过滤器”而非抬升权重。
若知识库同时开启“权限分级”，需注意 realtime_search 抓取的外部网页默认权限=公开，可能拉低整体权限一致性。

与第三方插件协同的最小权限原则

在 Bot Store 里，部分第三方插件（如“抖音电商数据参谋”）会声明“需访问知识库召回结果”。授权时建议只开“只读·返回摘要”权限，关闭“改写权重”权限，防止插件在后台擅自调高自身数据源权重，导致问答质量漂移。可在“设置→权限审计”查看最近 30 天的权重改动日志。

与第三方插件协同的最小权限原则

故障排查速查表

现象	可能原因	验证动作	处置
top-5 全是标题匹配，正文对不上	title_vector 权重过高	诊断工具看分路得分	降 title，升 chunk
热点问题回答空白	realtime_search 被防火墙拦截	网络诊断→curl 测外网	加白名单或降权关路
权重输入框灰化	非管理员角色	查看角色权限	联系超管提权

适用 / 不适用场景清单

高适用

文档规模 500–10000 篇，日更新 <10%，需要“标题+段落”双保险。
客服场景，标准 FAQ 与实时公告并存，需灵活调节。
多产品线共用知识库，不同智能体可用不同权重模板，互不干扰。

低适用或禁用

纯静态、200 篇以内的小库，单路已足够，多路反而增加 TTFT。
内网完全离线部署，realtime_search 不可达，应直接关闭该路。
对答案长度有硬阈值（如短信 70 字）且不能后置截断，调权空间极小。

最佳实践 6 条

先选模板再细调，减少盲目输入。
一次只改一路，幅度 ≤0.05，方便回退。
每改一次跑 20 条诊断问题，记录命中率@5。
监控 TTFT 与答案长度，防止体验劣化。
重大活动前锁定权重，避免活动高峰触发灰度抖动。
每季度复盘一次，淘汰权重为 0 的路，降低维护成本。

FAQ（结构化数据）

权重总和必须等于 1 吗？

不需要，系统内部会做 softmax 归一化，只需保证单路不超过 0.45 即可。

为什么移动端无法修改权重？

移动端界面以只读为主，防止误触；微调请使用桌面端或 Web Admin。

权重改动多久生效？

灰度 10% 流量约 5 分钟，全量最长 30 分钟；期间问答不中断。

可以针对不同用户组设置两套权重吗？

目前权重绑定在智能体维度，不支持用户组级差异；需要克隆一个智能体并挂载同一份知识库来实现。

realtime_search 抓取的内容会存库吗？

仅缓存 72 小时用于溯源，不写入私有知识库，到期自动清除。

收尾：下一步行动清单

读完本文，你应已理解豆包多路向量召回权重的位置、参数含义与调节节奏。建议立即打开桌面端“智能体工坊”，选一个不重要的测试库，先套用“均衡模板”跑 20 条诊断问题，记录命中率@5 与 TTFT；再逐步微调，体会“标题优先”与“实时增强”带来的差异。正式环境改动前，务必开启灰度观察 30 分钟，并设定回退快照。权重不是一劳永逸，每季度结合新文档规模与业务热点复盘一次，才能让知识库召回始终处于最佳平衡点。

豆包智能体如何为知识库配置多路向量召回权重？

功能定位：为什么需要“多路向量召回权重”

进入配置面板的 3 条最短路径

桌面端（Win & macOS）

Web Admin（管理员）

移动端（Android/iOS）

理解 5 条默认向量路

调节步骤：从“模板”到“细调”

验证与观测：3 个必看指标

1. 命中率@5

2. 首字符延迟（TTFT）

3. 答案字符长度

常见取舍与副作用

与第三方插件协同的最小权限原则

故障排查速查表

适用 / 不适用场景清单

高适用

低适用或禁用

最佳实践 6 条

FAQ（结构化数据）

权重总和必须等于 1 吗？

为什么移动端无法修改权重？

权重改动多久生效？

可以针对不同用户组设置两套权重吗？

realtime_search 抓取的内容会存库吗？

收尾：下一步行动清单

相关标签