基于大语言模型的向量检索增强生成有哪些需要注意的问题?哪些因素会影响检索增强生成的效果?
2023-10-30 阅读 11
向量检索增强生成要注意检索质量与生成的耦合问题:嵌入模型与下游生成是否语义对齐、向量维度和相似度度量是否合适、文档切分粒度和索引策略会影响上下文完整性。要权衡召回与精确率、去重与多样性(如用MMR)、并做候选重排序或融合(BM25+向量)以提升相关性。提示工程和检索结果的拼接方式会影响模型是否产生幻觉,需要显式引用来源并控制上下文长度。还要考虑数据时效性与清洗、隐私安全、检索延迟与成本,以及针对任务的评估指标和线上回归监控。
更新于 2025年12月28日