如何为GPT,或其他大语言模型添加外部知识库?
2024-04-10 阅读 87
可以用两类办法:运行时检索增强(RAG)或把知识内化(微调/LoRA/Adapter)。常见流程是把文档切分并做 embeddings,存入向量库(FAISS、Milvus、Pinecone、Weaviate),运行时检索最近邻并用交叉编码器重排,再把检索到的片段拼入提示生成,同时返回来源以降低幻觉。也可结合知识图谱做结构化查询或把高频事实通过微调内置。实践要注意分块大小与重叠、向量维度与相似度度量、重排与缓存、索引刷新与延迟。常用开源工具有 LangChain、LlamaIndex、Haystack。
更新于 2026年01月03日