HUMATA, ChatPDF, PandaGPT 都调用 GPT 的 API,他们的原理是什么?
2023-05-06 阅读 9
HUMATA、ChatPDF、PandaGPT 这类工具核心都是“检索增强生成”(RAG)。流程通常是把上传的文件用解析或 OCR 提取文本、做清洗并按窗口切分,然后用 Embedding API 把每段向量化并存入向量数据库(如 Pinecone、Milvus、Weaviate 等)。用户提问时把问题也向量化,检索出最相似的文本片段,把这些片段拼进提示词作为上下文,再调用 GPT 的生成接口返回答案,常配合流式输出、来源标注和缓存以降低延迟与成本。为处理超长文档还会用分层检索、摘要合并或候选答案排序,Prompt 设计和检索策略决定最终效果。
更新于 2025年12月04日