一个大语言模型比如llama之类的,该怎么学习才能使模型拥有联网的能力?
2023-07-20 阅读 1
把模型“联网”不是靠单纯多训练数据,而是把它当成会调用外部工具的决策器。常见做法是给模型接入检索/搜索 API、网页浏览器自动化(如 Playwright)、数据库或插件,并通过示例微调让模型学会何时调用哪个工具、如何构造查询和如何处理返回结果,必要时用 RLHF 强化工具使用策略。工程上需要做请求编排、身份与限流、输入清洗、结果缓存与上下文管理,还要对返回信息做可信性校验和安全沙箱。实践上可以先用检索增强生成(RAG)和查证管道快速验证,再逐步接入真实浏览或插件能力。
更新于 2025年12月22日