首页
如何看待GPT4,模型升级后,回答速度变快,但也变拉了?
2023-06-14 阅读 7
可以把这看作“速度与详尽度”之间的权衡,也可能是优化策略变了。加速常通过量化、蒸馏、提前终止或流式输出等手段实现,会让模型少做深度推理或更依赖默认偏好;同时为了稳健和安全,调参可能让回答更保守、简化,从而显得“拉”。要改善体验,可以用更具体的提示、要求步骤与来源、增加max_tokens或选择高质量的模型变体,通常能把准确性和细致度找回来。
更新于 2025年12月12日