首页
GhatGPT4.0回答问题比3.5要明显慢很多,他是真的在计算呢,还是假装慢一些让用户觉得他更高级?
2023-11-06 阅读 12
明显是因为真实的计算量更大,不是刻意慢下来。“4.0”模型参数更多、层数更深、上下文窗口可能更长,生成每个token需要更多浮点运算;此外实际服务里常有额外的校验、检索、工具调用或重排序步骤,以及不同的并发/批处理和流式输出策略,这些都会增加延迟。简单说,是技术和部署导致的慢,不是装出来的。
更新于 2025年12月29日