如何看待月之暗面发布对标 OpenAI o1 的推理模型 k0-math?

2024-11-19 阅读 8
更新于 2024年11月21日
从杨植麟的视频演示看,数学能力还是挺惊艳的,另外要特别赞赏的一点是kimi比openai慷慨,k0-math没有刻意去隐藏思维链,不害怕别人去蒸馏他的思维过程(以后其他人可以快速用kimi造数据了)
榜单成绩很强,注意到下图的一小段文字“与o1系列模型相似test token数量”,猜测月之暗面应该基本掌握了o1的技术细节,但是相似的token数不代表相似的算力,也要看模型的尺寸。
最后,期待code能力的突破,猜测应该也快了
这是我在网上找到的最长的一个视频。 有长资源的伙伴可以分享我一点。看起来是月之暗面内部分享会。
这个视频里,杨植麟分享了k0-math,自我反思,自我纠错的过程,全程可以看到CoT的描述过程。
他强调了一个特性:
①这是一个提示词模板达不到的效果
②很多问题都需要不同的思路,靠模板是不行的