DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型DeepSeek-Prover-V2刷新多项高难基准测试记录，尤其在普特南测试中表现出色，解决了671B模型未能解决的问题。

通过强化学习，7B小模型DeepSeek-Prover-V2-7B发现了671B模型不具备的新技能，特别是在处理涉及有限基数的问题时，显示出独特的推理模式。

Prover-V2采用两阶段训练，结合非CoT和CoT生成模式，并通过强化学习进一步提升其推理能力，展示了小模型在复杂问题解决上的潜力。

2025年5月1日下午6:59 分享到:

上一篇：DeepSeek开源Prover-V2强推理模型，网友：奥数从没这么简单过

下一篇：AI娱乐正在发起“效率革命”

公众号