DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型DeepSeek-Prover-V2刷新多项高难基准测试记录,尤其在普特南测试中表现出色,解决了671B模型未能解决的问题。

通过强化学习,7B小模型DeepSeek-Prover-V2-7B发现了671B模型不具备的新技能,特别是在处理涉及有限基数的问题时,显示出独特的推理模式。

Prover-V2采用两阶段训练,结合非CoT和CoT生成模式,并通过强化学习进一步提升其推理能力,展示了小模型在复杂问题解决上的潜力。

[原文链接]

上一篇:

下一篇:

微信