4月30日,DeepSeek发布新模型DeepSeek-Prover-V2,参数规模扩大至671B,显著提升了数学测试集上的效率和正确率,特别是在miniF2F测试通过率和普特南测试上超越了月之暗面的Kimina-Prover。
两家公司在技术报告中均强调了强化学习的重要性,DeepSeek-Prover-V2与DeepSeek的其他模型进化有关联,旨在通过微调提升模型性能。
尽管DeepSeek和月之暗面在大模型领域取得进展,但它们正面临来自阿里巴巴等大公司的竞争压力,特别是阿里巴巴推出的Qwen3模型在性能上全面超越DeepSeek-R1。