字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?

字节跳动最新推出的深度推理模型Seed-Thinking-v1.5在多项任务中超越了参数量更大的DeepSeek-R1,参数规模仅为200B,而DeepSeek-R1为671B。

该模型通过改进数据处理、强化学习算法和基础设施建设,在数学和代码推理任务中表现出色,特别是在AIME 2024基准测试中达到与OpenAI o3-mini-high模型相当的水平。

虽然Seed-Thinking-v1.5在某些任务上仍落后于顶级模型,但其轻量级的设计和显著的性能提升引起了广泛关注。

[原文链接]

上一篇:

下一篇:

微信