200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队发布了其新推理模型 Seed-Thinking-v1.5 的技术报告,该模型拥有200B参数,每次工作时激活20B参数,在多个基准测试中表现出色,超过了拥有671B参数的DeepSeek-R1。

该模型采用了混合专家模型(MoE)设计,通过强化学习算法和创新的数据处理方法提升推理能力,尤其在数学推理和编程竞赛中表现出显著优势。

豆包团队计划在4月17日的「2025火山引擎Force Link AI创新巡展」活动中正式发布该模型,进一步展示其在不同领域的泛化能力。

[原文链接]

上一篇:

下一篇:

微信