字节跳动豆包团队发布了其新推理模型 Seed-Thinking-v1.5 的技术报告,该模型拥有200B参数,每次工作时激活20B参数,在多个基准测试中表现出色,超过了拥有671B参数的DeepSeek-R1。
该模型采用了混合专家模型(MoE)设计,通过强化学习算法和创新的数据处理方法提升推理能力,尤其在数学推理和编程竞赛中表现出显著优势。
豆包团队计划在4月17日的「2025火山引擎Force Link AI创新巡展」活动中正式发布该模型,进一步展示其在不同领域的泛化能力。
字节跳动豆包团队发布了其新推理模型 Seed-Thinking-v1.5 的技术报告,该模型拥有200B参数,每次工作时激活20B参数,在多个基准测试中表现出色,超过了拥有671B参数的DeepSeek-R1。
该模型采用了混合专家模型(MoE)设计,通过强化学习算法和创新的数据处理方法提升推理能力,尤其在数学推理和编程竞赛中表现出显著优势。
豆包团队计划在4月17日的「2025火山引擎Force Link AI创新巡展」活动中正式发布该模型,进一步展示其在不同领域的泛化能力。