阿里半夜开源全新推理模型,QwQ-32B比肩DeepSeek-R1满血版

阿里开源发布了新推理模型 QwQ-32B,其参数量为 320 亿,性能媲美 6710 亿参数的 DeepSeek-R1 满血版,展示了大规模强化学习在提升模型性能方面的潜力。

QwQ-32B 在数学推理、编程和通用能力等基准测试中表现出色,集成了与 Agent 相关的能力,能够在使用工具的同时进行批判性思考。

该模型已在 Hugging Face 和 ModelScope 开源,并支持通过 Qwen Chat 直接体验,千问团队表示希望这一成果能证明强大的基础模型叠加大规模强化学习是通往通用人工智能的可行之路。

[原文链接]

上一篇:

下一篇:

微信