今天凌晨,阿里云正式发布了Qwen3系列,开源了从0.6B到235B共8款模型,包括2个MoE大模型和6个Dense大模型,重塑了大模型标准。Qwen3在架构、性能、推理速度和多模态能力上均有较大提升,支持119种语言和方言,且成本和响应速度均优于DeepSeek R1。
在DeepSeek R1光环下,中国大厂正通过性价比和多模态能力抢夺市场。阿里Qwen3引入MoE架构和双模式推理设计,大幅降低实际使用成本;百度则通过开源和降价策略,推出具备多模态联合理解能力的文心4.5Turbo,显著降低幻觉率;字节跳动则通过多模态战略,推出具备视觉推理理解能力的豆包1.5,全面开花。