我用Qwen3实测了9道经典难题,再聪明的AI也有犯傻的时候

阿里巴巴近日开源了8款大模型,包括两款MoE模型和六款密集模型,其中旗舰模型Qwen3-235B-A22B在多项基准测试中表现出色,与顶级模型不相上下。

通过一系列测试,Qwen3在逻辑推理、创意写作和编程能力方面展现了不俗的实力,但在某些问题上仍显繁复,特别是在幽默感的运用上显得有些生硬。

尽管存在一些不足,Qwen3系列尤其是旗舰模型Qwen3-235B-A22B仍展示了强大的技术实力。

[原文链接]

上一篇:

下一篇:

微信