最新一期权威大模型榜单显示,豆包1.5和商汤日日新V6并列国内第一,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。
SuperCLUE报告指出,国产大模型如Doubao-1.5-thinking-pro和SenseNova V6 Reasoner表现突出,国内推理模型竞争格局初现。
本次测评涵盖数学推理、科学推理等六大任务,共计1579道多轮简答题,显示国内外第一梯队大模型在中文领域的通用能力差距正在缩小。
最新一期权威大模型榜单显示,豆包1.5和商汤日日新V6并列国内第一,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。
SuperCLUE报告指出,国产大模型如Doubao-1.5-thinking-pro和SenseNova V6 Reasoner表现突出,国内推理模型竞争格局初现。
本次测评涵盖数学推理、科学推理等六大任务,共计1579道多轮简答题,显示国内外第一梯队大模型在中文领域的通用能力差距正在缩小。