慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统

上海交通大学人工智能学院、复旦大学和上海人工智能实验室团队开发了一种名为MedS3的新型医学推理系统,采用自我进化的“慢思考”范式,无需预训练和模型蒸馏,能够在医疗知识问答、生物医学问答、长上下文问答和医疗诊断任务上实现显著的推理能力提升。

MedS3通过蒙特卡洛树搜索(MCTS)技术生成可验证的推理链,并结合细粒度的监督信号迭代优化策略模型和过程奖励模型(PRM),在医疗诊断任务上实现了长链推理,成为首个在该任务上实现R1的大语言模型框架。

实验结果显示,MedS3在医疗知识问答、生物医学问答、长上下文问答和医疗诊断任务上的推理能力显著超越现有医疗大模型和通用域推理模型,展示了其在医疗推理领域的卓越性能。

[原文链接]

上一篇:

下一篇:

微信