基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作

上海人工智能实验室、悉尼大学和牛津大学联合研究团队提出了ReSo框架,一种基于奖励驱动和自组织机制的多智能体系统,用于复杂推理任务。该框架通过生成任务图并匹配最佳智能体,提升了多智能体协作效率和推理能力,解决了传统多智能体系统中的扩展性、能力评估和优化机制粗糙等问题。

ReSo框架通过引入协同奖励模型(CRM),实现了数据驱动的智能体动态优化与协作演化,相较于现有方法,在可扩展性和优化能力上更具优势,并在多项复杂推理任务中表现出色。

[原文链接]

上一篇:

下一篇:

微信