浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误

浙江大学等机构提出了InfiGUI-R1,一个基于Actor2Reasoner框架训练的GUI智能体,旨在让AI在行动前思考、行动后反思,从「反应式行动者」迈向「深思熟虑的推理者」。

该框架分为两阶段:第一阶段通过空间推理蒸馏建立「感知 → 推理 → 行动」的基础模式;第二阶段利用强化学习增强规划和反思能力。

InfiGUI-R1-3B在多个基准测试中表现出色,特别是在GUI元素定位和复杂任务执行方面,证明了其强大的推理和执行能力。

[原文链接]

上一篇:

下一篇:

微信