[快讯] 浙大&港理工等提出InfiGUI-R1：利用强化学习，让GUI智能体学会规划任务、反思错误

浙江大学等机构提出了InfiGUI-R1，一个基于Actor2Reasoner框架训练的GUI智能体，旨在让AI在行动前思考、行动后反思，从「反应式行动者」迈向「深思熟虑的推理者」。

该框架分为两阶段：第一阶段通过空间推理蒸馏建立「感知 → 推理 → 行动」的基础模式；第二阶段利用强化学习增强规划和反思能力。

InfiGUI-R1-3B在多个基准测试中表现出色，特别是在GUI元素定位和复杂任务执行方面，证明了其强大的推理和执行能力。