李晓熙等人提出了一种名为WebThinker的技术,赋予大型推理模型(LRMs)在推理过程中自主搜索网络、导航网页及撰写报告的能力,显著提升了其在复杂知识密集型任务中的表现。
WebThinker通过深度网页探索器和自主思考-搜索-写作策略,结合强化学习训练优化工具调用,实现了端到端的任务执行,使其在多个复杂推理基准测试中表现出色。
实验结果表明,WebThinker在科学报告生成任务中生成的报告质量高,信息边界广,特别是在完整性和彻底性方面表现突出,超越了传统RAG方法和其他先进系统。
李晓熙等人提出了一种名为WebThinker的技术,赋予大型推理模型(LRMs)在推理过程中自主搜索网络、导航网页及撰写报告的能力,显著提升了其在复杂知识密集型任务中的表现。
WebThinker通过深度网页探索器和自主思考-搜索-写作策略,结合强化学习训练优化工具调用,实现了端到端的任务执行,使其在多个复杂推理基准测试中表现出色。
实验结果表明,WebThinker在科学报告生成任务中生成的报告质量高,信息边界广,特别是在完整性和彻底性方面表现突出,超越了传统RAG方法和其他先进系统。