生成式人工智能(Generative AI)正从单一模型训练向系统优化时代过渡,其中REVOLVE作为一种新的优化框架,通过引入历史响应相似度的概念,优化模型在多轮迭代中的表现,避免陷入局部最优,提升整体性能。
REVOLVE在解决方案优化、提示词优化和代码优化等任务中表现出色,如在MMLU-Machine Learning benchmark上提升了20.72%的准确率,在Big Bench Hard任务中提升了7.8%的性能,以及在LeetCode Hard基准测试中提升了29.17%的性能。
REVOLVE通过综合考虑多轮迭代中的响应变化趋势,提供了一种更为精细和稳定的优化方法,适用于复杂任务的持续优化。