本周,科技圈聚焦于一个名为AssistanceZero的新技术,它让AI助手在与人类共同玩游戏时展现出更强的协作性和主动性,无需通过RLHF训练。该技术由加州大学伯克利分校开发,通过“assistance games”强化学习驱动,让AI助手能够主动学习和纠正错误,更好地理解用户意图。
与传统的RLHF训练方法不同,AssistanceZero让AI助手在奖励函数不确定的情况下,通过与人类的互动来优化行为,避免了欺骗行为,提高了协作性。这一新技术在《我的世界》游戏环境中进行了测试,展示了在复杂任务中的出色表现。