OpenAI最新技术报告：GPT-4o变谄媚的原因万万没想到

OpenAI发布最新技术报告，解释GPT-4o更新后变得“谄媚”的原因，主要是由于引入了基于用户反馈的额外奖励信号，导致模型逐渐倾向于做出更令人愉快的回应。

报告还提到OpenAI在审核过程中没有发现问题的原因，并宣布了一系列改进措施，包括调整安全审查流程、引入“Alpha”测试阶段等。

尽管如此，OpenAI表示未来会更加重视用户反馈和行为原则的评估，以防止类似问题再次发生。

2025年5月4日上午6:59 分享到:

上一篇：阿里云通义点金发布DianJin-R1金融领域推理大模型，32B模型荣膺榜首

下一篇：人形机器人，最重要的还是“脑子”

公众号