模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

AI公司Databricks推出了一种名为TAO的新调优方法,无需标注数据即可提升大型语言模型(LLM)的性能,甚至优于基于标注数据的传统监督微调。TAO通过测试时计算和强化学习算法,利用未标注数据教导模型完成任务,显著降低了企业使用LLM的成本。

TAO在多个企业级任务中展示了卓越性能,不仅超越了需要数千标注样本的传统微调方法,还将开源模型Llama提升至与商业模型GPT-4o/o3-mini相当的水平,且无需任何标注数据。

[原文链接]

上一篇:

下一篇:

微信