首个专为音频大语言模型(ALLMs)设计的多维度可信度评估基准AudioTrust由南洋理工与清华大学联合提出,扩展评估范围至公平性、幻觉、安全性、隐私、鲁棒性和身份验证六个核心维度,填补了现有评估框架的不足。
AudioTrust采用两阶段架构,第一阶段支持高效批量处理,第二阶段进行自动化、多维度评估,深入探究音频模态特有的安全与可信问题,全面提升了模型的可信度。
该基准及评估平台现已全面开发,旨在推动音频大模型的健康发展,提升其在实际应用中的可靠性和安全性。
首个专为音频大语言模型(ALLMs)设计的多维度可信度评估基准AudioTrust由南洋理工与清华大学联合提出,扩展评估范围至公平性、幻觉、安全性、隐私、鲁棒性和身份验证六个核心维度,填补了现有评估框架的不足。
AudioTrust采用两阶段架构,第一阶段支持高效批量处理,第二阶段进行自动化、多维度评估,深入探究音频模态特有的安全与可信问题,全面提升了模型的可信度。
该基准及评估平台现已全面开发,旨在推动音频大模型的健康发展,提升其在实际应用中的可靠性和安全性。