语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%

百度最新推出的端到端语音语言大模型大幅降低了语音交互的成本,最高可达90%,并实现了跨模态语音语言处理,提升了交互的真实性和情感表达。

该模型采用创新的Cross-Attention技术和EALLQA技术,有效降低了KV cache的存储和访问开销,同时通过语音模型和语言模型的融合,实现了流式逐字的自然语音合成。

低成本成为模型厂商获得竞争优势的关键,百度的新技术有望推动语音交互技术的广泛应用。

[原文链接]

上一篇:

下一篇:

微信