MIT三人团队:用Transformer解决经验贝叶斯问题,比经典方法快100倍

MIT 研究者发现 Transformer 适用于解决经验贝叶斯均值估计问题,并证明其性能优于经典估计方法,运行速度也快近 100 倍。

Transformer 能够学习到任意精度的 clipped Robbins 估计器和非参数最大似然估计器,并且在合成数据和真实数据实验中表现出色。

研究还表明,Transformer 具备长度泛化能力,在未见过的先验分布上仍能实现低后悔值,且在速度方面大幅领先传统方法。

[原文链接]

上一篇:

下一篇:

微信