卷积网络又双叒叕行了?OverLoCK:一种仿生的卷积神经网络视觉基础模型

香港大学俞益洲教授与博士生娄蒙提出了一种名为OverLoCK的新颖视觉基础模型,该模型借鉴了人类“纵观全局-聚焦细节”的认知机制,通过引入动态卷积和Context-Mixing机制,在ImageNet、COCO和ADE20K等数据集上展现出强大的性能。

OverLoCK模型在ImageNet-1K数据集上达到了84.2%的Top-1准确率,相比其他模型具有明显优势,特别是在参数规模相近的情况下。

研究团队通过提出一种新的动态卷积模块ContMix,使模型能够在保持强归纳偏置的同时,具备强大的全局建模能力,从而实现高效的特征表示。

[原文链接]

上一篇:

下一篇:

微信