[快讯] 梁文锋署名DeepSeek新论文：公开V3大模型降本方法

DeepSeek-V3通过内存优化、计算优化、通信优化和推理加速等四项创新技术，解决了大模型训练中的内存不足、计算效率低和通信速度慢等问题，实现了高效训练和推理。具体方法包括多头潜在注意力（MLA）、混合专家模型（MoE）与FP8低精度训练、多层胖树网络和多token预测（MTP）。

此外，论文还对未来AI硬件设计提出了建议，包括低精度计算支持、扩展与扩展融合、网络拓扑优化、内存系统优化和鲁棒性与容错等方面，旨在从“被动适配”过渡到“主动设计”，提升AI硬件性能。