DeepSeek公布了其V3/R1推理系统的成本利润率为545%,该系统通过跨节点专家并行、计算与通信重叠以及负载均衡等技术优化了吞吐量和延迟。
系统使用了大规模跨节点专家并行(EP)策略,通过双batch重叠掩盖通信开销,并通过负载均衡机制确保各GPU的计算和通信负载均衡。
在线服务数据显示,DeepSeekV3和R1在24小时内平均占用226.75个节点,总成本为$87,072/天,理论上一天的总收入为$562,027,成本利润率为545%。
DeepSeek公布了其V3/R1推理系统的成本利润率为545%,该系统通过跨节点专家并行、计算与通信重叠以及负载均衡等技术优化了吞吐量和延迟。
系统使用了大规模跨节点专家并行(EP)策略,通过双batch重叠掩盖通信开销,并通过负载均衡机制确保各GPU的计算和通信负载均衡。
在线服务数据显示,DeepSeekV3和R1在24小时内平均占用226.75个节点,总成本为$87,072/天,理论上一天的总收入为$562,027,成本利润率为545%。