英伟达推出了Llama-Nemotron系列模型,这是一个面向高效推理的大模型开放家族,具备卓越的推理能力和效率,并采用开放许可方式。该系列包括Nano(8B)、Super(49B)、Ultra(253B)和UltraLong(8B)四个模型规模,特别适用于企业使用。
通过Puzzle框架和多阶段后训练流程,Llama-Nemotron系列模型优化了推理和非推理任务表现,实现了显著的推理吞吐量和部署效率提升。模型权重和部分训练数据公开,遵循NVIDIA Open Model License和Llama社区许可,支持商业使用。