DeepSeek-V3/R1微调工具箱开源,提供低成本高质量私有模型构建方案,支持多种硬件和优化技术。
Colossal-AI发布包含LoRA低成本微调、强化学习工具链等组件的开源工具箱,适用于不同规模的硬件配置,降低大模型微调成本。
通过LoRA优化,SFT DeepSeek-V3/R1-671B微调仅需32个Ascend 910B NPU或24个H100/H800 GPU,强化学习微调则使用Qwen2.5-3B-Base模型验证GRPO算法。
DeepSeek-V3/R1微调工具箱开源,提供低成本高质量私有模型构建方案,支持多种硬件和优化技术。
Colossal-AI发布包含LoRA低成本微调、强化学习工具链等组件的开源工具箱,适用于不同规模的硬件配置,降低大模型微调成本。
通过LoRA优化,SFT DeepSeek-V3/R1-671B微调仅需32个Ascend 910B NPU或24个H100/H800 GPU,强化学习微调则使用Qwen2.5-3B-Base模型验证GRPO算法。