DeepSeek满血微调秘籍开源！站在巨人肩膀打造私有模型，教程在此

DeepSeek-V3/R1微调工具箱开源，提供低成本高质量私有模型构建方案，支持多种硬件和优化技术。

Colossal-AI发布包含LoRA低成本微调、强化学习工具链等组件的开源工具箱，适用于不同规模的硬件配置，降低大模型微调成本。

通过LoRA优化，SFT DeepSeek-V3/R1-671B微调仅需32个Ascend 910B NPU或24个H100/H800 GPU，强化学习微调则使用Qwen2.5-3B-Base模型验证GRPO算法。