DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,教程在此

DeepSeek-V3/R1微调工具箱开源,提供低成本高质量私有模型构建方案,支持多种硬件和优化技术。

Colossal-AI发布包含LoRA低成本微调、强化学习工具链等组件的开源工具箱,适用于不同规模的硬件配置,降低大模型微调成本。

通过LoRA优化,SFT DeepSeek-V3/R1-671B微调仅需32个Ascend 910B NPU或24个H100/H800 GPU,强化学习微调则使用Qwen2.5-3B-Base模型验证GRPO算法。

[原文链接]

上一篇:

下一篇:

微信