2月25日,阿里开源了其最新视频生成模型万相2.1,支持文生视频和图生视频任务,并采用最宽松的Apache2.0协议,生成内容版权完全归开发者所有,适用于免费渠道和商用。模型在评测中表现出色,但语义理解和物理表现仍有待提高。
万相2.1采用新颖的3D时空变分自动编码器(Wan-VAE)技术,解决了传统扩散模型计算量大、内存占用高的问题,实现了低成本、高效果、高可控的视频生成,能够处理无限长度的1080P视频。
通过全面开源,万相2.1降低了视频创作门槛,打破了视频模型付费的商业模式,有望加速优化更新速度,提升生成效果。