阿里开源的视频生成模型Wan 2.1在性能和商用方面表现出色,14B参数版本在个人消费级显卡上也能运行,并且支持在视频中生成文字等复杂细节。
该模型采用了创新的3D变分自动编码器和DiT架构,实现了高效的时间压缩和良好的图像生成效果。
阿里还开源了图生视频模型,并计划集成AI创作者喜爱的ComfyUI工具,为用户提供更多便利。
阿里开源的视频生成模型Wan 2.1在性能和商用方面表现出色,14B参数版本在个人消费级显卡上也能运行,并且支持在视频中生成文字等复杂细节。
该模型采用了创新的3D变分自动编码器和DiT架构,实现了高效的时间压缩和良好的图像生成效果。
阿里还开源了图生视频模型,并计划集成AI创作者喜爱的ComfyUI工具,为用户提供更多便利。