阿里通义万相2.1革新发布:开启中文文字与视频自动生成新时代
2月25日,据新浪科技报道,消息人士透露,阿里巴巴计划于今晚将其视频生成模型万相2.1进行全面开源。
今年1月,阿里通义万相发布了2.1版本的模型升级,该版本在视频生成和图像生成方面都有显著改进。
在视频生成领域,通义万相2.1凭借自主研发的高效VAE和DiT架构,提升了时空上下文建模的能力,能够实现1080P视频的无限长高效编解码。该版本还首次推出了中文文字视频生成功能,并在VBench榜单上荣登首位。
据介绍,通义万相 2.1 支持中英文视频,都可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等等。其还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。
官方曾表示,通义万相2.1不仅支持中英文的一键艺术字生成,还提供了丰富的视频特效选择,例如转场效果、粒子特效以及模拟特效等。
据此前报道,通义万相在去年9月宣布支持文本生成视频、图像生成视频等功能,并且具备插画设计、涂鸦作画、局部重绘、短片创作以及配乐生成等多样化的能力。这一系列功能不仅极大地丰富了数字内容创作的可能性,也为用户提供了更加便捷高效的工具。特别是在当前时间2025年02月,随着技术的不断进步和发展,通义万相的这些创新功能无疑为行业树立了一个新的标杆,进一步推动了人工智能技术在创意产业的应用与发展。