首页 > 人工智能 > 人工智能
发布日期:2025-02-26 00:26:54

[阿里万相视频生成巨无霸模型免费开放!低配显卡也能流畅运行]

颠覆想象!阿里万相推出视频生成巨无霸模型,低配显卡用户也能畅享高清视觉盛宴

   2月26日更新,25日晚上,阿里云重磅推出了视频生成大模型万相2.1(Wan)并进行了开源发布。

[阿里万相视频生成巨无霸模型免费开放!低配显卡也能流畅运行]

   此次开源项目采用了Apache2.0许可协议,我们对外开放了14B和1.3B两种参数规模的完整推理代码及模型权重,涵盖了文本生成视频以及图像生成视频的任务。全球开发者现在可以在Github、HuggingFace和ModelScope社区下载并试用这些资源。

[阿里万相视频生成巨无霸模型免费开放!低配显卡也能流畅运行]

   据介绍,在14B版本的万相模型中,其在指令遵循、复杂运动生成、物理建模以及文字视频生成方面表现出色。特别是在权威评测集Vbench中,万相2.1以总分86.22%的成绩,明显优于Sora、Luma、Pika等国内外模型,稳居首位。这一成绩不仅体现了该模型在技术上的先进性,也反映了它在实际应用中的强大能力。万相模型的成功,为人工智能领域的发展提供了新的动力,同时也展示了中国在这一领域的创新实力。

   1.3V版本的万相模型不仅超越了更大规模的开源模型,甚至与某些闭源模型的结果相当接近。它能够在消费级显卡上运行,仅需8.2GB显存即可生成480P视频,适合进行二次模型开发和学术研究。

   官方表示,自2023年起,阿里云便坚定地走上了大模型的开源之路,千问(Qwen)衍生模型的数量已超过10万个,成为全球规模最大的AI模型家族。

   在视频生成领域,万相2.1凭借自主研发的高效VAE和DiT架构提升了时空上下文建模能力,能够实现1080P视频的高效编解码,并且支持无限时长的视频处理。此外,它还首次推出了中文文本驱动的视频生成功能。

   随着万相的开源,阿里云的两大基础模型现已全部开放源代码,涵盖了全方位的模态和尺寸的大规模模型的开源工作。

   自从2025年1月DeepSeek爆火之后,开源已经成为国内外大模型领域的标准配置。

   进入2月,字节跳动的豆包计划、昆仑万维的开源项目、百度的文心大模型以及阿里云的通义千问等相继发布了各自的开源模型,共同推动了这一轮开源浪潮。

人工智能最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有