深度学习,绘就未来创作之路
1月21日,腾讯正式宣布开源并上线了混元3D生成大模型2.0版本。同时推出的还有混元3DAI创作引擎,该引擎被誉为“业内首个全面覆盖3D内容创作的AI平台”。
该技术声称,只需一句话、一张图片或是一幅草图,就能生成一个3D模型,并且还能够添加动作、更换纹理、调整人物细节以及制作动画。
腾讯混元3D-2.0版本主要对生成过程中的几何模型和纹理模型进行了优化升级。
腾讯云近期推出的Hunyuan3D-DiT和HunyuanShapeVAE技术在三维物体建模领域取得了显著进展。这些技术使得生成的“白模”不仅能够精确捕捉到3D物体的形状与结构,而且其精细程度甚至可以媲美专业设计师的手工建模作品。 这不仅展示了人工智能在三维设计领域的巨大潜力,也为相关行业带来了前所未有的机遇。比如,在游戏开发、建筑设计以及虚拟现实等领域,这类技术的应用将大大提升工作效率,并可能开启全新的创意表达方式。不过,随之而来的也有对版权和创作独特性的新挑战,如何平衡技术创新与保护原创成为了一个值得深思的问题。
纹理大模型Hunyuan3D-Paint能够根据文字或图片描述,为“白模”添加各种纹理效果。
此外,腾讯混元采用「解耦生成」新技术,使几何大模型与纹理大模型的结合效果达到超过简单相加的水平,实现了超过两者单独使用的效果。
附评测成绩如下:
腾讯混元今日发布了全新的3DAI创作引擎,这被标榜为业界首个一站式3D内容创作平台。这一创新工具不仅简化了3D模型创建的流程,还大大降低了非专业用户的入门门槛。它有望推动整个行业的发展,使得更多创意能够以更高效的方式实现。未来,我们可以期待看到更多的高质量3D内容涌现出来,丰富我们的数字生活。
具体来说,它支持:
通过输入中文或英文提示词,或者上传一张图片,即可生成四个3D模型,并且可以选择不同的纹理风格。 这项技术的发展无疑为设计师和创作者们提供了巨大的便利。它不仅大幅缩短了从创意到实现的时间,还降低了进入3D建模领域的门槛。对于那些缺乏专业技能的人来说,这无疑是一个福音,使得更多人可以参与到3D内容的创作中来。然而,随之而来的版权和隐私问题也不容忽视,如何在享受便捷的同时保护好个人权益,将是未来需要共同探讨的话题。
低多边形(Low-Poly)模型生成技术可以根据物体的复杂程度,自适应地生成几百至数千面的三角网格。这一技术不仅能够显著降低模型的面数,同时还能确保模型的细节效果,特别适合于游戏引擎中的渲染。 这项技术的发展无疑为游戏开发者提供了更多的创作空间。一方面,它大幅减少了渲染所需的计算资源,使得即使是配置较低的设备也能流畅运行高质量的游戏。另一方面,低多边形模型的简洁性也鼓励了艺术家们探索更加抽象和创意的表现形式,这在追求独特风格和高效性能的今天显得尤为重要。
一站式流程管理:从建模到动画再到素材管理,如同流水线一般高效。
具体效果方面:
3D 动画生成:选个动作模版,角色可以跑步、挥手、跳舞;
3D 纹理生成:通过文字或图片描述,一键生成高清纹理;
3D 草图生成:随手涂鸦的简笔画,加上简单描述就能生成 3D 模型;
3D角色创建:上传个人照片,瞬间生成虚拟形象,并可自由调整发型、服装等细节;
3D 小游戏创作:用头像生成角色,再配上一段动画,一键制作小游戏,直接分享给朋友。
不仅如此,混元3DAI创作引擎还能够协助专业人士构建3D内容制作流程,借助模块化设计,实现一键生成所需的角色或道具。
目前,腾讯的混元3D生成技术已在用户生成3D内容、商品素材合成及游戏3D资产生成等多个领域得到应用。最近,腾讯地图利用该混元3D大模型来创建个性化的3D导航图标,据称其生成速度提高了91%。
开发者可以在GitHub、HuggingFace等技术社区下载混元3D2.0模型,用户则可以通过访问混元3D的官方网站来申请体验相关功能。这不仅为开发者提供了便利,也使得普通用户能够轻松接触到这一先进技术,从而推动了人工智能领域的普及与发展。混元3D团队此举无疑是在降低技术门槛,让更多人有机会接触和使用这些前沿的人工智能工具,这对于促进技术创新和应用具有重要意义。