🤖 由 文心大模型 生成的文章摘要摘要:腾讯混元正式开启混元3D开源日活动,并将持续至3月19日。此次活动备受业界瞩目,期间将通过直播形式,全方位展示混元3D生成大模型2.0版本以及一站式创作引擎的强大功能与创新应用。
腾讯混元混元3D开源日活动开启,展示大模
腾讯混元正式开启混元3D开源日活动,并将持续至3月19日。此次活动备受业界瞩目,期间将通过直播形式,全方位展示混元3D生成大模型2.0版本以及一站式创作引擎的强大功能与创新应用。
早在1月21日,腾讯混元就已宣布开源3D生成大模型2.0版本,并上线业界首个一站式3D内容AI创作平台——混元3D AI创作引擎。这一举措在行业内引发了广泛关注,为3D内容创作领域带来了全新的变革。开发者可在GitHub、Hugging Face等技术社区便捷地下载混元3D 2.0模型,而普通用户也能直接在混元3D AI创作引擎上亲身体验其独特魅力。相较于1.0版本,混元3D 2.0不仅延续了同时支持文生3D与图生3D的核心能力,在生成效果上更是实现了质的飞跃。模型生成的3D作品在几何结构上愈发精细,纹理色彩也更加丰富,极大提升了3D内容的视觉呈现效果。
随着3D AIGC技术的迅猛发展,其应用场景不断拓展,在众多领域得到了积极应用。在游戏制作环节,借助混元3D技术,能够快速生成高质量的游戏角色、道具、建筑等3D资产,显著提升游戏开发效率,缩短开发周期;在社交领域,可用于创作个人3D形象、3D虚拟礼物等个性化3D资产,丰富社交互动体验;电商广告场景中,依据创意主题生成3D商品,帮助设计师和企业降低成本、提高效率;工业生产与制造业场景下,快速生成工业产品原型,助力设计验证。此次混元3D开源日活动的举办,无疑将进一步推动AIGC 3D技术在各行业的深度应用与落地。
腾讯混元上线的3D AI创作引擎,作为业界首个低门槛、一站式的3D内容AI创作平台,集成了多项实用功能。在基础模型生成方面,该引擎既支持输入中/英文提示词,通过描述主体内容、特征、风格等信息,快速生成4个高质量3D模型,也支持上传单张图片生成3D模型。同时,用户可根据需求选择不同纹理风格进行生成,并且支持PBR贴图,通过模拟物理特性,生成更逼真的材质贴图效果。此外,创作引擎还支持端到端低多边形模型生成,能够依据物体复杂程度,自适应生成几百至数千面的三角面,生成结果在低面片基础上最大程度展现模型细节,拓扑布线更符合美术标准,尤其适用于游戏引擎模型渲染。
在3D功能矩阵方面,混元3D AI创作引擎涵盖了丰富的3D建模、编辑及驱动能力,包括3D动画生成、3D纹理生成、草图生3D、3D 人物生成、3D小游戏创作等。其中,3D动画生成支持骨骼绑定和动作驱动,用户选择不同动作模板,就能让创作的角色模型生动地动起来,并且支持选择不同角色模型素材或上传本地模型生成3D动画,在游戏开发与动画制作中发挥着重要作用。3D纹理生成则针对白模及用户添加的模型,支持通过提示词或图像输入方式生成不同高清材质纹理,实现对不同类别3D模型的一键换肤。草图生3D功能更为便捷,用户仅需绘制一张简笔画,并通过文字描述草图主体的类别、颜色等信息,即可将二维草图快速转换为高质量的3D模型。3D人物生成功能也十分强大,用户仅需上传一张人物头像,选择不同主题类别的模板,就能轻松实现个性化的3D人物角色生成,满足个人UGC 3D形象定制需求。值得一提的是,该创作引擎还支持3D小游戏创作,用户上传一张头像并选择角色模板,即可一键生成个人专属IP角色的游戏动画视频,并能进行分享转发,让普通人也能轻松打造属于自己的3D小游戏。
混元3D AI创作引擎还支持设计3D生成工作流,通过模块化的节点设计搭建,助力专业用户在游戏开发、动画制作等领域快速搭建3D生成工作流,其中包含3D角色生成与3D道具生成。用户只需加载模板,根据个人需求输入提示词或上传图片,调整节点生成参数,就能一键生成具有特定风格和特征的 3D资产,进一步降低了专业用户的使用门槛,大幅提升了3D创作管线效率。
事实上,混元3D生成大模型1.0早在去年11月就已全面开源,作为业界首个同时支持文字、图像生成3D的开源大模型,为行业发展注入了新的活力。而此次2.0版本在技术上的进一步升级,通过将几何、纹理解耦生成,使得整体生成能力达到更高上限,能够生成更为精细和真实的3D结果。其中,几何大模型由Hunyuan3D – DiT模型和 Hunyuan ShapeVAE组成,可实现超高精度的白模生成,几乎达到了设计师手工建模的水平;纹理大模型Hunyuan3D-Paint采用多视图扩散生成的方案,能基于用户输入的参考图像对生成的几何白模进行纹理贴图,并且还支持对用户任意输入的几何模型进行任意文本或图像引导的纹理生成。
腾讯混元从定量和定性两个维度对混元3D 2.0进行了全面评估。在收集的In – the – wild测试集上,对3D生成质量进行了定量评估。根据CLIP Maximum Mean Discrepancy(CMMD)、Frechet Inception Distance(FID)和 CLIP – score指标,不论是端到端最终3D资产的质量,还是几何模型生成的几何结构以及纹理基模型生成纹理的质量,Hunyuan3D – 2.0的整体表现均优于当前业界包括闭源模型在内的最先进的模型。在定性评估方面,从整体满意度、3D物体质量和指令遵循三个维度进行用户主观评估,结果显示,Hunyuan3D – 2.0在生成质量上同样优于当前最先进的开源模型。
在实际应用层面,混元3D生成大模型此前已在UGC 3D创作、商品素材合成、游戏3D资产生成等腾讯内部业务及场景中得到应用。例如,混元3D生成能力已应用于腾讯内部游戏业务,其生成的3D质量已能满足部分游戏3D资产标准,包括几何布线合理性、贴图准确性与骨骼蒙皮合理性等。据统计,借助混元3D创作平台,游戏业务3D资产制作时间成本可从5-10天级别大幅下降到分钟级。腾讯地图也基于腾讯混元3D大模型,发布了自定义3D导航车标功能,支持用户创作个性化的3D导航车标,相比传统的3D车标重建方案,速度提升了91%,有效提升了用户使用体验。
腾讯混元3D负责人郭春超表示:“随着3D AIGC技术快速迭代,3D技术应用落地进程也在不断加快。混元3D生成大模型从1.0版本的率先开源,到快速升级2.0版本并开放业界首个一站式 3D AI创作平台,我们希望切实帮助大众爱好者、开发者、创作者们降低使用门槛,提升创作效率,让3D大模型技术在各行各业充分发挥价值。” 此次混元3D开源日活动的举办,无疑将吸引更多开发者与创作者参与到3D AIGC技术的创新应用中来,共同推动该领域技术的持续发展与产业应用落地,为3D内容创作生态带来更多可能。
来源:93913虚拟现实