模力方舟再上硬核3D新模型:Step1X-3D 全面开放在线体验

B站影视 内地电影 2025-05-23 15:41 2

摘要:Step1X-3D模型现已正式上线模力方舟在线体验,面向每一位开发者、设计师与创作者开放:https://ai.gitee.com/serverless-api?model=Step1X-3D

Step1X-3D模型现已正式上线模力方舟在线体验,面向每一位开发者、设计师与创作者开放:https://ai.gitee.com/serverless-api?model=Step1X-3D

Step1X-3D是由阶跃星辰开源的 3D 大模型,总参数规模达 4.8B,其中几何模块 1.3B,纹理模块 3.5B,支持从零生成结构完整、细节丰富的 3D 几何模型,并配合高一致性的多风格纹理合成。

下面是使用Step1X-3D生成的带纹理的北极熊 3D 模型,可以看出无论是外形和精度都十分出色,且同时支持直接下载为GLB或STL文件:

那么究竟是什么让它如此出色呢,下面就和马建仓看看Step1X-3D的三大核心特性。

Step1X-3D基于超过 500 万原始资产构建了 200 万标准化高质量训练样本,并公开发布了其中 80 万个高质量 UID 资产。我们同步开源了完整的数据清洗策略与预处理流程,有效突破行业 3D 数据稀缺、质量不稳的瓶颈。

同时,通过增强型网格-SDF 转换和锐边提取等技术,显著提升了水密几何结构的转换成功率(提升 20%),为生成细节丰富、结构清晰的 3D 模型打下基础。

Step1X-3D采用三维原生的两阶段架构,将几何建模与纹理合成解耦:

几何生成模块:基于优化过的混合式 VAE-DiT 结构,输出闭合的 TSDF 表达,结构完整,边缘清晰,无破面或失真;纹理生成模块:基于深度定制的 SD-XL Diffusion 架构,通过法线图与位置信息引导生成,结合潜空间多视图一致性机制,确保纹理色彩真实、风格统一、细节饱满。

这一架构既适用于单视图图像输入,也可扩展至多模态控制,为内容创作提供强大灵活性。

Step1X-3D与主流 2D 生成模型(如 Stable Diffusion)在架构上高度一致,因此可直接支持 LoRA、ControlNet 等成熟的 2D 控制模块迁移至 3D 生成中,实现更精细的生成控制与风格调节。

用户可自由调节生成模型的对称性、表面锐度、纹理风格等属性,让 3D 内容创作更符合具体项目需求。

在阶跃星辰自建的综合测试集中(共 110 个多样化用例),Step1X-3D在结构保真度、纹理细节一致性、语义匹配度等多个维度表现领先。其中,CLIP-Score达到目前开源 3D 生成模型的最高水平,实现对输入意图的高精准响应与还原,充分满足真实生产场景中的审美与技术双重需求。

模力方舟的 AI 模型广场提供了行业大模型、文本生成、视觉模型、语音多模态、图像生成与处理、3D生成、文档处理/OCR、视频生成、自动语音识别、语音合成、向量化和重排、代码生成、风控识别十三大类共 92 款各领域的顶尖开源模型的在线体验和 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。

来源:码云Gitee

相关推荐