全球领先的3D大模型出自上海“95后”团队之手

B站影视 2025-02-05 15:09 3

摘要:过去几年里,生成式AI技术已经在文字、图像、音频、视频取得重大进展,而3D生成常被认为是“世界模型”的“最后一块拼图”。近日,3D生成大模型公司——影眸科技完成数千万美元A轮融资。

不断试错依然充满信心,从无人问津到获千万美元融资

全球领先的3D大模型出自“95后”团队之手

过去几年里,生成式AI技术已经在文字、图像、音频、视频取得重大进展,而3D生成常被认为是“世界模型”的“最后一块拼图”。近日,3D生成大模型公司——影眸科技完成数千万美元A轮融资。

专注于3D生成大模型技术的影眸科技,是上海科技大学孵化的创业企业。此次融资将用于影眸科技进一步推进3D大模型前沿探索,同时推动以3D生成大模型Rodin为核心的Hyper3D系列产品在全球市场的商业化落地。

据悉,Rodin上线45天后已实现100万美元年经常性收入,截至目前已获得数百万元B端商业化订单,覆盖游戏、电商、空间计算、3D打印、影视等多个行业。

令人印象深刻的是,这家公司的团队成员大多在30岁以下,却完成了全球领先的3D大模型——Clay的研发。这一成果与团队同年研发的3D服装生成模型Dresscode同时获得SIGGRAPH2024最佳论文荣誉提名,团队也成为这一领域内唯一在同一个学术顶会上获得两项该提名的中国团队。

实验室科研,点燃创业源点

影眸科技的首席技术官,也是影眸科技的创始人之一——张启煊,出生于1999年,是上科大智能视觉与数据中心的一名研究生。

在本科时期,张启煊便进入实验室参与科研项目,并逐渐对计算机图形学和机器视觉方向的相关技术产生浓厚兴趣。在导师的指导下,他深入探索3D建模领域的前沿科技。

本科生就能进入实验室做科研,一直是上科大的一大特色。更为特殊的是,影眸科技创始人吴迪不仅参与实验室科研,更参与实验室的筹备工作。“从某种角度来说,实验室的筹备过程也是一种创业。”吴迪心中,实验室从无到有的过程本身就是一段宝贵的经历。“当时,实验室初创时期的名字叫MARS,张启煊那时大二,我是大四。”吴迪介绍,实验室最初的研究方向是——如何把现实世界中的人物和物品映射到虚拟世界中。这就需要光场扫描,因为有十分庞大的数据采集需求,实验室开始打造完全自研、全球领先的光场拍摄系统、数据采集系统。

经过6年与实验室伙伴们的共同努力,实验室搭建了穹顶光场。这个光场的核心在于,全场布满可控光源和4000帧/秒的超高速相机。通过这些设备,它可以以超高的精度与超快的速度动态扫描面部和物体表面的材质、捕捉表情变化时的肌肉运动。当这些状态被放到新环境中时,它们的高光、阴影都会随着环境的变化而变化。“这期间,我们拆掉了一个又一个辛苦搭建完成的装置,最终研发出了全球最高精度的人脸扫描设备——穹顶光场系统。”吴迪回忆道。

充分的试错平台

2020年,创始团队获得了上海科技大学相关技术IP授权,创办了影眸科技。虽然有了先进的科研成果,但成果转化并非一帆风顺。

这群年轻的创业者一度认为,终于研发成功了,就等着客户上门砸钱。然而现实情况是,大多数产品并不符合工业生产标准,更多是“躺在象牙塔里的科研”,很少考虑真实的市场需求。具体来说,影眸科技当时的技术与传统的影视、游戏通用的Unity系统并不兼容。所以,在当时很难有客户买单。

几经周折之后,公司团队做了一个痛苦的决定,把所有2D业务线全部砍掉,全面拥抱3D,着重研发新一代穹顶光场,聚焦数字人领域的研发。基于以前试错的教训,团队着重研发与现有影视、游戏业务相兼容的系统技术。通过这项新技术,以前需要3—5个月才能用的人物超写实复刻,现在3—5天就可以完成,这项技术目前主要服务于影视和游戏客户。

是什么让影眸科技在不断试错中,对未来依然充满信心?在吴迪眼中,“整个学校对创新有极大的包容性,给学生试错的平台。让我们能在这里拥抱科学研究的基本方法和价值观,互相包容、鼓励。最重要的是允许彼此失败,继而成功,这才给了我们真正的成长空间。”

在商业化的道路上,影眸科技不断探索市场需求,同时秉持的“让研发能够真正地被应用”的理念,将目光逐渐收束到3D大模型上。去年6月,基于Clay开发的Rodin Gen-1上线,以它最贴近行业标准的生成质量,获得广泛好评,帮助用户实现高效便捷的3D创作。同年12月,影眸科技发布Rodin Gen-1.5版本,通过新一代3D原生表达,全面解决了行业内长期存在的薄面与边缘锐度问题,再次提高3D生成全行业商用标准。这次更新再次引发了全球3D生成领域的关注,巩固了影眸科技在3D生成技术创新与商业化应用领域的领先地位。(记者 李蕾)

来源:金台资讯

相关推荐