热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >完成数亿元新融资,影眸科技 Hyper3D 让 3D 生成进入“思考时代”丨36氪首发

完成数亿元新融资,影眸科技 Hyper3D 让 3D 生成进入“思考时代”丨36氪首发

来源:互联网 更新时间:2026-06-24 22:59

2026 年开年以来,3D生成模型赛道的热度一直居高不下。

今年一季度,影眸科技拿出了首个3D编辑模型Rodin Gen-2 Edit,让AI 3D模型第一次具备了可编辑的能力;到了6月,VAST官宣了新融资,Meshy紧随其后,声称发布了全球首款3D AI Agent。

而最近,影眸科技——这支学术圈出身、创业早、团队非常年轻的3D模型团队,带着最新的技术成果和新一轮融资,又给这把火添了新的柴。

这支团队创立于2020年,创始人兼CEO吴迪、联合创始人兼CTO张启煊,以及另外两位联合创始人张龙文、曾初啸,均来自上海科技大学。团队约60人,平均年龄不到25岁。

别看团队年轻,在B端市场,影眸几乎已经坐稳了头把交椅。其B端客户数量和营收,比行业内其他公司加起来还要多。客户名单里包括了字节跳动、Unity、Figma、Canva这样的知名企业,海外收入占总收入约80%。

在学术成果上,影眸的表现同样亮眼。他们提出了定义主流AI 3D架构的原生3D生成方案CLAY,连续数年获得计算机图形学顶级会议SIGGRAPH的最佳论文及提名。在顶刊和各大会议上,论文和奖项不断,算法团队中每2个人里就有1人获得或提名过最佳论文。

《智能涌现》独家获悉,近日影眸科技宣布完成数亿元软妹币的新一轮融资,本轮融资由凯辉基金、上海国投先导联合领投,老股东持续跟投。

在此之前,字节跳动、美团龙珠、红杉、蓝驰等机构已经相继押注。

伴随新一轮融资,影眸科技发布了最新一代3D生成模型——Hyper3D Rodin Gen-2.5。这个模型最大的特点,是把语言模型中“先思考再生成”的模式,引入了3D生成领域。它面向不同生产场景,提供了可调节的精度模式。这也是全球首个千万面级的3D生成模型,最快4秒就能生成百万面模型,同时还推出了全球首个12K精度的原生3D贴图模型。

长期以来,影眸的主要业务是面向B端和专业C端,提供平台订阅、B端API售卖、私有化部署、直接交付最终资产等服务。应用场景主要集中在电商、3D打印、游戏、工业设计、具身智能等行业。

面对市场竞争,影眸的策略很清晰:瞄准海外市场,服务好C端专业用户,同时让模型的生成过程更加可控。

值得关注的是,在Rodin Gen-2.5发布后,一个重要的变化出现了——C端收入正在反超B端。

Rodin Gen-2.5上线首月,订阅用户和ARR的环比增速均超过了400%。

C端的发力,恰好击中了影眸一直想解决的核心问题:AI 3D到底能不能被用户真正用起来?

“从学术圈出来的人,容易有一种惯性,觉得自己技术和论文很厉害,市场为什么不用?但实际情况是,实验室研发出来的东西,和真正能被使用的东西之间,存在巨大的鸿沟。”吴迪的解释很直白。

想要填平这条鸿沟,关键在于生成的模型要符合使用标准,而且用户要能控制3D的生成结果。

为了做到这一点,影眸几乎给了用户最大程度的编辑自由。

在平台上,用户可以通过影眸自研的3D ControlNet,控制生成结果的长宽高和形状;还能实现3D编辑功能,平台生成的模型乃至第三方模型都能进行二次编辑,支持用自然语言局部修改模型;此外,能对3D资产进行分件,分件之后还能继续分件。

△影眸科技3D资产的分件能力,图源:企业官方

在影眸看来,这些看似复杂、需要用户反复确认和控制的流程,恰恰是用户选择他们的理由。

“我们对3D生成的用户群体有过预估,大部分愿意付费的用户,刚好是那些对‘可控’有需求的人。我们要先服务好那些真正会买单的人,”张启煊表示,“3D生成的落地应用,已经从追求观赏质量,迈向了可控、效率与质量并重、更贴近实际生产的下半场。”

在预训练阶段就做好模型的可控性设计

回顾影眸的发展历程,在经历了元宇宙赛道萎缩、2023年的资金困境之后,2024年原生3D生成方案CLAY的研究和提出,彻底改变了影眸科技乃至整个3D生成赛道的走向。

在当时,整个AI 3D行业的主流技术路径,几乎都围绕“2D升维3D”的模式——先生成物体的多视角图像,再建模成3D资产。这个模式有个明显的缺点:存在不可逆的信息丢失,生成的模型很难真正应用到工业设计、游戏等领域。

但影眸觉得,让生成的3D资产达到Production-Ready(生产就绪)的水准,比什么都重要。于是,他们做出了一个反共识的决定:用3D数据,从头开始训练3D原生模型。

这条没人走过的路,被他们走通了。

2024年,影眸团队提出了全球首个产品化的3D原生大模型框架CLAY(《CLAY:用于创建高质量3D资产的可控大规模生成模型》)。这个模型通过算法和框架层面的底层创新,把3D生成的效果从“不可用”变成了“可用”。该研究还提名了当年SIGGRAPH的最佳论文。

同年年中,基于CLAY架构,影眸科技发布了全球首个3D原生模型Rodin Gen-1。这也让行业的主流技术路线开始发生变化,纷纷转向3D生成原生路线。

影眸对他们的3D模型,有两个最重要的要求:可控性,以及质量。

其中,可控性是影眸打出的一张明牌。

“对专业创作者来说,可控性特别重要,这是他们选择我们的首要原因。”张启煊说。

“实现可控性的关键,是在预训练阶段就把相关设计放进去,让它和模型底层一起长出来。”从Rodin的第一个版本起,他们就引入了3D ControlNet等可控能力。

此后,影眸团队也在持续增加产品的可控性,包括支持局部修改模型,能自动拆分出不同部件,还能在分件后继续分件,帮助用户减少“抽卡”次数,提高模型生成过程中的控制力。

Rodin Gen-2.5首次在3D生成领域引入了类似LLM(大语言模型)的Test-time Scaling(测试时缩放)策略。这种自适应的可调节Thinking Effort(思考力度),为未来实现与图像生成模型、甚至与LLM的深度结合提供了可能。通过这个策略,用户可以选择模型的思考时间和深度。它支持五档思考深度,耗时从4秒到80秒不等,对应着从快速草稿到高精度资产。在Extreme-High模式下,模型能实现千万面数的生成能力,可以还原皮肤微结构、纹理、毛孔等细节特征。

△Rodin-2.5的五档思考深度,图源:企业官方

不仅如此,影眸还同步推出了一个原生3D贴图模型。与传统的投影法生成材质不同,这个模型能解决传统方法中存在的颜色断层、浸染等问题,可以清晰地保留Logo、文字等信息。从几何生成到贴图,整个过程最快只需5秒。

该贴图模型具备图像生成级别的能力,可以实现材质纹理的无死角覆盖,文字效果提升显著,并且支持基于物理的PBR材质。配合同步推出的12K原生3D贴图模型,生成的几何精度与材质保真度,已经可以超越实景扫描,在行业里处于断代领先的水平。

另一个关键点——质量,影眸用一系列研究成果做出了有力的证明。

自CLAY之后,他们相继推出了CAST、BANG等研究成果。前者能通过输入一张图片,生成包含物体和物体关系的完整3D场景;后者能实现对3D资产的分件。

其中,关于CAST的研究论文《CAST:基于单张RGB图像的组件对齐式3D场景重建》,一举斩获了SIGGRAPH 2025的最佳论文奖。同期在该领域获得最佳论文的商业公司,只有谷歌、Meta和影眸三家。

作为唯一连续多年获得SIGGRAPH最佳论文及提名的商业公司,影眸自2020年以来,在顶级学术会议及期刊上共发表了30余篇论文,其中70%的科研成果已经走向了落地。

这具体体现在产品的迭代上。近两年来,影眸的模型实现了四次重要迭代:从Rodin Gen-1,到2025年9月发布、具备拆件能力的Rodin Gen-2,再到2026年1月发布、拥有局部编辑功能的Rodin Gen-2 Edit,直到今年6月最新发布的Rodin Gen-2.5。

谈及AI 3D的未来,吴迪透露,未来一至两年内,公司会继续做两件事:一是精进底层模型的生成质量,二是拓展编辑、Agent化等能力,让模型在专业领域越来越好用。

服务最专业的用户,解决最真实的问题

AI 3D的商业化路径仍在被行业验证,但在影眸看来,这是一份可持续的好生意。

单看模型训练的算力成本,对Rodin而言,整数倍版本的迭代需要千卡级的训练,但由于影眸自身在算法架构上的积累,

相比同行训练出一个同级别的模型,其训练效率得到了极大的提高。

过去一年,

企业级(B端)营收的质量与可持续性,正逐步取代消费级用户规模,成为衡量AI公司长期价值的核心维度。

以Anthropic为代表的企业级路线,被广泛视为这一趋势的典型样本。

与此同时,在收入端,影眸走的正是类似Anthropic的企业级路线。其积累的B端客户营收,超过了同赛道其他公司的总和。

从客户构成来看,影眸的B端订单分布在游戏、电商、工业设计、具身智能、空间计算等多个高价值场景。而C端用户画像,则主要是Pro-C(专业级消费者),比如建模师、3D打印爱好者、产品设计师等。

在影眸团队看来,未来3到5年,3D生成主要还是被专业用户使用。不管对于语言模型、图像模型还是其他模型,都很难从绝对效果上完全分个高下。对于3D生成赛道而言,大众真正应该关注的是,模型厂商能否满足下游行业的真实需求。

“我们研发出来的东西,需要接入到后期的生产流程里去使用。所以我们必须做Production-Ready的东西,让它能直接进入影视、游戏等场景的后期流程。”吴迪说。

基于这个逻辑,影眸把产品设计成了生成过程中可以逐步确认、满意后再付费的模式。这个模式,源自影眸对自身模型可用性的底气。

在影眸的客户列表里,有不少具身智能公司。他们把影眸的3D资产,用作训练数据,或者用来生成仿真环境和资产。

谈到赛道上正热的“世界模型”,张启煊认为,撕开世界模型的标签,大家主要在做两件事:一是实时视频生成,比如Google的Genie-3;二是可仿真的环境,包括资产、模拟器等,以及做类似自动驾驶、机器人策略的执行器。

在世界模型的版图里,影眸偏向于做可仿真资产。在平台上,他们有一个叫Sim-Ready的功能,用户点击后,可以直接在英伟达的仿真环境里做物理仿真。

具身智能对3D生成模型的要求,包括几个层面:一是物理反馈,如重量、碰撞体等,这些功能影眸已经上线到产品中;二是可互动资产,比如3D资产在分件后如何动起来,在这个方向上,影眸也做出了相关的学术成果。

单纯用视频生成来做世界模型,可能会导致模型难以从视频中学到真实物理世界的维度关系。而这正是3D的优势所在:能理解物品之间的位置关系,视角角度连续性好,还能在模型中做物理模拟。

吴迪判断:“未来的世界模型,需要让机器真正学到和真实世界一致的场景,其背后可能会是

3D生成与视频生成混合的模式

。”

“3D生成的赛道正在收敛,而收敛意味着,最终只有少数真正解决了产业问题的团队能留在牌桌上。过去一年,市场习惯用用户规模和增长曲线来衡量一家AI公司的价值。但3D生成会是游戏、影视、工业设计乃至物理世界智能化都绕不开的底层能力。我们服务最专业的用户,解决最真实的生产问题,这个选择决定了我们今天的领先,也决定了我们未来要去定义、而不只是参与下一代3D生产工具的规则。”

热门手游

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc