来源:互联网 更新时间:2026-06-27 14:27
在过去的十多年里,以GPU为核心的数字计算几乎统治了整个AI领域。更大的集群、更高的带宽、更强的GPU、更密集的数据中心——这似乎是通向下一代AI的主流路径。
但当模型参数规模开始向万亿级狂奔时,行业开始频繁提及一个词:「能耗」。更底层的问题也随之浮出水面:如果AI继续按现有方式扩张,电从哪里来?
事实上,AI的「电费账单」与能源消耗,早已不是简单的运营成本问题,而是逐步演变为制约整个行业发展的「结构性瓶颈」。
面对这一迫在眉睫的能源危机,前Databricks AI负责人、硅谷传奇创业者Naveen Rao,带着他的全新硬科技初创公司Unconventional AI,走到了聚光灯下。
今天,Unconventional AI 官宣发布了它的第一个模型——Un-0,一个由「模拟耦合振子系统」驱动的图像生成模型。这可以看作是一种新兴物理计算底座的样例。在ImageNet 64×64上,Un-0达到了FID 6.74,质量已经接近一些主流传统图像生成方法刚发布时的水平。
Naveen Rao 称其为「第一个以物理作为计算原语构建的大规模生成模型」。
「这标志着基于物理的模型迎来了一个『Hello World』时刻。我们利用物理系统天然随时间变化的行为,让它替我们完成计算。最终结果是一种全新的计算机构建方式,并且有望在能效上实现大幅提升。」

在接受媒体采访时,Naveen Rao 给出了一个更为大胆的「小目标」:未来,或将AI推理能耗降低到现有系统的千分之一。

Un-0 生成过程随时间演化的轨迹样本。每条线的颜色都对应一个颜色相近的方框,方框中标注了类别,并展示了该类别图像随时间逐步生成的过程。
官方发布了一篇博客来介绍Un-0,接下来具体了解一下。
Unconventional AI 表示,他们的目标是构建一种新型计算机,让它利用物理规律完成计算,希望未来现代AI可以在远低于今天机器能耗的情况下运行——目标大约是降低1000倍能耗。
因此,他们提出了一个问题:能不能训练一个物理动力系统,让它在规模化任务上生成图像?
如今,最强的AI模型基本都是传统深度网络,尤其是以Transformer为骨干的模型。但在主流路线之外,长期以来也有很多研究试图借助物理系统的动态行为来提高能效,比如模拟电路中的噪声、时间变化、电压和电流等。这类方法不是用传统数字数值进行计算,而是利用物理系统自己的演化过程。
比如神经形态计算、Hopfield网络以及Reservoir Computing等,以及近年发展出的Hamiltonian Networks、Liquid Networks、Neural Wave Machines、Thermodynamic Computing,以及Kuramoto Oscillators等。
Un-0 就是在这些非传统计算路径上的一次新尝试。但核心难点在于:要想利用这些替代计算方式,AI任务必须被有效映射到物理系统的动态过程里。Un-0想验证的就是,现代AI工作负载是否可以被放到物理底座上运行,并最终比今天的硬件更高效。
官方表示,可以想象两个节拍器并排滴答作响,如下图所示。

每个节拍器在任意时刻都有一个「相位」,也就是摆臂当前处在摆动周期里的位置。如果两个节拍器放在同一张桌子上,它们会通过桌面彼此影响。根据相互作用强弱——也就是耦合强度——它们可能逐渐同步,也可能进入相反相位的同步状态。
这就是振子的基本概念:每个振子都有自己的相位,并且倾向于按照自身频率旋转,但同时会受到邻近振子的影响。
而如果把两个振子扩展到几千个振子,整个系统就会变得更有意思。大量振子之间存在不同强度的耦合关系,它们会通过相互作用自组织成某种模式,如下图所示。

这些耦合振子通常被建模为「Kuramoto 振子」。
具体来说,每个振子的运动都遵循一条简单规则,并且这条规则会随着时间连续生效:它一方面按照自身的自然频率旋转,另一方面又会受到其他所有振子的牵引而发生偏移。
下面这个常微分方程(ODE)描述的,就是这些振子随时间演化的过程:

每个振子 i 都带有一个相位

∈[0,2π),其中

表示它的自然频率。矩阵

则指定了耦合强度,用来决定振子 j 会以多大力度将振子 i 拉向同步状态,或推离同步状态。
Un-0 需要学习的,正是耦合矩阵 K 和自然频率 ω,这些参数共同定义了物理系统本身。
之所以选择振子,Unconventional AI 给出了两个理由:
Un-0 背后的赌注就是:
Un-0 生成一张图像,大致分为五步:

耦合振子在训练得到的耦合关系作用下随时间演化。其中,条件振子到主振子池之间存在一个单向的低秩类别条件矩阵,用于注入类别信息。在时间点T,系统通过一个解码器读取振子状态,并生成图像。通过多次采样不同的初始条件,就可以生成对应的图像分布。
训练过程中,模型主要学习三类参数:振子之间如何耦合,也就是矩阵K;每个振子的自然频率

;以及解码器的权重。整体上,振子系统承担了原本可能由传统神经网络层完成的计算。
Unconventional AI 解释,之所以选择这种架构,
在训练的前向传播里,模型只需要设置耦合矩阵、振子频率和初始相位,然后让动力系统演化,最后读取图像潜变量。
这和扩散模型、Flow Matching 等动态生成方法有所不同,扩散和Flow Matching 通常会在训练过程中显式指导动力系统如何演化,而Un-0的方法更像是只看最终生成样本,再通过损失函数反过来优化整个动力系统。
代价是,它需要一种更复杂的损失函数,因为训练信号主要来自生成样本本身。
Unconventional AI 在CIFAR-10和ImageNet 64×64上分别训练了三种规模的模型,结果如下:

在CIFAR-10上的训练结果

在ImageNet 64×64的训练结果
从结果看,
在训练方法上,使用了一种新提出的
评测方面,CIFAR-10使用5万张生成样本,并用标准包和评测流程与CIFAR-10参考统计进行比较;ImageNet 64×64同样使用5万张生成样本,并通过ADM evaluation suite计算FID。
算力方面,所有CIFAR-10模型在1张B200 GPU上训练,而所有ImageNet 64×64模型则在8张B200 GPU上训练。最大CIFAR-10模型训练消耗20个B200小时,最大ImageNet 64×64模型训练消耗640个B200小时。
官方表示,
为了更好地展现Un-0的性能表现,Unconventional AI把Un-0放在了「生成质量 vs 参数数量」的曲线上,与传统模型和非传统模型进行比较。

CIFAR-10数据集中的参数数量与FID值的对应关系

在64×64尺寸的图像中,参数数量与FID值的对应关系
结论是:
换句话说,
从整体上来看,
Naveen Rao 强调,Un-0的出现,说明
「我们正在开发的,正是这个时间维度。」

这和能效的关系在于,在现有冯·诺依曼架构机器中,大部分能量都消耗在内存与计算单元之间的信息搬运上,动力系统则把计算和记忆合并到同一个实体之中。更重要的是,动力系统可以容忍噪声,这进一步打开了节省通信能耗的新机会。
「大脑里并没有线性代数这种抽象,所以某种意义上,我们是在绕过中间环节。」
在贴文下面,很多网友也表示了期待。
「实际上,这种性能效率的提升非常巨大。如果这种技术能够得到广泛应用,那么很多在本地运行的应用程序都可能变得可行起来。」

「如果这种技术能够上市的话,那真是一项极其先进的脑科技啊。」

https://x.com/NaveenGRao/status/2070184079199494583
https://unconv.ai/blog/introducing-un-0-generating-images-with-coupled-oscillators/
https://techcrunch.com/2026/06/25/databricks-former-ai-chief-thinks-he-can-cut-ais-power-bill-by-1000x/
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
archiveofourown 实战指南:常见用法整理
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
作家助手如何上传自制封面 作家助手如何设置小说的封面
如何在夸克浏览器中开启网页视频的倍速播放功能?
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
电视剧《小欢喜》剧情介绍
全链网:黄金价格因美元的走强及利率担忧而下跌
美国市场:股票相对债券的风险溢价正在消失
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
有寓意的易经网名男生(精选100个)
植物娘大战僵尸电脑端与手机端存档转移的方法
电影《遁甲门之消失的公主》剧情介绍
动漫《柚木家的四兄弟》剧情介绍
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
卡厄思梦境哀嚎螺旋塔攻略 哀嚎螺旋塔怎么玩
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc