来源:互联网 更新时间:2026-07-04 14:43
最近,AI虚拟细胞(AIVC)赛道迎来了一波关键性的突破。
作为全球最早布局该领域的企业之一,
这个模型是目前公开报道中
最值得关注的突破在于,它首次将JEPA(联合嵌入预测架构)与世界模型理念系统性引入单细胞研究。
世界模型已经是自动驾驶、机器人和生成式AI领域的重要技术方向。CellOS的亮相,让外界好奇:
从目前公开的评测结果看,CellOS在预测精度、扰动建模等多个核心指标上与多款主流模型拉开倍数差距,达到了当前国际领先(SOTA)水平。
不过,想要真正理解它的技术逻辑与商业价值,咱们还得从
理解细胞变化,是生命科学最核心的问题之一。
疾病发生、药物作用、细胞治疗,本质上都是细胞状态发生变化的过程。
过去,科学家只能通过细胞培养、动物实验乃至人体验证来探究细胞在药物、基因扰动等刺激下的变化。高昂的研发成本和漫长的试验周期,让大量潜在新药和细胞疗法陷入漫长试错。"十年研发周期、十亿美元投入,临床成功率却不足10%"的"双十定律",是时候被终结了。
△图片由AI生成
"虚拟细胞"的出现,为新药发现开辟了一条全新的路径。
在计算机里"复刻"细胞的想法,早在20世纪90年代就有学者探索,并开发了最早的细胞建模软件之一VCell。后来,斯坦福大学研究团队发布了全球首个全细胞计算模型。
但此前的虚拟细胞,并不是一个学习型的模拟器,无法模拟细胞在不同条件和变化环境下的运作。它不能预测细胞功能、行为和动力学,也就无法揭示背后的机制,最终难以在药物开发中发挥最大价值。
直到近些年AI技术的突飞猛进,加上组学技术的迅猛发展,才让虚拟细胞逐渐靠近生命科学的"模拟沙盘":
2024年12月,美国斯坦福大学、基因泰克制药公司与陈—扎克伯格基金会组成的联合科研团队在顶级期刊《Cell》发表的重磅论文,点燃了全球的研发热潮:AI虚拟细胞(AIVC)的时代,正式宣告到来。
△图片由AI生成
其实在此之前,Geneformer、scGPT、scFoundation、GeneCompass等一批模型就已相继问世,只是业内还没有统一的"AIVC"叫法。
这些第一代AIVC模型解决了细胞类型识别等基础需求,但在预测细胞动态变化上存在明显局限。举个例子:
核心原因在于,它们的训练目标主要是学习基因表达模式本身,而非细胞状态变化的内在机制。因此,
进一步来看,由于模型主要基于单一表达视角学习静态基因表达模式,很难刻画基因调控关系及细胞状态演化的动态规律。许多只有在特定扰动条件下才显现的关键生物学信号,也容易被大量稳定表达的背景信号所淹没。
所以,
2026年6月,《Nature Methods》刊发的一项研究结果相当扎心:研究人员基于2220万个细胞的scTab语料库,预训练了400个模型,完成了6400次评估。结果显示,在多项任务中,模型性能往往在使用约1%的预训练数据后便进入平台期。
换句话说,仅用约22万细胞训练模型性能就已基本拉满,再多
这让行业开始重新思考:
CellOS给出的答案是后者:真正限制模型持续提升的,并非Scaling Law本身,而是
只有让模型真正学习细胞状态演化规律,而不仅仅是静态表达模式,数据规模扩展才能持续转化为模型能力的提升。
世界不是由文字构成的。
李飞飞最新长文如是说。
而细胞世界,更不由文字定义。
说到底,AIVC领域需要的是AI对细胞状态有理解,而非单纯的表达模式复现。只有这样的模型,才能支撑动态预测(如扰动响应)和可迁移的虚拟细胞能力。
站在业内角度,CellOS这次的策略其实挺狠的。它没有选择大多数团队还在走的"安全路线"——继续在大语言模型上卷参数、卷数据,而是直接选择JEPA这条更难、但潜在天花板更高的路。
因为人工智能领域的普遍共识是:
CellOS是
CellOS的核心创新有三点:多视角表征学习、JEPA联合嵌入预测、无损扩容。咱们一个个来看。
它让模型在进入更复杂的训练阶段前,就先获得更丰富、更敏锐的细胞特征辨别能力。
传统单细胞基础模型通常只依赖单一的"表达视角",即根据基因在单个细胞中的表达丰度来判断细胞状态。这种方式容易忽略那些表达量不高、但在生物学上具有重要标志意义的基因(如调控基因、应激响应基因),导致关键信号易被背景噪声淹没。
于是,
把这两个维度拆开、同时并行分析后,模型就像突然开了"透视挂",能更容易抓住那些隐藏的重要生物学信号。结果就是:模型对细胞状态变化的敏感度大幅提升,并且为第二层创新打下了坚实基础。
在创新一(双视角)给模型提供高质量的互补表征后,CellOS引入JEPA(联合嵌入预测架构),在隐空间利用这些互补表征进行跨视角预测和对齐。
传统模型的训练方式是:给你一个细胞的基因表达数据,让你尽量把它"原样复述"出来。这就像让学生死记硬背课文,容易只记住表面文字,却不懂背后的意思。
CellOS引入JEPA,则是彻底换了一种玩法:
简单说,就是逼着模型在脑子里建立一个"细胞状态的内在模型",去抓住那些真正稳定的生物学规律。举个例子,传统模型看的是"这个细胞现在长什么样";JEPA则在学"如果从不同角度看这个细胞,它的状态本质是什么?如果发生变化,它会往哪个方向走?"
这一招直接让模型的能力从"看懂表面"升级到"理解本质"。特别是在预测"敲除某个基因细胞会怎样"、"加药物后细胞如何反应"这类动态问题上,效果提升非常明显。
模型越大越聪明,但有个问题:参数变多之后,它经常把以前学到的东西忘掉。业内管这叫「灾难性遗忘」。
CellOS在这一点上做了特别的设计——无损扩容机制。具体做法:先好好训练一个"中小型"稠密模型,打牢基础;然后用一种平滑的方式,将它升级成超级大的MoE模型(混合专家模型)。在升级过程中,保留原来学到的核心知识,同时新增很多"专家"去学习更复杂的内容。
这样一来,
到这里,我们忽然发现,这三大创新
不过,
这种分阶段训练的设计
在三层创新+三阶段训练的加持下,多基准测试显示,在细胞状态注释和扰动响应预测任务上,CellOS达到SOTA水平。
在衡量细胞状态预测能力的核心指标Pearson_edist上,CellOS取得0.619的成绩,不仅位列所有模型第一,也是唯一突破0.6的模型。相比目前表现最好的开源模型TranscriptFormer(0.373),拉开了66%的性能差距。
另外,在细胞状态注释任务中,它在聚合注释基准上取得了0.792的生物学保守分数,全面超越了UCE、scGPT、TranscriptFormer等主流单细胞基础模型。
CellOS不只是一个新的大模型,更是一种研究范式的升级。它让AI从"看懂细胞表达"走向了"理解细胞状态"。而这种转变,也为虚拟细胞的实际应用奠定了坚实基础。
过去两年,AIVC已经从概念验证进入了技术竞速阶段。
标志性事件是2025年6月,知名研究机构Arc Institute发起的虚拟细胞挑战赛(Virtual Cell Challenge,简称VCC),集齐了英伟达、10x Genomics等赞助方,Cell鼎力支持。这被认为是
其中,预赛全球第一,决赛全能榜全球第二、国内第一的x.Compass团队核心成员,正是本次发布CellOS的研发团队。
当然,
比如成立仅1年、单轮融资10亿美元的Xaira Therapeutics,创下了当年全球医疗健康领域最大的单笔融资纪录;2024年前后,Somite.ai、Noetik、Turbine等生物科技公司也陆续拿到了知名机构的投资……
△图片由AI生成
同时,Big Pharma(大型制药巨头)也相继向AIVC公司抛出业务合作的橄榄枝。
美国FDA持续推动New Approach Methodologies(NAMs),鼓励采用计算模型、类器官、器官芯片等新方法补充甚至替代部分动物实验;欧洲、中国等监管机构开始加强AI辅助药物研发相关研究,为数字化研发提供更明确的发展方向;国内也已将"细胞编程与调控""先进组学研究""生命工程设计软件工具"列为前沿攻关方向。
微观层面,随着AI虚拟细胞赛道持续升温,全球入局者快速增加,并逐渐分化出三类核心玩家:
第一类,是以Arc Institute、同济大学等
第二类,是以Xaira、Noetik、Cellular Intelligence、Tahoe Therapeutics、百曜科技等为代表的
第三类,则是以Recursion、Owkin、Isomorphic Labs等
△图片由AI生成
事实上,观察近年来获得较大融资、商业合作的平台公司可以发现,它们几乎都具有共同特点:不仅拥有AI模型,更拥有持续积累数据和验证模型的实验体系。
也就是说,行业对AIVC的期待已经不只是一个算法,而是希望其成为连接AI、生物数据、实验平台和药物研发的新型基础设施。大家开始关注:
这些能力,往往比单一模型性能更难建立,也更难复制。
值得关注的是,在这一轮AI虚拟细胞竞赛中,
过去几年,全球AI制药领域的重要创新主要集中于欧美。从AlphaFold到生成式分子模型,再到虚拟细胞,国际头部机构率先完成了基础设施布局。但随着国内单细胞组学、生物计算以及大模型技术不断发展,一批中国原生AI生物科技公司开始强势进入这一赛道。
比如CellOS背后的百曜科技,先发优势明显,已经搭建了覆盖单细胞数据处理、高通量扰动实验和AI模型训练的技术体系,
据公开报道,百曜科技目前布局了管线资产和模型服务两大应用落地方向,前者进一步延展到细胞治疗、工程细胞,后者则涵盖靶点发现、虚拟药筛及虚拟临床全周期。
整体来看,尽管行业发展迅速,但
对于整个生命科学产业而言,这场围绕AIVC商业化落地而展开的新竞赛,才刚刚开始。当所有人都在谈论世界模型的时候,或许,最值得建模的那个「世界」,就藏在36万亿个细胞里。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
电视剧《小欢喜》剧情介绍
俄罗斯最大yandex入口外贸日报直达链接
如何在夸克浏览器中开启网页视频的倍速播放功能?
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
腾讯元宝怎么用来分析股票基金的基本面信息?
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
二次元男生网名可爱(精选100个)
wallpaper壁纸声音怎么开启
问题:CIA币好不?Cia Protocol币今日上线:价格预测、代币经济学和未来潜力
免费观看国外短视频的app有哪些 观看国外短视频的软件下载
国际贵金属走低,现货黄金价格跌0.49%
新浪人工智能热点小时报丨2026年06月20日02时_今日实时人工智能热点速递
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
动漫《无赖勇者的鬼畜美学》剧情介绍
短剧《嫡女她是山大王》剧情介绍
AO3网址链接入口 教程:从入门到实际使用
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc