来源:互联网 更新时间:2026-07-03 14:25
刚刚,Together AI完成了一笔8亿美元(约合软妹币54亿元)的融资。这让它的估值直接飙到了83亿美元(约合软妹币564亿元)。
它的核心逻辑并不复杂:帮企业以更低成本调用大模型,尤其是开源模型。
这一轮由沙特阿美旗下的Aramco Ventures领投,跟投名单里有Vista Equity Partners、General Catalyst、Emergence Capital,甚至英伟达和Salesforce Ventures也加入了。
上一次融资时,Together AI的估值还是33亿美元,现在已经翻了一倍还多。
更值得关注的是它的年化收入:11.5亿美元(约合软妹币78亿元)。
Together AI成立于2022年,和ChatGPT同一年诞生。
创始团队技术积累深厚,亚裔面孔占了不小比例。
创始人兼CEO Vipul Ved Prakash,出生于印度新德里。他曾在德里圣史蒂芬学院学习数学、物理和计算机科学,随后退学投身软件开发。他联合创立过网络安全公司Cloudmark和社交媒体搜索公司Topsy。苹果收购Topsy后,他参与负责Siri的搜索和AI工作。
CTO张策2008年毕业于北大数学系,随后在威斯康星大学麦迪逊分校获得博士学位。他先后在苏黎世联邦理工学院和芝加哥大学任教,研究主线是让机器学习变得更便宜、更可信、更容易被广泛使用。
团队里还有几位大牛。
Chris Re是斯坦福大学计算机科学教授,也是连续创业者。他参与创办过SambaNova、Snorkel,以及被苹果收购的Lattice和Inductiv,在机器学习系统和AI基础设施领域很有分量。
Tri Dao(越南裔)是Together AI的首席科学家,也是普林斯顿大学计算机科学系的助理教授,曾在Chris Re门下读博。他是FlashAttention的主要作者之一,这项研究让Transformer在GPU上跑得更快、显存占用更少。
Percy Liang(华裔)是斯坦福基础模型研究中心主任,长期聚焦语言模型、开放模型和模型评测的工作。

Together AI的主要团队成员。(从左至右)上排依次是:普拉卡什、张策、克里斯·雷、特里·陶;下排是珀西·梁、首席产品官泽德莱夫斯基、首席营收官凯·马克、财务副总裁史美成。
ChatGPT爆火之后,市场的目光几乎都集中在闭源大模型上,但Together AI做出了不同的选择。
起初,它因为提供英伟达GPU访问权而受到关注,随后逐步扩展成一个帮助开发者构建、定制开源AI模型的平台。
客户留在Together AI,不是单纯为了GPU卡。他们需要一整套服务:模型选择、训练、微调、推理、部署、评估、GPU集群、专属端点、成本优化。
这才是Together AI真正的商业价值所在。
它卖的不是一个“更聪明的AI”,而是“更便宜、更稳定、更可控地使用AI”的能力。
Together AI最亮眼的数字不是8亿美元融资,而是11.5亿美元的年度化订单额。客户覆盖了Cursor、Cognition、Decagon等AI原生公司。
它的收入增长快得惊人。2024年2月,年化收入大约3000万美元;到2025年2月,这个数字超过了1亿美元。今年,已经达到了11.5亿美元。两年下来,暴增了约38倍。
它的赚钱路径是:在做大模型推理的过程中,把零散的开源模型,整合成企业愿意付费购买的生产系统。
具体模式包括几种——
企业调用模型,按tokens付费。不同的模型,100万tokens的收费也不同,比如DeepSeek V4 Pro、MiniMax M3、Kimi K2.7 Code等模型,都有各自的输入、缓存输入、输出价格。
有些客户用量大,或者对延迟、稳定性、安全性要求更高,公共API就满足不了了。他们需要专属端点。Together AI的价格页明确指出,很多团队从API调用起步,规模大了之后会迁移到专属端点。
企业不满足于通用模型。它们希望模型能理解自己的业务、客户、文档、产品和流程。Together AI提供Fine-Tuning服务,按训练和验证过程中处理的token量收费。不同模型规模、不同训练方式,价格也不同。
有些客户仍然需要自己训练、微调或部署模型。Together AI也提供按小时计费的GPU能力。价格页显示,它的GPU Clusters支持H100、H200、B200等硬件,按每GPU每小时收费。
这几项加起来,就构成了Together AI的商业模式:赚的是企业使用模型过程中的钱。
现在,Together AI每月处理超过400万亿个开放模型的推理token。一年前,这个数字只有大约300亿。调用量在一年内增长了大约1.3万倍。
这个生意之所以突然变大,是因为企业开始认真运用AI了。
客服机器人每天需要回复客户。AI编程工具每天要生成和修改代码。销售系统要自动写邮件。金融系统要读文件。医疗系统要总结病历。AI Agent还会反复调用模型:先理解任务,再查资料,再调用工具,再生成结果,再检查错误。
每一步都要花钱。

前段时间,硅谷传来一个消息:某家企业一个月在Claude上的支出,高达5亿美元——折合软妹币约33亿元,相当于每天烧掉超过1亿元。
开源模型的时机到了。
企业并不每个任务都需要最贵、最强的闭源大模型。很多时候,它们只需要一个足够好、足够快、足够便宜的模型。
在OpenRouter上,开源模型处理的tokens占比,从1月的34%升到了6月的65%。中国开源模型正在缩小与美国顶级模型的能力差距,同时也给了开发者更多定制和微调的自由。部分模型价格低至每百万tokens 18美分,而顶级模型平均约为4美元。
因此,Together AI的平台让企业可以在DeepSeek、MiniMax、Kimi等开放模型上训练和运行AI工作负载,成本低于封闭系统。
Together AI给出了一组很惊人的数字:企业使用开放模型通常能实现6倍到20倍的成本下降。Decagon迁移到Together AI后,推理成本下降了6倍。
推理不是一次性生意。客户一旦觉得能省钱,把业务流程接进去,就会持续产生账单。
Together AI并不是唯一一个被资本追逐的推理基础设施公司。
上周,铅笔道报道Baseten完成了15亿美元融资,估值达到130亿美元。而且,Baseten也特别提到,过去一年收入增长了20倍,原因是企业对“推理”的需求明显增加。
今年5月,Fireworks AI也在洽谈新一轮融资,目标估值可能达到150亿美元。
资本追逐它们,是因为资本发现:大模型应用开始商业化之后,真正持续产生账单的地方,是推理层。
这对中国公司很有启发意义。
金融、制造、政务、教育、医疗、客服、电商、办公软件,都存在大量AI推理需求。这些场景不一定需要最强模型,但需要可控、便宜、安全、能接入业务流程的模型服务。
这意味着机会将出现在推理云、模型路由、国产芯片适配、行业模型部署、AI成本管理、Agent调度、私有化交付和运维服务等领域。
最后,我们把目光投向投资方。Together AI和Baseten的投资方名单里,都出现了英伟达。
英伟达投这类公司并不奇怪。推理平台越多,GPU需求就越大。Together AI在2025年完成3.05亿美元融资时,就宣布要大规模部署英伟达Blackwell GPU。它还预计,未来五年计算能力和基础设施规模将扩大约50倍。
除了卖GPU的英伟达,Together AI和Baseten这类公司,正在演变为芯片、能源、电力设备、制造和企业软件巨头共同押注的基础设施入口。
Salesforce也有理由进场。作为企业软件巨头,它最关心的是AI能不能低成本、稳定地进入销售、客服、营销、办公和管理流程。投资Together AI,相当于提前卡位企业AI工作流背后的“算力水电煤”。
Aramco代表的是能源资本。AI推理看起来是软件生意,但背后需要大量电力、数据中心和算力资源。Schneider Electric是电气和数据中心基础设施相关公司,Pegatron则是电子制造和服务器供应链的重要玩家。
Together AI和Baseten的融资,不只是两家创业公司的事。它更像是一个产业信号:AI基础设施的竞争,已经转向比拼谁能更便宜、更稳定地承接海量调用。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
电视剧《小欢喜》剧情介绍
如何在夸克浏览器中开启网页视频的倍速播放功能?
俄罗斯最大yandex入口外贸日报直达链接
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
植物娘大战僵尸电脑端与手机端存档转移的方法
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
腾讯元宝怎么用来分析股票基金的基本面信息?
二次元男生网名可爱(精选100个)
wallpaper壁纸声音怎么开启
国际贵金属走低,现货黄金价格跌0.49%
问题:CIA币好不?Cia Protocol币今日上线:价格预测、代币经济学和未来潜力
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
短剧《嫡女她是山大王》剧情介绍
新浪人工智能热点小时报丨2026年06月20日02时_今日实时人工智能热点速递
Bubbly无法连接服务器修复方法
免费观看国外短视频的app有哪些 观看国外短视频的软件下载
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc