您的位置：首页 > > 教程攻略 > ai资讯 >暴涨38倍，一群华人卖Token：年入78亿

暴涨38倍，一群华人卖Token：年入78亿

来源:互联网 更新时间:2026-07-03 14:25

帮企业省token，正在变成一门炙手可热的生意

刚刚，Together AI完成了一笔8亿美元（约合软妹币54亿元）的融资。这让它的估值直接飙到了83亿美元（约合软妹币564亿元）。

它的核心逻辑并不复杂：帮企业以更低成本调用大模型，尤其是开源模型。

这一轮由沙特阿美旗下的Aramco Ventures领投，跟投名单里有Vista Equity Partners、General Catalyst、Emergence Capital，甚至英伟达和Salesforce Ventures也加入了。

上一次融资时，Together AI的估值还是33亿美元，现在已经翻了一倍还多。

更值得关注的是它的年化收入：11.5亿美元（约合软妹币78亿元）。

01 开源模型里的机会

Together AI成立于2022年，和ChatGPT同一年诞生。

创始团队技术积累深厚，亚裔面孔占了不小比例。

创始人兼CEO Vipul Ved Prakash，出生于印度新德里。他曾在德里圣史蒂芬学院学习数学、物理和计算机科学，随后退学投身软件开发。他联合创立过网络安全公司Cloudmark和社交媒体搜索公司Topsy。苹果收购Topsy后，他参与负责Siri的搜索和AI工作。

CTO张策2008年毕业于北大数学系，随后在威斯康星大学麦迪逊分校获得博士学位。他先后在苏黎世联邦理工学院和芝加哥大学任教，研究主线是让机器学习变得更便宜、更可信、更容易被广泛使用。

团队里还有几位大牛。

Chris Re是斯坦福大学计算机科学教授，也是连续创业者。他参与创办过SambaNova、Snorkel，以及被苹果收购的Lattice和Inductiv，在机器学习系统和AI基础设施领域很有分量。

Tri Dao（越南裔）是Together AI的首席科学家，也是普林斯顿大学计算机科学系的助理教授，曾在Chris Re门下读博。他是FlashAttention的主要作者之一，这项研究让Transformer在GPU上跑得更快、显存占用更少。

Percy Liang（华裔）是斯坦福基础模型研究中心主任，长期聚焦语言模型、开放模型和模型评测的工作。

Together AI的主要团队成员。（从左至右）上排依次是：普拉卡什、张策、克里斯·雷、特里·陶；下排是珀西·梁、首席产品官泽德莱夫斯基、首席营收官凯·马克、财务副总裁史美成。

ChatGPT爆火之后，市场的目光几乎都集中在闭源大模型上，但Together AI做出了不同的选择。

起初，它因为提供英伟达GPU访问权而受到关注，随后逐步扩展成一个帮助开发者构建、定制开源AI模型的平台。

客户留在Together AI，不是单纯为了GPU卡。他们需要一整套服务：模型选择、训练、微调、推理、部署、评估、GPU集群、专属端点、成本优化。

这才是Together AI真正的商业价值所在。

它卖的不是一个“更聪明的AI”，而是“更便宜、更稳定、更可控地使用AI”的能力。

02 调用token，年入11.5亿美元

Together AI最亮眼的数字不是8亿美元融资，而是11.5亿美元的年度化订单额。客户覆盖了Cursor、Cognition、Decagon等AI原生公司。

它的收入增长快得惊人。2024年2月，年化收入大约3000万美元；到2025年2月，这个数字超过了1亿美元。今年，已经达到了11.5亿美元。两年下来，暴增了约38倍。

它的赚钱路径是：在做大模型推理的过程中，把零散的开源模型，整合成企业愿意付费购买的生产系统。

具体模式包括几种——

第一，推理API。

企业调用模型，按tokens付费。不同的模型，100万tokens的收费也不同，比如DeepSeek V4 Pro、MiniMax M3、Kimi K2.7 Code等模型，都有各自的输入、缓存输入、输出价格。

第二，专属推理服务。

有些客户用量大，或者对延迟、稳定性、安全性要求更高，公共API就满足不了了。他们需要专属端点。Together AI的价格页明确指出，很多团队从API调用起步，规模大了之后会迁移到专属端点。

第三，微调。

企业不满足于通用模型。它们希望模型能理解自己的业务、客户、文档、产品和流程。Together AI提供Fine-Tuning服务，按训练和验证过程中处理的token量收费。不同模型规模、不同训练方式，价格也不同。

第四，GPU集群。

有些客户仍然需要自己训练、微调或部署模型。Together AI也提供按小时计费的GPU能力。价格页显示，它的GPU Clusters支持H100、H200、B200等硬件，按每GPU每小时收费。

这几项加起来，就构成了Together AI的商业模式：赚的是企业使用模型过程中的钱。

现在，Together AI每月处理超过400万亿个开放模型的推理token。一年前，这个数字只有大约300亿。调用量在一年内增长了大约1.3万倍。

这个生意之所以突然变大，是因为企业开始认真运用AI了。

客服机器人每天需要回复客户。AI编程工具每天要生成和修改代码。销售系统要自动写邮件。金融系统要读文件。医疗系统要总结病历。AI Agent还会反复调用模型：先理解任务，再查资料，再调用工具，再生成结果，再检查错误。

每一步都要花钱。

前段时间，硅谷传来一个消息：某家企业一个月在Claude上的支出，高达5亿美元——折合软妹币约33亿元，相当于每天烧掉超过1亿元。

开源模型的时机到了。

企业并不每个任务都需要最贵、最强的闭源大模型。很多时候，它们只需要一个足够好、足够快、足够便宜的模型。

在OpenRouter上，开源模型处理的tokens占比，从1月的34%升到了6月的65%。中国开源模型正在缩小与美国顶级模型的能力差距，同时也给了开发者更多定制和微调的自由。部分模型价格低至每百万tokens 18美分，而顶级模型平均约为4美元。

因此，Together AI的平台让企业可以在DeepSeek、MiniMax、Kimi等开放模型上训练和运行AI工作负载，成本低于封闭系统。

Together AI给出了一组很惊人的数字：企业使用开放模型通常能实现6倍到20倍的成本下降。Decagon迁移到Together AI后，推理成本下降了6倍。

推理不是一次性生意。客户一旦觉得能省钱，把业务流程接进去，就会持续产生账单。

03 最赚钱的AI赛道，英伟达巨头纷纷入场

Together AI并不是唯一一个被资本追逐的推理基础设施公司。

上周，铅笔道报道Baseten完成了15亿美元融资，估值达到130亿美元。而且，Baseten也特别提到，过去一年收入增长了20倍，原因是企业对“推理”的需求明显增加。

今年5月，Fireworks AI也在洽谈新一轮融资，目标估值可能达到150亿美元。

资本追逐它们，是因为资本发现：大模型应用开始商业化之后，真正持续产生账单的地方，是推理层。

这对中国公司很有启发意义。

金融、制造、政务、教育、医疗、客服、电商、办公软件，都存在大量AI推理需求。这些场景不一定需要最强模型，但需要可控、便宜、安全、能接入业务流程的模型服务。

这意味着机会将出现在推理云、模型路由、国产芯片适配、行业模型部署、AI成本管理、Agent调度、私有化交付和运维服务等领域。

最后，我们把目光投向投资方。Together AI和Baseten的投资方名单里，都出现了英伟达。

英伟达投这类公司并不奇怪。推理平台越多，GPU需求就越大。Together AI在2025年完成3.05亿美元融资时，就宣布要大规模部署英伟达Blackwell GPU。它还预计，未来五年计算能力和基础设施规模将扩大约50倍。

除了卖GPU的英伟达，Together AI和Baseten这类公司，正在演变为芯片、能源、电力设备、制造和企业软件巨头共同押注的基础设施入口。

Salesforce也有理由进场。作为企业软件巨头，它最关心的是AI能不能低成本、稳定地进入销售、客服、营销、办公和管理流程。投资Together AI，相当于提前卡位企业AI工作流背后的“算力水电煤”。

Aramco代表的是能源资本。AI推理看起来是软件生意，但背后需要大量电力、数据中心和算力资源。Schneider Electric是电气和数据中心基础设施相关公司，Pegatron则是电子制造和服务器供应链的重要玩家。

Together AI和Baseten的融资，不只是两家创业公司的事。它更像是一个产业信号：AI基础设施的竞争，已经转向比拼谁能更便宜、更稳定地承接海量调用。

暴涨38倍，一群华人卖Token：年入78亿

帮企业省token，正在变成一门炙手可热的生意

01 开源模型里的机会

01 开源模型里的机会

02 调用token，年入11.5亿美元

02 调用token，年入11.5亿美元

第一，推理API。

第二，专属推理服务。

第三，微调。

第四，GPU集群。

03 最赚钱的AI赛道，英伟达巨头纷纷入场

03 最赚钱的AI赛道，英伟达巨头纷纷入场

热门资讯

热门手游

相关攻略

热门专题