您的位置：首页 > > 教程攻略 > ai资讯 >扣子出品 | 大模型竞技场：谁与争锋

扣子出品 | 大模型竞技场：谁与争锋

来源:互联网 更新时间:2026-05-30 21:29

字节跳动最近动作不小。继悄悄上线了一大波第三方国产大模型之后，旗下的扣子平台，今天正式推出了一个“竞技场”功能——让各大模型正面“厮杀”，一较高下。

截至今天（2024年6月12日），扣子支持的第三方国产大模型阵容如下：

豆包·Function call模型

功能特点：支持Function calling能力（提供更准确、稳定的工具调用能力）

功能特点：支持Function calling能力；输入最长8192个Tokens（约12288个中文字符）

功能特点：支持Function calling能力；输入最长120000个Tokens（约180000个中文字符）

功能特点：支持Function calling能力；输入最长250880个Tokens（约376320个中文字符）

功能特点：支持Function calling能力；输入最长32768个Tokens（约49152个中文字符）

今天下午，扣子正式上线了“模型广场”，“厮杀”就此拉开序幕。竞技场支持两种玩法：随机对战和选择模型对战。

对战模式	说明
指定Bot对战	指定Bot进行模型对战，适用于评测模型在指定细分领域的文本生成、技能和知识调用等能力。
随机Bot对战	系统随机选择一个Bot进行模型对战，适用于评测模型在任意业务场景下的文本生成、技能和知识调用等能力。
纯模型对战	不指定任何Bot，系统随机选择两个模型展开对决。模型回答不受编排、工作流等配置的限制和影响，适用于评测模型本身的文本生成等能力。

选择“随机对战”，点击开始。说实话，事先你根本不知道对阵的双方是谁——就像是蒙面的对手，都在回答同一个问题。究竟谁的回答更能赢得观战者的芳心？只能拭目以待。

实际跑了一局，GLM-4拿下了这场battle的胜利。MiniMax的角色扮演能力在这种对话场景里算是锦上添花，但GLM-4显然更胜一筹。

当然，竞技场也支持推理能力、编码能力、任务解决、生成创作、角色扮演这几个维度的专项PK。

信息分析与处理、知识应用、推理能力

编码能力、任务解决、生成创作

角色创作