热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >阿里云2026保姆级教程:Hermes Agent与OpenClaw部署及Token Plan配置完整步骤

阿里云2026保姆级教程:Hermes Agent与OpenClaw部署及Token Plan配置完整步骤

来源:互联网 更新时间:2026-06-17 13:00

一、整体方案概述

2026年,要是想快速搭一套能7×24小时自己跑代码、处理文档、调工具、干多步活儿的AI智能体,Hermes Agent和OpenClaw绝对是绕不开的两个框架。这两个本地自治智能体框架,配合阿里云服务器的算力,再挂上百炼Token Plan的统一积分计费,就能做到稳定、低成本、可规模化。整个落地流程拆成四个核心阶段:创建阿里云服务器资源→开通百炼Token Plan并拿到密钥→分别部署Hermes Agent和OpenClaw→把智能体跟Token Plan绑定,最后跑通验证。这篇文章是个保姆级的手把手教程,覆盖了轻量应用服务器和ECS云服务器两种主流载体,零基础新手和有一定运维基础的人都能跟上,全程附完整命令、配置参数和故障排查方案。

Token Plan采用积分订阅模式,一套积分通吃平台上的所有大模型,支持多模型灵活切换。用于多模态模型调用时,可以实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。

二、部署前置准备工作

2.1 账号与实名认证要求

账号方面,先确认阿里云账号已完成实名认证。个人用户走人脸识别或快捷渠道,企业用户则需要提交资质材料。如果团队多人协作,强烈建议用RAM子账号分配权限,只给云服务器和百炼平台相关操作的权限,遵循最小权限原则,避免主账号凭证泄露。子账号提前分配的权限要涵盖云服务器实例管理、安全组编辑、百炼模型调用、API密钥查看等,缺了谁都会在后续操作中报错——比如服务器创建失败,或者模型调用时鉴权通不过。

2.2 百炼Token Plan基础说明与开通流程

Token Plan是百炼平台推出的订阅式统一计费服务,用Credits积分作为通用消耗单位。和传统按Token计费相比,这种模式的好处是预算可控,特别适合智能体长期高频调用的场景。具体开通步骤:

  1. 进入阿里云百炼大模型服务平台,找到Token Plan订阅入口,根据使用规模选择档位。个人日常开发选标准坐席就行,团队并行跑多个高频智能体的话,建议选高级或尊享坐席。
  2. 完成订阅后去API密钥管理页面,创建Token Plan专属密钥。密钥标识以sk-sp开头,和普通按量付费的API Key不一样。创建后务必完整复制保存,关闭弹窗后就再也看不到了。
  3. 记录Token Plan专属的OpenAI兼容接口地址。这个地址是Hermes和OpenClaw接入的核心参数,后续配置智能体时必须填写,不能用普通模型的通用地址代替。

2.3 本地操作工具准备

远程连接工具用来SSH登录阿里云服务器,市面上主流的客户端都能用。另外准备一个文本编辑器,单独存放API密钥、智能体访问凭证等敏感信息,别直接写在脚本里,防止泄露。地域选择上,国内华北2网络稳定性高,适合常规业务;如果选海外地域则无需备案,公网访问没限制,智能体的联网搜索功能也能正常用。

三、阿里云服务器创建与基础环境初始化

这里提供两种主流部署方案:轻量应用服务器适合零基础用户,内置简化流程;ECS云服务器适合需要自定义系统、资源扩容的进阶使用者。

零基础部署AI Agent:OpenClaw/Hermes Agent喂饭级步骤流程

第一步:访问阿里云镜像市场,选择预装OpenClaw或Hermes Agent的镜像(如果已经买了服务器,可以重置系统重新选择镜像)。

第二步:配置实例参数——镜像选择OpenClaw(或Hermes Agent)镜像;内存必须2GiB及以上;地域默认选美国(弗吉尼亚),因为当前中国内地地域(除香港)的轻量应用服务器联网搜索功能受限;时长按预算自选。完成后确认提交,等几分钟实例状态变成运行中。

第三步:进入阿里云百炼大模型控制台,找到密钥管理,创建API-Key。

然后去轻量应用服务器控制台,找到安装了OpenClaw的实例,进入“应用详情”放行18789端口、配置百炼API-Key、执行命令,生成访问OpenClaw的Token。

  • 端口放通:需要放通对应端口的防火墙,单击一键放通即可。
  • 配置百炼API-Key:单击一键配置,输入百炼的API-Key,然后执行命令写入。
  • 配置OpenClaw/Hermes:执行命令,生成访问Token。
  • 访问控制页面:单击打开网站页面进入对话界面。

阿里云百炼Coding Plan API-Key 获取、配置保姆级教程

创建API-Key,推荐使用阿里云百炼Coding Plan——这是一个按次计费的套餐,每天两场抢购活动,从按tokens计费升级为按次收费,能进一步节省费用。

  • 购买后在控制台生成API Key。注意复制并保存好,后面要用。

  • 回到轻量应用服务器控制台,单击服务器卡片中的实例ID,进入服务器概览页。

  • 在服务器概览页面单击“应用详情”页签。

  • 端口放通:在OpenClaw使用步骤区域,单击“端口放通”下的执行命令,开放OpenClaw服务运行端口的防火墙。

  • 系统会列出已创建的Coding Plan API Key,直接选择。

  • 获取访问地址:单击“访问Web UI面板”下的执行命令,获取OpenClaw WebUI的地址。

3.1 方案一:轻量应用服务器(新手首选)

  1. 进入轻量应用服务器控制台,点击创建实例,镜像分类选“应用镜像”,里面自带Hermes Agent预装镜像,省去手动下载依赖环境的麻烦。
  2. 实例规格最低2核2G内存,如果打算同时跑Hermes和OpenClaw两个智能体,建议升级到4核4G。系统盘默认40G以上高效云盘,带宽选5M及以上,保证公网访问流畅。
  3. 设置登录密码,选择订阅时长,确认配置后提交,等几分钟实例状态变成运行中。
  4. 端口放行:进入实例应用详情页面,一键放行22端口(SSH远程连接)和18789端口(智能体Web可视化页面访问)。测试阶段可以开放全部公网访问,正式上线后建议改成白名单模式,只允许固定IP接入,提升安全性。

3.2 方案二:ECS云服务器(自定义进阶部署)

  1. 进入ECS控制台创建实例,操作系统可选Alibaba Cloud Linux 3或Ubuntu 20.04及以上。选择专有网络,开启公网IP,设置登录密码或密钥对。
  2. 实例规格基础要求2核2G,多智能体并行推荐4核8G及以上。系统盘用ESSD云盘,容量不低于40G。
  3. 安全组规则新增放行TCP 22和18789端口,临时来源设为0.0.0.0/0,生产环境务必限制到指定IP段。
  4. 用SSH工具连接服务器,执行系统更新和基础依赖安装。Ubuntu系统:
    sudo apt update && sudo apt upgrade -y
    sudo apt install python3 python3-pip git docker.io nodejs -y
    
    Alibaba Cloud Linux系统:
    sudo yum update -y
    sudo yum install python3 python3-pip git docker nodejs -y
    

3.3 服务器通用基础优化

  1. 时区校准:统一服务器时区,避免日志和任务执行时间错乱。
  2. 关闭不必要的系统自带服务,释放内存和CPU资源,保障智能体运行算力。
  3. 配置磁盘自动扩容,防止长期运行后日志和缓存把磁盘塞满导致服务崩溃。

四、Hermes Agent完整部署与Token Plan绑定配置

4.1 Hermes一键安装脚本执行

SSH登录服务器终端,执行官方一键安装脚本,脚本会自动拉取程序并配置运行环境:

curl -fsSL https://hermes.ai/install.sh | bash

安装完成后查看版本号,确认是否成功:

hermes -v

如果能输出版本号,说明安装没问题;如果提示命令不存在,重新执行脚本或检查网络连通性。

4.2 命令行绑定百炼Token Plan参数

逐条执行配置指令,把其中API Key和接口地址换成你自己的:

hermes config set model.provider custom
hermes config set model.base_url https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
hermes config set model.api_mode openai_messages
hermes config set model.api_key sk-sp-替换为自己的密钥
hermes config set model.default qwen3.7-plus
hermes config set gateway.port 18789

参数说明:默认模型推荐Qwen3.7 Plus,文本推理和多模态能力都比较均衡;如果纯处理超长文本文档,可以改成qwen3.7-max。

4.3 启动服务并生成Web访问凭证

配置完成后启动Hermes后台服务:

hermes run

在新开终端窗口生成管理员访问Token,用于浏览器登录可视化后台:

hermes token generate

复制生成的长字符串妥善保存,没有这个凭证进不了智能体管理页面。

4.4 手动配置文件精细化调整(高级自定义)

如果要调整模型随机度、单次最大输出长度等参数,直接编辑本地配置文件,路径是~/.hermes/config.yaml,改完后重启服务:

hermes restart

举个例子:temperature在严谨公文、数据分析场景设0.2,创意内容生成场景设0.7;max_tokens根据业务需要调整上限。

4.5 Hermes开机自启配置

为防止服务器重启后智能体中段,配置开机自动运行:

sudo vim /etc/rc.local

在文件末尾新增指令:

cd /root/.hermes
nohup hermes run > hermes_log.log 2>&1 &

保存退出后赋予执行权限:

sudo chmod +x /etc/rc.local

重启服务器测试,重启后不用手动执行hermes run就能正常访问Web页面了。

五、OpenClaw完整部署与Token Plan绑定配置

OpenClaw采用容器化部署,依赖Docker环境。轻量服务器预装镜像可以跳过Docker安装,ECS手动部署要先确认Docker服务正常运行。

5.1 容器拉取与启动基础容器

拉取OpenClaw核心镜像并启动容器:

docker pull openclaw/core
docker run -d --name openclaw-core -p 18789:18789 openclaw/core

进入容器内部执行配置:

docker exec -it openclaw-core /bin/bash

5.2 容器内配置Token Plan相关参数

依次执行配置命令,填入专属密钥和接口地址:

openclaw config set models.providers.bailian-token.apiKey "sk-sp-替换为自身密钥"
openclaw config set models.providers.bailian-token.baseUrl "https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1"
openclaw config set agents.defaults.model.primary "bailian-token/qwen3.7-plus"
openclaw config set models.providers.bailian-token.token_plan_enabled true

特别注意:token_plan_enabled参数必须设为true,否则调用模型时不会走积分抵扣,自动切到按量付费模式,产生额外开销。

5.3 重启服务并生成管理员访问凭证

配置完成后重启网关服务:

openclaw gateway restart

生成Web后台登录Token:

openclaw token generate --admin

保存生成的凭证,浏览器登录后用它可以查看任务队列、工具调用记录、模型消耗统计等。

5.4 OpenClaw容器开机自启设置

配置Docker容器随服务器自动启动:

docker update --restart always openclaw-core

重启服务器验证,重启后容器自动运行,不需要手动执行docker run。

六、智能体功能验证与Token Plan额度消耗校验

6.1 Web可视化页面访问测试

浏览器输入 http://服务器公网IP:18789,输入生成的访问Token登录。分别进Hermes和OpenClaw的后台页面,正常能看到模型选择列表、技能开关、任务执行日志、用量统计面板。

6.2 基础对话与工具调用验证

  1. 简单文本测试:输入“简要介绍百炼Token Plan计费模式”,看模型是否正常返回回答,不报错、不超时就说明接口连通正常。
  2. 工具调用测试:输入“编写一段两数求和Python脚本并执行”,智能体应该自动生成代码、运行并返回结果,代表工具调用链路完整。
  3. 多模态测试(仅Qwen3.7 Plus支持):上传一张本地图片,下达分析指令,图片能被正常解析就说明多模态配置没问题。

6.3 Token Plan积分消耗校验

登录阿里云百炼平台,进Token Plan用量统计页面,查看Credits实时扣除记录。正常情况下每次模型调用都会从套餐积分里抵扣,不会产生按量付费账单。如果没看到积分消耗记录,排查三点:API Key是不是sk-sp开头的专属密钥;base_url是不是Token Plan专属地址;智能体配置里token_plan_enabled是否已开启。

七、智能体优化配置与安全管控方案

7.1 技能扩展配置

Hermes和OpenClaw都内置了文件处理、代码执行、联网检索、数据查询等通用技能,在Web后台的技能管理面板一键启用就行。所有技能调用模型都统一消耗Token Plan积分,省去单独配置计费的麻烦。还可以自定义专属工作流技能,把重复的业务流程固化下来,一键调用,减少重复输入指令。

7.2 性能优化手段

  1. 模型分层调度:简单问答、文本过滤用Qwen3.7 Flash,积分消耗低;图文和自动化任务用Plus;超长复杂逻辑推理时临时切到Max。
  2. 精简上下文记忆长度:自动清理无用的历史对话,减少单次输入Token数量。
  3. 批量文件处理启用批量推理模式,降低单位Credits消耗。
  4. 定期更新智能体版本,修复运行bug,提升工具调用稳定性。

7.3 服务器安全加固

  1. 安全组改成IP白名单模式,关掉全网公网访问权限。
  2. 定期轮换Token Plan API Key和智能体Web访问Token,防止凭证泄露。
  3. 别把密钥硬编码到脚本和配置文件里,优先用环境变量存储敏感参数。
  4. 开启服务器日志持久化存储,记录所有智能体调用行为,便于异常时溯源。

八、高频故障排查指南

8.1 智能体无法连接Token Plan模型接口

  1. 核对API Key前缀,必须是sk-sp,普通按量付费密钥不能抵扣套餐积分。
  2. 确认接口地址填写完整,不能用通用dashscope基础地址代替。
  3. 检查服务器网络出口有没有访问拦截,可以用ping命令测试接口域名连通性。
  4. 检查Token Plan套餐是否过期,Credits积分是否还有剩余。

8.2 Web页面无法打开访问

  1. 确认安全组已放行18789端口,没有防火墙拦截。
  2. 检查智能体服务是否正常运行,重启服务后重试。
  3. 核对访问Token输入无误,没有字符缺失或多余空格。

8.3 Credits积分消耗异常过快

  1. 对话上下文堆积过多,长期没清理历史记录。
  2. 频繁用Max旗舰模型处理简单轻量任务。
  3. 上传超大尺寸图片、长视频素材,大幅增加输入Token消耗。
  4. 适当调低temperature参数,减少模型冗余输出内容。

8.4 OpenClaw容器启动失败

  1. 检查Docker服务是否设了开机自启,执行systemctl start docker手动启动。
  2. 端口被占用了就修改网关端口配置,换一个没占用的端口。
  3. 服务器内存不足,建议升级实例内存规格,或者关掉后台闲置程序释放资源。

8.5 Hermes执行工具调用报错

  1. 服务器可能没装对应运行依赖(Python、Node等),重新执行依赖安装命令。
  2. 权限不足,切换root用户运行服务。
  3. 模型参数max_tokens设得太小,装不下完整工具执行返回的内容。

九、整体落地总结

2026年,在阿里云上部署Hermes Agent和OpenClaw,再接入百炼Token Plan,算是低成本、稳定运行自治AI智能体的标准答案了。轻量应用服务器适合零基础快速搭建,开箱即用;ECS云服务器则适合需要自定义资源、多智能体并行跑的进阶场景。整套流程的核心就是四个模块:服务器资源搭建、Token Plan订阅与密钥获取、两款智能体分别部署并绑定计费、功能验证与成本管控。全程配有可直接复制的终端命令,新手也能跟着走下来。Token Plan用统一Credits积分计费,解决了传统按量付费账单波动、预算不可控的痛点,一套积分自由切换平台全部大模型,适配智能体多场景混合调用。再加上开机自启、白名单安全加固、模型分层调度、用量告警等优化手段,智能体长期稳定运行、数据安全和成本控制就都照顾到了。实际落地时,根据业务负载灵活调整服务器配置和模型选型,定期查一查Token Plan用量统计,及时优化调用逻辑,就能让智能体的自动化能力发挥到最大,同时把AI算力开销控制在合理范围。

热门手游

相关攻略

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc