2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

Hermes Agent + Ollama本地安装指南

发布日期:2026-05-20 08:10:18 浏览次数: 1809
作者:AI拉呱

微信搜一搜,关注“AI拉呱”

推荐语

想要在本地搭建一个会学习的AI助手?Hermes Agent + Ollama指南,手把手教你从安装配置到体验核心功能。

核心内容:
1. Hermes Agent的核心优势:自动学习与三层记忆结构
2. 本地环境搭建与Ollama部署的详细步骤
3. 实际应用演示与多平台支持说明

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

自从 OpenClaw 发布以后,几乎每周都会冒出新的 agent 项目,让人很难一个个都试过去。但最近有一个新项目,确实吸引了不少注意力,它就是 Hermes Agent。

它在 GitHub 上的 star 数虽然远不及 OpenClaw,但它并没有走“比谁 memory 更大”的路线,而是更强调性能和学习能力。所以,它很可能不是简单的替代品,而是这个领域里另一条值得关注的产品路径。

2026 年 3 月,Nous Research 推出了 Hermes Agent。 它是一个开源 agent framework,重点在于解决“AI 失忆”和“长期个体化”这两个问题。

如果你以为这只是又一个新聊天机器人,那其实不太对。Hermes 更接近一个会学习的 AI agent。你用得越久,它越会把自己的经验整理成可复用 skills,持续改进,保存有价值的信息,甚至还能搜索过去的会话。

它还支持多平台,包括 Telegram、Discord、Slack、WhatsApp、Signal 和 CLI,并兼容 200 多个模型端点,例如 OpenRouter、Nous Portal、OpenAI 和 Anthropic。部署方式也很灵活,从 5 美元 VPS 到 GPU 集群,再到几乎零空闲成本的 serverless 架构都可以跑。

Hermes Agent 的三个关键特性

1. 自动学习 Skills:越用越聪明

这是 Hermes 最有辨识度的能力之一。

举个例子,如果你让 Hermes “用 Docker 部署一个服务”,它执行完之后,会把完成这个任务的关键步骤自动保存成一个 skill。下次你再让它做类似工作时,它就可以更快、更稳定地复用之前积累的经验。

更重要的是,这些 skills 不是一劳永逸写死的,它们还能随着使用被持续修正和更新。

相比之下,很多其他 agent 的 skills 更多还是人工编写、人工维护。而 Hermes 的思路更接近“把你的真实使用过程,逐渐沉淀成机器自己的能力资产”。

2. 三层记忆结构:一种不容易“失忆”的 AI

很多 AI 一旦会话结束,就相当于把你忘了。但 Hermes 尝试从结构上解决这件事。

它的 memory 分成三层:

  • • MEMORY.md:由 agent 维护的长期备忘,记录你的环境、项目和偏好
  • • USER.md:更偏静态的人物画像,例如名字、时区、沟通风格
  • • Session Search(FTS5):把历史会话保存到 SQLite,可供后续检索

因此,如果你问它“还记得上周我们聊过 Nginx 配置吗?”,它可以搜索历史 session 再回答,而不是完全从零开始。

3. 多平台一致接入:同一个 Agent,到处都能用

Hermes 支持 Telegram、Discord、Slack、WhatsApp、Signal、Email/SMS、Home Assistant、Matrix/Mattermost、DingTalk 和 CLI 等多个入口。

重点不是“能接很多平台”,而是:这些平台共享的是同一个 agent 和记忆体系

这意味着你可以早上用 Telegram 给它布置任务,晚上在 Discord 上追问进展,它依然知道自己是谁,也知道你们刚刚在做什么。

它的 Memory 到底怎么工作

Hermes 的 memory 不是简单的历史归档,而是更偏“执行与个体化”的基础设施。

它把 memory 分成短期记忆、长期记忆和技能记忆,每层负责的事情不同:

  • • 短期记忆:保存最近的上下文
  • • 长期记忆:保存用户偏好、行为模式和长期信息
  • • 技能记忆:把重复任务自动沉淀成可复用 skill

其中最有意思的是“技能记忆”。

例如,如果你多次让它“每周一生成进度报告”,Hermes 会在内部逐渐把这件事总结成一个稳定 skill。之后它不仅更快,而且输出格式也会越来越贴近你的习惯。

这就是它所谓“自我改进”的核心:不是模型本身会自动升级,而是执行经验在被持续结构化。

多平台兼容,是它另一个很现实的优势

Hermes 可以跑在 Telegram、Discord、Slack、WhatsApp 和 CLI 等不同入口。

这带来的好处是,你不必为每个平台都单独培养一个 agent。你面对的是同一个知道你偏好、记得你上下文的 AI,只是入口换了。

我自己试过 CLI 方式,但如果放在实际使用里,Telegram bot 反而可能是更实用的方案。因为你可以直接用手机对话,而且它还能保持上下文连续。

OpenClaw 和 Hermes Agent 怎么看

Hermes 更适合这些场景:

  • • 你想把它作为更长期的个人 companion 使用
  • • 你希望持续自动化重复任务,让 skill learning 逐渐发挥作用
  • • 你在意语音、多平台和更轻量级的运行方式
  • • 你更看重“长期记忆”和“越用越个性化”

OpenClaw 更适合这些场景:

  • • 你想做多 agent 协同
  • • 你希望依赖更大的社区与生态
  • • 你需要 browser automation 或更多插件能力
  • • 你更看重已经被大量用户验证过的成熟度

所以这两个项目,不一定是非此即彼。它们完全可以共存:一个更偏“舰队级协调”,一个更偏“个人长期助理”。

开始安装 Hermes Agent

下面进入真正的安装过程。

Hermes 支持 Linux、macOS 和 Windows(包括 WSL)。最理想的部署方式通常是在 VPS 或闲置设备上长期运行;不过这篇演示是在本地 Mac 上完成的,体验也没有问题。

安装命令只有一条:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

它会自动创建虚拟环境,并装好需要的 Python 与 Node.js 依赖。

安装完成后,首先会进入一个 setup wizard,整体分成五个步骤:

  1. 1. 选择 Model 和 Provider
  2. 2. 配置 Terminal Backend
  3. 3. 调整 Agent Settings
  4. 4. 连接 Messaging Platforms
  5. 5. 配置 Tools

你只需要一路按流程走。

如果机器上已经装过 OpenClaw,它会自动检测 ~/.openclaw 下的已有数据,并询问你是否迁移配置、memory、skills 和 API keys。

如果你是 OpenClaw 老用户,直接迁移会省很多时间;如果你想全新开始,也可以先跳过,之后再补做迁移。

选择 Ollama 作为本地推理后端

在 Provider 选择阶段,我们可以直接选 Custom OpenAI-compatible endpoint,因为 Ollama 正好符合这个接口形式。

随后输入 Ollama 的本地地址:

http://localhost:11434/v1

这里的 11434 是 Ollama 默认端口,/v1 是兼容 OpenAI 风格 API 的路径。

如果全部本地运行,API key 可以留空。模型则可以填入你已经提前拉下来的本地模型,例如 gpt-oss:20b,context length 可以交给 Hermes 自动识别。

调整 Agent Settings

在 Agent Settings 里,可以重点关注三项:

  • • Max iterations:例如设成 60,表示单个任务最多允许 60 次工具调用
  • • Tool Progress Display:建议设成 “all”,这样可以更直观看到 agent 在做什么
  • • Context Compression:例如设为 0.5,表示上下文用到一半时就开始压缩旧消息

在 Session Reset Policy 里,也可以启用按空闲时间或每日固定时间自动 reset。这样会话不会无限膨胀,但重要信息仍会先被保存。

一个相对稳妥的默认组合是:24 小时无操作自动 reset,加上每天凌晨固定 reset 一次。

Messaging Platforms 与 Tools 配置

消息平台部分,如果你暂时只想在本地试跑,可以先全部跳过,后面需要时再配置 Telegram、Discord、Slack、Matrix 或 WhatsApp。

工具配置阶段,Hermes 的能力会一下子完整起来:网页搜索、浏览器控制、终端访问、文件处理、代码执行、vision、memory 等,大多数默认就已开启。

对于 browser automation,可以选择 Local Browser;对于 text-to-speech,可以保留默认的 Microsoft Edge TTS;对于 web search,如果不想接付费服务,也可以先用内置的 DuckDuckGo。

启动 Hermes 并切换到本地模型

安装完成后,直接输入:

hermes

你会看到 dashboard 与已经加载好的 tools 和 skills。不过有时状态栏默认显示的还是 Claude,而不是本地模型。

这时退出后执行:

hermes model

然后选择刚刚保存的本地 endpoint,把模型设为 gpt-oss:20b,URL 仍然用本地 Ollama 地址即可。

重新启动 Hermes 后,状态栏就会显示 gpt-oss:20b,说明当前已经完全本地运行,不再依赖云端。

这时你可以直接输入一句简单的话,比如“hey, how are you doing today?”,看它是否能快速返回正常响应。状态栏中的模型名和上下文大小,也能帮助你确认整个链路确实跑在本机上。

实际体验感受

说实话,作为一个较早期版本的项目,它还是有一些粗糙之处。比如 memory 的准确性并不总是稳定,skill generation 偶尔也会跑偏。

但即便如此,这条产品路线本身非常有价值。

今天很多人对 AI 工具最大的不满,并不是模型不够强,而是“上下文总是断掉”。每次开启新对话,都得重新解释项目背景、个人偏好和团队规则,整个过程非常低效。

Hermes Agent 试图正面解决的,正是这个问题。

而且它还是开源的,数据也在自己手里。从隐私和可控性角度看,这一点会让很多团队更放心。

如果说下一阶段 AI 助手真正的竞争焦点是什么,我会认为是 memory。在这条路线上,Hermes Agent 已经是值得持续观察的项目之一。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询