Hermes Agent + Ollama本地安装指南

发布日期：2026-05-20 08:10:18 浏览次数： 1879

作者：AI拉呱

微信搜一搜，关注“AI拉呱”

自从 OpenClaw 发布以后，几乎每周都会冒出新的 agent 项目，让人很难一个个都试过去。但最近有一个新项目，确实吸引了不少注意力，它就是 Hermes Agent。

它在 GitHub 上的 star 数虽然远不及 OpenClaw，但它并没有走“比谁 memory 更大”的路线，而是更强调性能和学习能力。所以，它很可能不是简单的替代品，而是这个领域里另一条值得关注的产品路径。

2026 年 3 月，Nous Research 推出了 Hermes Agent。 它是一个开源 agent framework，重点在于解决“AI 失忆”和“长期个体化”这两个问题。

如果你以为这只是又一个新聊天机器人，那其实不太对。Hermes 更接近一个会学习的 AI agent。你用得越久，它越会把自己的经验整理成可复用 skills，持续改进，保存有价值的信息，甚至还能搜索过去的会话。

它还支持多平台，包括 Telegram、Discord、Slack、WhatsApp、Signal 和 CLI，并兼容 200 多个模型端点，例如 OpenRouter、Nous Portal、OpenAI 和 Anthropic。部署方式也很灵活，从 5 美元 VPS 到 GPU 集群，再到几乎零空闲成本的 serverless 架构都可以跑。

Hermes Agent 的三个关键特性

1. 自动学习 Skills：越用越聪明

这是 Hermes 最有辨识度的能力之一。

举个例子，如果你让 Hermes “用 Docker 部署一个服务”，它执行完之后，会把完成这个任务的关键步骤自动保存成一个 skill。下次你再让它做类似工作时，它就可以更快、更稳定地复用之前积累的经验。

更重要的是，这些 skills 不是一劳永逸写死的，它们还能随着使用被持续修正和更新。

相比之下，很多其他 agent 的 skills 更多还是人工编写、人工维护。而 Hermes 的思路更接近“把你的真实使用过程，逐渐沉淀成机器自己的能力资产”。

2. 三层记忆结构：一种不容易“失忆”的 AI

很多 AI 一旦会话结束，就相当于把你忘了。但 Hermes 尝试从结构上解决这件事。

它的 memory 分成三层：

• MEMORY.md：由 agent 维护的长期备忘，记录你的环境、项目和偏好
• USER.md：更偏静态的人物画像，例如名字、时区、沟通风格
• Session Search（FTS5）：把历史会话保存到 SQLite，可供后续检索

因此，如果你问它“还记得上周我们聊过 Nginx 配置吗？”，它可以搜索历史 session 再回答，而不是完全从零开始。

3. 多平台一致接入：同一个 Agent，到处都能用

Hermes 支持 Telegram、Discord、Slack、WhatsApp、Signal、Email/SMS、Home Assistant、Matrix/Mattermost、DingTalk 和 CLI 等多个入口。

重点不是“能接很多平台”，而是：这些平台共享的是同一个 agent 和记忆体系。

这意味着你可以早上用 Telegram 给它布置任务，晚上在 Discord 上追问进展，它依然知道自己是谁，也知道你们刚刚在做什么。

它的 Memory 到底怎么工作

Hermes 的 memory 不是简单的历史归档，而是更偏“执行与个体化”的基础设施。

它把 memory 分成短期记忆、长期记忆和技能记忆，每层负责的事情不同：

• 短期记忆：保存最近的上下文
• 长期记忆：保存用户偏好、行为模式和长期信息
• 技能记忆：把重复任务自动沉淀成可复用 skill

其中最有意思的是“技能记忆”。

例如，如果你多次让它“每周一生成进度报告”，Hermes 会在内部逐渐把这件事总结成一个稳定 skill。之后它不仅更快，而且输出格式也会越来越贴近你的习惯。

这就是它所谓“自我改进”的核心：不是模型本身会自动升级，而是执行经验在被持续结构化。

多平台兼容，是它另一个很现实的优势

Hermes 可以跑在 Telegram、Discord、Slack、WhatsApp 和 CLI 等不同入口。

这带来的好处是，你不必为每个平台都单独培养一个 agent。你面对的是同一个知道你偏好、记得你上下文的 AI，只是入口换了。

我自己试过 CLI 方式，但如果放在实际使用里，Telegram bot 反而可能是更实用的方案。因为你可以直接用手机对话，而且它还能保持上下文连续。

OpenClaw 和 Hermes Agent 怎么看

Hermes 更适合这些场景：

• 你想把它作为更长期的个人 companion 使用
• 你希望持续自动化重复任务，让 skill learning 逐渐发挥作用
• 你在意语音、多平台和更轻量级的运行方式
• 你更看重“长期记忆”和“越用越个性化”

OpenClaw 更适合这些场景：

• 你想做多 agent 协同
• 你希望依赖更大的社区与生态
• 你需要 browser automation 或更多插件能力
• 你更看重已经被大量用户验证过的成熟度

所以这两个项目，不一定是非此即彼。它们完全可以共存：一个更偏“舰队级协调”，一个更偏“个人长期助理”。

开始安装 Hermes Agent

下面进入真正的安装过程。

Hermes 支持 Linux、macOS 和 Windows（包括 WSL）。最理想的部署方式通常是在 VPS 或闲置设备上长期运行；不过这篇演示是在本地 Mac 上完成的，体验也没有问题。

安装命令只有一条：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

它会自动创建虚拟环境，并装好需要的 Python 与 Node.js 依赖。

安装完成后，首先会进入一个 setup wizard，整体分成五个步骤：

1. 选择 Model 和 Provider
2. 配置 Terminal Backend
3. 调整 Agent Settings
4. 连接 Messaging Platforms
5. 配置 Tools

你只需要一路按流程走。

如果机器上已经装过 OpenClaw，它会自动检测 ~/.openclaw 下的已有数据，并询问你是否迁移配置、memory、skills 和 API keys。

如果你是 OpenClaw 老用户，直接迁移会省很多时间；如果你想全新开始，也可以先跳过，之后再补做迁移。

选择 Ollama 作为本地推理后端

在 Provider 选择阶段，我们可以直接选 Custom OpenAI-compatible endpoint，因为 Ollama 正好符合这个接口形式。

随后输入 Ollama 的本地地址：

http://localhost:11434/v1

这里的 11434 是 Ollama 默认端口，/v1 是兼容 OpenAI 风格 API 的路径。

如果全部本地运行，API key 可以留空。模型则可以填入你已经提前拉下来的本地模型，例如 gpt-oss:20b，context length 可以交给 Hermes 自动识别。

调整 Agent Settings

在 Agent Settings 里，可以重点关注三项：

• Max iterations：例如设成 60，表示单个任务最多允许 60 次工具调用
• Tool Progress Display：建议设成 “all”，这样可以更直观看到 agent 在做什么
• Context Compression：例如设为 0.5，表示上下文用到一半时就开始压缩旧消息

在 Session Reset Policy 里，也可以启用按空闲时间或每日固定时间自动 reset。这样会话不会无限膨胀，但重要信息仍会先被保存。

一个相对稳妥的默认组合是：24 小时无操作自动 reset，加上每天凌晨固定 reset 一次。

Messaging Platforms 与 Tools 配置

消息平台部分，如果你暂时只想在本地试跑，可以先全部跳过，后面需要时再配置 Telegram、Discord、Slack、Matrix 或 WhatsApp。

工具配置阶段，Hermes 的能力会一下子完整起来：网页搜索、浏览器控制、终端访问、文件处理、代码执行、vision、memory 等，大多数默认就已开启。

对于 browser automation，可以选择 Local Browser；对于 text-to-speech，可以保留默认的 Microsoft Edge TTS；对于 web search，如果不想接付费服务，也可以先用内置的 DuckDuckGo。

启动 Hermes 并切换到本地模型

安装完成后，直接输入：

hermes

你会看到 dashboard 与已经加载好的 tools 和 skills。不过有时状态栏默认显示的还是 Claude，而不是本地模型。

这时退出后执行：

hermes model

然后选择刚刚保存的本地 endpoint，把模型设为 gpt-oss:20b，URL 仍然用本地 Ollama 地址即可。

重新启动 Hermes 后，状态栏就会显示 gpt-oss:20b，说明当前已经完全本地运行，不再依赖云端。

这时你可以直接输入一句简单的话，比如“hey, how are you doing today?”，看它是否能快速返回正常响应。状态栏中的模型名和上下文大小，也能帮助你确认整个链路确实跑在本机上。

实际体验感受

说实话，作为一个较早期版本的项目，它还是有一些粗糙之处。比如 memory 的准确性并不总是稳定，skill generation 偶尔也会跑偏。

但即便如此，这条产品路线本身非常有价值。

今天很多人对 AI 工具最大的不满，并不是模型不够强，而是“上下文总是断掉”。每次开启新对话，都得重新解释项目背景、个人偏好和团队规则，整个过程非常低效。

Hermes Agent 试图正面解决的，正是这个问题。

而且它还是开源的，数据也在自己手里。从隐私和可控性角度看，这一点会让很多团队更放心。

如果说下一阶段 AI 助手真正的竞争焦点是什么，我会认为是 memory。在这条路线上，Hermes Agent 已经是值得持续观察的项目之一。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-04

ThinkParse 1.1.0 开源发布：把文档解析，做成可扩展的企业级服务

2026-07-04

Agent 工程终于有脚手架了， Google开源一个开发agent的工具

2026-07-03

用云新范式：Qoder Cloud Agents × Alibaba Cloud Skills

2026-07-03

Ornith-1.0 发布：新一代 Agentic Coding 之王，MIT 开源

2026-07-02

Meta把内部设计系统开源了，支撑内部13000+应用，专为Agent调优

2026-07-02

别再把 AI 当搜索引擎了，这 20 个操作让它替你干活

2026-07-02

ollama v0.31.1发布：Apple Silicon上Gemma 4提速近90%，默认开启无感升级

2026-07-01

在 OpenCode 中接入本地模型：Ollama 部署与配置完全指南

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-22

Claude 的金融 Skills 开源了

2026-05-10

Ollama 换引擎，苹果 M5 封神了

2026-05-06

亲测有效！Codex桌面版免费接入DeepSeek V4

2026-05-31

Qwen3.7来了，全球排名第13，国内第一

2026-05-20

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Kimi K2.6 发布并开源，全面精进代码和 Agent 集群能力

2026-04-21

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw