2026年5月21日 周四晚上19:30,报名腾讯会议了解“从个人提效到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

1.6万 Star,AI Agent 赛道又杀出一匹黑马!

发布日期:2026-05-19 20:48:57 浏览次数: 1574
作者:极客之家

微信搜一搜,关注“极客之家”

推荐语

OpenHuman 让 AI 真正理解你的工作流,成为你的“数字分身”,摆脱无状态对话的烦恼。

核心内容:
1. 解决 AI 工具无状态、需反复介绍背景的核心痛点
2. Memory Tree 机制如何构建本地的、持续更新的个人记忆库
3. 118+ 服务集成与隐私保护的设计

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

用 Claude Code 干活,有个反复出现的摩擦点:每次开一个新对话,都要重新介绍一遍自己在做什么。"我在用 Rust 写一个异步任务调度服务","这个项目上周刚从 tokio 0.2 迁移过来","你上次建议我用这个方案的"……

说实话每次打这些东西,我都想骂人。Codex 也是这样,Cursor 也是这样,Gemini 2.5 Pro 也逃不掉——不是模型的错,是所有这些工具生来就是无状态的,你一关窗口,上下文就消失了。

OpenHuman 这个开源项目就是冲着这个缺口去的,开源短时间内收获1.6万 Star,AI Agent又一匹黑马诞生。


它是什么,一句话先讲清楚

GitHub 描述写的是 "Your Personal AI super intelligence. Private, Simple and extremely powerful."。听起来像是产品页面的广告词,但我看完实现细节之后,觉得这话没夸大。

OpenHuman 是一个桌面端 AI Agent 框架,用 Rust + Tauri 写的,走 GNU GPL-3 协议开源。它的定位不是聊天机器人,更接近一个「常驻助手」:它在你电脑上跑着,主动去拉取你的数字生活数据,把这些东西整理成它自己的记忆库,然后你跟它对话的时候,它已经知道你是谁、在做什么、上周碰到了什么问题。


怎么做 AI 记忆

我有时候觉得,把 AI 记忆做对这件事比训练大模型本身还难。难在哪儿?难在怎么存、存什么、存完之后怎么检索用上。

OpenHuman 的解法叫 Memory Tree

流程是这样的:你把 Gmail、Slack、GitHub、Notion 这些服务接进来之后,系统每 20 分钟自动把最新数据拉一次,过一条处理管道:先转成规范化的 Markdown 格式,再切成不超过 3000 token 的块,打分,最后折叠进层级化的摘要树里。整个东西存在你本地的 SQLite 数据库里,不会上传到任何服务器。

还有一个细节做的很好:这些 Markdown 文件会同步成一个 Obsidian 兼容的 vault。就是说你可以直接打开 Obsidian,翻看 AI 到底「知道」你什么。这个灵感来自 Andrej Karpathy 的 obsidian-wiki 工作流——对,就是那个前 OpenAI 联合创始人写的那套东西。

官方文档有一句话我觉得说得挺直接:

OpenHuman 把你连接的所有文档、邮件和聊天记录都摘要压缩,生成一个让 Agent 能记住你一切的记忆图谱。

一次同步完成之后,Agent 就有了你的收件箱、日历、代码仓库、文档、消息记录的完整压缩上下文。不需要训练期,不需要「先用几周再说」。


118+ 个集成,用 OAuth,不用 API Key

很多 Agent 框架也号称支持接各种服务,但实际体验下来,往往是「你自己去申请 API Key,填进配置文件,自己处理鉴权失败」。对普通用户来说,这就是一道墙。

OpenHuman 走的是 OAuth 一键授权。你在设置界面点一下授权 Gmail,弹出 OAuth 窗口,确认一下,完事儿。它现在支持的服务包括 Gmail、Notion、GitHub、Slack、Stripe、Google Calendar、Google Drive、Linear、Jira,数字目前停在 118+,还在涨。

每个接入的服务都被封装成一个「类型化工具」暴露给 Agent。每 20 分钟 auto-fetch 一次,把新数据折进 Memory Tree。所以你早上打开电脑问它「昨天有什么重要的 GitHub PR 评论」,它不需要临时去查,因为昨晚它已经拉过了。

顺着这个再说一句:如果你已经在 Claude Code 或者 Codex 里用了 agentmemory 这个项目(rohitg00 做的那个),OpenHuman 支持接它作为 memory 后端——在 config.toml 里设置 memory.backend = "agentmemory",然后 Claude Code、Cursor、Codex、OpenHuman 就可以共享同一个持久化记忆存储。这个设计的方向我觉得是对的,「跨工具统一记忆」,而不是每个工具各搞一套。


TokenJuice

这是一个很低调但很关键的设计

这个功能在文档里不算显眼,但我觉得它可能是整个项目里工程品位最高的一块。

问题是这样的:你接入了 Gmail,同步了半年的邮件,拿去喂大模型,光 token 费用就能把你喂穷。一个 600 条消息的邮件线程,一次 git status 的输出,一份 cargo build 日志……这些东西扔进上下文里,大量 token 都是纯噪声。

OpenHuman 在工具调用结果进模型之前,先过一层叫 TokenJuice 的压缩管道。处理策略包括:HTML 转 Markdown,长 URL 缩短,重复行去重,啰嗦的工具输出摘要化。针对 git、npm、cargo、docker、kubectl 这些命令各有预设规则,规则文件是 JSON 格式,你也可以自己写覆盖规则,放到 ~/.config/tokenjuice/rules/ 下就生效,不需要重新编译。

管道位置长这样:

工具调用结果
      │
      ▼
TokenJuice(分类 → 匹配规则 → 压缩)
      │
      ▼
LLM 上下文

官方给的数据是能减少最多 80% 的 token 消耗。「用前沿模型扫你过去六个月的邮件,只需要个位数美元」,我没跑过这个数字,但机制是可信的,实现代码在 src/openhuman/tokenjuice/ 里,开放的,可以自己核查。


对比

GitHub README 里有张对比表(原表用了一些内部代号,我稍微对应了一下):


OpenClaw
Hermes Agent
OpenHuman
开源协议
MIT
MIT
GNU GPL-3
上手难度
中(需要终端)
高(Python/Linux 环境)
低(安装包,几分钟搞定)
记忆类型
插件缓存
递归自学习
Memory Tree + Obsidian vault
接入服务方式
自己配
自己配
118+ OAuth 一键
自动拉数据
每 20 分钟一次
模型路由
手动
手动
内置自动路由
原生工具
仅代码
仅代码
代码 + 搜索 + 爬虫 + 语音

OpenClaw 的优势在消息渠道覆盖广,Hermes Agent 在复杂推理和自主编程这块比 OpenHuman 强,OpenHuman 的核心差异是它真的在帮你维护上下文,而不是等你来喂。

模型路由这块也值得单独说一下:OpenHuman 内置了自动路由逻辑,推理型任务送去前沿模型,快速问答走轻量模型,视觉任务走视觉模型,全在一个账号下,不需要你手动切。本地跑模型的话支持 Ollama 和 LM Studio,对隐私要求高的用户可以把敏感任务留在设备上。


不足之处

项目现在是 Early Beta 状态,README 里也坦白说了 "expect rough edges"。

我觉得几个地方需要认真想一下:

权限范围很大。 它需要读你的 Gmail、GitHub、Calendar、Slack……为了做记忆,它必须摄入大量数据。数据存本地这一点我信,但接入这么多服务本身是一个不小的攻击面,安全意识强的人应该认真评估一下。

资源消耗不低。 在本地维护一个实时更新的记忆索引,加上一个常驻桌面 shell,老机器或者 16GB 以下内存的机器可能会感受到压力。

复杂推理目前不是它的主场。 它现在更擅长整理、记忆和主动获取,如果你要做那种需要深度逻辑推理的任务,直接开 Claude 3.7 Sonnet 可能更直接、更快。这不是说 OpenHuman 不行,是说它的定位本来就不在这里。

我自己也还在摸索这个工具,有些功能还没完全跑通,上面这几条是我觉得目前阶段最值得留意的。


怎么安装

macOS / Linux:

curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash

Windows(PowerShell):

irm https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.ps1 | iex

或者直接去https://tinyhumans.ai/openhuman下载 DMG 或 EXE 安装包,图形界面装完就能用,不需要开终端。

想从源码跑的开发者需要准备:Node.js 24+、pnpm 10.10.0、Rust 1.93.0(带 rustfmt + clippy),还有 CMake、Ninja、ripgrep。pnpm dev 跑 web UI,pnpm --filter openhuman-app dev:app 跑桌面端。详细环境配置看官方文档。


写在最后

我一直觉得,Agent 这个领域真正的门槛不是模型能力,是上下文管理。Claude 3.7 Sonnet 写代码已经相当能打了,但如果每次对话都要从零开始介绍「我是谁在做什么」,效率的天花板就摆在那儿。

OpenHuman 在这方面做的不错,这也是它在众多 AI 产品冲杀出来的原因,值得研究一下。

 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询