OpenHuman 评测:我自部署这款中国本土个人 AI 14 天
OpenHuman 评测:独立开发者用 Docker 自部署这款中国本土个人 AI 助手两周。真实部署踩坑、硬件需求、与 Open WebUI / LobeChat / AnythingLLM 的对比。
OpenHuman 评测:我自部署这款中国本土个人 AI 14 天
最后更新:2026-05-26
GitHub 仓库一天内从几百星冲到接近四千。我就是被这个数字勾着去亲自部署的。
OpenHuman(openhuman.cn)是一款中国本土的、可自部署的"个人 AI"——可以理解为 Open WebUI 的精神近亲,但更看重长期记忆、agent 风格的任务链、以及把数据牢牢留在自己机器上。我在家用服务器上跑了它两周。这篇文章是我的实测结论。
TL;DR
- OpenHuman 是一款开源、可自部署的个人 AI,你只要给它一个 OpenAI 兼容的端点(DeepSeek、Ollama、Claude 代理、GPT 都行),所有聊天记录、记忆、文档 embedding 都留在你自己的硬件上。
- 我部署它那一周,GitHub 每日新增星数约 3,991。势头是真实的,不是昙花一现。
- 我第二次跑通用了约 40 分钟(第一次踩坑花掉了一晚上,下文细说)。
- 隐私层面真的不错。我笔记本里那些不应该外泄的 prompt,确实没有外泄。
- 结论:你在乎数据主权、本身就已经在自部署其他工具,那它值得跑。如果只是想要一个更顺手的 ChatGPT,Open WebUI 更成熟、LobeChat 更好看、AnythingLLM 的 RAG 更强。
- 能用的硬件底线:4 核 + 8 GB 内存的小盒子(推理走远端 API);想全本地推理就 16 GB 起跳,加 GPU。
我是谁
我是 Jim Liu,悉尼的独立开发者,一个人维持一家小 SaaS 店。我从 2023 年开始自部署各种工具——Vaultwarden、Immich、Open WebUI、Nextcloud,常见那一套。我在这个站点上评测 AI 工具,标准是我自己每周真的在用,而不是跑实验室基准。
所以我说在 OpenHuman 上跑了 14 天,意思是它真的住在我家服务器上、夹在其他自部署服务中间,被我拿来处理真活:代码问题、日记式碎碎念、文档问答——不是跑合成测试。
OpenHuman 到底是什么
它是一套可自部署的 Web UI 加后端,串联了:聊天、跨会话长期记忆、文档摄入、可以链式调用工具的 agent 层、以及多用户的管理面板。模型你自己接。它说 OpenAI 的 API 方言,所以任何兼容那个接口的东西——局域网里的 Ollama、DeepSeek API、Claude 代理、OpenRouter——都能用。
它跟 Open WebUI 拉开差异的点:更重的长期个人上下文。记忆层默认就在跨会话记关于你的笔记,agent 面板的设计也更偏"一条命令端到端搞完",而不是一来一回。
它是中国本土项目,这点在两个地方有影响。第一,文档和 issue 双语但偏中文,碰到深点的问题我用了几次翻译。第二,默认的模型预设指向 DeepSeek 和几家国内厂商——换起来不难,但部署前心里要有数。
架构和 Docker 部署
OpenHuman 是多容器栈:Web 服务、API 服务、Postgres 数据库、Redis 缓存、可选的向量库(用于文档 embedding)。推荐路径是 docker-compose up,配上一个你提前编辑好的 .env。
我的部署大致长这样:
# 我 .env 的片段
OPENAI_API_BASE=https://api.deepseek.com/v1
OPENAI_API_KEY=sk-***
EMBEDDING_API_BASE=http://ollama:11434/v1
JWT_SECRET=...
DATABASE_URL=postgresql://openhuman:***@db:5432/openhuman
REDIS_URL=redis://redis:6379
聊天指向 DeepSeek 是为了便宜,embedding 指向本地 Ollama 跑的 bge-large,原因是我不想让文档内容离开这台机器。这种切分是典型配置——快且廉价的远端模型负责聊天,本地 embedding 负责 RAG 那一层敏感数据。
启动是 docker compose pull && docker compose up -d。大概 90 秒后 Web UI 就能在 localhost:3000 打开,创建管理员账号,那一步跟 Open WebUI 一样丝滑。首次启动 migration 跑得很干净。
如果你想从更宏观的视角看为什么这种"本地敏感 + 远端肌肉"的切分越来越普遍,我写过一篇 Personal LLM Wiki 笔记,讲的就是这套思路。
14 天真实使用是什么样的
两周正常工作。不是基准测试。
第 1-2 天:把那些蠢蠢的部署错误熬过去。 具体踩了什么坑下面专门一节讲。短版:我因为一个谁都没提的配置细节赔进去一晚上。
第 3-7 天:工作日里拿它处理代码问题。 多数是小活——解释这段正则、把这 30 行函数重构一下、给我写个加两列的 SQL migration。后端用 DeepSeek,成本几乎为零,单次响应大约 1 秒延迟,一来一回完全够用。
第 8-10 天:喂文档。 我把笔记里大约 60 个 markdown 文件丢进文档面板。Embedding 在本地 Ollama 上跑,整批大概四分钟,然后我就能问"三月份关于迁移到 Postgres 我最后到底是怎么定的"这类问题,能拿到有用的回答,还附带回到对应文件的引用。这是 OpenHuman 比我原本 Open WebUI 配置好用的真正场景,因为它的知识库管理 UI 明显更顺手。
第 11-14 天:试 agent 面板。 老实说结果一般。我让它抓了几个 changelog 做总结。可以。我让它在一个小 TypeScript 文件上跑"找 bug、写测试、写修复"的多步链。三步对了两步,第三步自信地搞错了。Agent 这一块概念有意思,但我不会让它在我仓库上独立跑。
我说个让我意外的小细节。这种小地方让它更像产品而不是研究 demo:快捷键的行为符合预期、markdown 渲染干净、导出文件按钮不会吐出 HTML 垃圾。Open WebUI 这些也都到位。LobeChat 四个里 UI 最美。AnythingLLM 在打磨上还差一代。
OpenHuman vs Open WebUI vs LobeChat vs AnythingLLM
四个我都用过。下面是我的诚实对比,前提是这些项目都在快速迭代,且个人口味会有影响。
| 维度 | OpenHuman | Open WebUI | LobeChat | AnythingLLM |
|---|---|---|---|---|
| 部署难度(Docker) | 中——多容器,一个 .env 坑 | 简单——一行命令 | 简单——单容器 | 中——桌面或 Docker 都行 |
| 跨会话记忆 | 强——内建,默认开启 | 可选插件 | 插件实现 | 按工作区隔离 |
| RAG 文档问答 | 不错——支持本地 embedding | 不错——pipelines | 能用,但非主打 | 四者里 RAG 最强 |
| Agent 任务链 | 内建面板,beta 感 | 函数/工具,成熟 | 插件市场 | 有限 |
| 默认 UI 打磨 | 干净、能用 | 干净、能用 | 最精致 | 差一代 |
| 自带模型 | OpenAI 兼容——啥都能接 | OpenAI + Ollama 原生 | 20+ 供应商 | OpenAI / Ollama / LM Studio 等 |
| 英文文档 | 部分——中文优先 | 完整 | 完整 | 完整 |
| GitHub 势头(测试那周) | 每日约 3,991 星 | 稳定 | 稳定 | 稳定 |
短结论:只能选一个,Open WebUI 仍是安全默认。OpenHuman 赢在你看重记忆 + agent 链,并且不介意偶尔翻译一下 issue。AnythingLLM 适合唯一用例就是大规模个人语料 RAG。LobeChat 适合"UI 难看就过不下去"的人。
如果你还没想清楚自己到底要哪种 AI agent 风格,部署任何自部署方案之前,我那篇 AI agent governance 指南 把权衡讲透了。
硬件需求(我实际跑的配置)
硬件问题问的人最多,所以给真实答案。
我的环境:家用 homelab,6 核 Ryzen,32 GB 内存,没独立显卡。推理走 DeepSeek 远端 API。Embedding 在本地 Ollama 上跑 bge-large-en-v1.5,模型够小,CPU 上跑个人语料速度也合理。
空闲时整个栈大概用 1.2 GB 内存,CPU 几乎不动。我活跃聊天、偶尔 embedding、Postgres 正常工作时,占用稳定在 2-3 GB 和个位数百分比 CPU。对任何还行的家用服务器都不算什么。
要是想完全本地,画风就变了。要让 7B 级模型跑出能用的延迟,至少 16 GB 内存,最好有 8 GB 显存的 GPU,否则就得等。要跑 14B,得 24-32 GB 显存,或者一台规格高的 Apple Silicon。我这次评测没走那条路,因为远端 DeepSeek 太便宜,自己跑的电费都算不过来。
"OpenHuman + 远端模型" 的合理底线:4 核盒子、8 GB 内存、几百 GB 硬盘存聊天和 embedding。一台插了 USB SSD 的树莓派 5、或者任何便宜的迷你 PC 都行。"OpenHuman + 本地推理"的底线则完全是另一台机器。
关于接上 DeepSeek 之后的成本数学,我那篇 DeepSeek V4 Pro 降价评测 给了当前的每 token 数字。
我部署时踩的坑
让你少走我走过的弯路。
坑 1:我没看清 embedding 的环境变量名。 OpenHuman 给 RAG 单独留了一个 EMBEDDING_API_BASE。我直接空着,以为它会回退到主 API base。它不会。文档上传一切正常、查询全是空结果,我花了四十五分钟以为向量库坏了。它没坏。是 embedding 调用一直在静默失败。两个都要设。
坑 2:太早把它暴露到公网。 我把 Web UI 绑到 0.0.0.0,忘了上周给另一个服务在路由器上开了端口。任何人都能打到注册页面。我第二天发现,没有真出事——但对一个带长期记忆层的个人 AI 来说,这就是会咬人的那种错。前面要套一个带认证的反代。我现在每个自部署服务前都用 Caddy + basic auth。
坑 3:第一天一次性导入太多文档。 我在第一天往知识库丢了大约 400 个文件。Embedding 跑了一个多小时,Postgres 开始喘。更好的做法是分批 50 个左右,盯着 embedding 队列,确认本地模型跟得上。
坑 4:升级前低估了 migration。 第 9 天左右我拉了新镜像,DB schema 变了。启动时 migration 跑了大概 20 秒,要是我先备份过就一点问题没有。我没备。自部署的东西在 docker compose pull 前永远先给 Postgres 拍快照。
隐私权衡
这点估计你最在乎,所以我说直白点。
如果你把 OpenHuman 的聊天指向 DeepSeek 远端 API,你的 prompt 就发到 DeepSeek 去了。UI 自部署不改变这件事。记忆层、文档 embedding、聊天记录——这些都留在你机器上。模型调用本身不留,除非你模型也自部署。
如果你模型也自部署(比如同一台机器上跑 Ollama),那么没错,什么都不离开机器。这是严格隐私版。代价是速度和能力——本地 7B 有用,但不是 DeepSeek V4,也不是 Claude。
我自己跑的是中间务实路线:embedding 本地 + 聊天远端。我的文件内容不离开机器,因为 embedding 在本地算。我那些临时的聊天问题确实会出去,因为脑子在那边。对我这种威胁模型——独立开发者,敏感的是代码和笔记,没有合规约束——这是对的折中。你可能不一样。
还有一点值得一提:OpenHuman 默认会把 agent 运行的日志记得相当详细。调试有用。也意味着日志文件里 PII 比你想的多。在你忘了之前先去检查日志保留设置。
FAQ
OpenHuman 真的免费吗?
软件本身开源免费跑。你要付的是接上去的那个模型 API 的钱(DeepSeek、OpenAI、Claude 代理),加上你机器的电费。如果你用 Ollama 把模型也自部署,单次聊天的边际成本就只剩电费了——零点几分钱的级别。
OpenHuman 和 Open WebUI 怎么选?
重叠很多。Open WebUI 英文文档更好、插件更成熟、首次启动体验更顺。OpenHuman 跨会话记忆更强、agent 面板更有立场。看重记忆和 agent 链选 OpenHuman;想要安全默认选 Open WebUI。
OpenHuman 能完全离线、零 API 调用跑吗?
可以,前提是配本地模型服务器,比如 Ollama 或 LM Studio,把 OPENAI_API_BASE 指向本地服务。但你得有跑得动一个有用模型的硬件——现实点说,小模型 16 GB 内存,更大就要 GPU。
跑 OpenHuman 需要什么硬件?
OpenHuman + 远端模型 API:4 核 + 8 GB 内存就够。OpenHuman + 本地 7B:16 GB 内存起,最好 8 GB 显存 GPU。本地 14B:24-32 GB 显存级别,或者高规格 Apple Silicon。
把 OpenHuman 暴露到公网安全吗?
不要,除非你前面套一个带认证的反代。它默认有自己的认证,但一个带长期记忆的服务,纵深防御才安心。我自己跑的是 Caddy + basic auth,而且只能通过 Tailscale 访问。
中文文档的坑是什么?
部分 issue 和深层文档是中文优先。Web UI 本身有中英双语。日常用完全无摩擦。但当你撞上具体 bug 想读 issue tracker 时,有时候得开个翻译标签。
OpenHuman 支持多用户吗?
支持。管理面板支持用户账号,记忆按用户隔离。我现在只一个人用,但多用户能力是齐的,小团队也能跑。
OpenHuman 的 agent 和工具调用怎么样?
内建了一个 agent 面板,可以链式调用工具——搜索、文件操作、API 调用。简单链路我测下来跑得不错;复杂多步就脆。我把它当"局部任务好用",不当"自己去把 bug 修了"那种自治体。
下一步
如果你正在纠结 OpenHuman 还是干脆给现有方案多买点 model 额度,先用 AI 工具选择器 自检一下,看自部署到底适不适合你的工作流——很多人以为自己想要自部署 AI,其实想要的是稍微好用一点的远端。如果你已经决定走 local-first,我那篇 Qwen3 Coder Next 本地编码评测 讲的是这套栈里模型那一端。
我现在还在跑 OpenHuman 第 14 天往后。如果数据变了或者项目转向,我会更新这篇。
关于作者
Jim Liu 是悉尼的独立开发者,一个人维持一家小 SaaS 店。他从 2023 年开始自部署个人基础设施,并在这个站点上根据日常实际使用而非基准测试评测 AI 工具。更多见 About 页面。
联盟声明:本文部分链接可能是推荐链接。如果你通过这些链接注册,对你来说不增加任何费用,对这个站点的维持有帮助;我只会推荐我自己真的在用的工具。