OpenClaw 用着用着发现账单暴涨？一个月下来花了几百美金却感觉没干什么实事？你不是一个人。很多人兴冲冲地装上 OpenClaw，结果发现一个简单的 “今天天气怎么样” 要花 10-20 美分，一天发 10 条消息就是 2 美元，一周下来 15 美元没了。更可怕的是，如果你一个会话保持好几天不刷新，后面的每条消息可能要花 12 美分、13 美分，越来越贵。但真相是：OpenClaw 的 token 消耗有 90% 是可以避免的。问题不在工具本身，而在于你不了解它怎么花钱的。这篇教程会手把手教你三件事：文件管理、模型管理、会话管理。掌握这三点，你的 OpenClaw token 消耗可以直接降低 90% 以上。

01、OpenClaw 如何消耗 Token：你看不见的隐藏成本

先搞清楚钱是怎么花的，才能知道怎么省。

想象一下，你问 OpenClaw：“今天天气怎么样？”10 秒后它回答 “20 度，晴天”。看起来你只是发了个简单问题、收到个简单回答，对吧？

错了。在你看不见的后台，OpenClaw 其实在每次请求里塞进去了一大堆东西：

第一层：核心指令（无法修改）

OpenClaw 自己的系统指令，告诉它怎么运作、怎么响应、怎么调用工具。这部分你改不了，每次都会发送。

第二层：上下文文件

agents.md – 你的代理指令和行为规则
soul.md – 你设定的代理性格和沟通风格
memory.md – 代理的长期记忆，每次对话后都会追加内容

第三层：历史对话

所有之前的对话记录。你问 “天气怎么样”，它答 “20 度晴天”。然后你问 “我该穿什么”，这时候它会把前面那轮对话也一起发送过去。每一轮新对话，都会带着所有旧对话。这就是为什么 OpenClaw 这么贵。

举个例子：你用 Sonnet 4.6 模型，一个简单的 “天气” 问题可能要 10-20 美分。不是因为 “天气怎么样” 这几个字值 20 美分，而是因为 OpenClaw 为了保持自主性，必须每次都发送完整的上下文、工具定义、历史记录。

如果你一天发 10 条消息（真的不多），那就是 2 美元。如果你一个会话保持 7 天不刷新，后面的消息会越来越贵，因为上下文越积越多。

7 天 × 一天 10 条 × 平均 15 美分 = 大约 15 美元。

对比一下普通的 ChatGPT API 调用：

如果你直接用 OpenAI 的 chat completions API，发送 “天气怎么样”，收到 “20 度晴天”，可能只消耗 1000 个 token，成本大约 1-2 美分。10 条消息 10 美分。

差别在哪？普通 API 不是自主代理。它不能自己重启服务器、不能做健康检查、不能在出问题时自动修复。OpenClaw 可以。

比如你让 OpenClaw “把我的服务器更新到最新版本”，它需要执行 5 个循环：

拉取更新信息
重启服务器
做健康检查
如果有问题就修复
回来告诉你完成了

这一个请求，实际上是 5 次完整的上下文发送。每次都带着所有文件、所有历史。所以有些任务的 token 消耗会爆炸性增长。

这就是为什么文件管理这么关键。

02、文件管理：控制 agents.md、soul.md、memory.md 的大小

打开 OpenClaw 的 UI，你会看到这些文件。第一步：截个图，看看它们现在多大。

不用打开文件看内容，就看外面显示的大小：

agents.md – 7.7KB? 70KB?
soul.md – 3.2KB? 30KB?
memory.md – 这个会随时间暴涨，10KB? 100KB? 500KB?

如果你的agents.md超过 15KB，你可能在浪费钱。

优化agents.md的核心原则：简洁、明确、不重复

很多人会在agents.md里写一大堆详细指令：“如果我说 A 你就做 B，如果我说 C 你就做 D…”。别这么干。正确的做法：

核心行为规则：每条不超过 1-2 句话
常用技能：写成简短的关键词或命令
参考示例：给 1-2 个例子就够了，不要写 10 个

举个例子，不要写：

“当我要求你做研究时，你应该先问我研究的主题是什么，然后问我需要多深入的研究，然后问我…（巴拉巴拉 500 字）”

应该写：

“研究任务：询问主题和深度，使用子代理完成，交付摘要”

soul.md也一样。不要写一整篇小说描述你的代理。应该 “有同理心、专业、友好、幽默…”。写 3-5 个关键词就够了。模型会理解的。

memory.md是最大的问题。

这个文件会在每次对话后追加新内容。用了一个月？几百 KB。用了六个月？可能上 MB。而这个文件在每次请求时都会被完整发送。

解决方法：定期清理memory.md

每个月或每两周，让你的代理帮你做一次 “记忆压缩”：

“请总结 memory.md 中最重要的 10 件事，删除重复和过时的信息，将文件压缩到 5KB 以内”

代理会帮你整理，保留核心信息，删掉噪音。一次压缩可能让你的每条消息省 2-5 美分。

03、用子代理处理大任务：保持主会话轻量化

这是个很多人不知道的技巧：不要让主代理干重活。假设你想让 OpenClaw 帮你：

研究某个技术话题
写一个完整的代码项目
分析一大堆数据

如果你在主会话里让它做这些，所有的中间步骤、所有的代码、所有的分析结果都会留在你的主会话上下文里。之后你每发一条消息，都要带着这些垃圾。

正确的做法：创建子代理。

在agents.md里加一条指令：

“对于复杂任务（研究、编程、数据分析），创建临时子代理完成。子代理完成后，只返回最终结果给主会话。”

子代理的好处：

它有自己的会话和 token
它完成工作后，只把结果（比如 10% 的关键信息）返回给主会话
主会话保持轻量，后续对话不会被之前的大任务拖累

实际操作：
当你说 “帮我研究一下 xx 技术”，代理会：

创建一个临时的研究子代理
子代理去做深度研究（消耗它自己的 token）
完成后，子代理返回一个简短摘要给主代理
主会话只记录这个摘要，不记录整个研究过程

这样你的主会话永远保持干净。

04、Codex 免费策略：用 ChatGPT 订阅里的 token 跑编程任务

这是个超级省钱的技巧。如果你有 ChatGPT Plus 订阅（每月 20 美元），你已经有了一定数量的免费 token。为什么不用这些 token 来跑 OpenClaw 的编程任务？

核心思路：

你的 OpenClaw 运行在一台服务器或电脑上。你可以在同一台机器上安装 Cursor 或其他使用 Codex 的工具，然后用 OAuth 认证你的 ChatGPT 账号。

配置步骤：

在运行 OpenClaw 的机器上打开新的终端
安装 Cursor 或 Codex 客户端
用 OAuth 认证（不是 API key，是直接登录 ChatGPT 账号）
在agents.md里添加指令：
“编程任务：启动本地 Codex 会话，使用 OAuth 认证的免费 token。完成后返回代码，我会在localhost查看。”

这样的好处：

不消耗你的 OpenClaw API 配额
用你已经付费的 ChatGPT 订阅里的 token
代码质量往往更高（Codex 专门为编程优化）
你的主 OpenClaw 代理只需要等待，不需要自己写代码

建议用 Sonnet 4.6 或 Opus 4.6 来处理这个配置，因为小模型可能搞不定这么复杂的设置。

05、数据库替代 MD 文件：长期数据不要放文本里

很多人刚开始用 OpenClaw 时会发现：它喜欢把所有东西写进 MD 文件。

你说 “帮我记录每天的健康数据”，它会创建一个health_log.md，然后每天追加一行：

2026-02-01: 跑步 30 分钟，吃了沙拉
2026-02-02: 健身房 1 小时，吃了鸡胸肉
2026-02-03: …

90 天后，这个文件有 90 行。如果这个文件被包含在会话上下文里（很多人会这么设置），你每次发消息都要带着这 90 行数据。

正确的做法：用数据库。

OpenClaw 自带数据库功能。在agents.md里加这条指令：

“所有长期数据（任务、健康记录、项目进度）存入数据库，不要写入 MD 文件。”

然后用 Codex 策略（上一节）让代理帮你搭建一个简单的查看面板。这样：

数据存在数据库里，不占用会话上下文
你想看数据时，打开localhost上的面板，直接查看
不需要问代理 “给我看最近 30 天的数据”（这又是一次昂贵的 token 消耗）

一个实际例子：

假设你用 OpenClaw 做健康追踪：

每天记录饮食和运动
90 天后有 90 条记录
如果存 MD 文件：每次对话 + 5-10 美分（因为要发送整个文件）
如果存数据库：每次对话 + 0 美分（数据库不在上下文里）

3 个月下来，这一项就能省几十美元。

06、模型选择的平衡：不要无脑选最便宜的

很多人看到 token 成本高，第一反应是：“换最便宜的模型！”

这是个陷阱。小模型（30B、70B 参数的本地模型）有几个致命问题：

上下文理解能力差：很容易丢失之前的对话
工具调用能力弱：需要连续执行 5 个工具调用时经常卡住
容易被 prompt injection：安全性差
频繁出错：导致你要重复发送请求，反而更贵

举个例子：

你用小模型，让它 “更新服务器”。它可能：

第一次尝试失败
你重发指令
第二次尝试还是失败
你再重发
第三次才成功

看起来模型便宜，但你发了 3 次请求。总成本可能比用 Sonnet 4.6 一次成功还贵。

正确的策略：

主代理用好模型：Sonnet 4.6 或 Opus 4.6，保证可靠性
子代理可以用中等模型：Minimax 2.5，便宜但能完成简单任务
Heartbeat 用中等模型：不要用最小的，但也不用最大的

价值判断：

如果 OpenClaw 每天帮你：

追踪健康数据，让你 3 个月减掉 10 公斤
管理项目任务，让你效率提升 30%
自动化重复工作，每天省 1 小时

那么每天花 1-2 美元是完全值得的。比健身教练便宜多了。

但如果你只是用它闲聊、问天气、看新闻，那每一分钱都是浪费。

核心原则：先找到价值，再优化成本。不要为了省钱而牺牲价值。

07、Cron Jobs 和 Heartbeats：定时任务的成本陷阱

OpenClaw 有两种自动化机制：

Cron Jobs（定时任务）：在特定时间执行任务
Heartbeats（心跳检测）：定期 “醒来” 检查状态，会带着当前会话的所有历史对话，非常容易变得昂贵

Cron Jobs 的成本：

假设你设置了一个每天早上 8 点的 Cron：“给我发送今天的天气、3 条 AI 新闻、推荐 YouTube 视频”。

每次执行这个 Cron，OpenClaw 会：

加载所有上下文文件（agents.md、soul.md、memory.md）
执行网络搜索
生成报告
发送给你

一次可能消耗 10-20 美分。看起来不多，但如果你设置了 5 个不同的 Cron（早报、午间提醒、晚间总结等），一天就是 50 美分 - 1 美元。

Heartbeats 更可怕：

假设你设置心跳每 15 分钟检查一次。一天 24 小时 = 96 次检查。

如果你的主会话已经有 20-30 条历史消息，每次心跳都要带着这些消息。一次心跳可能 10-20 美分，96 次 = 一天 10-20 美元！

优化策略：

Cron Jobs 用中等模型：不要用 Opus，用 Minimax 2.5 或类似的
Heartbeats 设置长间隔：不要 15 分钟，至少 1 小时或更长
Heartbeats 用轻量模型：除非真的需要高质量推理
默认关闭 Heartbeats：在 config 文件里设置为 0 分钟（完全关闭）

如何在 config 文件里关闭 Heartbeats：

找到你的 config 文件，设置：

plaintext

heartbeat_interval: 0

只在真正需要时才开启，比如：

监控长时间运行的任务（比如 Codex 编程会话可能跑 6 小时）
夜间需要自动修复问题的场景

大部分时候，你不需要 Heartbeats。

08、n8n 的妙用：日报、提醒这些不需要 AI

天气：调用天气 API，拿到数据，格式化

新闻：调用新闻 API，拿到标题，排序

YouTube 推荐：调用 YouTube API，按关键词筛选

这些步骤，用 n8n 这样的 workflow 工具几乎不花钱。

n8n 是什么？一个自动化 workflow 工具，可以连接各种 API、处理数据、发送通知。关键是：大部分操作不消耗 AI token。

实际操作：用 n8n 替代 OpenClaw Cron

假设你想要每天早上的报告，包括：

当地天气
3 条 AI trending 新闻
推荐 YouTube 视频

用 OpenClaw 做：

触发 Cron
OpenClaw 调用天气 API（AI token）
OpenClaw 搜索新闻（AI token）
OpenClaw 筛选 YouTube（AI token）
OpenClaw 格式化（AI token）
发送到 Telegram（AI token）

成本：10-50 美分，取决于复杂度。

用 n8n 做：

n8n 定时触发（免费）
调用天气 API（免费）
调用新闻 API（免费）
调用 YouTube API（免费）
格式化数据（免费）
发送到 Telegram（免费）
只在必要时调用一次 AI（比如总结新闻）（~2 美分）

成本：2 美分。省了 80-95%。

怎么设置 n8n？

在 Docker 容器里安装 n8n
把 n8n 连接到 OpenClaw
用 Tailscale 保证安全
设置基本的 workflow

n8n 和 OpenClaw 的配合使用：

不是说完全不用 OpenClaw，而是：

简单的数据抓取、格式化、定时发送 → n8n
需要推理、决策、复杂工具调用 → OpenClaw

甚至可以这样：用 n8n 抓取你今天的日历，看看你要见谁，然后把那个人的名字和公司发给 OpenClaw，让 OpenClaw 做深度研究，生成谈话要点。最后 n8n 把结果发给你。

这样你只为 “AI 推理” 这部分付费，数据抓取和发送都是免费的。

实际应用场景：

假设你要用 OpenClaw 设置 n8n（上一节提到的）：

开始用 Opus 4.6 处理复杂的安装配置
安装完成后，输入/models
切换到 Minimax 2.5
用便宜模型继续日常对话和测试

这样复杂任务用好模型，简单任务用便宜模型，在同一个会话里实现。

09、会话管理命令：随时控制成本的工具

OpenClaw 内置了几个超级有用的命令，但很多人不知道。

/status – 查看当前会话状态

在 Telegram 或 Discord 里输入/status，你会看到：

当前使用的模型（可能你以为用的 Minimax，其实在用 Opus）
已消耗的 token 数量
当前上下文的 token 数量（这个很关键）

如果你看到上下文有 80 万 token（满额 100 万），说明你的会话已经严重臃肿了。

/compact – 压缩当前会话

如果你正在处理一个大项目，不想开新会话（因为需要保留所有上下文），但又发现 token 用得太多，可以用/compact。

这个命令会把当前会话压缩到原来的 10-15%。

比如你有 80 万 token 的上下文，压缩后可能只剩 10 万。下一条消息立刻省 70 万 token 的成本。

什么时候用compact：

会话很长，但你还需要继续
上下文超过 50 万 token
不想丢失当前的工作进度

/new – 开启全新会话
这个命令会清空所有历史对话，给你一个全新的会话。

最佳实践：如果你在处理一个任务到一半，不想丢失进度，可以这样：

“请把我们当前的工作进度、遇到的问题、已尝试的方案、下一步计划写入 temporary.md 文件”

等代理写完，然后运行/new开新会话。

新会话里，告诉代理：

“读取 temporary.md，继续之前的工作”

这样你既清空了上下文，又不丢失进度。

/models – 切换模型

在同一个会话中途，你可以切换模型。

10、设置支出限制：硬性控制烧钱速度

这是最后的保险，防止意外烧钱。

API 层级的支出限制：

如果你用 OpenRouter、Anthropic 或 OpenAI，你可以在 API 密钥层面设置消费上限。

操作步骤：

登录你的 API 提供商（OpenRouter/Anthropic/OpenAI）
找到你的 API 密钥
点击 “编辑” 或 “设置”
设置每日 / 每周 / 每月消费上限

比如设置每日 5 美元：

一旦达到 5 美元，API 会自动停止响应
第二天重置，继续可用
防止某个配置错误导致一天烧掉 100 美元

OpenClaw 层级的监控：

你还可以更高级一点，搭建一个监控系统：

每天从 OpenClaw 导出 token 消耗数据到数据库
从 API 提供商导出账单数据到数据库
用 Codex 策略（第 4 节）让代理帮你搭建一个仪表板
在仪表板里查看：
- 按天 / 周 / 月的消费
- 按任务类型的消费
- 按模型的消费
- 按代理的消费
- 设置预警：如果某天消费超过预算，自动发送 Telegram 通知提醒你。

更简单的方法：每周花 10 分钟，打开 API 提供商的账单页面，看看

这周花了多少钱
主要花在哪些模型上
是否符合预期

如果不满意，调整策略：

少发消息
换便宜模型
关闭某些 Cron
更频繁地刷新会话

11、进阶技巧：让 OpenClaw 教你怎么用它

这是作者分享的一个很聪明的策略：让 OpenClaw 主动发现你的需求。

很多人把 OpenClaw 当成高级版的 ChatGPT，随便聊聊天、问问题。这样用不会产生价值。

更好的方式：在agents.md里加这样的指令

“观察我的对话模式。如果我多次提到某个话题（比如健康、项目、学习），主动问我是否要：

创建追踪系统
设置提醒
建立数据库
搭建仪表板

不要等我提出，要主动建议。”

实际效果：当你跟代理聊了几次关于 “想减肥”，它会说

“我注意到你 3 次提到想减肥了。要不要我帮你：

搭建一个每日饮食和运动记录系统
设置每天晚上 8 点的提醒，问你今天吃了什么、运动了没
创建一个数据库，90 天后可以看图表
用 Codex 搭建一个简单的仪表板

这样我能更好地帮你实现目标。”

这时候你才意识到：原来 OpenClaw 可以这么用！同样的逻辑适用于：

工作项目管理、学习进度追踪、财务记录、阅读列表、任何你反复提到的事情

让代理主动挖掘你的需求，而不是你自己想 “我能用 OpenClaw 做什么”。

12、最后的建议：从一个代理开始，慢慢扩展

很多人（包括作者）一开始会犯的错误：一次性创建 4-5 个代理。

财务代理、YouTube 代理、研究代理、个人助理代理、项目管理代理

结果：

同时有 5 个对话在进行
每个都在消耗 token
但其中 3 个其实没啥用

正确的策略：从一个主代理开始。

第一个月：

只用一个代理
让它观察你的需求
让它主动建议功能
慢慢建立起你真正需要的系统

第二个月：

如果发现某个领域需要专门的代理（比如确实需要一个专门做 YouTube 研究的）
那时候再创建第二个代理
用不同的模型（主代理 Sonnet，专项代理 Minimax）

不要一开始就搞 5 个代理，那只会浪费钱。

用法转变：

❌ 把 OpenClaw 当 ChatGPT 用 → 随便聊天，问天气，看新闻

✅ 把 OpenClaw 当系统构建工具 → 搭建追踪系统、自动化流程、管理项目

一旦你建立起系统（健康追踪、项目管理、学习记录等），OpenClaw 的价值就会指数级增长。而你的 token 成本会因为优化而大幅下降。

💥 token 消耗的真相 —— 每次对话背后 OpenClaw 都在发送巨量隐藏上下文

💥 文件管理是关键 —— agents.md、soul.md、memory.md会越来越大，不控制就是烧钱

💥 用子代理处理大任务 —— 主会话保持轻量，复杂工作交给临时代理

💥 Codex 免费策略 —— 用 ChatGPT 订阅里自带的 token 跑编程任务，不花额外的钱

💥 数据库替代 MD 文件 —— 90 天的记录存 MD 会炸，存数据库几乎不耗 token

💥 模型选择的平衡 —— 不要无脑用最便宜的，小模型容易掉链子反而更贵

💥 Cron 和 Heartbeat 的陷阱 —— 15 分钟跑一次心跳，一天 96 次执行要 10-20 美元

💥 n8n 的妙用 —— 日报、天气、新闻这些不需要 AI，用 workflow 省 90% 成本

💥 会话管理命令 —— /status、/compact、/new、/models随时控制成本

💥 支出限制必须设 —— API 密钥设每日 5 美元上限，硬性控制烧钱速度

文章来源于：

https://zxiaolin.com/1823.html

OpenClaw 太贵？这套烧掉 3000 美金总结的方案，能帮你省 97% 的 Token 成本（附完整操作指南）

01、OpenClaw 如何消耗 Token：你看不见的隐藏成本

02、文件管理：控制 agents.md、soul.md、memory.md 的大小

03、用子代理处理大任务：保持主会话轻量化

04、Codex 免费策略：用 ChatGPT 订阅里的 token 跑编程任务

05、数据库替代 MD 文件：长期数据不要放文本里

06、模型选择的平衡：不要无脑选最便宜的

07、Cron Jobs 和 Heartbeats：定时任务的成本陷阱

Cron Jobs 的成本：

Heartbeats 更可怕：

08、n8n 的妙用：日报、提醒这些不需要 AI

09、会话管理命令：随时控制成本的工具

10、设置支出限制：硬性控制烧钱速度

11、进阶技巧：让 OpenClaw 教你怎么用它

12、最后的建议：从一个代理开始，慢慢扩展

小林酱&唐晓萌博客

分享文章

文章目录

01、OpenClaw 如何消耗 Token：你看不见的隐藏成本

02、文件管理：控制 agents.md、soul.md、memory.md 的大小

03、用子代理处理大任务：保持主会话轻量化

04、Codex 免费策略：用 ChatGPT 订阅里的 token 跑编程任务

05、 数据库替代 MD 文件：长期数据不要放文本里

06、模型选择的平衡：不要无脑选最便宜的

07、Cron Jobs 和 Heartbeats：定时任务的成本陷阱

Cron Jobs 的成本：

Heartbeats 更可怕：

08、n8n 的妙用：日报、提醒这些不需要 AI

09、会话管理命令：随时控制成本的工具

10、设置支出限制：硬性控制烧钱速度

11、 进阶技巧：让 OpenClaw 教你怎么用它

12、 最后的建议：从一个代理开始，慢慢扩展

分享文章

文章目录

05、数据库替代 MD 文件：长期数据不要放文本里

11、进阶技巧：让 OpenClaw 教你怎么用它

12、最后的建议：从一个代理开始，慢慢扩展