OpenClaw 用着用着发现账单暴涨?一个月下来花了几百美金却感觉没干什么实事?你不是一个人。很多人兴冲冲地装上 OpenClaw,结果发现一个简单的 “今天天气怎么样” 要花 10-20 美分,一天发 10 条消息就是 2 美元,一周下来 15 美元没了。更可怕的是,如果你一个会话保持好几天不刷新,后面的每条消息可能要花 12 美分、13 美分,越来越贵。但真相是:OpenClaw 的 token 消耗有 90% 是可以避免的。问题不在工具本身,而在于你不了解它怎么花钱的。这篇教程会手把手教你三件事:文件管理、模型管理、会话管理。掌握这三点,你的 OpenClaw token 消耗可以直接降低 90% 以上。

01、OpenClaw 如何消耗 Token:你看不见的隐藏成本
先搞清楚钱是怎么花的,才能知道怎么省。
想象一下,你问 OpenClaw:“今天天气怎么样?”10 秒后它回答 “20 度,晴天”。看起来你只是发了个简单问题、收到个简单回答,对吧?
错了。在你看不见的后台,OpenClaw 其实在每次请求里塞进去了一大堆东西:
第一层:核心指令(无法修改)
OpenClaw 自己的系统指令,告诉它怎么运作、怎么响应、怎么调用工具。这部分你改不了,每次都会发送。
第二层:上下文文件
agents.md– 你的代理指令和行为规则soul.md– 你设定的代理性格和沟通风格memory.md– 代理的长期记忆,每次对话后都会追加内容
第三层:历史对话
所有之前的对话记录。你问 “天气怎么样”,它答 “20 度晴天”。然后你问 “我该穿什么”,这时候它会把前面那轮对话也一起发送过去。每一轮新对话,都会带着所有旧对话。这就是为什么 OpenClaw 这么贵。
举个例子:你用 Sonnet 4.6 模型,一个简单的 “天气” 问题可能要 10-20 美分。不是因为 “天气怎么样” 这几个字值 20 美分,而是因为 OpenClaw 为了保持自主性,必须每次都发送完整的上下文、工具定义、历史记录。
如果你一天发 10 条消息(真的不多),那就是 2 美元。如果你一个会话保持 7 天不刷新,后面的消息会越来越贵,因为上下文越积越多。
7 天 × 一天 10 条 × 平均 15 美分 = 大约 15 美元。
对比一下普通的 ChatGPT API 调用:
如果你直接用 OpenAI 的 chat completions API,发送 “天气怎么样”,收到 “20 度晴天”,可能只消耗 1000 个 token,成本大约 1-2 美分。10 条消息 10 美分。
差别在哪?普通 API 不是自主代理。它不能自己重启服务器、不能做健康检查、不能在出问题时自动修复。OpenClaw 可以。
比如你让 OpenClaw “把我的服务器更新到最新版本”,它需要执行 5 个循环:
拉取更新信息
重启服务器
做健康检查
如果有问题就修复
回来告诉你完成了
这一个请求,实际上是 5 次完整的上下文发送。每次都带着所有文件、所有历史。所以有些任务的 token 消耗会爆炸性增长。
这就是为什么文件管理这么关键。
02、文件管理:控制 agents.md、soul.md、memory.md 的大小
打开 OpenClaw 的 UI,你会看到这些文件。第一步:截个图,看看它们现在多大。
不用打开文件看内容,就看外面显示的大小:
agents.md– 7.7KB? 70KB?soul.md– 3.2KB? 30KB?memory.md– 这个会随时间暴涨,10KB? 100KB? 500KB?
如果你的agents.md超过 15KB,你可能在浪费钱。
优化agents.md的核心原则:简洁、明确、不重复
很多人会在agents.md里写一大堆详细指令:“如果我说 A 你就做 B,如果我说 C 你就做 D…”。别这么干。正确的做法:
核心行为规则:每条不超过 1-2 句话
常用技能:写成简短的关键词或命令
参考示例:给 1-2 个例子就够了,不要写 10 个
举个例子,不要写:
“当我要求你做研究时,你应该先问我研究的主题是什么,然后问我需要多深入的研究,然后问我…(巴拉巴拉 500 字)”
应该写:
“研究任务:询问主题和深度,使用子代理完成,交付摘要”
soul.md也一样。不要写一整篇小说描述你的代理。应该 “有同理心、专业、友好、幽默…”。写 3-5 个关键词就够了。模型会理解的。
memory.md是最大的问题。
这个文件会在每次对话后追加新内容。用了一个月?几百 KB。用了六个月?可能上 MB。而这个文件在每次请求时都会被完整发送。
解决方法:定期清理memory.md
每个月或每两周,让你的代理帮你做一次 “记忆压缩”:
“请总结 memory.md 中最重要的 10 件事,删除重复和过时的信息,将文件压缩到 5KB 以内”
代理会帮你整理,保留核心信息,删掉噪音。一次压缩可能让你的每条消息省 2-5 美分。
03、用子代理处理大任务:保持主会话轻量化
这是个很多人不知道的技巧:不要让主代理干重活。假设你想让 OpenClaw 帮你:
研究某个技术话题
写一个完整的代码项目
分析一大堆数据
如果你在主会话里让它做这些,所有的中间步骤、所有的代码、所有的分析结果都会留在你的主会话上下文里。之后你每发一条消息,都要带着这些垃圾。
正确的做法:创建子代理。
在agents.md里加一条指令:
“对于复杂任务(研究、编程、数据分析),创建临时子代理完成。子代理完成后,只返回最终结果给主会话。”
子代理的好处:
它有自己的会话和 token
它完成工作后,只把结果(比如 10% 的关键信息)返回给主会话
主会话保持轻量,后续对话不会被之前的大任务拖累
实际操作:
当你说 “帮我研究一下 xx 技术”,代理会:
创建一个临时的研究子代理
子代理去做深度研究(消耗它自己的 token)
完成后,子代理返回一个简短摘要给主代理
主会话只记录这个摘要,不记录整个研究过程
这样你的主会话永远保持干净。
04、Codex 免费策略:用 ChatGPT 订阅里的 token 跑编程任务
这是个超级省钱的技巧。如果你有 ChatGPT Plus 订阅(每月 20 美元),你已经有了一定数量的免费 token。为什么不用这些 token 来跑 OpenClaw 的编程任务?
核心思路:
你的 OpenClaw 运行在一台服务器或电脑上。你可以在同一台机器上安装 Cursor 或其他使用 Codex 的工具,然后用 OAuth 认证你的 ChatGPT 账号。
配置步骤:
在运行 OpenClaw 的机器上打开新的终端
安装 Cursor 或 Codex 客户端
用 OAuth 认证(不是 API key,是直接登录 ChatGPT 账号)
在
agents.md里添加指令:“编程任务:启动本地 Codex 会话,使用 OAuth 认证的免费 token。完成后返回代码,我会在localhost查看。”
这样的好处:
不消耗你的 OpenClaw API 配额
用你已经付费的 ChatGPT 订阅里的 token
代码质量往往更高(Codex 专门为编程优化)
你的主 OpenClaw 代理只需要等待,不需要自己写代码
建议用 Sonnet 4.6 或 Opus 4.6 来处理这个配置,因为小模型可能搞不定这么复杂的设置。
05、 数据库替代 MD 文件:长期数据不要放文本里
很多人刚开始用 OpenClaw 时会发现:它喜欢把所有东西写进 MD 文件。
你说 “帮我记录每天的健康数据”,它会创建一个health_log.md,然后每天追加一行:
2026-02-01: 跑步 30 分钟,吃了沙拉
2026-02-02: 健身房 1 小时,吃了鸡胸肉
2026-02-03: …
90 天后,这个文件有 90 行。如果这个文件被包含在会话上下文里(很多人会这么设置),你每次发消息都要带着这 90 行数据。
正确的做法:用数据库。
OpenClaw 自带数据库功能。在agents.md里加这条指令:
“所有长期数据(任务、健康记录、项目进度)存入数据库,不要写入 MD 文件。”
然后用 Codex 策略(上一节)让代理帮你搭建一个简单的查看面板。这样:
数据存在数据库里,不占用会话上下文
你想看数据时,打开localhost上的面板,直接查看
不需要问代理 “给我看最近 30 天的数据”(这又是一次昂贵的 token 消耗)
一个实际例子:
假设你用 OpenClaw 做健康追踪:
每天记录饮食和运动
90 天后有 90 条记录
如果存 MD 文件:每次对话 + 5-10 美分(因为要发送整个文件)
如果存数据库:每次对话 + 0 美分(数据库不在上下文里)
3 个月下来,这一项就能省几十美元。
06、模型选择的平衡:不要无脑选最便宜的
很多人看到 token 成本高,第一反应是:“换最便宜的模型!”
这是个陷阱。小模型(30B、70B 参数的本地模型)有几个致命问题:
上下文理解能力差:很容易丢失之前的对话
工具调用能力弱:需要连续执行 5 个工具调用时经常卡住
容易被 prompt injection:安全性差
频繁出错:导致你要重复发送请求,反而更贵
举个例子:
你用小模型,让它 “更新服务器”。它可能:
第一次尝试失败
你重发指令
第二次尝试还是失败
你再重发
第三次才成功
看起来模型便宜,但你发了 3 次请求。总成本可能比用 Sonnet 4.6 一次成功还贵。
正确的策略:
主代理用好模型:Sonnet 4.6 或 Opus 4.6,保证可靠性
子代理可以用中等模型:Minimax 2.5,便宜但能完成简单任务
Heartbeat 用中等模型:不要用最小的,但也不用最大的
价值判断:
如果 OpenClaw 每天帮你:
追踪健康数据,让你 3 个月减掉 10 公斤
管理项目任务,让你效率提升 30%
自动化重复工作,每天省 1 小时
那么每天花 1-2 美元是完全值得的。比健身教练便宜多了。
但如果你只是用它闲聊、问天气、看新闻,那每一分钱都是浪费。
核心原则:先找到价值,再优化成本。不要为了省钱而牺牲价值。
07、Cron Jobs 和 Heartbeats:定时任务的成本陷阱
OpenClaw 有两种自动化机制:
Cron Jobs(定时任务):在特定时间执行任务
Heartbeats(心跳检测):定期 “醒来” 检查状态,会带着当前会话的所有历史对话,非常容易变得昂贵
Cron Jobs 的成本:
假设你设置了一个每天早上 8 点的 Cron:“给我发送今天的天气、3 条 AI 新闻、推荐 YouTube 视频”。
每次执行这个 Cron,OpenClaw 会:
加载所有上下文文件(
agents.md、soul.md、memory.md)执行网络搜索
生成报告
发送给你
一次可能消耗 10-20 美分。看起来不多,但如果你设置了 5 个不同的 Cron(早报、午间提醒、晚间总结等),一天就是 50 美分 - 1 美元。
Heartbeats 更可怕:
假设你设置心跳每 15 分钟检查一次。一天 24 小时 = 96 次检查。
如果你的主会话已经有 20-30 条历史消息,每次心跳都要带着这些消息。一次心跳可能 10-20 美分,96 次 = 一天 10-20 美元!
优化策略:
Cron Jobs 用中等模型:不要用 Opus,用 Minimax 2.5 或类似的
Heartbeats 设置长间隔:不要 15 分钟,至少 1 小时或更长
Heartbeats 用轻量模型:除非真的需要高质量推理
默认关闭 Heartbeats:在 config 文件里设置为 0 分钟(完全关闭)
如何在 config 文件里关闭 Heartbeats:
找到你的 config 文件,设置:
plaintext
heartbeat_interval: 0只在真正需要时才开启,比如:
监控长时间运行的任务(比如 Codex 编程会话可能跑 6 小时)
夜间需要自动修复问题的场景
大部分时候,你不需要 Heartbeats。
08、n8n 的妙用:日报、提醒这些不需要 AI
天气:调用天气 API,拿到数据,格式化
新闻:调用新闻 API,拿到标题,排序
YouTube 推荐:调用 YouTube API,按关键词筛选
这些步骤,用 n8n 这样的 workflow 工具几乎不花钱。
n8n 是什么?一个自动化 workflow 工具,可以连接各种 API、处理数据、发送通知。关键是:大部分操作不消耗 AI token。
实际操作:用 n8n 替代 OpenClaw Cron
假设你想要每天早上的报告,包括:
当地天气
3 条 AI trending 新闻
推荐 YouTube 视频
用 OpenClaw 做:
触发 Cron
OpenClaw 调用天气 API(AI token)
OpenClaw 搜索新闻(AI token)
OpenClaw 筛选 YouTube(AI token)
OpenClaw 格式化(AI token)
发送到 Telegram(AI token)
成本:10-50 美分,取决于复杂度。
用 n8n 做:
n8n 定时触发(免费)
调用天气 API(免费)
调用新闻 API(免费)
调用 YouTube API(免费)
格式化数据(免费)
发送到 Telegram(免费)
只在必要时调用一次 AI(比如总结新闻)(~2 美分)
成本:2 美分。省了 80-95%。
怎么设置 n8n?
在 Docker 容器里安装 n8n
把 n8n 连接到 OpenClaw
用 Tailscale 保证安全
设置基本的 workflow
n8n 和 OpenClaw 的配合使用:
不是说完全不用 OpenClaw,而是:
简单的数据抓取、格式化、定时发送 → n8n
需要推理、决策、复杂工具调用 → OpenClaw
甚至可以这样:用 n8n 抓取你今天的日历,看看你要见谁,然后把那个人的名字和公司发给 OpenClaw,让 OpenClaw 做深度研究,生成谈话要点。最后 n8n 把结果发给你。
这样你只为 “AI 推理” 这部分付费,数据抓取和发送都是免费的。
实际应用场景:
假设你要用 OpenClaw 设置 n8n(上一节提到的):
开始用 Opus 4.6 处理复杂的安装配置
安装完成后,输入
/models切换到 Minimax 2.5
用便宜模型继续日常对话和测试
这样复杂任务用好模型,简单任务用便宜模型,在同一个会话里实现。
09、会话管理命令:随时控制成本的工具
OpenClaw 内置了几个超级有用的命令,但很多人不知道。
/status– 查看当前会话状态在 Telegram 或 Discord 里输入
/status,你会看到:
当前使用的模型(可能你以为用的 Minimax,其实在用 Opus)
已消耗的 token 数量
当前上下文的 token 数量(这个很关键)
如果你看到上下文有 80 万 token(满额 100 万),说明你的会话已经严重臃肿了。
/compact– 压缩当前会话如果你正在处理一个大项目,不想开新会话(因为需要保留所有上下文),但又发现 token 用得太多,可以用
/compact。
这个命令会把当前会话压缩到原来的 10-15%。
比如你有 80 万 token 的上下文,压缩后可能只剩 10 万。下一条消息立刻省 70 万 token 的成本。
什么时候用compact:
会话很长,但你还需要继续
上下文超过 50 万 token
不想丢失当前的工作进度
/new– 开启全新会话这个命令会清空所有历史对话,给你一个全新的会话。
最佳实践:如果你在处理一个任务到一半,不想丢失进度,可以这样:
“请把我们当前的工作进度、遇到的问题、已尝试的方案、下一步计划写入 temporary.md 文件”
等代理写完,然后运行/new开新会话。
新会话里,告诉代理:
“读取 temporary.md,继续之前的工作”
这样你既清空了上下文,又不丢失进度。
/models– 切换模型在同一个会话中途,你可以切换模型。
10、设置支出限制:硬性控制烧钱速度
这是最后的保险,防止意外烧钱。
API 层级的支出限制:
如果你用 OpenRouter、Anthropic 或 OpenAI,你可以在 API 密钥层面设置消费上限。
操作步骤:
登录你的 API 提供商(OpenRouter/Anthropic/OpenAI)
找到你的 API 密钥
点击 “编辑” 或 “设置”
设置每日 / 每周 / 每月消费上限
比如设置每日 5 美元:
一旦达到 5 美元,API 会自动停止响应
第二天重置,继续可用
防止某个配置错误导致一天烧掉 100 美元
OpenClaw 层级的监控:
你还可以更高级一点,搭建一个监控系统:
每天从 OpenClaw 导出 token 消耗数据到数据库
从 API 提供商导出账单数据到数据库
用 Codex 策略(第 4 节)让代理帮你搭建一个仪表板
在仪表板里查看:
按天 / 周 / 月的消费
按任务类型的消费
按模型的消费
按代理的消费
设置预警:如果某天消费超过预算,自动发送 Telegram 通知提醒你。
更简单的方法:每周花 10 分钟,打开 API 提供商的账单页面,看看
这周花了多少钱
主要花在哪些模型上
是否符合预期
如果不满意,调整策略:
少发消息
换便宜模型
关闭某些 Cron
更频繁地刷新会话
11、 进阶技巧:让 OpenClaw 教你怎么用它
这是作者分享的一个很聪明的策略:让 OpenClaw 主动发现你的需求。
很多人把 OpenClaw 当成高级版的 ChatGPT,随便聊聊天、问问题。这样用不会产生价值。
更好的方式:在agents.md里加这样的指令
“观察我的对话模式。如果我多次提到某个话题(比如健康、项目、学习),主动问我是否要:
创建追踪系统
设置提醒
建立数据库
搭建仪表板
不要等我提出,要主动建议。”
实际效果:当你跟代理聊了几次关于 “想减肥”,它会说
“我注意到你 3 次提到想减肥了。要不要我帮你:
搭建一个每日饮食和运动记录系统
设置每天晚上 8 点的提醒,问你今天吃了什么、运动了没
创建一个数据库,90 天后可以看图表
用 Codex 搭建一个简单的仪表板
这样我能更好地帮你实现目标。”
这时候你才意识到:原来 OpenClaw 可以这么用!同样的逻辑适用于:
工作项目管理、学习进度追踪、财务记录、阅读列表、任何你反复提到的事情
让代理主动挖掘你的需求,而不是你自己想 “我能用 OpenClaw 做什么”。
12、 最后的建议:从一个代理开始,慢慢扩展
很多人(包括作者)一开始会犯的错误:一次性创建 4-5 个代理。
财务代理、YouTube 代理、研究代理、个人助理代理、项目管理代理
结果:
同时有 5 个对话在进行
每个都在消耗 token
但其中 3 个其实没啥用
正确的策略:从一个主代理开始。
第一个月:
只用一个代理
让它观察你的需求
让它主动建议功能
慢慢建立起你真正需要的系统
第二个月:
如果发现某个领域需要专门的代理(比如确实需要一个专门做 YouTube 研究的)
那时候再创建第二个代理
用不同的模型(主代理 Sonnet,专项代理 Minimax)
不要一开始就搞 5 个代理,那只会浪费钱。
用法转变:
❌ 把 OpenClaw 当 ChatGPT 用 → 随便聊天,问天气,看新闻
✅ 把 OpenClaw 当系统构建工具 → 搭建追踪系统、自动化流程、管理项目
一旦你建立起系统(健康追踪、项目管理、学习记录等),OpenClaw 的价值就会指数级增长。而你的 token 成本会因为优化而大幅下降。
💥 token 消耗的真相 —— 每次对话背后 OpenClaw 都在发送巨量隐藏上下文
💥 文件管理是关键 —— agents.md、soul.md、memory.md会越来越大,不控制就是烧钱
💥 用子代理处理大任务 —— 主会话保持轻量,复杂工作交给临时代理
💥 Codex 免费策略 —— 用 ChatGPT 订阅里自带的 token 跑编程任务,不花额外的钱
💥 数据库替代 MD 文件 —— 90 天的记录存 MD 会炸,存数据库几乎不耗 token
💥 模型选择的平衡 —— 不要无脑用最便宜的,小模型容易掉链子反而更贵
💥 Cron 和 Heartbeat 的陷阱 —— 15 分钟跑一次心跳,一天 96 次执行要 10-20 美元
💥 n8n 的妙用 —— 日报、天气、新闻这些不需要 AI,用 workflow 省 90% 成本
💥 会话管理命令 —— /status、/compact、/new、/models随时控制成本
💥 支出限制必须设 —— API 密钥设每日 5 美元上限,硬性控制烧钱速度
文章来源于: