文章背景图

OpenClaw 太贵?这套烧掉 3000 美金总结的方案,能帮你省 97% 的 Token 成本(附完整操作指南)

2026-03-03
6
-
- 分钟
|

OpenClaw 用着用着发现账单暴涨?一个月下来花了几百美金却感觉没干什么实事?你不是一个人。很多人兴冲冲地装上 OpenClaw,结果发现一个简单的 “今天天气怎么样” 要花 10-20 美分,一天发 10 条消息就是 2 美元,一周下来 15 美元没了。更可怕的是,如果你一个会话保持好几天不刷新,后面的每条消息可能要花 12 美分、13 美分,越来越贵。但真相是:OpenClaw 的 token 消耗有 90% 是可以避免的。问题不在工具本身,而在于你不了解它怎么花钱的。这篇教程会手把手教你三件事:文件管理、模型管理、会话管理。掌握这三点,你的 OpenClaw token 消耗可以直接降低 90% 以上。

01、OpenClaw 如何消耗 Token:你看不见的隐藏成本

先搞清楚钱是怎么花的,才能知道怎么省。

想象一下,你问 OpenClaw:“今天天气怎么样?”10 秒后它回答 “20 度,晴天”。看起来你只是发了个简单问题、收到个简单回答,对吧?

错了。在你看不见的后台,OpenClaw 其实在每次请求里塞进去了一大堆东西:

第一层:核心指令(无法修改)

OpenClaw 自己的系统指令,告诉它怎么运作、怎么响应、怎么调用工具。这部分你改不了,每次都会发送。

第二层:上下文文件

  • agents.md – 你的代理指令和行为规则

  • soul.md – 你设定的代理性格和沟通风格

  • memory.md – 代理的长期记忆,每次对话后都会追加内容

第三层:历史对话

所有之前的对话记录。你问 “天气怎么样”,它答 “20 度晴天”。然后你问 “我该穿什么”,这时候它会把前面那轮对话也一起发送过去。每一轮新对话,都会带着所有旧对话。这就是为什么 OpenClaw 这么贵。

举个例子:你用 Sonnet 4.6 模型,一个简单的 “天气” 问题可能要 10-20 美分。不是因为 “天气怎么样” 这几个字值 20 美分,而是因为 OpenClaw 为了保持自主性,必须每次都发送完整的上下文、工具定义、历史记录。

如果你一天发 10 条消息(真的不多),那就是 2 美元。如果你一个会话保持 7 天不刷新,后面的消息会越来越贵,因为上下文越积越多。

7 天 × 一天 10 条 × 平均 15 美分 = 大约 15 美元。

对比一下普通的 ChatGPT API 调用:

如果你直接用 OpenAI 的 chat completions API,发送 “天气怎么样”,收到 “20 度晴天”,可能只消耗 1000 个 token,成本大约 1-2 美分。10 条消息 10 美分。

差别在哪?普通 API 不是自主代理。它不能自己重启服务器、不能做健康检查、不能在出问题时自动修复。OpenClaw 可以。

比如你让 OpenClaw “把我的服务器更新到最新版本”,它需要执行 5 个循环: 

  1. 拉取更新信息

  2. 重启服务器

  3. 做健康检查

  4. 如果有问题就修复

  5. 回来告诉你完成了

这一个请求,实际上是 5 次完整的上下文发送。每次都带着所有文件、所有历史。所以有些任务的 token 消耗会爆炸性增长。

这就是为什么文件管理这么关键。


02、文件管理:控制 agents.md、soul.md、memory.md 的大小

打开 OpenClaw 的 UI,你会看到这些文件。第一步:截个图,看看它们现在多大。

不用打开文件看内容,就看外面显示的大小:

  • agents.md – 7.7KB? 70KB?

  • soul.md – 3.2KB? 30KB?

  • memory.md – 这个会随时间暴涨,10KB? 100KB? 500KB? 

如果你的agents.md超过 15KB,你可能在浪费钱。

优化agents.md的核心原则:简洁、明确、不重复

 很多人会在agents.md里写一大堆详细指令:“如果我说 A 你就做 B,如果我说 C 你就做 D…”。别这么干。正确的做法:

  • 核心行为规则:每条不超过 1-2 句话

  • 常用技能:写成简短的关键词或命令

  • 参考示例:给 1-2 个例子就够了,不要写 10 个

 举个例子,不要写:

“当我要求你做研究时,你应该先问我研究的主题是什么,然后问我需要多深入的研究,然后问我…(巴拉巴拉 500 字)”

应该写:

“研究任务:询问主题和深度,使用子代理完成,交付摘要”

 

soul.md也一样。不要写一整篇小说描述你的代理。应该 “有同理心、专业、友好、幽默…”。写 3-5 个关键词就够了。模型会理解的。

 memory.md是最大的问题。

 这个文件会在每次对话后追加新内容。用了一个月?几百 KB。用了六个月?可能上 MB。而这个文件在每次请求时都会被完整发送。

 解决方法:定期清理memory.md

 每个月或每两周,让你的代理帮你做一次 “记忆压缩”:

“请总结 memory.md 中最重要的 10 件事,删除重复和过时的信息,将文件压缩到 5KB 以内”

代理会帮你整理,保留核心信息,删掉噪音。一次压缩可能让你的每条消息省 2-5 美分。

03、用子代理处理大任务:保持主会话轻量化

这是个很多人不知道的技巧:不要让主代理干重活。假设你想让 OpenClaw 帮你:

  • 研究某个技术话题

  • 写一个完整的代码项目

  • 分析一大堆数据

如果你在主会话里让它做这些,所有的中间步骤、所有的代码、所有的分析结果都会留在你的主会话上下文里。之后你每发一条消息,都要带着这些垃圾。

 正确的做法:创建子代理。

 在agents.md里加一条指令:

 

“对于复杂任务(研究、编程、数据分析),创建临时子代理完成。子代理完成后,只返回最终结果给主会话。”

子代理的好处:

  • 它有自己的会话和 token

  • 它完成工作后,只把结果(比如 10% 的关键信息)返回给主会话

  • 主会话保持轻量,后续对话不会被之前的大任务拖累

实际操作:
当你说 “帮我研究一下 xx 技术”,代理会:

  1. 创建一个临时的研究子代理

  2. 子代理去做深度研究(消耗它自己的 token)

  3. 完成后,子代理返回一个简短摘要给主代理

  4. 主会话只记录这个摘要,不记录整个研究过程

这样你的主会话永远保持干净。

04、Codex 免费策略:用 ChatGPT 订阅里的 token 跑编程任务

 这是个超级省钱的技巧。如果你有 ChatGPT Plus 订阅(每月 20 美元),你已经有了一定数量的免费 token。为什么不用这些 token 来跑 OpenClaw 的编程任务?

 核心思路:

 你的 OpenClaw 运行在一台服务器或电脑上。你可以在同一台机器上安装 Cursor 或其他使用 Codex 的工具,然后用 OAuth 认证你的 ChatGPT 账号。

 配置步骤:

  1. 在运行 OpenClaw 的机器上打开新的终端

  2. 安装 Cursor 或 Codex 客户端

  3. 用 OAuth 认证(不是 API key,是直接登录 ChatGPT 账号)

  4. agents.md里添加指令:

    “编程任务:启动本地 Codex 会话,使用 OAuth 认证的免费 token。完成后返回代码,我会在localhost查看。”

     

这样的好处:

  • 不消耗你的 OpenClaw API 配额

  • 用你已经付费的 ChatGPT 订阅里的 token

  • 代码质量往往更高(Codex 专门为编程优化)

  • 你的主 OpenClaw 代理只需要等待,不需要自己写代码

 建议用 Sonnet 4.6 或 Opus 4.6 来处理这个配置,因为小模型可能搞不定这么复杂的设置。 

05、 数据库替代 MD 文件:长期数据不要放文本里

 很多人刚开始用 OpenClaw 时会发现:它喜欢把所有东西写进 MD 文件。

 你说 “帮我记录每天的健康数据”,它会创建一个health_log.md,然后每天追加一行:

  • 2026-02-01: 跑步 30 分钟,吃了沙拉

  • 2026-02-02: 健身房 1 小时,吃了鸡胸肉

  • 2026-02-03: …

 90 天后,这个文件有 90 行。如果这个文件被包含在会话上下文里(很多人会这么设置),你每次发消息都要带着这 90 行数据。

 正确的做法:用数据库。

 OpenClaw 自带数据库功能。在agents.md里加这条指令:

“所有长期数据(任务、健康记录、项目进度)存入数据库,不要写入 MD 文件。”

 

然后用 Codex 策略(上一节)让代理帮你搭建一个简单的查看面板。这样:

  • 数据存在数据库里,不占用会话上下文

  • 你想看数据时,打开localhost上的面板,直接查看

  • 不需要问代理 “给我看最近 30 天的数据”(这又是一次昂贵的 token 消耗)

一个实际例子:

 假设你用 OpenClaw 做健康追踪:

  • 每天记录饮食和运动

  • 90 天后有 90 条记录

  • 如果存 MD 文件:每次对话 + 5-10 美分(因为要发送整个文件)

  • 如果存数据库:每次对话 + 0 美分(数据库不在上下文里)

3 个月下来,这一项就能省几十美元。


06、模型选择的平衡:不要无脑选最便宜的

 很多人看到 token 成本高,第一反应是:“换最便宜的模型!”

 这是个陷阱。小模型(30B、70B 参数的本地模型)有几个致命问题:

  • 上下文理解能力差:很容易丢失之前的对话

  • 工具调用能力弱:需要连续执行 5 个工具调用时经常卡住

  • 容易被 prompt injection:安全性差

  • 频繁出错:导致你要重复发送请求,反而更贵

 举个例子:

 你用小模型,让它 “更新服务器”。它可能: 

  1. 第一次尝试失败

  2. 你重发指令

  3. 第二次尝试还是失败

  4. 你再重发

  5. 第三次才成功

 看起来模型便宜,但你发了 3 次请求。总成本可能比用 Sonnet 4.6 一次成功还贵。

 正确的策略:

  • 主代理用好模型:Sonnet 4.6 或 Opus 4.6,保证可靠性

  • 子代理可以用中等模型:Minimax 2.5,便宜但能完成简单任务

  • Heartbeat 用中等模型:不要用最小的,但也不用最大的

 价值判断:

 如果 OpenClaw 每天帮你:

  • 追踪健康数据,让你 3 个月减掉 10 公斤

  • 管理项目任务,让你效率提升 30%

  • 自动化重复工作,每天省 1 小时

 那么每天花 1-2 美元是完全值得的。比健身教练便宜多了。

 但如果你只是用它闲聊、问天气、看新闻,那每一分钱都是浪费。

 核心原则:先找到价值,再优化成本。不要为了省钱而牺牲价值。

07、Cron Jobs 和 Heartbeats:定时任务的成本陷阱

 OpenClaw 有两种自动化机制:

  • Cron Jobs(定时任务):在特定时间执行任务

  • Heartbeats(心跳检测):定期 “醒来” 检查状态,会带着当前会话的所有历史对话,非常容易变得昂贵

Cron Jobs 的成本:

 假设你设置了一个每天早上 8 点的 Cron:“给我发送今天的天气、3 条 AI 新闻、推荐 YouTube 视频”。

 每次执行这个 Cron,OpenClaw 会:

  1. 加载所有上下文文件(agents.mdsoul.mdmemory.md

  2. 执行网络搜索

  3. 生成报告

  4. 发送给你

 一次可能消耗 10-20 美分。看起来不多,但如果你设置了 5 个不同的 Cron(早报、午间提醒、晚间总结等),一天就是 50 美分 - 1 美元。

Heartbeats 更可怕:

 假设你设置心跳每 15 分钟检查一次。一天 24 小时 = 96 次检查。

 如果你的主会话已经有 20-30 条历史消息,每次心跳都要带着这些消息。一次心跳可能 10-20 美分,96 次 = 一天 10-20 美元!

 优化策略:

  1. Cron Jobs 用中等模型:不要用 Opus,用 Minimax 2.5 或类似的

  2. Heartbeats 设置长间隔:不要 15 分钟,至少 1 小时或更长

  3. Heartbeats 用轻量模型:除非真的需要高质量推理

  4. 默认关闭 Heartbeats:在 config 文件里设置为 0 分钟(完全关闭)

 如何在 config 文件里关闭 Heartbeats:

 找到你的 config 文件,设置:

 plaintext

heartbeat_interval: 0

只在真正需要时才开启,比如:

  • 监控长时间运行的任务(比如 Codex 编程会话可能跑 6 小时)

  • 夜间需要自动修复问题的场景

 大部分时候,你不需要 Heartbeats。 

08、n8n 的妙用:日报、提醒这些不需要 AI

天气:调用天气 API,拿到数据,格式化

 新闻:调用新闻 API,拿到标题,排序

 YouTube 推荐:调用 YouTube API,按关键词筛选

 这些步骤,用 n8n 这样的 workflow 工具几乎不花钱。

 n8n 是什么?一个自动化 workflow 工具,可以连接各种 API、处理数据、发送通知。关键是:大部分操作不消耗 AI token。

 实际操作:用 n8n 替代 OpenClaw Cron

 假设你想要每天早上的报告,包括:

  • 当地天气

  • 3 条 AI trending 新闻

  • 推荐 YouTube 视频

 用 OpenClaw 做:

  1. 触发 Cron

  2. OpenClaw 调用天气 API(AI token)

  3. OpenClaw 搜索新闻(AI token)

  4. OpenClaw 筛选 YouTube(AI token)

  5. OpenClaw 格式化(AI token)

  6. 发送到 Telegram(AI token)

 成本:10-50 美分,取决于复杂度。

 用 n8n 做:

  1. n8n 定时触发(免费)

  2. 调用天气 API(免费)

  3. 调用新闻 API(免费)

  4. 调用 YouTube API(免费)

  5. 格式化数据(免费)

  6. 发送到 Telegram(免费)

  7. 只在必要时调用一次 AI(比如总结新闻)(~2 美分)

 成本:2 美分。省了 80-95%。

 怎么设置 n8n?

  1. 在 Docker 容器里安装 n8n

  2. 把 n8n 连接到 OpenClaw

  3. 用 Tailscale 保证安全

  4. 设置基本的 workflow

 n8n 和 OpenClaw 的配合使用:

 不是说完全不用 OpenClaw,而是:

  • 简单的数据抓取、格式化、定时发送 → n8n

  • 需要推理、决策、复杂工具调用 → OpenClaw

 甚至可以这样:用 n8n 抓取你今天的日历,看看你要见谁,然后把那个人的名字和公司发给 OpenClaw,让 OpenClaw 做深度研究,生成谈话要点。最后 n8n 把结果发给你。

 这样你只为 “AI 推理” 这部分付费,数据抓取和发送都是免费的。

 实际应用场景:

 假设你要用 OpenClaw 设置 n8n(上一节提到的):

  1. 开始用 Opus 4.6 处理复杂的安装配置

  2. 安装完成后,输入/models

  3. 切换到 Minimax 2.5

  4. 用便宜模型继续日常对话和测试

 这样复杂任务用好模型,简单任务用便宜模型,在同一个会话里实现。

09、会话管理命令:随时控制成本的工具

OpenClaw 内置了几个超级有用的命令,但很多人不知道。

  1. /status – 查看当前会话状态

     

    在 Telegram 或 Discord 里输入/status,你会看到:

  • 当前使用的模型(可能你以为用的 Minimax,其实在用 Opus)

  • 已消耗的 token 数量

  • 当前上下文的 token 数量(这个很关键)

如果你看到上下文有 80 万 token(满额 100 万),说明你的会话已经严重臃肿了。

  1. /compact – 压缩当前会话

     

    如果你正在处理一个大项目,不想开新会话(因为需要保留所有上下文),但又发现 token 用得太多,可以用/compact

这个命令会把当前会话压缩到原来的 10-15%。

 比如你有 80 万 token 的上下文,压缩后可能只剩 10 万。下一条消息立刻省 70 万 token 的成本。

 什么时候用compact

  • 会话很长,但你还需要继续

  • 上下文超过 50 万 token

  • 不想丢失当前的工作进度

  1. /new – 开启全新会话

    这个命令会清空所有历史对话,给你一个全新的会话。

 最佳实践:如果你在处理一个任务到一半,不想丢失进度,可以这样:

 

“请把我们当前的工作进度、遇到的问题、已尝试的方案、下一步计划写入 temporary.md 文件”

 

 等代理写完,然后运行/new开新会话。

 新会话里,告诉代理:

 

“读取 temporary.md,继续之前的工作”

 

 这样你既清空了上下文,又不丢失进度。

  1. /models – 切换模型

     

    在同一个会话中途,你可以切换模型。 

10、设置支出限制:硬性控制烧钱速度

这是最后的保险,防止意外烧钱。

 API 层级的支出限制:

 如果你用 OpenRouter、Anthropic 或 OpenAI,你可以在 API 密钥层面设置消费上限。

 操作步骤:

  1. 登录你的 API 提供商(OpenRouter/Anthropic/OpenAI)

  2. 找到你的 API 密钥

  3. 点击 “编辑” 或 “设置”

  4. 设置每日 / 每周 / 每月消费上限

 比如设置每日 5 美元:

  • 一旦达到 5 美元,API 会自动停止响应

  • 第二天重置,继续可用

  • 防止某个配置错误导致一天烧掉 100 美元

 OpenClaw 层级的监控:

 你还可以更高级一点,搭建一个监控系统:

  1. 每天从 OpenClaw 导出 token 消耗数据到数据库

  2. 从 API 提供商导出账单数据到数据库

  3. 用 Codex 策略(第 4 节)让代理帮你搭建一个仪表板

  4. 在仪表板里查看:

    • 按天 / 周 / 月的消费

    • 按任务类型的消费

    • 按模型的消费

    • 按代理的消费

    • 设置预警:如果某天消费超过预算,自动发送 Telegram 通知提醒你。

     

 更简单的方法:每周花 10 分钟,打开 API 提供商的账单页面,看看

  • 这周花了多少钱

  • 主要花在哪些模型上

  • 是否符合预期

 如果不满意,调整策略:

  • 少发消息

  • 换便宜模型

  • 关闭某些 Cron

  • 更频繁地刷新会话 

11、 进阶技巧:让 OpenClaw 教你怎么用它

 这是作者分享的一个很聪明的策略:让 OpenClaw 主动发现你的需求。

 很多人把 OpenClaw 当成高级版的 ChatGPT,随便聊聊天、问问题。这样用不会产生价值。

 更好的方式:在agents.md里加这样的指令

“观察我的对话模式。如果我多次提到某个话题(比如健康、项目、学习),主动问我是否要:

 

  1. 创建追踪系统

  2. 设置提醒

  3. 建立数据库

  4. 搭建仪表板

     

    不要等我提出,要主动建议。”

 

 实际效果:当你跟代理聊了几次关于 “想减肥”,它会说

“我注意到你 3 次提到想减肥了。要不要我帮你:

 

  1. 搭建一个每日饮食和运动记录系统

  2. 设置每天晚上 8 点的提醒,问你今天吃了什么、运动了没

  3. 创建一个数据库,90 天后可以看图表

  4. 用 Codex 搭建一个简单的仪表板

     

    这样我能更好地帮你实现目标。”

 

 这时候你才意识到:原来 OpenClaw 可以这么用!同样的逻辑适用于:

 工作项目管理、学习进度追踪、财务记录、阅读列表、任何你反复提到的事情

 让代理主动挖掘你的需求,而不是你自己想 “我能用 OpenClaw 做什么”。 

12、 最后的建议:从一个代理开始,慢慢扩展

很多人(包括作者)一开始会犯的错误:一次性创建 4-5 个代理。

财务代理、YouTube 代理、研究代理、个人助理代理、项目管理代理

 结果:

  • 同时有 5 个对话在进行

  • 每个都在消耗 token

  • 但其中 3 个其实没啥用

 正确的策略:从一个主代理开始。

 第一个月:

  • 只用一个代理

  • 让它观察你的需求

  • 让它主动建议功能

  • 慢慢建立起你真正需要的系统

 第二个月:

  • 如果发现某个领域需要专门的代理(比如确实需要一个专门做 YouTube 研究的)

  • 那时候再创建第二个代理

  • 用不同的模型(主代理 Sonnet,专项代理 Minimax)

 不要一开始就搞 5 个代理,那只会浪费钱。

 用法转变:

  把 OpenClaw 当 ChatGPT 用 → 随便聊天,问天气,看新闻

  把 OpenClaw 当系统构建工具 → 搭建追踪系统、自动化流程、管理项目

 一旦你建立起系统(健康追踪、项目管理、学习记录等),OpenClaw 的价值就会指数级增长。而你的 token 成本会因为优化而大幅下降。

💥 token 消耗的真相 —— 每次对话背后 OpenClaw 都在发送巨量隐藏上下文

💥 文件管理是关键 —— agents.mdsoul.mdmemory.md会越来越大,不控制就是烧钱

💥 用子代理处理大任务 —— 主会话保持轻量,复杂工作交给临时代理

💥 Codex 免费策略 —— 用 ChatGPT 订阅里自带的 token 跑编程任务,不花额外的钱

💥 数据库替代 MD 文件 —— 90 天的记录存 MD 会炸,存数据库几乎不耗 token

💥 模型选择的平衡 —— 不要无脑用最便宜的,小模型容易掉链子反而更贵

💥 Cron 和 Heartbeat 的陷阱 —— 15 分钟跑一次心跳,一天 96 次执行要 10-20 美元

💥 n8n 的妙用 —— 日报、天气、新闻这些不需要 AI,用 workflow 省 90% 成本

💥 会话管理命令 —— /status/compact/new/models随时控制成本

💥 支出限制必须设 —— API 密钥设每日 5 美元上限,硬性控制烧钱速度

文章来源于:

https://zxiaolin.com/1823.html

评论交流

文章目录