放弃AI，Agent才是你真正需要的东西

2026 年了，AI 正式进入大众视野满打满算第四个年头。从最初的"人工智障"到如今的超级智能，这个速度令人咂舌。就拿中国来说，虽然大多数人用不上最新的御三家（ChatGPT、Gemini、Claude），但你要说"豆包"，相信大家都不会陌生。

豆包就是一个非常典型的 AI，具体来说，是一个"窗口对话式 AI"。这个形态跟 GPT 刚出道那年一模一样——用户在一个聊天窗口中对话，一问一答，如果觉得回答还不错，那就复制粘贴出来用，也就是我个人定义的"复制粘贴式工作"。

这种形态作为陪伴聊天，我觉得蛮不错的。但如果想用到工作上，从大幅提高生产力的角度来说，这种对话式 AI 应该马上放弃掉。请你立刻放弃使用豆包、ChatGPT、Gemini、Claude 这种对话聊天式的网页端 AI，你更应该去接触 Codex、Claude Code、Hermes、OpenClaw 这类在本地拥有电脑操控能力的 Agent。

OpenClaw（小龙虾）—— Agent 的全民普及

提起小龙虾，我相信只要是接触互联网的，大部分人都会有所耳闻。我个人认为这是 AI 朝着 Agent 方向发展的一次非常重要的全民普及事件。

在小龙虾之前，不管是 Claude Code 还是 Codex，使用者大多是程序员，用来进行程序开发工作，并没有普及到普通人的日常。而小龙虾才是真正让普通人体验到 Agent 魅力的产品。

我还记得部署了小龙虾之后，我干的第一件事就是在飞书上给它发了一条消息，让它帮我截一张图，然后帮我把电脑关机。那一刻，我是真的感受到了 AI 对现实生活产生的影响，当时非常震撼。

小龙虾之后，基本上各大厂都在跟进，推出各种 Agent 助理，这个趋势已经不可逆了。

单 Agent 和多 Agent

小龙虾就是 Agent，就是 AI 带给普通人的那一点震撼。到目前为止，市面上已经推出了非常多贴合普通人工作、非常好用、便于理解的工具。比如 Codex，它已经推出了桌面端，并且进化出了电脑操控等各种插件，用来进行日常工作完全没问题。还有 Claude Code 衍生出来的 Claude Work、Claude Desktop，也可以实现跟 Codex 相同的工作。包括后来的 Hermes，还有各种大厂套壳开发的 AIgent 助理等工具，层出不穷。

目前互联网上大部分人在吹捧 Codex，主流也都在使用这个工具。但就我个人而言，现在的Codex 代表的是 Agent 未来的发展趋势，但是我认为这个趋势绝对不仅仅只是一个单 Agent。除非有一天 AI 的进化能力达到了钢铁侠里贾维斯那样的智能——拥有了自我辩证的能力——那时候用单 Agent 没问题。但就目前阶段而言，我觉得多 Agent 才是当前的主流方向。

为什么？因为单 Agent 有一个无法回避的缺陷：幻觉和顺从。

不管你用的是豆包、ChatGPT、Gemini 还是 Claude，你会发现在跟单个 AI 对话的过程中，不管你说的是什么建议、什么方向，它都会顺着你的方向去思考、去走，而不会站出来反驳你说"你这个观点不对"。这种体验，只要你是经常使用 AI 工具的人，应该能感受得到。

如果你想要更强烈的体感，可以去体验一下 Gemini。Gemini 真的是一个乖宝宝——不管你说什么，它都会上来先夸你一顿，然后沿着你的想法继续往下走。哪怕你跟它说"不要顺从我"，它会站出来反驳你几句，但后面又开始顺从你。

这就导致了一个问题：当你需要进行深度思考，或者需要辩证讨论、需要客观事实支撑的工作时，跟单个 Agent 对话会非常难受。

在这种情况下，我们需要多 Agent 团队。 给每个 Agent 塞入不同的性格——就跟我目前的团队构建一样：有主将调控全场的，有质疑者对团队想法提出刁钻评论的，让大家站在一起能够更好地讨论一个事情。这样你才能从中得到一个较为客观、较为公正的好点子。

如果你使用单 Agent，它只会随着你的想法不断往下走，不知道你的想法是好是坏，反正它觉得你的想法就是对的，就要帮你实现。当然这也不是说不行，但往往做着做着你就会发现——做不通了。

还有一个实际问题：臃肿。拿 Hermes 举例，里面的 Agent 的确可以自我进化，自己沉淀 skill。但如果你把所有工作内容和生活全部交给一个 Agent 去沟通，这个 Agent 会积累多少不同的 skill？每当你跟它对话时，它要根据你的问题调用不同的 skill 来执行，当所有内容都只跟一个 Agent 沟通时，它会变得越来越臃肿。臃肿带来的问题就是执行越来越不精准——有时候调用错技能，每次执行都消耗大量 token。

人类是高级智能动物，但人类都有分工。公司董事长为什么不一个人把所有事全干了？因为人类都有固定的领域和发展方向。那为什么不能给 Agent 也固定一个发展方向呢？各有所长，不断强化各个 Agent 在对应领域的能力，然后相互配合。这才是目前用 AI 突破幻觉瓶颈、正常开展工作的方式。

使用 Agent 的正确方式

这个时候我们不得不聊一聊使用 Agent 的正确方式。

我从 ChatGPT 刚对外公开的时候就开始使用 AI，这么多年下来，尤其是 OpenClaw 小龙虾得到突破之后，我在使用体验上最大的改变就是：从只在聊天窗口中对话工作，逐步转变为在本地使用 Obsidian 来沉淀所有数据。

SOP 工作流程、独立站的产品信息、跟 AI 之间的协作规范，我全部放在 Obsidian 里面。之前我用的是 Notion，不是说它不好，而是它的文件结构不是 Markdown 文档，在 AI 时代没法被 AI 直接搜索关联和修改，哪怕它有第三方连接。这也是迫使我转到 Obsidian——以本地文件为主的应用——的原因。

就我个人目前的经验来看，在 AI 时代，最有价值的东西不是你使用了什么 AI 工具，不是你学会了什么 AI 新技术，不是你又掌握了什么插件。No，不是这样的。最重要的是：现在、立刻、马上，你需要去使用本地数据库来沉淀你工作的 SOP 流程。

换一种说法：你把这些 SOP 用中文写下来之后，让 AI 把它沉淀为一个可执行的 skill——一个工作技能。这本质上就是"蒸馏自己"。就像互联网上大家调侃的——DeepSeek 蒸馏 Claude，阿里蒸馏其他模型——一个老师教学生的蒸馏模式。所以也就衍生出了"蒸馏你的同事"、"蒸馏自己"这些说法。

你需要不断把个人技能、经验、工作流程全部沉淀在本地，用 SOP 文档去承载，然后转变为 skill 交给 AI，让它逐步替代你工作中那些标准化的、重复性的部分。这才是 AI 最大的价值。

本地的数据库和你的 skill 才是真正有价值的东西。因为目前的 AI 智能——不管是 Claude Opus 4.6、ChatGPT、Gemini，还是国产的 DeepSeek 等模型——从智力上来说已经超越了 90% 的人。智能是过剩的。所以从现在往后，不管你使用任何 Agent，不管 Agent 发展得多强大、多智能，只要你本地的数据库在这里，只要你的 skill 在这里，那么不管你何时切换到任何一个新的 Agent，它都能在几秒钟内扫描你的本地数据库和 skill，然后快速接管之前所有的工作。

这跟卡帕西说的差不多——用 Obsidian 打造一个 AI 全自动化的外挂大脑。现在使用 AI，用好 AI 的基础就是学会自我反思，学会制定规则。

因为越往后走，AI 的应用能力会越来越强。Codex 从之前只能作为编程工具，到现在逐步进化为拥有电脑操控能力，甚至可以帮你剪视频、执行各种日常任务。往后它们能应用的范围只会越来越大。

所以人类在 AI 时代的角色正在发生转变——从以前坐在电脑前敲键盘的繁重体力活，逐步转变为规则的制定者。你需要把大量时间花费在决策、思考、制定规则上，然后让 AI 帮你完成执行。

虽然现在的 token 费用还是挺贵的，但就跟当初 4G 流量"一个晚上烧一套房"一样，往后 token 费用也会越来越低，逐步融入普通大众的日常开支。AI 进入到人类实际生活和工作中的程度会越来越深。人类如果不想被淘汰，发展方向就是从执行者变为决策者，变为规则的制定者。

必须学会用 API

说完本地数据库，还有一个必须强调的点：如果你想用好 Agent，现在就必须学会使用 API。

API 不复杂。打个比方：你在移动、联通、电信分别办了一张卡，往里面充不同的钱，按量扣费。而中转站（聚合 API）就相当于办了一张三网通——一张卡可以同时消费三个网络，根据网络属性扣相应的钱。

为什么必须用 API？因为多 Agent 协作需要为不同 Agent 搭配不同模型。比如我目前团队里：主将 Max 搭配 Claude Opus 4.6，负责营销和视觉设计的用 GPT-5.5，生活助理用 DeepSeek V4。如果每个模型都去官方开会员，那也太贵了。通过 API 按量计费，就可以在一个面板里同时使用多个不同模型，按需消费即可。

总结两个你必须掌握的技能：