2026 年了,AI 正式进入大众视野满打满算第四个年头。从最初的"人工智障"到如今的超级智能,这个速度令人咂舌。就拿中国来说,虽然大多数人用不上最新的御三家(ChatGPT、Gemini、Claude),但你要说"豆包",相信大家都不会陌生。

豆包就是一个非常典型的 AI,具体来说,是一个"窗口对话式 AI"。这个形态跟 GPT 刚出道那年一模一样——用户在一个聊天窗口中对话,一问一答,如果觉得回答还不错,那就复制粘贴出来用,也就是我个人定义的"复制粘贴式工作"。

这种形态作为陪伴聊天,我觉得蛮不错的。但如果想用到工作上,从大幅提高生产力的角度来说,这种对话式 AI 应该马上放弃掉。请你立刻放弃使用豆包、ChatGPT、Gemini、Claude 这种对话聊天式的网页端 AI,你更应该去接触 Codex、Claude Code、Hermes、OpenClaw 这类在本地拥有电脑操控能力的 Agent。


OpenClaw(小龙虾)—— Agent 的全民普及

提起小龙虾,我相信只要是接触互联网的,大部分人都会有所耳闻。我个人认为这是 AI 朝着 Agent 方向发展的一次非常重要的全民普及事件。

CleanShot 2026-06-25 at 13.40.21@2x.png

在小龙虾之前,不管是 Claude Code 还是 Codex,使用者大多是程序员,用来进行程序开发工作,并没有普及到普通人的日常。而小龙虾才是真正让普通人体验到 Agent 魅力的产品。

我还记得部署了小龙虾之后,我干的第一件事就是在飞书上给它发了一条消息,让它帮我截一张图,然后帮我把电脑关机。那一刻,我是真的感受到了 AI 对现实生活产生的影响,当时非常震撼。

小龙虾之后,基本上各大厂都在跟进,推出各种 Agent 助理,这个趋势已经不可逆了。


单 Agent 和多 Agent

小龙虾就是 Agent,就是 AI 带给普通人的那一点震撼。到目前为止,市面上已经推出了非常多贴合普通人工作、非常好用、便于理解的工具。比如 Codex,它已经推出了桌面端,并且进化出了电脑操控等各种插件,用来进行日常工作完全没问题。还有 Claude Code 衍生出来的 Claude Work、Claude Desktop,也可以实现跟 Codex 相同的工作。包括后来的 Hermes,还有各种大厂套壳开发的 AIgent 助理等工具,层出不穷。

目前互联网上大部分人在吹捧 Codex,主流也都在使用这个工具。但就我个人而言,现在的Codex 代表的是 Agent 未来的发展趋势,但是我认为这个趋势绝对不仅仅只是一个单 Agent。除非有一天 AI 的进化能力达到了钢铁侠里贾维斯那样的智能——拥有了自我辩证的能力——那时候用单 Agent 没问题。但就目前阶段而言,我觉得多 Agent 才是当前的主流方向。

为什么?因为单 Agent 有一个无法回避的缺陷:幻觉和顺从

不管你用的是豆包、ChatGPT、Gemini 还是 Claude,你会发现在跟单个 AI 对话的过程中,不管你说的是什么建议、什么方向,它都会顺着你的方向去思考、去走,而不会站出来反驳你说"你这个观点不对"。这种体验,只要你是经常使用 AI 工具的人,应该能感受得到。

如果你想要更强烈的体感,可以去体验一下 Gemini。Gemini 真的是一个乖宝宝——不管你说什么,它都会上来先夸你一顿,然后沿着你的想法继续往下走。哪怕你跟它说"不要顺从我",它会站出来反驳你几句,但后面又开始顺从你。

这就导致了一个问题:当你需要进行深度思考,或者需要辩证讨论、需要客观事实支撑的工作时,跟单个 Agent 对话会非常难受。

在这种情况下,我们需要多 Agent 团队。 给每个 Agent 塞入不同的性格——就跟我目前的团队构建一样:有主将调控全场的,有质疑者对团队想法提出刁钻评论的,让大家站在一起能够更好地讨论一个事情。这样你才能从中得到一个较为客观、较为公正的好点子。

CleanShot 2026-06-25 at 13.41.20@2x.png

如果你使用单 Agent,它只会随着你的想法不断往下走,不知道你的想法是好是坏,反正它觉得你的想法就是对的,就要帮你实现。当然这也不是说不行,但往往做着做着你就会发现——做不通了。

还有一个实际问题:臃肿。拿 Hermes 举例,里面的 Agent 的确可以自我进化,自己沉淀 skill。但如果你把所有工作内容和生活全部交给一个 Agent 去沟通,这个 Agent 会积累多少不同的 skill?每当你跟它对话时,它要根据你的问题调用不同的 skill 来执行,当所有内容都只跟一个 Agent 沟通时,它会变得越来越臃肿。臃肿带来的问题就是执行越来越不精准——有时候调用错技能,每次执行都消耗大量 token。

人类是高级智能动物,但人类都有分工。公司董事长为什么不一个人把所有事全干了?因为人类都有固定的领域和发展方向。那为什么不能给 Agent 也固定一个发展方向呢?各有所长,不断强化各个 Agent 在对应领域的能力,然后相互配合。这才是目前用 AI 突破幻觉瓶颈、正常开展工作的方式。


使用 Agent 的正确方式

这个时候我们不得不聊一聊使用 Agent 的正确方式。

我从 ChatGPT 刚对外公开的时候就开始使用 AI,这么多年下来,尤其是 OpenClaw 小龙虾得到突破之后,我在使用体验上最大的改变就是:从只在聊天窗口中对话工作,逐步转变为在本地使用 Obsidian 来沉淀所有数据。

CleanShot 2026-06-25 at 13.42.15@2x.png

SOP 工作流程、独立站的产品信息、跟 AI 之间的协作规范,我全部放在 Obsidian 里面。之前我用的是 Notion,不是说它不好,而是它的文件结构不是 Markdown 文档,在 AI 时代没法被 AI 直接搜索关联和修改,哪怕它有第三方连接。这也是迫使我转到 Obsidian——以本地文件为主的应用——的原因。

就我个人目前的经验来看,在 AI 时代,最有价值的东西不是你使用了什么 AI 工具,不是你学会了什么 AI 新技术,不是你又掌握了什么插件。No,不是这样的。 最重要的是:现在、立刻、马上,你需要去使用本地数据库来沉淀你工作的 SOP 流程。

换一种说法:你把这些 SOP 用中文写下来之后,让 AI 把它沉淀为一个可执行的 skill——一个工作技能。这本质上就是"蒸馏自己"。就像互联网上大家调侃的——DeepSeek 蒸馏 Claude,阿里蒸馏其他模型——一个老师教学生的蒸馏模式。所以也就衍生出了"蒸馏你的同事"、"蒸馏自己"这些说法。

你需要不断把个人技能、经验、工作流程全部沉淀在本地,用 SOP 文档去承载,然后转变为 skill 交给 AI,让它逐步替代你工作中那些标准化的、重复性的部分。这才是 AI 最大的价值。

本地的数据库和你的 skill 才是真正有价值的东西。因为目前的 AI 智能——不管是 Claude Opus 4.6、ChatGPT、Gemini,还是国产的 DeepSeek 等模型——从智力上来说已经超越了 90% 的人。智能是过剩的。所以从现在往后,不管你使用任何 Agent,不管 Agent 发展得多强大、多智能,只要你本地的数据库在这里,只要你的 skill 在这里,那么不管你何时切换到任何一个新的 Agent,它都能在几秒钟内扫描你的本地数据库和 skill,然后快速接管之前所有的工作。

这跟卡帕西说的差不多——用 Obsidian 打造一个 AI 全自动化的外挂大脑。现在使用 AI,用好 AI 的基础就是学会自我反思,学会制定规则

因为越往后走,AI 的应用能力会越来越强。Codex 从之前只能作为编程工具,到现在逐步进化为拥有电脑操控能力,甚至可以帮你剪视频、执行各种日常任务。往后它们能应用的范围只会越来越大。

所以人类在 AI 时代的角色正在发生转变——从以前坐在电脑前敲键盘的繁重体力活,逐步转变为规则的制定者。你需要把大量时间花费在决策、思考、制定规则上,然后让 AI 帮你完成执行。

虽然现在的 token 费用还是挺贵的,但就跟当初 4G 流量"一个晚上烧一套房"一样,往后 token 费用也会越来越低,逐步融入普通大众的日常开支。AI 进入到人类实际生活和工作中的程度会越来越深。人类如果不想被淘汰,发展方向就是从执行者变为决策者,变为规则的制定者。


必须学会用 API

说完本地数据库,还有一个必须强调的点:如果你想用好 Agent,现在就必须学会使用 API。

API 不复杂。打个比方:你在移动、联通、电信分别办了一张卡,往里面充不同的钱,按量扣费。而中转站(聚合 API)就相当于办了一张三网通——一张卡可以同时消费三个网络,根据网络属性扣相应的钱。

CleanShot 2026-06-25 at 13.43.15@2x.png

为什么必须用 API?因为多 Agent 协作需要为不同 Agent 搭配不同模型。比如我目前团队里:主将 Max 搭配 Claude Opus 4.6,负责营销和视觉设计的用 GPT-5.5,生活助理用 DeepSeek V4。如果每个模型都去官方开会员,那也太贵了。通过 API 按量计费,就可以在一个面板里同时使用多个不同模型,按需消费即可。

总结两个你必须掌握的技能:

  1. 学会在本地沉淀你的 skill 和 SOP 标准化工作流程
  2. 学会使用 API 按量调用不同模型

这是未来想提升个人能力,你绝对不能错过的两个点。


用哪个

如果让我选择现在市面上用哪一个 Agent 作为主力,我首选 Hermes。原因如下:

  • 自带进化功能:Agent 可以根据对话自动沉淀不同的 skill
  • 开源:可以根据个人喜好完成高度自定义,让它变成更贴合你使用需求的工作台
  • 灵活接入:你可以为 Hermes 接入各种不同类型的模型,想用哪个都行
CleanShot 2026-06-25 at 13.43.55@2x.png

当然 OpenClaw 也是一样的,我只是从个人角度比较喜欢 Hermes 而已。

至于 Codex、Claude、Gemini 这些非常强大的模型,我会通过 Hermes 去调用它们来完成工作。比如 Codex 在编程上确实很强——我之前试过用 Hermes 帮我编辑一个小组件,做出来的东西确实没有 Codex 好。

所以就是取各家精华。市面上没有一个 All-in-one 的完美工具,只有最适合某个场景的工具。

我个人的使用方式是:

  • Hermes 充当我的超级大脑和助理,日常工作和生活都跟它沟通,由它选择性地调用 Codex、Claude 等完成具体工作,再把结果反馈给我
  • 编程时:高强度使用 Codex
  • 需要制定策略时:选择 Claude,深度思考能力突出
  • 日常生活:用 Hermes 统筹

这些都是随着工作场景的不同而切换的。


结尾

所以,放弃对话式 AI,去使用 Agent。

Agent 才是你在 AI 时代需要真正掌握的东西,也是需要你真正沉淀的东西。 而让 Agent 发挥最大价值的前提,是你在本地沉淀的数据库和 skill。工具会不断更迭,但你的经验和规则永远跟着你走。

从现在开始,沉淀自己。