当你深度依赖 AI 工作之后,你会发现一个问题:吊在一个模型上,迟早会被卡脖子。

随着使用程度的加深,我越来越频繁地需要混用多个模型。而官方订阅那套"按月付费、限额使用"的模式,已经无法承载我的工作节奏。所以我做了一个决定——彻底抛弃官方订阅,转向第三方聚合客户端 + API 按量付费。

这篇文章,我会把这次切换的原因、过程和目前的工作台架构完整地分享出来。

为什么要切换

在 4 月份之前,我的主力模型是 Gemini。从文案写作到代码编写,几乎所有工作都扔给它。但自从进入 4 月,一个很明显的变化出现了——Pro 版的额度越来越少了。

虽然我开的是 Pro 会员,但还是时常触碰到额度限制。一旦触顶,你面临两个选择:

  1. 等。 等额度恢复后继续在原对话中工作。但这意味着工作流被强行中断,你的思路、你的上下文、你正在推进的任务,全部悬在半空。
  2. 换。 切到本地客户端继续对话。但问题是,你迁移了对话窗口,上下文记忆却无法跟着走。你得把之前的背景、需求、细节,一字不差地重新喂给新模型。产出效果往往大打折扣。

这两条路,本质上都是在强行打断工作流。 对于一个每天高频使用 AI 的人来说,这是最让人抓狂的事情。

当然,可以加钱升级到 Ultra 套餐。但我算了一笔账——我的工作强度有高有低,Ultra 的额度大概率是用不完的,花冤枉钱没有意义。

于是在触发 Gemini Pro 限额后,我开始在 Claude 和 GPT 的免费额度之间来回切换。说实话,在几个官方客户端之间跳来跳去,体验非常割裂,心里总是焦躁不安的。

从 Notion 到 Obsidian:笔记系统的迁移

与此同时,随着 AI 技术的成熟,包括 OpenClaw、Obsidian 这些工具的不断进化,我也在探索更多前沿的工作方式。

这里要聊一下笔记系统的变化。在此之前,我的笔记全部沉淀在 Notion 里,也在用 Notion AI。说实话,Notion AI 本身是不错的——如果它不按积分收费的话。

假设它能提供一个包月的基础模型长期运行,不疯狂扣积分,我觉得它是一个挺好用的工具。但现实是,Notion AI 的代理和 AI 额度在调整后需要花额外的积分购买。按照我的工作强度算了一笔账,每个月在 Notion 上大概要花 200 到 300 美金,这完全没有必要。

但 AI 又是写文章、做第二大脑不可或缺的一部分,所以我转向了 Obsidian。

Obsidian 是纯粹的 Markdown 文档。在里面可以接入 Claude 插件,让 AI 直接赋能你的整个个人知识库。目前,Obsidian + Claude 已经成为我编写文章和拓展想法的主要根据地。

很多人觉得 Obsidian 复杂,其实不要把它想得太难。装几个基本插件就够了,不要一上来就追求花里胡哨的配置。只要满足当前需求,Obsidian 是一个相当简洁的工具。

它真正的优势在于:因为底层是 Markdown,所以无论接入什么 AI Agent,都非常顺畅。 你可以接 CodeX,可以接 OpenClaw,也可以接 Claude,随时调用。接入之后,你可以把 Obsidian 想象成一个外挂大脑——你不再需要反复向 AI 输入上下文和指令,你的知识库本身就是上下文。

当然,在这一点上,Notion 做得确实不差。但综合成本和灵活性来看,Obsidian 是更适合我的选择。

我的新客户端:LobeChat

聊完了笔记系统,再说说我的 AI 对话客户端。

在切换之前,我用的是 Cherry Studio。吐槽一下——它的界面真的挺丑的。交互设计缺乏质感,对话界面也谈不上美观。虽然它也推出了第三方主题,但装了之后依然不太行。功能层面倒还凑合,但对于我这种对设计感有一点追求的人来说,它始终差了口气。

后来我切换到了 LobeChat,一个开源的第三方聚合客户端。现在的 LobeChat 已经不像早期那么简陋了,功能相当完善:

  • 生图:直接在客户端内执行
  • 知识库:支持挂载本地知识库进行对话
  • Agent:可以在本地执行任务
  • Skills:支持加载技能扩展

日常所需的功能基本都覆盖了。

第三方中转站:按量付费的自由

切换到 LobeChat 之后,我逐步把主力 AI 从官方订阅迁移到了第三方 API 中转站。

所谓中转站,就是第三方服务商提供的 API 聚合服务。我手上目前在用的有几家:

中转站 主要接入模型
ikunCode Claude
DuckCoding GPT
云雾 AI Gemini 及其他全系列模型

这样一来,在一个 LobeChat 客户端里,我就可以集中完成所有工作——写文案、生图、代码辅助,全部在一个界面内解决。并且,你可以在同一个对话框里无缝切换不同厂商的大模型:觉得 GPT 不行就换 Claude,Claude 不行就切 Gemini。这种跨模型的灵活性,是任何单一官方订阅都给不了你的。

中转站的原理

第三方中转站的低价从何而来?原理通常有两种:一种是通过逆向工程获取官方的 API 接口,另一种是从 Cursor、Windsurf 等编程工具中提取 API 通道。

坦白说,通过这些渠道出来的 API,可能存在轻微的"降智"问题。主要表现在:由于你和其他用户共享同一个 API 通道,可能会产生一定程度的上下文污染。但在日常使用中,如果你的任务复杂度不算特别高,这种影响几乎可以忽略。

算下来,每个月在 AI 上的支出至少能降低 50%,而且额度往往还用不完。

不同需求,不同选择

并非所有场景都适合用最便宜的渠道。我的建议是分层使用:

1. 高负荷 / 复杂任务
推荐使用中转站提供的"官转"渠道(官方直转)。这类渠道直接对接官方 API,上下文污染极少,输出质量接近原版。适合需要长上下文、高精度的复杂工作。

2. 大量编程需求
推荐直接购买 Code Plan。可以通过第三方中转站(例如 YesCode)购买套餐——有些套餐一个月大约 100 多美金,但每天能提供 150 美金的额度,整月额度高达 1080 美金。对于重度编程用户来说,这种方案性价比极高。

3. 普通工作强度
日常写文案、做总结、头脑风暴这类需求,普通中转站完全够用,没必要多花钱。

为什么 API 比官方订阅更好

除了价格优势,还有几个让我彻底放弃官方订阅的原因。

官方订阅的隐性风险

对于中国用户来说,直接使用官方账号面临多重障碍:

  • Claude:近期大面积封号,并将中国定义为对抗性国家。账号随时可能消失,你积累的所有对话和设置一夜归零。
  • GPT:虽然没那么激进,但同样存在封号风险,且支付门槛较高(需要第三方代充或礼品卡)。
  • Gemini:相对友好,前三个月仅需 6.9 美金左右,但之后恢复到 19.9 美金。而且目前也出现了额度收紧和质量下降的问题。

花了钱,还得提心吊胆,这种体验实在太糟糕了。

API 才是"满血版"

这里有一个很多人不知道的关键点:厂商为了盈利,所有的算力都是优先供应 API 的。

API 输出的,通常是满血版的模型能力。而官方客户端的对话,在算力紧张的情况下,厂商会对其进行降质处理——把更多的算力分配给付费的 API 用户。

换句话说,你花了 20 美金订阅的官方客户端,用到的可能反而是"阉割版";而通过 API 按量付费,你得到的才是完整的模型能力。


所以结论很清晰:API 按量计费 + 第三方客户端,是当下最优的 AI 使用方案。

目前我已经完全脱离了官方订阅,通过 LobeChat + 多家中转站的组合来满足所有需求。到目前为止,这套方案不仅够用,甚至比官方原版更好用——因为你可以随时在一个界面内切换不同的模型,对比它们的效果,选择最适合当前任务的那一个。

不再被单一厂商绑架,不再被额度限制打断,不再为封号风险焦虑。工具是为人服务的,而不是反过来。