大家好,我是烧麦。
今天聊一个很多人都纠结的话题:ChatGPT、Claude、Gemini 这三大 AI 模型,到底该怎么选?
我相信只要你用过一两个月的 AI,这个问题就会自然浮现。尤其是当你需要用 AI 来辅助编程的时候,这个选择更是绑不开——因为每家的会员额度都有限(比如我之前一个项目,让 ChatGPT 帮忙改一段代码,一次就烧掉了百分之十几的额度),而且每个模型的风格和擅长领域都不一样。
虽然从 Benchmark 来看,各家大模型的硬实力都不差,但它们各自的"性格"差异其实非常明显。这正是我今天想展开聊的。
一、ChatGPT:全能型选手
ChatGPT,说实话,GPT-5.4 的回复质量让人头疼——又臭又长,废话连篇,大多数时候你只需要拉到最后看总结就行了,中间那一大段基本没什么信息量。
好在升级到 5.5 之后有了明显改善。虽然回复依然偏长,但至少不再像之前那么离谱了。特别是在 Codex 中使用时,任务执行的精准度相当不错,这也是我目前最看重它的一点。
ChatGPT 还有一个非常突出的特征:持续优化,没有上限。它给你一版内容后,往往会追问"需要我再升级一下吗?"或者"我可以给你一个更好的方案"。无论你迭代多少轮,它总能找到新的优化方向。
适合谁? 如果你是 AI 新手,ChatGPT 是最稳妥的入门选择——功能全面,生态成熟,不容易踩坑。
二、Claude:干练的专家顾问
Claude 是我目前最推荐的模型。
它最大的特点是交互体验极佳。跟它讨论问题时,它会主动引导你澄清需求——有时会在对话框里弹出选项,让你做选择、输入更精确的想法,而不是自己瞎猜。相比之下,ChatGPT 在普通对话中并没有这种引导机制,只有在 Codex 里才会出现类似的交互。
回复风格上,Claude 偏向干练、理性,像是在跟一个资深专家对话。更难得的是,Claude 会反驳你——当它认为你的想法有问题时,它不会一味附和,而是直接指出来,帮你回归理性。这在需要做决策的场景中非常有价值。
但它的门槛也是三者中最高的。 Claude 现在对中国大陆用户的访问限制非常严格,将中国定义为对抗性国家,原因据说是国内太多模型在蒸馏他们的成果。目前 Claude 存在严重的账号封禁风险和 KYC 验证障碍。虽然 ChatGPT 也有类似限制,但远没有 Claude 这么严。至于 Gemini,呵呵,随便上。
另外,我自己是没有开过 Claude 官方会员的,所以不清楚直接用官方 Claude Code 是什么体验。我一般是通过第三方中转站的 API 来使用。
在使用 Claude Code 编程的过程中,我遇到了几个比较头疼的问题:
- 模型自动降级 — 哪怕我已经选择了 Opus 4.6,但在编程过程中观察 API 后台,发现它总会自动切换成 Haiku 4.5。
- 输出质量断崖式下跌 — 这种自动降级直接导致输出质量变差。比如前天,一个页面我改了四五版都改不回去。
最后,还是换成 Codex 才搞定了这个任务。
三、Gemini:被"谄媚"拖后腿的实力派
Gemini 超会谄媚的,这可不是说说而已。
有时候我在想,谷歌这么一家技术驱动的科技公司,怎么做出来的 AI 是这个画风?难道是印度人太多了?
无论你提出什么想法,它都会先夸你一番:"哇,你这个想法太棒了!""比上一版有了很大的提升!"哪怕你在提示词里明确要求它"不要谄媚",效果也很有限——它只是换了一种方式继续顺着你。
这在日常聊天中可能无伤大雅,但在你需要客观建议的时候就成了大问题。比如你在两个方案之间犹豫不决,只要你稍微流露出对其中一个的偏好,Gemini 就会立刻顺着那个方向走。这种时候,你就会有一种非常强烈的"不爽"的感觉,让人感到烦恼。
当然了,Gemini 它有一个很明显的长板:创意和审美。
在你没有任何参照、从零开始构思的情况下,Gemini 的 UI 设计初稿比 ChatGPT 和 Claude 都要好一些。它的创意方向和尺度更加开阔,不会那么死板和中规中矩。文案创意也是同理,它的发散空间比另外两家更大。
如果你是做内容、需要创意灵感的人,Gemini 是一个非常好的"思路打开器"。 虽然你不能指望它直接输出高质量的成品,但在帮你打开思路这件事上,我觉得它确实排在几家模型里的第一位。
四、我的用法:我全都要
聊完了这几家模型的优缺点,我想讲讲我目前是怎样把它们组合起来用的。
Claude = 大脑(CEO)
Claude 主要负责制定计划和写文章。凭借它的严谨性和独立思考的能力(它甚至会反驳你),我经常会与 Claude 探讨我的想法,由它来进行顶层设计。
ChatGPT Codex = 双手(执行总监)
Claude 制定好计划后,我会把它交给 Codex 来执行。
我觉得 Codex 甚至比普通的 ChatGPT 对话更好用,因为:
- 它会进行思考、反思,甚至在不懂的地方主动询问
- 它可以在没有太多人为干扰的情况下,一路将任务执行下去
- 整个过程非常顺畅,验收时也很少出错
这也是我觉得目前 ChatGPT 在编程方面最大的优势——很少需要人工干涉调整。相比之下,Claude 在执行力上目前没有 Codex 那么强,还是需要比较多的人工干预,Claude 会带着你乱跑,经常有自己的想法。
Gemini = 画笔(创意总监)
如果说 Claude 是大脑,Codex 是手脚,那 Gemini 就像是一支画笔。我主要用它来负责前端的审美和文案创意——在你没有任何参考的情况下,它在这方面会做得更胜一筹。
五、我目前的工具选择与省钱策略
说完了怎么用,再聊聊怎么选和怎么省。"小孩子才做选择,大人全都要",对吧?
我目前手头唯一在续费订阅的工具是 ChatGPT。20 美金的 Plus 会员额度,配合我的 Codex 编程需求,用起来刚刚好。即便有时候额度用不完,也可以直接接入到小龙虾里去消耗掉,这种方式比较通用,性价比也高。
除了 ChatGPT 之外,其他模型我全部通过第三方中转站的 API 来调用。比如 Codex、Claude 的桌面端现在都支持接入第三方 API 接口,当然,在中转站的时候你也需要注意令牌的分组,分组中会有提示,告诉你当前分组只能用于哪个场景。
例如 Claude 模型一般只支持在 Claude Code 中使用,但不用的中转站规则不同,有些也不限制场景使用。
如果需要用到生图功能,我就会去 Google 的 Flow 。每天登录都会有一些免费额度,生图大概有三五十张,视频每天可以生成两个,对我来说基本够用了。
如果你的需求量更大,其实直接从第三方 API 里调接口去生图也挺便宜的。像目前最强的 GPT Imagen 2,价格只要六分钱一张,算下来非常划算。
六、总结
| 模型 | 定位 | 优势 | 短板 |
|---|---|---|---|
| ChatGPT | 全能选手 | 生态成熟,Codex 执行力强 | 回复偏长,前端审美一般 |
| Claude | 专家顾问 | 回复干练,敢于反驳,适合规划 | 访问门槛高,封号风险 |
| Gemini | 创意担当 | 前端审美好,文案创意强 | 过于"顺从",缺乏独立判断 |
三者各有所长,最高效的方式就是组合使用——Claude 规划、Codex 执行、Gemini 美化,各取所长。
以上就是我目前使用 AI 的一些经验分享,希望对大家有所帮助。