独立站 AI 生图大致流程分享、Skill 分享

大家好，我是烧麦。

在独立站的运营过程中，绕不开的一个门槛就是作图，但在如今 AI 的时代，加上前段时间 Gpt 出的 image 2 模型，现在的 AI 制图已经进入了以假乱真的时代。

在 GPT 本次的生图模型更新之前，我都是使用的 Nano Banan 2 和 Pro 模型，在之前我还有 Gemni 会员的时候，我会使用 Google Flow 来完成生图，按照官方的说法，一天大概可以生成一百多张图，在实际的使用过程中，我并没有遇到生图数量的限制。

我会使用 Nano Banana 模型来完成我的产品、视频封面、博客文章、图标、LOGO 等的制作，非常好用，下图是我的一些项目：

但现在，比这个更加强大的生图模型 GPT 的 Image 2 的到来，更加让人感到震惊。没错，就是震惊级别。这种震惊甚至到了让我连夜放弃 Gemni，转而投向 GPT 的怀抱，因为实在是太香了。

生图流程

ChatGPT

我们先从 ChatGPT 讲起，GPT 不像 Gemini 有比较完善的生态，它不能做到一次性生成多张图片，网上有人做到过，我也做到过，但后面我让它生成多张图片，它会直接将多张图片混在一起，这让我感到有些无语，如下图：

它直接给我混在一张图片里，我都不知道该如何吐槽，只能夸他生成的图片细节不错。

但经过研究和查询攻略，我们依旧有办法，其实也算是比较简单的办法，就是需要在对话的时候打开 GPT 的代理模式，但这种方式咋说呢，你们可以看见这生成的图跟上一张图的产品完全没有任何关系，差别太大了，或许在执行这种生图方式之前，需要将生成的图的规则给定死会好一些。

目前 ChatGPT 除了这种方式我没找到有其他可以同时生成多张图片的方式，如果各位有方法，可以告诉我一下，真的有些难搞。

Codex

请出目前的最强大工具（个人评价），为啥呢？因为可以调用 Image 2 的图片啊，虽然说现在各大中转站都有 image 2 的 API ，且生图便宜，大概 6 分钱一张图，但是，目前的 Image 2 的 API 速率且不说大多数中转站的失误率都非常高，剩下的都非常慢，生成一张图片，要等个 2 分钟，这属实有些拉胯，我能想到的唯一方式就是调用官方的 API。

但考虑到工作量和额度，最好的方式就是购买一个 GPT 的会员，这样，我们就能直接在 Codex 中使用，如图：

当然了，生图这不是随便生成的，在 Codex 中装一个 Skill，这个是我目前自用的，也是我自己创建的，你可以直接将这个压缩包丢给 Codex，让其安装就好。

资源我都整理在百度网盘中，年度会员可以找我私聊，我会将提取码分享给你。

安装完之后，你就可以在对话过程中直接调用这个 Skill。然后把你的这些需求发给它，或者问它：“我现在准备生成一个产品组，需要提供什么样的东西？”它会引导你。

Skill

这个 SkIl 主要是用来制作产品详情图的，但不是那种传统电商的详情图，是我用在独立站里面的，最后会有 9 张筛选出来的固定图片，由 2 张棚拍图、5 张场景图、2 张规格图组成，另外，在制作的过程中，可以根据你现有产品的 SKU，来生成不同 SKU 所使用的分类头图。

但在使用这个 Skill 的开始对话中，也需要你提交很多跟产品相关的图片，例如最好包含产品的正面、背面、侧面、顶部、底部、45 度角，以及关键结构的近景。比如接口、孔位、螺丝、卡扣、折叠状态、展开状态、安装后的样子等等，总之，是越详细越好，它会自己拆解产品并建模，然后生成 3 张图：结构基准、安装关系、尺寸接口，用来为后续的 9 张图奠定生成基础，不会产生图片错误。

如果你没有购买样品回来的话，可以去翻一翻这个产品目前用户评论里的照片。多翻一点，然后发给 AI 也可以，各个角度都收集一下，AI 它自己会在后台进行标注，当然，建议多收集一些。

在生成的过程中，会多生成一些图片，供你备选使用。

Skill 理念

这个 SKU 的配置脱离了传统的电商详情图，没有那么多文字，由：

两张干净的暖灰色底图为背景生成的棚拍图，这个的存在是用来做产品本体的展示。
五张场景图：这个场景图的 SKU 是以“杂志拍摄”为理念。并不注重产品在装配时是什么样的概念，而是更加注重使用产品那一刻的感觉，也就是“使用时刻”
规格图：是一种类似于产品拆解的那种概念，线条感，没有传统规格图那么传统。

我们的产品详情图，比起介绍产品的各个功能及其优势，我们更加注重产品融入生活的那种感觉，即人们在使用产品那一刻的感受。

所以，我们的整体风格在生成场景时，会采取大胆的裁切。我们不再以产品主体为核心观念，而是更多地展现景色与产品融为一体的感觉，让用户在视觉上产生溢价，不会将我们与廉价的厂图放在一起作为比较。

在生成的过程中，你可以自由地去调整自己的 Logo，尤其是对于那些目前手上还没有现货，想要去做一些素材出来的朋友，非常合适，当然，目前的 Skill 还处在一个初期的版本，在整体的生成上可能并不是百分之百如人愿。这个 Skill 也会随着我在实践过程中的不断尝试，进行持续的优化和更新，感兴趣的伙伴可以保持关注。