一个模型一条龙:主图、场景图、海报、详情页 banner 全做完,省下摄影师和设计师的钱

做电商的都清楚,一个新品上架,最磨人的不是写文案、不是定价,是凑齐那一整套视觉。
主图要干净专业,得请摄影师进棚拍。生活场景图要有氛围,又是一次布景拍摄。促销海报、详情页 banner,那是设计师的活,得排版、做卖点、调配色。一套下来,钱花了不少,时间还拖得长——摄影师档期、设计师改稿、你来回沟通,一个商品的视觉做完,半个月就过去了。
更别说改。海报上的价格变了、想换个主推卖点、风格不满意要重来——每一次改动都意味着重新找人、重新等。
这篇文章讲的是另一条路:用 GPT Image 2 一个模型,把一个商品的全套视觉一条龙做完。不是「AI 能帮你做几张图」这种泛泛而谈,而是一个完整的、可复制的工作流。下面我们拿一支香薰蜡烛当样品,实跑一遍——主图、场景图、海报、banner、特写、成分图,6 张全套视觉,每一张都给你完整 prompt 和真实出图。
传统流程的真正成本,不在某一张图本身,在于协调。摄影师负责实拍、设计师负责排版,是两拨人、两套流程、两轮沟通。中间任何一环卡住,整套视觉就交付不了。
GPT Image 2 能把这件事压成一条龙,靠的是它同时能做两件事:
于是整套视觉变成同一个工具、同一段描述、6 条 prompt 的事。GPT Image 2 是 OpenAI 在 2026 年 4 月发布的次代图像模型,在 hiapi 上 $0.03/张起,文生图、图生图都支持(数据截至 2026-05)。模型本身的画质、文字渲染细节,可以看 GPT Image 2 深度测评,这里我们只关心一件事:怎么用它把活干完。
下面是一支香薰蜡烛(琥珀磨砂玻璃罐、奶油色空白标签)的全套 6 张视觉。每张 prompt 都是英文——图像模型上英文 prompt 更稳——你把里面描述蜡烛的句子换成你的商品、中文文案换成你的,就能直接复用。
用途:商品列表页、搜索结果里露出的那张第一图。要求只有一个——干净、专业、让人一眼看清商品。纯白背景、1:1 方图,是大多数电商平台的主图标准。
A professional e-commerce catalog main photo of the same scented candle: a frosted amber glass jar with a smooth cream blank label, single centered wick, unlit. The jar is perfectly upright, front-facing, centered, and fills about 70% of the square frame. Seamless pure white background, soft even studio lighting from above and front, gentle softbox highlights on the frosted glass, subtle natural shadow beneath the jar, very faint clean reflection on the surface. Razor-sharp focus, true-to-life color, visible frosted glass texture, smooth cream wax surface, premium minimal product photography, no props, no clutter, no hands, no packaging box, no extra candles, no text, no logo, no watermark. 1:1 square composition, high-end e-commerce product image.

纯白背景、商品居中占画面约 70%、底部带自然倒影——这就是一张能直接上架的主图,省下进棚拍摄那一趟。
用途:详情页头部、社媒种草帖。主图负责「看清商品」,场景图负责「让人想买」——把商品放进一个有温度的使用场景里。
A cozy lifestyle product photograph featuring the same scented candle in a frosted amber glass jar with a smooth cream blank label. The candle is lit with a small warm flame and placed as the clear hero object on a light oak side table. Nearby are a folded neutral knit blanket, an open book, and a small eucalyptus sprig, arranged subtly so they support the product without distracting from it. Warm late-afternoon window light from the side, soft natural shadows, shallow depth of field, softly blurred comfortable living room background. The candle remains sharply focused, front label visible, amber glass texture visible, warm inviting color grade, calm relaxing mood, premium home-fragrance brand aesthetic, photorealistic. No readable text, no logo, no extra candles, no messy background, no people. 4:3 horizontal composition.

蜡烛点亮、是画面绝对主角,毛毯、书本、桉树叶做氛围陪衬——一张种草感很足的场景图,不用真的去布景拍。
用途:新品上架公告、活动投放、社媒推广位。这是典型的「设计师活」——需要标题、卖点、价格徽章和排版。
A clean modern promotional poster for a premium scented candle launch, 3:4 portrait. A bold Chinese headline "新品上市" near the top in an elegant sans-serif typeface, rendered with accurate well-formed strokes, and a smaller Chinese subheadline "天然大豆蜡 · 40 小时长效留香" directly beneath it. Central visual: the same lit scented candle in a frosted amber glass jar with a smooth cream blank label, placed on a soft cream surface with a few dried botanicals arranged elegantly beside it, warm gentle lighting. A small circular price badge showing "¥129" in the upper-right corner. Refined warm palette of cream, sage green and amber, generous negative space, balanced elegant layout, soft shadows, premium home-fragrance brand aesthetic. 3:4 portrait composition.

「新品上市」「天然大豆蜡 · 40 小时长效留香」「¥129」——这些中文字是 GPT Image 2 直接渲染出来的,笔画准确、排版利落。这一步不用甩给设计师:把文案写进 prompt,模型直接出带字成品,出图后核一遍字,确认无误就能投放。
用途:详情页里那条「产品 + 卖点」的横幅。同样需要文字,而且是结构化的多条卖点。
A wide e-commerce detail-page banner for a premium scented candle, 16:9. On the left third, the same lit scented candle in a frosted amber glass jar with a smooth cream blank label, warm flame, soft realistic shadows, visible frosted glass texture. On the right two-thirds, three concise Chinese selling points stacked vertically, each rendered in clear accurate type and paired with a small minimalist line icon: "天然大豆蜡", "40 小时持久燃烧", "淡雅自然留香". Soft warm gradient background from cream to pale sage, clean modern layout with clear separation between product and text areas, gentle soft shadows, premium home-fragrance aesthetic, tidy elegant composition. 16:9 wide composition.

左侧产品、右侧三条中文卖点(天然大豆蜡 / 40 小时持久燃烧 / 淡雅自然留香)各配一个线条图标——文字、图标、排版一次成型。和海报一样,中文卖点是模型直接渲染的,出图后逐条核字即可。
用途:详情页里讲材质、讲工艺的那一段配图。微距特写,把「这东西做工好」直观地拍出来。
A premium macro product detail photo of the same scented candle in a frosted amber glass jar with a smooth cream blank label. Close-up crop showing the frosted glass texture, warm amber translucency, smooth cream wax surface, and centered wick. Soft studio lighting, shallow depth of field, elegant minimal composition, no text, no logo, no props, photorealistic, 1:1.

磨砂玻璃的颗粒质感、琥珀色的透光、蜡面的细腻——这种微距特写过去得靠摄影师的镜头和灯光功底,现在一条 prompt 就出来了。
用途:详情页里讲成分、讲卖点(天然、环保)的配图。把原材料和商品摆在一起,让「天然大豆蜡」这个卖点有画面支撑。
A refined natural ingredient lifestyle photo for the same scented candle in a frosted amber glass jar with a cream blank label. The candle is placed on a warm neutral surface beside dried botanicals, soy wax flakes, eucalyptus leaves, and soft linen fabric. Calm premium composition, warm daylight, natural shadows, muted cream sage amber palette, photorealistic, no readable text, no logo, 4:3.

蜡烛旁边摆上大豆蜡片、桉树叶、干花、亚麻布——一张「天然成分」叙事图,用在详情页讲卖点的段落里。
至此,一个商品上架要的全套视觉就齐了:主图、场景图、海报、banner、特写、成分图,6 张,一个模型、一个下午。
跑通这套流程,真正要掌握的就四点。把这四点拿稳,换任何商品都能复用。
这是整套工作流的命门。6 张图必须是同一个商品,否则就成了 6 个不同的蜡烛,详情页会穿帮。
做法:在每条 prompt 里都用同一段固定描述来指代商品——本文用的是 the same scented candle in a frosted amber glass jar with a smooth cream blank label(同一支琥珀磨砂玻璃罐、奶油色空白标签的香薰蜡烛)。这段描述像一个「商品锚点」,6 条 prompt 全引用它,出来的才是同一个商品。
换商品时,你要改的就是这段描述——把它换成你的商品的外观特征,6 条 prompt 的其余部分基本不用动。
海报标题、详情页卖点这类文字,不用先出无字底图再叠字。GPT Image 2 的中文文字渲染是强项——视觉 3 的「新品上市」和视觉 4 的三条卖点都验证过,直接写进 prompt 就能成字。
铁律:出图后人工核字。 模型渲染文字是 99% 不是 100%,极个别会出错字或字距问题,逐张核过再用,发现错的就重跑一次。这点小成本,换来的是省掉整个排版设计环节。
包装上的小标签——品牌名、香型那种细小文字——比海报标题难渲染得多,字小、容易糊。所以本文所有 prompt 里蜡烛都是 blank label(空白标签)。
正确做法:让模型出空标签的干净商品,品牌名、香型这些细节后期用设计软件叠上去。这样既保证商品图干净专业,又能精确控制小字。
不同视觉位对图片比例要求不同,prompt 里直接指定:
出图就是对应位置能直接用的尺寸,不用再裁剪。
想要更多现成的、覆盖各种商品类型的 prompt,可以看 GPT Image 2 提示词模板——那篇是模板清单,本文是工作流,配合着用。
把两条路摆一起看:
| 传统外包流程 | GPT Image 2 一条龙 | |
|---|---|---|
| 人 | 摄影师 + 设计师,两拨人 | 一个人操作一个模型 |
| 出图成本 | 一套视觉摄影 + 设计,按商品数累加 | $0.03/张起,6 张全套也就几毛钱 |
| 周期 | 排档期 + 拍摄 + 改稿,按天甚至按周算 | 几分钟出一版 |
| 改动 | 重新找人、重新等 | 改 prompt 重跑,几分钟一版 |
最关键的差别是改动成本。电商视觉很少一版定稿——价格要调、卖点要换、风格要试。传统流程每改一次都是一轮沟通和等待;这套工作流改 prompt 重跑就行,文案、配色、构图随便试,试到满意为止。
价格、活动信息这类频繁变动的文字,建议还是后期叠——不是模型做不了,而是后期改一个数字比重跑一张图更快。
生成的商品图能直接当真实商品照用吗? 主图、场景图、特写这类纯视觉图可以直接用。要注意的是:图里的商品是模型「画」出来的,和你的实物会有细微差异。如果你的平台或品类对「图文一致」要求严格,建议用图生图——以实物照片为基础让模型优化,而不是纯文生图。
海报上的中文字会出错吗? GPT Image 2 中文渲染准确率很高,但不是 100%。所以工作流里有「出图后人工核字」这一步——逐张核标题和卖点,发现错字就重跑。这点核对成本远低于请设计师排版。
6 张图怎么保证是同一个商品? 靠 prompt 里那段固定的商品描述。6 条 prompt 都引用同一段描述,模型才会画出同一个商品。这是工作流第一个关键技巧,也是最容易被忽略的一点。
换一个商品要重写所有 prompt 吗? 不用。这 6 条 prompt 的结构是通用的——你只需要把里面描述蜡烛的句子换成你的商品、把中文文案换成你的卖点,其余部分(背景、灯光、构图、比例)基本照搬。等于这 6 条 prompt 是一套可复用的模板。
这套工作流适合哪些品类? 家居、美妆、配饰、食品包装这类「商品形态相对标准、靠视觉和氛围卖货」的品类最合适。对款式极其复杂、或必须 100% 还原实物细节的品类(如珠宝、精密电子产品),建议以图生图为主、纯文生图为辅。
GPT Image 2 和上一代比,做电商视觉强在哪? 主要是文字渲染和画质稳定性的提升,这两点正好是电商物料最看重的。具体差别可以看 GPT Image 2 vs GPT Image 1.5。
一个商品的全套视觉,难的从来不是单张图,是协调摄影师和设计师两拨人、来回改稿的那套流程。GPT Image 2 把这件事压成了一条龙——同一个模型、同一段商品描述、6 条 prompt,主图、场景图、海报、banner、特写、成分图全部做完。
要点就四个:用固定描述锁住商品一致性、文字直接交给模型渲染(出图后核字)、产品标签留空、比例按用途选。把这四点拿稳,再加上一套写好的 prompt,换任何商品都能套用。
成本上单张 $0.03 起、几分钟一版,和传统外包流程不在一个量级——尤其是在「改」这件事上。
想直接上手,去 GPT Image 2 模型详情页,把上面 6 条 prompt 里的蜡烛换成你的商品试一遍。想看模型的画质、文字渲染到底什么水平,GPT Image 2 深度测评 有完整实测。
核心要点