反杀 Nano-banana 的 GPT images 1.5，手把手教会你。

兄弟们，这次真的离大谱了！

霸榜几个月、被视为 AI 生图标杆的谷歌 Nano-banana Pro，居然在 AI 竞技榜中跌下神坛，屈居第二了！

而将它斩于马下的，正是 OpenAI 刚发布一周的新王——GPT Images 1.5。

要知道，前段时间 Nano-banana Pro 可是把 GPT Images 1.0 按在地上摩擦的，现在的剧情居然来了个惊天大反转！

科普一下：AI 竞技榜（LMArena.ai） 是全球最权威的 AI 图像生成“盲测”平台。

该竞技榜提供了一个 AI PK 平台，用户在不知道模型名称的情况下，对生成的图像进行二选一投票。同一提示词 → 匿名生成两张图 → 普通用户投票 → 看谁更受欢迎。

因为评分全靠一线真实用户“用脚投票”，AI 竞技榜比实验室数据/专家评测更真实，直接反映了 AI 在大众眼里的好用程度。

榜单地址：https://lmarena.ai/zh/leaderboard/text-to-image

Nano-banana Pro 为何会被发布仅一周的新手反超？是用户审美疲劳，还是 OpenAI 真的憋出了大招？

你好，我是清风。今天这篇文章，我将带你系统掌握 GPT Images 1.5。从基础操作到独家秘技，再到避坑指南和神级搭子，手把手教你玩转这个新晋霸主。

本篇文章干货极多，建议先点赞+收藏，防止迷路！

《Nano-banana Pro 完整使用指南：国内免费网站、案例集锦、提示词，看这一篇就够了！》

《瑜亮之争？横向评测 GPT Images 1.5 / nano-banana》

《手把手教你做 AI 漫剧+闭坑指南》

let's go！

基本情况

GPT Images 1.5 的前身，其实就是 DALL·E。

上一个版本是 GPT Images 1.0，也就是 GPT-4o 里那个“言出法随”的改图模型。2025 年 3 月面世，因改图能力惊人，一度刷屏。

只是后来，Nano-banana Pro 横空出世，把风头全抢走了。

直到 2025 年 12 月 17 日，OpenAI 悄悄上线了 GPT Images 1.5。没发布会、没大张旗鼓，但模型一上线，LMArena 排名开始悄悄爬升。

仅一周时间，反超 Nano-banana Pro！

一、零基础上手：比你想象更简单

要使用 GPT Images 1.5，最简单的方式就是 OpenAI 官网

https://chatgpt.com/images

GPT Images 1.5 已经深度集成到了 GPT 中，网页版和 APP 都有。网页版左边的那个"图片“就是。

使用次数方面，免费用户每天只有几张额度。

而 GPT PLUS 有福了，敞开用，基本无限额。

升级 Plus 会员的方式也很简单，到 www.91gpt.com.cn 购充值卡，5 分钟搞定。详见《国内怎么充值 GPT-5.2 会员？最简单的开通方法分享》。最近好像还在做新年促销，囤起来慢慢用。

国内用户使用建议到设计平台 lovart.ai，我刚看了，也集成上去了：

www.lovart.ai

还可以用 API，不过我们普通用户不能直接用。等我回头找一个稳定的 API 渠道再手撸一个本地网页版给大家用。类似上次的 Nano-bananan 呱呱做图。

解决了使用路径，我们来看看怎么用：

一、基础操作

1、主界面

GPT 的主页，点左边那个“图片（新）”就进入 GPT Images 1.5 了

界面乍看朴实无华（甚至有点土），但易用性完爆谷歌 Gemini

2、生图区：

支持文生图、图生图（最多可参考 10 张图）

比如，传几张图，让 AI 来个大杂烩

顷刻，得到：

实测超过 6 张图，AI 就有点力不从心了，容易出错。

OK。我们先来生成一张今天的女主角，小美

提示词： 8K 超清特写，韩系偶像级东亚少女。瓷白通透肌肤，细腻无瑕，柔粉色唇妆；棕色眼眸，神情温柔克制，正视镜头。短黑色鲍伯头，齐刘海，发丝丝滑有光泽，自然垂落于脸颊两侧。身披雾蓝色 faux-fur 短披肩，质感轻柔蓬松；内搭冰蓝色亮片吊带上衣，银蓝亮片细密闪耀。颈间佩戴修长银色项链，黑色四叶幸运草吊坠垂落胸前，随呼吸轻微摆动。暖金色柔光自正前方与侧前方打亮，肤质与亮片同时高光闪现；背景为虚焦卧室环境，暖色调 bokeh 光斑环绕。整体呈现高端商业摄影、时尚杂志封面质感，干净构图，真实写实。

输入提示词后，速度还行，比上一代快 4 倍，比香蕉慢 30%，但在能接受的范围。

小美 1 号（未提供参考图）

小美 2 号（提供了人物参考图）

活动区：配合推广，放一些好玩的活动，比如着两天圣诞放的做动画

3、预设风格

内置了 20 多种风格

我们选个“艺术风格”。点选后选择图片，就可以生成对应风格。还出来对应的提示词，用户还可以复制出来微调。

点击就直接生成了艺术照。

4、内置特效

内置特效也有十几种，创作产品照片，职场形象照，移除人物，装饰房间、做贺卡、换装啥的，真的很好用

看看穿职业装的小美，明星小美，戴珍珠的小美，冰箱贴小美

趣味小插曲：我不小心在“高端产品”特效里选中了小美，结果 AI 居然把她脖子上的项链按照“奢侈品广告”的标准重塑了（下图右）！

内置提示、内置特效，都是新手很喜欢的。

刚看到觉得这些功能，我不屑一顾，觉得太小白。

但是想想，现在 AI 应用普及，不是卡在算力，卡在 AI 大模型的能力，而是好多人不会用。

而 GPT images 不但效果好，它“内置风格”和“内置特效”真的降低了用户门槛，提高了产品易用性。就这点来讲，真的比谷歌那群钢铁直男懂产品多了。谷歌 gemini 还好，谷歌的 AI studio 简直是每个部件都放错了地方。

新手友好，而 AI 竞技榜（LMArena.ai）都是真实一线用户体验后的打分。

也许，“更高的易用性”就是 GPT images 1.5 评分反超 Nano-banana pro 的原因之一！

5、修图改图

GPT Images 1.5 的改图功能分为两个流派：

(1)提示语修改派

言出法随的改图，我们觉得照片人物表情太呆板，蜡烛颜色也不突出

提示词：蜡烛改为白色，人更有曲线

AI 立刻把图改好了

（2）涂改编辑派

有些不太好用言语控制的，可以用涂抹，先涂再发提示词修改。

先上传或者生成一张图片，击这张图 → 点击「选择区域」，进入后，鼠标移到图片上，出现画笔蒙版 + 半透明颜色，涂你要改的地方，再写提示词

得到新图如下：

多层涂改

GPT images 1.5 还有些功能正在小范围测试，比如还多色框涂改功能，用不同颜色画笔做上记号，再发出提示。等正式上线再分享。

二、进阶技巧：从新手到大神

1、逻辑生图

GPT Images 1.5 不仅可以生图，还支持逻辑生图

夏天，一个 DQ 冰激凌制作后的 0 分钟，5 分钟，15 分钟，30 分钟

AI 理解了

2、一次多图

可以一次性生成多张图，然后我再生成不同的分景做视频。

提示词：(杰作, 最高画质, 超细节, 8k 分辨率). 一张照片般逼真的 4 格分屏拼图，所有画面为同一女性角色。[关键：保持精确的面部特征，保留原始脸部结构，整个拼图中角色完全一致]. 角色皮肤白皙，质感自然，眼神明亮。左上图：角色穿着绿色的圣诞精灵服装，戴着尖尖的精灵耳朵道具，对着镜头敬礼，表情顽皮。右上图：角色手里拿着一个巨大的玩具锤子，假装要敲打镜头，眼睛睁得圆圆的。左下图：角色正在包装礼物，嘴里咬着丝带的一端，眉头微皱显得很专注可爱。右下图：角色坐在礼物堆上，双手托腮，双脚悬空晃动，一脸满足。环境：色彩饱和的圣诞工坊背景，红绿撞色。灯光：明亮的影棚灯光，无阴影，卡通感强。风格：K-pop 专辑内页风格，色彩鲜艳跳跃，清晰对焦，活泼搞怪。

3、参考名家

AI 支持融合各种流派的绘画风格，而且还临摹得有模有样。

提示词：以图中人物为主人公，创作一幅霍华德霍普一样孤独风格的照片

推荐大家去小红书看一个孙老师，拆解名画家风格

浅显易懂，非常有启发

4、更好的保持人物一致性

生成人物图像时，加上以下提示：

提示词：高挑沙漏黑发女郎（图 1)，长波浪黑发垂肩，身着红白蛛网主题紧身无袖连体衣与高腰包腿裤，胸印大黑蜘蛛标志，手举橙色 iPhone17 Pro 对镜自拍，微嘟唇。全身入镜，镜框洁白，身后步入式衣橱衣物齐挂、叠衫列架，鞋靴排底，阳光漫入，柔影清新，现代极简 influencer 质感，高分辨率锐焦。一致性（身份锁定（最高优先级）】 100%还原 FACE_REF 的五官与骨相：脸型、容貌、眼距、鼻梁鼻翼、唇形、下颌线、颧骨结构完全一致，不得漂移。真实皮肤质感：可见细微纹理与毛孔，不要过度磨皮与网红化。成年女性形象。）

看看效果，中间是原图，左边是没加这段提示的，右边是加了的。加了人物保持会好一丢丢。

提示词：高挑沙漏黑发女郎（图 1)，长波浪黑发垂肩，身着红白蛛网主题紧身无袖连体衣与高腰包腿裤，胸印大黑蜘蛛标志，手举橙色 iPhone17 Pro 对镜自拍，微嘟唇。全身入镜，镜框洁白，身后步入式衣橱衣物齐挂、叠衫列架，鞋靴排底，阳光漫入，柔影清新，现代极简 influencer 质感，高分辨率锐焦。

5、增加真实感

GPT 每张图都很美，但是有时候我们需要真实感。

增加以下提示时，会让做出来的图片更有真实感。

提示词：一张未经修饰的自然风格业余照片，背景清晰，采用三星 Galaxy S21 Ultra 拍摄，镜头焦距 24mm，光圈 f/8。照片呈现出一种朴素的现实感，自然柔和的阴影，抓拍的画面，光线平淡自然，低对比度，带有类似一次性相机的质感，随意的摄影风格，背景也完全清晰。照片中存在一些细微瑕疵，展现出一种日常美感，略带 JPEG 伪影，未经修饰，呈现出一种不完美的业余风格。

下面的图，左边加了真实感提示，右边没有

照片中人物为图片 1 人物，正在大堡礁沙滩喂海龟。

这张也是

对比一下，加了咒语的图（左）明显更有“人味儿”，像朋友圈发的照片；没加的（右）则像精修广告图。

6、镜头语言

可以用不同的镜头来做图

下面的图片，提示词，参考图完全一样，镜头分别是远景、中景、特写、近景

可以去看小红书一个叫“麟哥谈分镜”的频道，很多干货

7. 绕过“敏感词”限制

OpenAI 的安全机制非常严格，稍微带点“性感”的词就会被拦截。

解决方案：

使用“黑话”：不要直接描写身体部位。用“曲线凹凸”、“沙漏型”、“薄料”、“收腰”、“自信姿态”等词汇。

侧面描写：描述环境氛围（如“晨间慵懒”、“晚宴抓拍”），一些只可意会不可言传的词语，让 AI 自己去领悟。

李代桃僵：你提供的参考图本身比较妖娆,AI 基本不会卡你。

提示词: 4K iPhone 24mm 前置人物（图片）自拍 9:16 竖幅：我们=她的手机，臂长距离，胸上至头顶构，微仰随角度，手持轻晃真实感。傍晚 Burger King 内，顶灯柔光，菜单牌虚焦背景，托盘摆皇堡、薯条、纸杯。东 20+ 岁少女，大眼圆亮，自然裸妆微唇彩，深褐乱发垂颊。灰棉短衫，薄料收腰，漏斗型身材，轻撑桌沿；浅蓝牛仔裤裹臀。她微倾身，一手握汉堡近口，一手闲放桌面，抓拍自拍瞬间，可爱带点小随性。体型仅参考图比例：纤腰平腹、圆润自然，布料真实拉伸。无脸克隆，无棚拍，无露骨。