兄弟们,这次真的离大谱了!

霸榜几个月、被视为 AI 生图标杆的谷歌 Nano-banana Pro,居然在 AI 竞技榜中跌下神坛,屈居第二了!

而将它斩于马下的,正是 OpenAI 刚发布一周的新王——GPT Images 1.5

要知道,前段时间 Nano-banana Pro 可是把 GPT Images 1.0 按在地上摩擦的,现在的剧情居然来了个惊天大反转!

科普一下:AI 竞技榜(LMArena.ai) 是全球最权威的 AI 图像生成“盲测”平台。

该竞技榜提供了一个 AI PK 平台,用户在不知道模型名称的情况下,对生成的图像进行二选一投票。同一提示词 → 匿名生成两张图 → 普通用户投票 → 看谁更受欢迎。

因为评分全靠一线真实用户“用脚投票”,AI 竞技榜比实验室数据/专家评测更真实,直接反映了 AI 在大众眼里的好用程度。

榜单地址:https://lmarena.ai/zh/leaderboard/text-to-image

Nano-banana Pro 为何会被发布仅一周的新手反超?是用户审美疲劳,还是 OpenAI 真的憋出了大招?

你好,我是清风。今天这篇文章,我将带你系统掌握 GPT Images 1.5。从基础操作到独家秘技,再到避坑指南和神级搭子,手把手教你玩转这个新晋霸主。

本篇文章干货极多,建议先点赞+收藏,防止迷路!


《Nano-banana Pro 完整使用指南:国内免费网站、案例集锦、提示词,看这一篇就够了!》

《瑜亮之争?横向评测 GPT Images 1.5 / nano-banana》

《手把手教你做 AI 漫剧+闭坑指南》

let's go!

基本情况

GPT Images 1.5 的前身,其实就是 DALL·E。

上一个版本是 GPT Images 1.0,也就是 GPT-4o 里那个“言出法随”的改图模型。2025 年 3 月面世,因改图能力惊人,一度刷屏。

只是后来,Nano-banana Pro 横空出世,把风头全抢走了。

直到 2025 年 12 月 17 日,OpenAI 悄悄上线了 GPT Images 1.5。 没发布会、没大张旗鼓,但模型一上线,LMArena 排名开始悄悄爬升。

仅一周时间,反超 Nano-banana Pro!

一、 零基础上手:比你想象更简单

要使用 GPT Images 1.5,最简单的方式就是 OpenAI 官网

https://chatgpt.com/images

GPT Images 1.5 已经深度集成到了 GPT 中,网页版和 APP 都有。网页版左边的那个"图片“就是。

使用次数方面,免费用户每天只有几张额度。

而 GPT PLUS 有福了,敞开用,基本无限额。

升级 Plus 会员的方式也很简单,到 www.91gpt.com.cn 购充值卡,5 分钟搞定。详见《国内怎么充值 GPT-5.2 会员?最简单的开通方法分享》。最近好像还在做新年促销,囤起来慢慢用。

国内用户使用建议到设计平台 lovart.ai,我刚看了,也集成上去了:

www.lovart.ai

还可以用 API,不过我们普通用户不能直接用。等我回头找一个稳定的 API 渠道再手撸一个本地网页版给大家用。类似上次的 Nano-bananan 呱呱做图。

解决了使用路径,我们来看看怎么用:

一、基础操作

1、主界面

GPT 的主页,点左边那个“图片(新)”就进入 GPT Images 1.5 了

界面乍看朴实无华(甚至有点土),但易用性完爆谷歌 Gemini

2、生图区:

支持文生图、图生图(最多可参考 10 张图)

比如,传几张图,让 AI 来个大杂烩

顷刻,得到:

实测超过 6 张图,AI 就有点力不从心了,容易出错。

OK。我们先来生成一张今天的女主角,小美

提示词: 8K 超清特写,韩系偶像级东亚少女。瓷白通透肌肤,细腻无瑕,柔粉色唇妆;棕色眼眸,神情温柔克制,正视镜头。短黑色鲍伯头,齐刘海,发丝丝滑有光泽,自然垂落于脸颊两侧。 身披雾蓝色 faux-fur 短披肩,质感轻柔蓬松;内搭冰蓝色亮片吊带上衣,银蓝亮片细密闪耀。颈间佩戴修长银色项链,黑色四叶幸运草吊坠垂落胸前,随呼吸轻微摆动。 暖金色柔光自正前方与侧前方打亮,肤质与亮片同时高光闪现;背景为虚焦卧室环境,暖色调 bokeh 光斑环绕。整体呈现高端商业摄影、时尚杂志封面质感,干净构图,真实写实。  

输入提示词后,速度还行,比上一代快 4 倍,比香蕉慢 30%,但在能接受的范围。

小美 1 号(未提供参考图)

小美 2 号(提供了人物参考图)

活动区:配合推广,放一些好玩的活动,比如着两天圣诞放的做动画

3、预设风格

内置了 20 多种风格

我们选个“艺术风格”。点选后选择图片,就可以生成对应风格。还出来对应的提示词,用户还可以复制出来微调。

点击就直接生成了艺术照。

4、 内置特效

内置特效也有十几种,创作产品照片,职场形象照,移除人物,装饰房间、做贺卡、换装啥的,真的很好用

看看穿职业装的小美,明星小美,戴珍珠的小美,冰箱贴小美

趣味小插曲: 我不小心在“高端产品”特效里选中了小美,结果 AI 居然把她脖子上的项链按照“奢侈品广告”的标准重塑了(下图右)!

内置提示、内置特效,都是新手很喜欢的。

刚看到觉得这些功能,我不屑一顾,觉得太小白。

但是想想,现在 AI 应用普及,不是卡在算力,卡在 AI 大模型的能力,而是好多人不会用

而 GPT images 不但效果好,它“内置风格”和“内置特效”真的降低了用户门槛,提高了产品易用性。就这点来讲,真的比谷歌那群钢铁直男懂产品多了。谷歌 gemini 还好,谷歌的 AI studio 简直是每个部件都放错了地方。

新手友好,而 AI 竞技榜(LMArena.ai)都是真实一线用户体验后的打分。

也许,“更高的易用性”就是 GPT images 1.5 评分反超 Nano-banana pro 的原因之一!

5、修图改图

GPT Images 1.5 的改图功能分为两个流派:

(1)提示语修改派

言出法随的改图,我们觉得照片人物表情太呆板,蜡烛颜色也不突出

提示词:蜡烛改为白色,人更有曲线

AI 立刻把图改好了

(2)涂改编辑派

有些不太好用言语控制的,可以用涂抹,先涂再发提示词修改。

先上传或者生成一张图片,击这张图 → 点击「选择区域」,进入后,鼠标移到图片上,出现画笔蒙版 + 半透明颜色, 涂你要改的地方,再写提示词

得到新图如下:

多层涂改

GPT images 1.5 还有些功能正在小范围测试,比如还多色框涂改功能,用不同颜色画笔做上记号,再发出提示。等正式上线再分享。

二、进阶技巧:从新手到大神

1、逻辑生图

GPT Images 1.5 不仅可以生图,还支持逻辑生图

夏天,一个 DQ 冰激凌 制作后的 0 分钟,5 分钟,15 分钟,30 分钟

AI 理解了

2、一次多图

可以一次性生成多张图,然后我再生成不同的分景做视频。

提示词:(杰作, 最高画质, 超细节, 8k 分辨率). 一张照片般逼真的 4 格分屏拼图,所有画面为同一女性角色。[关键:保持精确的面部特征,保留原始脸部结构,整个拼图中角色完全一致]. 角色皮肤白皙,质感自然,眼神明亮。左上图:角色穿着绿色的圣诞精灵服装,戴着尖尖的精灵耳朵道具,对着镜头敬礼,表情顽皮。右上图:角色手里拿着一个巨大的玩具锤子,假装要敲打镜头,眼睛睁得圆圆的。左下图:角色正在包装礼物,嘴里咬着丝带的一端,眉头微皱显得很专注可爱。右下图:角色坐在礼物堆上,双手托腮,双脚悬空晃动,一脸满足。环境:色彩饱和的圣诞工坊背景,红绿撞色。灯光:明亮的影棚灯光,无阴影,卡通感强。风格:K-pop 专辑内页风格,色彩鲜艳跳跃,清晰对焦,活泼搞怪。

3、参考名家

AI 支持融合各种流派的绘画风格,而且还临摹得有模有样。

提示词:以图中人物为主人公,创作一幅霍华德霍普一样孤独风格的照片

推荐大家去小红书看一个孙老师,拆解名画家风格

浅显易懂,非常有启发

4、更好的保持人物一致性

生成人物图像时,加上以下提示:

提示词:高挑沙漏黑发女郎(图 1),长波浪黑发垂肩,身着红白蛛网主题紧身无袖连体衣与高腰包腿裤,胸印大黑蜘蛛标志,手举橙色 iPhone17 Pro 对镜自拍,微嘟唇。全身入镜,镜框洁白,身后步入式衣橱衣物齐挂、叠衫列架,鞋靴排底,阳光漫入,柔影清新,现代极简 influencer 质感,高分辨率锐焦。一致性(身份锁定(最高优先级)】 100%还原 FACE_REF 的五官与骨相:脸型、容貌、眼距、鼻梁鼻翼、唇形、下颌线、颧骨结构完全一致,不得漂移。 真实皮肤质感:可见细微纹理与毛孔,不要过度磨皮与网红化。 成年女性形象。)

看看效果,中间是原图,左边是没加这段提示的,右边是加了的。加了人物保持会好一丢丢。

提示词:高挑沙漏黑发女郎(图 1),长波浪黑发垂肩,身着红白蛛网主题紧身无袖连体衣与高腰包腿裤,胸印大黑蜘蛛标志,手举橙色 iPhone17 Pro 对镜自拍,微嘟唇。全身入镜,镜框洁白,身后步入式衣橱衣物齐挂、叠衫列架,鞋靴排底,阳光漫入,柔影清新,现代极简 influencer 质感,高分辨率锐焦。

5、增加真实感

GPT 每张图都很美,但是有时候我们需要真实感。

增加以下提示时,会让做出来的图片更有真实感。

提示词:一张未经修饰的自然风格业余照片,背景清晰,采用三星 Galaxy S21 Ultra 拍摄,镜头焦距 24mm,光圈 f/8。照片呈现出一种朴素的现实感,自然柔和的阴影,抓拍的画面,光线平淡自然,低对比度,带有类似一次性相机的质感,随意的摄影风格,背景也完全清晰。照片中存在一些细微瑕疵,展现出一种日常美感,略带 JPEG 伪影,未经修饰,呈现出一种不完美的业余风格。

下面的图,左边加了真实感提示,右边没有

照片中人物为图片 1 人物,正在大堡礁沙滩喂海龟。

这张也是

对比一下,加了咒语的图(左)明显更有“人味儿”,像朋友圈发的照片;没加的(右)则像精修广告图。

6、镜头语言

可以用不同的镜头来做图

下面的图片,提示词,参考图完全一样,镜头分别是远景、中景、特写、近景

可以去看小红书一个叫“麟哥谈分镜”的频道,很多干货

7. 绕过“敏感词”限制

OpenAI 的安全机制非常严格,稍微带点“性感”的词就会被拦截。

解决方案:

使用“黑话”:不要直接描写身体部位。用“曲线凹凸”、“沙漏型”、“薄料”、“收腰”、“自信姿态”等词汇。

侧面描写:描述环境氛围(如“晨间慵懒”、“晚宴抓拍”),一些只可意会不可言传的词语,让 AI 自己去领悟。

李代桃僵:你提供的参考图本身比较妖娆,AI 基本不会卡你。

提示词: 4K iPhone 24mm 前置人物(图片)自拍 9:16 竖幅: 我们=她的手机,臂长距离,胸上至头顶构,微仰随角度,手持轻晃真实感。 傍晚 Burger King 内,顶灯柔光,菜单牌虚焦背景,托盘摆皇堡、薯条、纸杯。 东 20+ 岁少女,大眼圆亮,自然裸妆微唇彩,深褐乱发垂颊。灰棉短衫,薄料收腰,漏斗型身材,轻撑桌沿;浅蓝牛仔裤裹臀。 她微倾身,一手握汉堡近口,一手闲放桌面,抓拍自拍瞬间,可爱带点小随性。 体型仅参考图比例:纤腰平腹、圆润自然,布料真实拉伸。无脸克隆,无棚拍,无露骨。

再比如这段:

3:4 手机自拍:晨间圣诞主卧,红床皱乱,灯串与小树闪。湿卷黑短发的雀斑韩国 Kpop 女子,红色浴巾,露肩与深锁骨。她后仰微侧身,头向左倾抬眸看镜,红唇轻噘,右腕伸自拍,左肩后展。柔光窗光自左前洒,肤孔痣粒真实,背景浅景深虚化,raw 质感,节日慵懒气息.

也算是曲线救国了。 要放开限制还要GPT 的成人模式

给大家带来一个好消息:据悉 GPT 的成人模式(Adult Mode)已在小范围内测,预计 2026 年 Q1 全面启用,届时限制会放宽。Plus 会员先启用。

下图来自某网友发图:

三、黄金搭档:AI 工具搭子推荐

1、视频搭子

图 → 视频,首推 Grok,其次即梦。

国外推荐 grok ,grok 做图一般,图转视频效果却是一流

我们试一试 grok

打开网址 https://grok.com/imagine

上传图片

输入提示语:

女人站立俯身,拿起项链贴近镜头,特写项链

我简直被项链闪瞎了眼。

没有对比就没有伤害,我们看看谷歌的 Veo3.1:

哈哈,Veo 完全没有领悟到人民群众想要啥。

Grok上手指南:马斯克 Grok imagine 完整使用指南:工具、案例、提示词,看这一篇就够了!

2、姿势搭子

光靠提示词很难描述复杂的瑜伽或格斗动作。可以给参考图。

方法:直接上传“火柴人”或姿势图作为参考,GPT Images 1.5 对骨架的理解力极强。

可以给出参考图片

得到新图

推荐一个姿势图库网站:www.pinterest.com

更多姿势技巧详见文章《这六个神器,让 Nano-Banana 实现人物姿势自由》

3、对口型搭子

想让生成的静态美女说话?

上次我们在《火爆全网!手把手教你用 AI 做好莱坞探班视频》介绍了可灵视频 2.5 的首尾帧功能。

今天推荐用它的视频 2.6,支持音画同步

登录可灵,来到视频,选 2.6

上传小美,点选音色,输入要说的话,点生成

铛铛铛,小美活过来啦,还要请你喝奶茶

再来一段,炫耀自己的项链

总结

GPT Images 在 AI 竞技榜反超 Nano Banana 说明了什么?

通过实测,我们可以清晰地看到:GPT Images 1.5 并不是在画质上“碾压”了 Nano-banana Pro,而是赢在了“体验”上。

这是一个非常值得关注的行业信号,意味着图像生成的竞争重点正在发生变化,也可以理解为 OpenAI 对 Google 的一次阶段性反击。

第一,榜单本质在变

LMArena 更像“用户偏好投票”,不只看画质,而看“好不好用、听不听话”。

第二,GPT Images 1.5 赢在可控性

它在局部修改、多轮编辑、文字渲染上的稳定性明显提升,符合真实工作流,而不只是“一次性出图”。

第三,Nano Banana Pro 仍然很强,但偏理工

它在信息图、复杂逻辑画面上依然领先,但风格更偏严肃、功能导向,第一眼惊艳度略弱。

第四,用户需求已经转向

现在更看重“能反复改”、“不跑偏”、“更具美感”,而不是单纯“画得像不像”。Nano Banana Pro 太过写实,用户已经有点审美疲劳了。

一句话总结:

GPT Images 1.5 的反超,不是画质碾压,而是“更听话、更好改”,更贴近真实使用场景。

得用户者得天下。OpenAI 的战略是 GPT 锁定专业用户,绘图/视频服务小白用户。

别看谷歌现在嗓门大,一顿操作猛如虎,好不容易争取到了 15% 的市场份额,但终究显得底气不足,Nano Banana Pro 前期形成的优势肉眼可见地在缩小。

而手里握着 70% 用户的 OpenAI 也没闲着,它正在疯狂补短板,这一波操作下来,地位只会更稳。

这场 AI 绘图界的「权力的游戏」,好戏才刚刚开场。

你是站 Nano-banana 的「硬核写实派」,还是准备投奔 GPT Images 1.5 的「唯美易用派」?

评论区亮出你的观点,看看哪边的兄弟更多!”

感兴趣也可加入我们的小报童社区,到微信群一起讨论

近期精选:

国内怎么充值 GPT-5.2 会员?最简单的开通方法分享

AI漫剧三大天坑!你都中了几个?

本周最美!17 组「神级」AI 画小姐姐提示词

存下吧,很难找全的!12月最新AI视频工具/教程集锦

一站式搞定小电影,这才是打开 Nano-Banana Pro 的最强姿势!

国内可用,3毛一张!一键启动版Nano banana Pro,支持Openrouter,速创API

没有对比就没有伤害,实测可灵、即梦、Sora数字人

可灵吊打Sora ?中国 Banana 视频AI来啦

杀疯了!阿里开源 Z-Image 免费用,效果比拟 Nano Pro

限免 48 小时!Kimi 上线 Nano-banana pro 做 PPT 功能

吐血整理!10个免费Nano-banana Pro 的网站

AI 编程神器 OpenAI CodeX 完整教程:基本概念、安装配置、MCP、CLI+IDE运行、开发案例,看这一篇就够了

ChatGPT 5.2 完整使用指南:特性、案例、教程,看这一篇就够了!

Gemini3.0 完整使用指南:评测、案例、白嫖网站,看这一篇就够了!

标签: 分类

添加新评论