王不见王？横向评测GPT Images 1.5 / nano-banana：输赢只在毫厘！

兄弟们，ChatGPT 又双叒叕升级了！

上周 GPT-5.2 才刚发布，本以为它家的图像新模型要憋到圣诞节才舍得拿出来，结果昨天毫无预警地就上线了——正式名称 ChatGPT Images 1.5。

回想 ChatGPT Images 的初代版本（1.0）是今年 3 月底发布的，当时号称“一句话改图”全球首创，立马在全网掀起了一波“言出法随”的热潮，妥妥的顶流 SOTA。

没想到才过大半年，攻防换位。GPT 被 Gemini 步步紧逼，在生图领域更是被 Nano-banana 按在地上摩擦。

这次 OpenAI 显然是憋了一肚子火，带着 1.5 版本杀回来了。

四大改进拳拳到肉： 指令更听话、编辑更精准、细节更变态、速度快 4 倍。甚至连那个被吐槽烂了的“画面发黄”问题，也终于修好了。

有些媒体写的得很夸张，一些说吊打 nano bananaana，一些则反映跑分第一，实际拉垮。

是骡子是马，遛遛就知道了，今天我们就来实地测试一下！

今天我们就来一场实地硬核评测！

我们的初赛集结了 8 位选手，除了主角 GPT，分别是：

谷歌 Gemini（Nano-banana）：gemini.google.com

Midjourney：Lovart.ai

马斯克的 Grok： grok.com/imagine

豆包(即梦）：www.doubao.com

可灵 AI：app.klingai.com

通义万相：https://tongyi.aliyun.com/wan/generate/image

阿里 Z-Image ：https://www.modelscope.cn/aigc/imageGeneration

评测标准

我们将分四步走：先测美感（颜值即正义），再看中文支持（本土化能力），接着测一句话 P 图（聪明程度），最后考察多图融合的综合实力。

预赛先刷掉一波，最后留下两三个顶尖 AI 进行巅峰对决。

注：本次测试在 GPT 官网进行，作为 GPT Plus 用户，基本上可以无限敞开跑图。

大家可以选择升级到 GPT Plus（参考教程：《国内怎么充值 GPT-5.2 会员？最简单的开通方法分享》），

也可以直接到人见人爱的 Lovart.ai 聚合平台使用。

进入 OpenAI 官网，在左边多了一个图像，再点进去，我都以为我进错地方了，整个界面粉嘟嘟的。

测试正式开始！

一、美感测试

什么是美？能把人画好看，就是硬道理。

案例 1：韩系少女

❝
提示词：韩式高亮闪光灯风格的年轻成年东亚女性自拍：白皙瓷感肌肤，慵懒侧坐在黑色皮质沙发上，穿灰色卫衣与白色背心、抽绳短裤，居家感自然放松。凌乱高丸子头与碎发，左眼下有一颗小痣。头部微微倾斜，右手托下巴，直视镜头并眨一只眼，表情俏皮自然。妆容为粉嫩腮红、渐变唇色，Aegyo-sal 高光明显。背景为极简白墙，旁边放置一台银色 MacBook。 50mm 竖幅构图，正面硬闪直打，高对比冷白色调，肤质细腻干净，粉色系饱和，整体清爽克制.

GPT Images 1.5

Nano-banana pro：

Midjourney 7：

马斯克的 Grok 1：

豆包(即梦 4.5）：

可灵 AI 1.5：

通义万相 2.6：

阿里 Z-Image ：

这一轮暂时都留下。

案例 2：展会美女

❝
一位美丽的微笑着的深褐色头发亚裔女性，长发凌乱地扎成马尾，身穿一件多彩的连衣裙，脖子上挂着蓝色的挂绳，手持麦克风站在“TedX”的舞台上。她一边与观众交谈一边微笑。她身后是一面白色的墙，墙上有一个黄色的谷歌标志。她有着优美的身材曲线。她的眼睛看起来里面闪烁着有趣或聪明的想法。整体氛围传达出信心和决心，因为她以 TedX 演讲的风格向来自不同领域的人们分享关于人工智能技术的知识。

GPT Images 1.5

美女眼中竟然有光？

Nano-banana pro：

谷歌你是想搞哪样？胖是胖了点，但是很真实！

Midjourney 7：

成像质量不错，但是你对"挂绳"的理解是否有点表面？

马斯克的 Grok：

马斯克你是不是对亚裔有偏见？

豆包(即梦）4.5：

可灵 AI 1.5：

你可能会问为什么不用最新的可灵 2.1？

2.1 的风格如下图。总感觉哪里没对

通义万相 2.6：

万相，你这分明是傻大姐

阿里 Z-Image ：

这轮淘汰：Midjourney 7 、马斯克的 Grok、通义万相 2.6、阿里 Z-Image

案例 3：美女日常自拍

❝
人像摆拍摄影，日常快照风格，非精心构图或打光，御姐，动作为在镜子前随手自拍，场景为酒店房间，落地镜前，用 iPhone 后置镜头自拍，开启闪光灯，略带快门速度不够造成的运动模糊，构图随意、角度尴尬、画面不够对称或美观，画质带有日常感和粗糙感，体现「平凡无奇」

GPT Images 1.5

讲真，我都不相信这是 GPT 画的。它把自拍和日常随拍的精华都抓到了。

Nano-banana pro：

看来谷歌对御姐的理解是到位的。真的是资深大姐。

豆包(即梦）4.5：

我说大姐，你能不能站近点？

可灵 AI 2.1 ：

美女，你站得又未免太近了些

二、中文支持

案例 4：课本生成

❝
提示词：生成小学语文课本，有中文和拼音，标题是《枫桥夜泊》唐。张继月落乌啼霜满天, 江枫渔火对愁眠。姑苏城外寒山寺, 夜半钟声到客船。

GPT Images 1.5

三个汉字有瑕疵。一个拼音都没有错，整体完成度也很高。

Nano-banana pro：

中文堪称完美

豆包(即梦）：

我用 3.0、4.0、4.5 分别测试了，4.5 最差，3.0 其次，4.0 稍微好一点。如下，但是还是很多错别字。

可灵 AI 1.5：

再见，可灵 AI

本轮淘汰可灵 AI，留着豆包做个国产软件的对比参考。

三、言出法随改图

案例 5：做手办

❝
提示词：以高清摄影的写实风格和环境，制作一幅插画中角色的商业化手办。将手办放置在电脑桌上，使用无任何文字的圆形透明亚克力底座。在电脑屏幕上，展示该插画的图片。在电脑屏幕旁边，放置一个印着原画的玩具长方体包装盒。

GPT Images 1.5

GPT 对衣着再暴露一点就控制的很严了。

Nano-banana pro：

一如既往的 nice

材质感更真实

豆包(即梦）4.5：

案例 6：改图片风格

❝
提示词:服装主题改为奥斯卡颁奖典礼风格，服装适配氛围

GPT Images 1.5

输入奥斯卡几个字，GPT 审核通不过，我只能改为"晚会"才通过。

不过这一轮我还是喜欢 GPT 的图，更耐看一些。

Nano-banana pro：

豆包(即梦）4.5：

杜宝对奥斯卡理解有误啊

案例 7：更换物品

❝
提示词：把这个女的怀里的东西变成一根巨大的香蕉，她抱着香蕉露出很满意的样子。

GPT Images 1.5

别问为什么香蕉变成了西瓜？因为 GPT 说香蕉涉嫌违规，不让我生成。

Nano-banana pro：

Nano-banana 会微调人物容貌，应该是故意的。

豆包(即梦）4.5：

这次豆包改得还是不错的

四、多图融合

案例 8：人物姿势自由

❝
提示词：图一和图二里的人物参考图三的动作，生成一个激烈的打斗场最的图片,专业棚拍，背景灰色

GPT Images 1.5

生成请了两次才出来图，说提示词低俗帮我改了一下。

我觉得 GPT 的尺度比以前大了。

Nano-banana pro：

豆包(即梦）4.5：

豆包拒绝生成。

案例 9：PPT 制作

❝
收集最新资料，做一个万科化债可行性分析 PPT 风格的海报，用哈佛商业周刊风格

GPT Images 1.5

他给我生成的《哈佛商业评论》的封面。

Nano-banana pro：

完美

豆包(即梦）4.5：

几个版本做出来，海报上都有中文的乱码。不应该呀。

感觉豆包已经力不从心了，后面就不麻烦它了。淘汰。

案例 10：多图融合

❝
提示词：把前面的图都有机地放到最后一张房间的图片里。

GPT Images 1.5

感觉怪怪的。不过房间整体一致性还是保持得比较好。

Nano-banana pro：

看到孙悟空在电视里，我就想笑。

想想也合情合理，孙悟空就该在电视里。不过为什么把房间给我改了？因为需要有墙放电视吗？

案例 11：装修图

❝
提示词：生成这张图片房屋精装修后的图片，北欧简约风格，不改变户型。

GPT Images 1.5

我觉得效果都不错，各自都有优点和瑕疵

Nano-banana pro：

案例 12：百科全图

❝
提示词：为我生成 V8 发动机的详细解说图，配上详细的中文知识解析。

GPT Images 1.5

中文还是有不少瑕疵

Nano-banana pro：

中文略有瑕疵

案例 13：四格漫画

❝
生成四格漫画：四格漫画构思：《战斗力，能斩巨人吗？》核心梗概：利用《龙珠》中经典的“战斗力数值”体系，与《进击的巨人》里人类通过“信念、战术与牺牲”对抗绝对力量的主题，形成幽默而鲜明的对比。第一格：误入墙壁的赛亚人场景：XXX。题目很长，这里就略了

GPT Images 1.5

Nano-banana pro：

总结：神仙打架，谁主沉浮？

从去年到今年，AI 作图领域真的发生了翻天覆地的变化。OpenAI 和谷歌的竞争已经进入白热化阶段。

这次 OpenAI 推出的新绘图模型，绝对是奥特曼（Sam Altman）应对危机拉响红色警报后的第二记重拳（第一拳是 GPT-5.2）。

评测下来，我的结论是：

Nano-banana 文字生成略胜一筹：特别是在带有文字的图片生成和中文支持方面，优势相当明显，不愧是“细节狂魔”。

GPT 后来居上：在提示词遵从、图片结构、人物美感等方面，GPT 已经完全不落下风，而且那种“一眼假”的 AI 味儿少了很多。

安全策略：GPT 的风控依然很严（甚至有点过于严了），这对想要“搞点颜色”的朋友来说是个坏消息，但也让我们更加期待传说中 OpenAI 即将上线的“成人模式”会是什么样。

接下来的一周是圣诞季，我很期待这两家巨头还没掏出的秘密武器。

兄弟们，好戏还在后头！

既然看到这里了，如果觉得这篇实测还不错，随手点个赞、在看、转发三连吧！

如果想第一时间收到推送，不错过下周的圣诞 AI 大乱斗，也可以给我个星标 ⭐ ～

谢谢你看我的文章，我们，下次再见。

对视频 AI 感兴趣的小伙伴可以关注“手把手教你用AI做视频赚钱”小报童！

这个频道日更！分享了很多 AIGC 的知识和最前沿的实操案例、工具、提示词。

原价 299，买断优惠推广价 19元！

近期文章集锦：

《吐血整理！10 个免费 Nano-banana Pro 的网站》

《杀疯了！阿里开源 Z-Image 免费用，效果比拟 Nano Pro》

《一站式搞定小电影，这才是打开 Nano-Banana Pro 的最强姿势！》

《ChatGPT 5.2 完整使用指南：特性、案例、教程，看这一篇就够了！》

《国内可用，3 毛一张！一键启动版 Nano banana Pro，支持 Openrouter，速创 API》

《一句话生成你的 AI 数字人！实时互动+专属知识库+真人克隆，NuwaAI 让虚拟员工轻松上线》

《AI 编程神器 OpenAI CodeX 完整教程：基本概念、安装配置、MCP、CLI+IDE 运行、开发案例，看这一篇就够》

王不见王？横向评测GPT Images 1.5 / nano-banana：输赢只在毫厘！

一、美感测试

案例 1：韩系少女

案例 2：展会美女

案例 3：美女日常自拍

二、中文支持

案例 4：课本生成

三、言出法随改图

案例 5：做手办

案例 6：改图片风格

案例 7：更换物品

四、多图融合

案例 8：人物姿势自由

案例 9：PPT 制作

案例 10：多图融合

案例 11：装修图

案例 12：百科全图

案例 13：四格漫画

总结：神仙打架，谁主沉浮？

添加新评论

分类

其它