兄弟们,ChatGPT 又双叒叕升级了!

上周 GPT-5.2 才刚发布,本以为它家的图像新模型要憋到圣诞节才舍得拿出来,结果昨天毫无预警地就上线了——正式名称 ChatGPT Images 1.5。

回想 ChatGPT Images 的初代版本(1.0)是今年 3 月底发布的,当时号称“一句话改图”全球首创,立马在全网掀起了一波“言出法随”的热潮,妥妥的顶流 SOTA。

没想到才过大半年,攻防换位。GPT 被 Gemini 步步紧逼,在生图领域更是被 Nano-banana 按在地上摩擦。

这次 OpenAI 显然是憋了一肚子火,带着 1.5 版本杀回来了。

四大改进拳拳到肉: 指令更听话、编辑更精准、细节更变态、速度快 4 倍。甚至连那个被吐槽烂了的“画面发黄”问题,也终于修好了。

有些媒体写的得很夸张,一些说吊打 nano bananaana,一些则反映跑分第一,实际拉垮。

是骡子是马,遛遛就知道了,今天我们就来实地测试一下!

今天我们就来一场实地硬核评测!

我们的初赛集结了 8 位选手,除了主角 GPT,分别是:

谷歌 Gemini(Nano-banana):gemini.google.com

Midjourney:Lovart.ai

马斯克的 Grok: grok.com/imagine

豆包(即梦):www.doubao.com

可灵 AIapp.klingai.com

通义万相:https://tongyi.aliyun.com/wan/generate/image

阿里 Z-Image :https://www.modelscope.cn/aigc/imageGeneration

评测标准

我们将分四步走:先测美感(颜值即正义),再看中文支持(本土化能力),接着测一句话 P 图(聪明程度),最后考察多图融合的综合实力。

预赛先刷掉一波,最后留下两三个顶尖 AI 进行巅峰对决。

注:本次测试在 GPT 官网进行,作为 GPT Plus 用户,基本上可以无限敞开跑图。

大家可以选择升级到 GPT Plus(参考教程:《国内怎么充值 GPT-5.2 会员?最简单的开通方法分享》),

也可以直接到人见人爱的 Lovart.ai 聚合平台使用。

进入 OpenAI 官网,在左边多了一个图像,再点进去,我都以为我进错地方了,整个界面粉嘟嘟的。


测试正式开始!

一、美感测试

什么是美?能把人画好看,就是硬道理。

案例 1:韩系少女

提示词:韩式高亮闪光灯风格的年轻成年东亚女性自拍:白皙瓷感肌肤,慵懒侧坐在黑色皮质沙发上,穿灰色卫衣与白色背心、抽绳短裤,居家感自然放松。凌乱高丸子头与碎发,左眼下有一颗小痣。头部微微倾斜,右手托下巴,直视镜头并眨一只眼,表情俏皮自然。妆容为粉嫩腮红、渐变唇色,Aegyo-sal 高光明显。背景为极简白墙,旁边放置一台银色 MacBook。 50mm 竖幅构图,正面硬闪直打,高对比冷白色调,肤质细腻干净,粉色系饱和,整体清爽克制.

GPT Images 1.5

Nano-banana pro

Midjourney 7

马斯克的 Grok 1

豆包(即梦 4.5)

可灵 AI 1.5

通义万相 2.6

阿里 Z-Image :

这一轮暂时都留下。

案例 2:展会美女

一位美丽的微笑着的深褐色头发亚裔女性,长发凌乱地扎成马尾,身穿一件多彩的连衣裙,脖子上挂着蓝色的挂绳,手持麦克风站在“TedX”的舞台上。她一边与观众交谈一边微笑。她身后是一面白色的墙,墙上有一个黄色的谷歌标志。她有着优美的身材曲线。她的眼睛看起来里面闪烁着有趣或聪明的想法。整体氛围传达出信心和决心,因为她以 TedX 演讲的风格向来自不同领域的人们分享关于人工智能技术的知识。

GPT Images 1.5

美女眼中竟然有光?

Nano-banana pro

谷歌你是想搞哪样?胖是胖了点,但是很真实!

Midjourney 7

成像质量不错,但是你对"挂绳"的理解是否有点表面?

马斯克的 Grok

马斯克你是不是对亚裔有偏见?

豆包(即梦)4.5

可灵 AI 1.5

你可能会问为什么不用最新的可灵 2.1?

2.1 的风格如下图。总感觉哪里没对

通义万相 2.6

万相,你这分明是傻大姐

阿里 Z-Image :

这轮淘汰:Midjourney 7 、马斯克的 Grok、通义万相 2.6、阿里 Z-Image

案例 3:美女日常自拍

人像摆拍摄影,日常快照风格,非精心构图或打光,御姐 ,动作为在镜子前随手自拍,场景为酒店房间,落地镜前,用 iPhone 后置镜头自拍,开启闪光灯,略带快门速度不够造成的运动模糊,构图随意、角度尴尬、画面不够对称或美观,画质带有日常感和粗糙感,体现「平凡无奇」

GPT Images 1.5

讲真,我都不相信这是 GPT 画的。它把自拍和日常随拍的精华都抓到了。

Nano-banana pro

看来谷歌对御姐的理解是到位的。真的是资深大姐。

豆包(即梦)4.5

我说大姐,你能不能站近点?

可灵 AI 2.1 :

美女,你站得又未免太近了些

二、中文支持

案例 4:课本生成

提示词:生成小学语文课本,有中文和拼音,标题是《枫桥夜泊》 唐。张继 月落乌啼霜满天, 江枫渔火对愁眠。 姑苏城外寒山寺, 夜半钟声到客船。

GPT Images 1.5

三个汉字有瑕疵。一个拼音都没有错,整体完成度也很高。

Nano-banana pro

中文堪称完美

豆包(即梦)

我用 3.0、4.0、4.5 分别测试了,4.5 最差,3.0 其次,4.0 稍微好一点。如下,但是还是很多错别字。

可灵 AI 1.5

再见,可灵 AI

本轮淘汰可灵 AI,留着豆包做个国产软件的对比参考。

三、言出法随改图

案例 5:做手办

提示词:以高清摄影的写实风格和环境,制作一幅插画中角色的商业化手办。将手办放置在电脑桌上,使用无任何文字的圆形透明亚克力底座。在电脑屏幕上,展示该插画的图片。在电脑屏幕旁边,放置一个印着原画的玩具长方体包装盒。

GPT Images 1.5

GPT 对衣着再暴露一点就控制的很严了。

Nano-banana pro

一如既往的 nice

材质感更真实

豆包(即梦)4.5

案例 6:改图片风格

提示词:服装主题改为奥斯卡颁奖典礼风格,服装适配氛围

GPT Images 1.5

输入奥斯卡几个字,GPT 审核通不过,我只能改为"晚会"才通过。

不过这一轮我还是喜欢 GPT 的图,更耐看一些。

Nano-banana pro

豆包(即梦)4.5

杜宝对奥斯卡理解有误啊

案例 7:更换物品

提示词:把这个女的怀里的东西变成一根巨大的香蕉,她抱着香蕉露出很满意的样子。

GPT Images 1.5

别问为什么香蕉变成了西瓜?因为 GPT 说香蕉涉嫌违规,不让我生成。

Nano-banana pro

Nano-banana 会微调人物容貌,应该是故意的。

豆包(即梦)4.5

这次豆包改得还是不错的

四、多图融合

案例 8:人物姿势自由

提示词:图一和图二里的人物参考图三的动作,生成一个激烈的打斗场最的图片,专业棚拍,背景灰色

GPT Images 1.5

生成请了两次才出来图,说提示词低俗帮我改了一下。

我觉得 GPT 的尺度比以前大了。

Nano-banana pro

豆包(即梦)4.5

豆包拒绝生成。

案例 9:PPT 制作

收集最新资料,做一个万科化债可行性分析 PPT 风格的海报,用哈佛商业周刊风格

GPT Images 1.5

他给我生成的《哈佛商业评论》的封面。

Nano-banana pro

完美

豆包(即梦)4.5

几个版本做出来,海报上都有中文的乱码。不应该呀。

感觉豆包已经力不从心了,后面就不麻烦它了。淘汰。

案例 10:多图融合

提示词:把前面的图都有机地放到最后一张房间的图片里。

GPT Images 1.5

感觉怪怪的。不过房间整体一致性还是保持得比较好。

Nano-banana pro

看到孙悟空在电视里,我就想笑。

想想也合情合理,孙悟空就该在电视里。不过为什么把房间给我改了?因为需要有墙放电视吗?

案例 11:装修图

提示词:生成这张图片房屋精装修后的图片,北欧简约风格,不改变户型。

GPT Images 1.5

我觉得效果都不错,各自都有优点和瑕疵

Nano-banana pro

案例 12:百科全图

提示词:为我生成 V8 发动机的详细解说图,配上详细的中文知识解析。

GPT Images 1.5

中文还是有不少瑕疵

Nano-banana pro

中文略有瑕疵

案例 13:四格漫画

生成四格漫画:四格漫画构思:《战斗力,能斩巨人吗?》 核心梗概:  利用《龙珠》中经典的“战斗力数值”体系,与《进击的巨人》里人类通过“信念、战术与牺牲”对抗绝对力量的主题,形成幽默而鲜明的对比。第一格:误入墙壁的赛亚人 场景:XXX。题目很长,这里就略了

GPT Images 1.5

Nano-banana pro

总结:神仙打架,谁主沉浮?

从去年到今年,AI 作图领域真的发生了翻天覆地的变化。OpenAI 和谷歌的竞争已经进入白热化阶段。

这次 OpenAI 推出的新绘图模型,绝对是奥特曼(Sam Altman)应对危机拉响红色警报后的第二记重拳(第一拳是 GPT-5.2)。

评测下来,我的结论是:

Nano-banana 文字生成略胜一筹:特别是在带有文字的图片生成和中文支持方面,优势相当明显,不愧是“细节狂魔”。

GPT 后来居上:在提示词遵从、图片结构、人物美感等方面,GPT 已经完全不落下风,而且那种“一眼假”的 AI 味儿少了很多。

安全策略:GPT 的风控依然很严(甚至有点过于严了),这对想要“搞点颜色”的朋友来说是个坏消息,但也让我们更加期待传说中 OpenAI 即将上线的“成人模式”会是什么样。

接下来的一周是圣诞季,我很期待这两家巨头还没掏出的秘密武器。

兄弟们,好戏还在后头!

既然看到这里了,如果觉得这篇实测还不错,随手点个赞、在看、转发三连吧!

如果想第一时间收到推送,不错过下周的圣诞 AI 大乱斗,也可以给我个星标 ⭐ ~

谢谢你看我的文章,我们,下次再见。

对视频 AI 感兴趣的小伙伴可以关注“手把手教你用AI做视频赚钱”小报童

这个频道日更!分享了很多 AIGC 的知识和最前沿的实操案例、工具、提示词。

原价 299,买断优惠推广价 19元!

图片


近期文章集锦:

《吐血整理!10 个免费 Nano-banana Pro 的网站》

《杀疯了!阿里开源 Z-Image 免费用,效果比拟 Nano Pro》

《一站式搞定小电影,这才是打开 Nano-Banana Pro 的最强姿势!》

《ChatGPT 5.2 完整使用指南:特性、案例、教程,看这一篇就够了!》

《国内可用,3 毛一张!一键启动版 Nano banana Pro,支持 Openrouter,速创 API》

《一句话生成你的 AI 数字人!实时互动+专属知识库+真人克隆,NuwaAI 让虚拟员工轻松上线》

《AI 编程神器 OpenAI CodeX 完整教程:基本概念、安装配置、MCP、CLI+IDE 运行、开发案例,看这一篇就够》

标签: 分类

添加新评论