ChatGPT 灰度新模型 GPT Image 2:文字清晰到不像 AI
Nano Banana 2/Pro 生图已经很强了,就在刚刚 ChatGPT 灰度了一套新图像模型 GPT Image 2(还不是正式名称),我还是被震惊了一下:它在「文字效果」这件事上,明显又往前走了一步,而且是以假乱真的大跨越。
直接看生成的图。
1)多语言信息图:可读性非常好
X 网友 @takuto_pitali 用新老两版 GPT Image 生成日文信息图,差异非常直观。
👇这张是 GPT Image 1.5 的:存在日文乱码、排版不够清晰、配色也略显杂乱。

而用 GPT Image 2 生成的版本,版式更精炼、层级更清楚,颜色更协调,文字也清晰且几乎没有乱码,可读性非常好。

让 GPT Image 2 生成游戏包装盒,比老模型的画面细节更丰富、文字渲染更清晰、色彩更自然,整体更接近专业游戏封面设计。

2)UI / 游戏截图风:文字多到夸张,居然还很稳
文字渲染能力远不止如此,看 X 网友 @0x0SojalSec 用 GPT Image 2 生成游戏与软件界面,文本量巨大、字号很小、字体样式丰富。
我如果说这是我截图的,而不是用 AI 生成的,我估计很多人都会信。



3)透视倾斜 + 拍屏幕:文字跟着空间一起成立
更狠的是新模型对拟真摄影语境的模拟:X 网友 @venturetwins 让GPT Image 2在截图外生成一个带透视的电脑屏幕外框,让画面像是手机斜着拍屏幕。屏幕内的文字也跟着产生倾斜与透视变化。

4)中文/书法/密集文字:覆盖面更广
X 网友 @Tz_2022 测试了中文书法、荧光汉字、韩文、阿拉伯文等密集文字内容,整体也相当稳定。


除了文字,还有哪些关键改进?
除了文字生成效果之外,GPT Image 2 还有一些明显的改进。
1)色彩倾向没那么暖黄
上一代 GPT Image 经常出现一种很典型的暖黄色调:整体偏黄、偏橙,像盖了一层暖色滤镜。它会导致白墙/地面变奶油黄,肤色发黄,越改越黄。
很多人甚至靠「是不是偏黄」来判断这是不是 GPT 生成的图。
从 X 网友 @0x0SojalSec 的测试看,这个倾向明显弱化:比如这张 Fortnite 大厅界面背景更接近中性灰白/蓝白,而不是泛暖黄。

2)真实感与世界理解
下面这张图很容易让人误以为是实拍,平凡甚至有些脏乱:水泥地面的粗糙纹理、干湿交界的水渍、灰尘颗粒、砖块风化、黑色塑料袋的反光褶皱……都很像手机贴地拍出来的效果。光影柔和自然,没有刻意的锐化或虚假的高级感。

GPT Image 2 还能准确还原真实超市货架:KAME 牡蛎酱的品牌 Logo、乌龟图案、英文标签、净含量、包装配图,以及旁边 WOK MEI 同系列产品的风格统一性;货架高度与排列方式也符合常识,甚至连亚洲调味品区的典型摆放逻辑都有体现。

再看这张生成的世界地图,说明GPT Image 2 能一次性准确回忆并画出全球地形、地理特征和大量真实地名,几乎像从专业数据库里直接「复制」了一张真实地图。连图上几百个英文地名、海洋名称、图例文字、统计数据框,全都清晰、字体一致、位置精准。(当然也有一些部分单词拼写错误的小瑕疵)

3)结构一致性与几何推理更少崩坏
从这张人像示例看,头部比例、脖子与衣领连接、帽子透视变形、肩膀姿态等都符合基本解剖和透视规则。眼睛对焦准确,左右脸对称但又保留自然微差(真实人脸本来就不完全对称)。

如果用1.5和2生成Sam Altman对比你就能发现,2没有那种卡通质感,而是更接近真人,有明显的皱纹和皮肤油光毛孔。

时钟测试这种经典难题也能过,很多模型会把指针画错(常见的是全部指向 10:10 的广告式对称位置),或者干脆忽略秒针。
X 网友 @Tz_2022 让 GPT Image 2 生成 8:13:44 这种具体时间,说明新模型在细粒度空间理解和数学/几何推理上的进步,而不是单纯靠训练数据里的常见图案去猜。

@mjlbach 还发现 GPT Image 2 的有点幽默感:让GPT Image 2 用 ChatGPT CEO Sam Altman 的形象生成一张游戏卡牌,这个新模型把 Sam Altman 封为 「AI 时代主席」(Chairman of the AI Era),像政治领袖一样。还配上夸张的 ATK/DEF 和稀有度,让Sam Altman看上去像是一个很难抽到的稀有角色,
很像员工给老板做的恶搞海报,又吹捧又搞笑。

和主流模型相比如何?
由于现在还是灰度测试,很多人没拿到权限,所以在网上也找不到和其他模型对比的很多案例。
如果你把比较焦点收窄到文字相关的任务,GPT Image 2 的优势会非常明显。
从 X 网友 @grmchn4ai 这个高信息量的手办海报场景对比来看,Nano Banana 2 的文字版式相对一般,而 GPT Image 2 在细节锐利度、文字清晰度,以及对版式和色彩的美学上更占优势。

真的就毫无缺点吗?
当然有!剑桥大学纯数学学生AcerFur就发现,GPT Image 2空间推理能力一般般。涉及到镜面反射就不太行了
比如魔方在镜子里的反射颜色是错的。

文字「WOW」的倒影,O都变方了。

还有直接效果非常好的屏幕里界面效果,遇到倒影界面里的文字方向就错了。

迈克尔·穆尔(ETH Zurich的助理教授)指出,OpenAI新图像生成模型产生的解剖图外观看着很专业,但存在多处错误,他特别标注了左腿区域的问题。


怎么才能试用到 GPT Image 2?
目前 GPT Image 2 仍处于灰度/泄露测试阶段,尚未看到 OpenAI 的正式发布与明确命名。
不过从 X 上的集中反馈看,最近一段时间 ChatGPT 的 Images 生成任务有概率随机切换到新模型,你可以试试以下方式:
- 登录 chatgpt.com(网页)或 ChatGPT 手机 App(iOS/Android)。
- 进入左侧 Images 专区(或直接在聊天框输入「生成一张……」)。
- 多刷复杂提示:连续生成 5-15 张带大量文字、界面、产品、YouTube 截图、医疗图、信息海报的图片。简单风景或纯艺术图更容易走旧模型。
- 触发/验证技巧:
- 在提示词最后加 “Format 16:9” —— GPT Image 2 支持 16:9 宽屏,而 GPT Image 1.5 最高只到 3:2。如果成功生成 16:9 比例且质量明显更高(文字 razor sharp、无暖黄色调、细节更真实),就是新模型。
- Plus/Pro 账号概率更高,免费用户也能抽到,但限额更严。
你可以试着用网友@Elaina43114880的提示词:
Generate an image: A realistic YouTube screenshot showing the official launch promotional video for GPT Image V2 from OpenAI’s official account, with comments, 16:9 aspect ratio, 4K resolution.
如果生成的效果像这样,文字超级清晰、颜色自然、复杂场景逻辑完美 → 恭喜,你抽中了。

ChatGPT 灰度新模型 GPT Image 2:文字清晰到不像 AI

