2026-04-05发表2026-05-23更新AI新知15 分钟读完 (大约2223个字)0次访问

ChatGPT 灰度新模型 GPT Image 2：文字清晰到不像 AI

Nano Banana 2/Pro 生图已经很强了，就在刚刚 ChatGPT 灰度了一套新图像模型 GPT Image 2（还不是正式名称），我还是被震惊了一下：它在「文字效果」这件事上，明显又往前走了一步，而且是以假乱真的大跨越。

直接看生成的图。

1）多语言信息图：可读性非常好

X 网友 @takuto_pitali 用新老两版 GPT Image 生成日文信息图，差异非常直观。

👇这张是 GPT Image 1.5 的：存在日文乱码、排版不够清晰、配色也略显杂乱。

而用 GPT Image 2 生成的版本，版式更精炼、层级更清楚，颜色更协调，文字也清晰且几乎没有乱码，可读性非常好。

让 GPT Image 2 生成游戏包装盒，比老模型的画面细节更丰富、文字渲染更清晰、色彩更自然，整体更接近专业游戏封面设计。

2）UI / 游戏截图风：文字多到夸张，居然还很稳

文字渲染能力远不止如此，看 X 网友 @0x0SojalSec 用 GPT Image 2 生成游戏与软件界面，文本量巨大、字号很小、字体样式丰富。

我如果说这是我截图的，而不是用 AI 生成的，我估计很多人都会信。

3）透视倾斜 + 拍屏幕：文字跟着空间一起成立

更狠的是新模型对拟真摄影语境的模拟：X 网友 @venturetwins 让GPT Image 2在截图外生成一个带透视的电脑屏幕外框，让画面像是手机斜着拍屏幕。屏幕内的文字也跟着产生倾斜与透视变化。

4）中文/书法/密集文字：覆盖面更广

X 网友 @Tz_2022 测试了中文书法、荧光汉字、韩文、阿拉伯文等密集文字内容，整体也相当稳定。

除了文字，还有哪些关键改进？

除了文字生成效果之外，GPT Image 2 还有一些明显的改进。

1）色彩倾向没那么暖黄

上一代 GPT Image 经常出现一种很典型的暖黄色调：整体偏黄、偏橙，像盖了一层暖色滤镜。它会导致白墙/地面变奶油黄，肤色发黄，越改越黄。

很多人甚至靠「是不是偏黄」来判断这是不是 GPT 生成的图。

从 X 网友 @0x0SojalSec 的测试看，这个倾向明显弱化：比如这张 Fortnite 大厅界面背景更接近中性灰白/蓝白，而不是泛暖黄。

2）真实感与世界理解

下面这张图很容易让人误以为是实拍，平凡甚至有些脏乱：水泥地面的粗糙纹理、干湿交界的水渍、灰尘颗粒、砖块风化、黑色塑料袋的反光褶皱……都很像手机贴地拍出来的效果。光影柔和自然，没有刻意的锐化或虚假的高级感。

GPT Image 2 还能准确还原真实超市货架：KAME 牡蛎酱的品牌 Logo、乌龟图案、英文标签、净含量、包装配图，以及旁边 WOK MEI 同系列产品的风格统一性；货架高度与排列方式也符合常识，甚至连亚洲调味品区的典型摆放逻辑都有体现。

再看这张生成的世界地图，说明GPT Image 2 能一次性准确回忆并画出全球地形、地理特征和大量真实地名，几乎像从专业数据库里直接「复制」了一张真实地图。连图上几百个英文地名、海洋名称、图例文字、统计数据框，全都清晰、字体一致、位置精准。（当然也有一些部分单词拼写错误的小瑕疵）

3）结构一致性与几何推理更少崩坏

从这张人像示例看，头部比例、脖子与衣领连接、帽子透视变形、肩膀姿态等都符合基本解剖和透视规则。眼睛对焦准确，左右脸对称但又保留自然微差（真实人脸本来就不完全对称）。

如果用1.5和2生成Sam Altman对比你就能发现，2没有那种卡通质感，而是更接近真人，有明显的皱纹和皮肤油光毛孔。

时钟测试这种经典难题也能过，很多模型会把指针画错（常见的是全部指向 10:10 的广告式对称位置），或者干脆忽略秒针。

X 网友 @Tz_2022 让 GPT Image 2 生成 8:13:44 这种具体时间，说明新模型在细粒度空间理解和数学/几何推理上的进步，而不是单纯靠训练数据里的常见图案去猜。

@mjlbach 还发现 GPT Image 2 的有点幽默感：让GPT Image 2 用 ChatGPT CEO Sam Altman 的形象生成一张游戏卡牌，这个新模型把 Sam Altman 封为「AI 时代主席」（Chairman of the AI Era），像政治领袖一样。还配上夸张的 ATK/DEF 和稀有度，让Sam Altman看上去像是一个很难抽到的稀有角色，

很像员工给老板做的恶搞海报，又吹捧又搞笑。

和主流模型相比如何？

由于现在还是灰度测试，很多人没拿到权限，所以在网上也找不到和其他模型对比的很多案例。

如果你把比较焦点收窄到文字相关的任务，GPT Image 2 的优势会非常明显。

从 X 网友 @grmchn4ai 这个高信息量的手办海报场景对比来看，Nano Banana 2 的文字版式相对一般，而 GPT Image 2 在细节锐利度、文字清晰度，以及对版式和色彩的美学上更占优势。

真的就毫无缺点吗？

当然有！剑桥大学纯数学学生AcerFur就发现，GPT Image 2空间推理能力一般般。涉及到镜面反射就不太行了

比如魔方在镜子里的反射颜色是错的。

文字「WOW」的倒影，O都变方了。

还有直接效果非常好的屏幕里界面效果，遇到倒影界面里的文字方向就错了。

迈克尔·穆尔（ETH Zurich的助理教授）指出，OpenAI新图像生成模型产生的解剖图外观看着很专业，但存在多处错误，他特别标注了左腿区域的问题。

怎么才能试用到 GPT Image 2？

目前 GPT Image 2 仍处于灰度/泄露测试阶段，尚未看到 OpenAI 的正式发布与明确命名。

不过从 X 上的集中反馈看，最近一段时间 ChatGPT 的 Images 生成任务有概率随机切换到新模型，你可以试试以下方式：

登录 chatgpt.com（网页）或 ChatGPT 手机 App（iOS/Android）。
进入左侧 Images 专区（或直接在聊天框输入「生成一张……」）。
多刷复杂提示：连续生成 5-15 张带大量文字、界面、产品、YouTube 截图、医疗图、信息海报的图片。简单风景或纯艺术图更容易走旧模型。
触发/验证技巧：
- 在提示词最后加 “Format 16:9” —— GPT Image 2 支持 16:9 宽屏，而 GPT Image 1.5 最高只到 3:2。如果成功生成 16:9 比例且质量明显更高（文字 razor sharp、无暖黄色调、细节更真实），就是新模型。
- Plus/Pro 账号概率更高，免费用户也能抽到，但限额更严。

你可以试着用网友@Elaina43114880的提示词：

Generate an image: A realistic YouTube screenshot showing the official launch promotional video for GPT Image V2 from OpenAI’s official account, with comments, 16:9 aspect ratio, 4K resolution.

如果生成的效果像这样，文字超级清晰、颜色自然、复杂场景逻辑完美 → 恭喜，你抽中了。

ChatGPT 灰度新模型 GPT Image 2：文字清晰到不像 AI

https://www.ftium4.com/GPT-Image-2.html

作者

龙爪槐守望者

发布于

2026-04-05

更新于

2026-05-23

许可协议

#AI ChatGPT

支付宝

微信

ChatGPT 灰度新模型 GPT Image 2：文字清晰到不像 AI

1）多语言信息图：可读性非常好

2）UI / 游戏截图风：文字多到夸张，居然还很稳

3）透视倾斜 + 拍屏幕：文字跟着空间一起成立

4）中文/书法/密集文字：覆盖面更广

除了文字，还有哪些关键改进？

1）色彩倾向没那么暖黄

2）真实感与世界理解

3）结构一致性与几何推理更少崩坏

和主流模型相比如何？

真的就毫无缺点吗？

怎么才能试用到 GPT Image 2？

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

follow.it

分类

链接

目录

标签

广告