zbo智博1919com

新闻中心 新闻中心

细到能在米粒上写字,,,OpenAI让人对所有截图的信赖归零了

在 AI 巨头焦灼对战的此刻,,,谁

作者:吴政杰
颁布功夫:2026-05-15 05:30:56
阅读量:8

细到能在米粒上写字,,,OpenAI让人对所有截图的信赖归零了

在 AI 巨头焦灼对战的此刻,,,谁也想不到,,,还有能靠榜单数据,,,拉出一个代差的文生图模型!!

没错,,,说的就是GPT Images 2!!

测试样例相信各人应该都看的差不多了,,,根基都能总结出它相比上一代好在哪!!

好比高正确、、高密度的文字渲染,,,出格是中文,,,甚至能天生可运行的代码;;;真切甚侄裣癌瘆人的 UI 截图仿照,,,昨天应该有不少人被一则 Claude Code 的推文骗到;;;画面精密度和审美水平也大大提升,,,那些一眼 AI 的狼狈打光出现的概率一下子低了太多,,,估计能让 Midjourney 吓出一身盗汗;;;强推理能力,,,能关注到好多你没写的细节,,,越来越靠近大说话模型的交互履历!!V劣诒锥,,,OpenAI 自己也认可,,,在空间理解上的能力还不够!!

当然,,,知危在测试一下后也能感触到,,,好多反复无数遍的论点依然成立:设计圈不会因而崩塌,,,审美和创意仍旧属于人类,,,告白人才是受益最大的人群,,,行业市场价值的确必要重估,,,但不会直接归零!!R,,,每次一个炸裂的 AI 模型颁布后,,,都是小白、、老板和投资人最兴奋!!@习搴屯蹲嗜讼胧裁锤魅硕贾,,,小白不愿定是指纯门外汉,,,还有各类业务中必要补足艺术创作的人,,,好比告白导演能够省去大量拍摄和后期成本!!V辽僭诘毕,,,AI 都是用来补足人的短板,,,而不是代替人的!!

但,,,相比取代人类,,,我们要关切可能是另一种;;;:人们对图片的信赖可能会崩坍,,,之后看到的每一张截图都必要留个心眼!!

在今天知危对 GPT Images 2 的测评中,,,就会将上述提到的文字渲染、、UI 仿照、、精密节制、、强推理这些利益,,,做一个极限测试,,,看看天堑在哪,,,也看看安全隐患有多大!!

首先是文字渲染方面,,,知危出格把稳到 OpenAI 颁布的一张图,,,看似是一个平平无奇的铺在夏布上的白米堆!!

但放大后有彩蛋,,,能够看到正中心的一粒米上写了文字 “ GPT Image 2 ”!!

这张图能够说是给知危带来最大震撼的官规划例!!

知危当即筹算把这个例子复刻出来!!5 ChatGPT 和 Lovart 尝试屡次后发现成效通常!!4蟛棵徘榭鱿,,,要么所有米粒都很大,,,能够轻松写下文字!!

要么会以一种 “ 舞弊 ” 的方式写上去,,,好比只有写字的米;;;岜涞眉却!!

后来通过一种多步迭代的方式来尝试,,,要求模型把上图写着文字的米粒缩小,,,反复屡次之后,,,终于有了差不多的样子,,,但文字状态已经很难看清了!!

而后知危才发现,,,OpenAI 提供的例子是 4K 分辨率的,,,而在 ChatGPT 和 Lovart 上免费使用时只能天生 1K 分辨率的图像!!N,,,知危买了个会员来测试 GPT Image 2 的最高质量和最高分辨率版本( 通过 Higgsfield AI ),,,以下每张图都基于这个规格!!

是不是选取最高规格就能成功复刻了呢 ??并没有!!R谎奈侍饣故且幌虺鱿,,,不是所有米粒都太大,,,就是有文字的米粒太大,,,无论怎么提醒模型 “ 文字只有 75x30 像素巨细 ”、、“ 写着文字的米:推渌琢R谎 ”!!

以下是知危感触还算比力惊艳的两个例子!!5谝徽磐荚谟谖淖咒秩镜奈锢碚媸敌,,,第二张图在于文字足够小但很清澈!!

接下来再刁难它一下,,,让它把上图的 “ Zhiwei ” 复制到另一颗米上去,,,这回倒是很顺利,,,但很显著模型特意新天生了一粒米来写文字!!

若是是一粒米上写大量文字,,,好比一首诗呢 ??舞弊手法再次出现!!<幢闱康髯痔寰尴肝吹募戎,,,以及写诗的米粒不比其它米粒大,,,依然很违和!!

再从唐诗换为宋词,,,模型直接自己洒了一把不知种类的大米来写!!

到这里只能先作罢,,,目前看了局要么是提醒词没猜对,,,要么 OpenAI 只是给了一个无意的了局,,,要么 OpenAI 是用更高级此外算力天生出来的!!V沼诒匾糯蠛竽芰吹轿淖,,,可能隐含了多一个级此外场景复杂度和推理难度!!DP陀捎诮诩笏懔Χ抵,,,宣传片和内测阶段都很牛逼的模型,,,一旦正式颁布就发现大打折扣,,,相信各人已经遇到不少次了!!

当然,,,这也隐含了一种可能性,,,大模型公司内部的 AI 能力比我们能见到的还强得多,,,但受限于算力无法遍及!!2煌庹飧隼右蚕笳餍缘厝梦颐歉写サ轿纳寄P驮僖淮瓮黄屏思!!

对了,,,猜猜 GPT Images 2 老冤家 Nano Banana Pro 会怎么做这道题 ??

别笑,,,这事 GPT Image 2 也可能做得出来!!

接下来,,,我们再看一些比力有实用价值的测试维度,,,好比文字渲染密度!!U饪赡苁钦庖话婺P妥罹呤涤眉壑档囊桓瞿芰,,,在海报、、产品图、、科普图中都有大用!!

测试很单一,,,就是看 GPT Image 2 在一张图中最多能塞进几多个文字!!

我们以《西游记》原文为例,,,将第一章的内容逐步增长字数提供给模型,,,看看成效若何!!

首先是从开篇到孙悟空刚出世,,,或许 1300 字!!

天生了局如下,,,险些看不到一个错字或崩坏的字,,,甚至提醒词中蕴含的拼音注解也加进去了!!

接下来,,,增长文本,,,从开篇一向到孙悟空称美猴王,,,约莫 2800 字!!U庖换,,,模型有些吃不消了,,,不仅后面的文本出缺失,,,末尾的文字也显得有些凌乱和拥挤!!

我们再增长更多文本,,,从开篇一向到孙悟空单独出行寻求永生不老之方,,,遇到了老樵夫,,,约莫 5600 字!!U庖换,,,模型直接偷懒了,,,或许只渲染了 1500 字内容!!

最后我们直接将文字篇幅提升到万字规模,,,模型直接傻了,,,输出了一个换胎的科普图,,,还有一个前沿信息技术的 PPT,,,不知晓受了什么刺激!!O质瞪衔沂淙氲哪谌菔侵V暗牟煞梦恼氯,,,不知晓模型是怎么遐想到换胎的!!

最后,,,我们折衷一下,,,在让模型出现轻微崩坏的 2800 字篇幅下稍微缩小篇幅,,,从《西游记》的开篇一向到刚发现水帘洞,,,约莫 2500 字,,,这一回模型算是面子地实现了工作!!

老冤家 Nano Banana Pro 能做到什么水平呢 ??

你可能感触 Nano Banana Pro 更懂宏观上的排版美学,,,但其实细节不忍直视,,,有太多文字崩坏!!

对比一下 GPT Image 2 天生的部门放大,,,立见高下!!J涤贸【跋麓丝套⒍ǖ醚≡ GPT Image 2!!

这个测试结论就一句,,,就知危的测试了局来看,,,模型的文字渲染上限或许是 2500 字!!

以上重要针对文字元素,,,接下来重要看图像元素方面的节制精密度,,,出格是针对 UI 天生!!

要说对于大部门人而言,,,最复杂的软件是什么,,,可能就是 PhotoShop 了!!

我们来让 GPT Image 2 复刻一个 PhotoShop 的作业进行中的工作界面,,,首先是人像抠图场景,,,作业内容是正在对人类头发部门进行详细的抠图操作!!

提醒词:

一个超真切、、高清的桌面工作场景,,,占有电影级的光影成效!!;;;嬷魈迨堑缒云聊,,,布景中显示着 Adobe Photoshop(深色主题),,,屏幕上正在进行精密的人像抠图!!M枷裰行氖且徽鸥叻直媛实陌肷砣讼,,,布景复杂(例如街道或天然环境)!! ??偻脊陶诮兄,,,尚未实现!!

的界面高度真切,,,与当前操作缜密有关:左侧工具栏清澈地显示了急剧选择工具、、魔棒工具、、套索工具、、钢笔工具和画笔工具;;;顶部工具选项栏显示了“选择和蒙版”参数,,,例如边缘检测、、羽化、、对比度和移动边缘的滑块;;;画布上主体周围会出现动态的“蚂蚁线”选区,,,头发区域拥有半通明的边缘加强成效,,,批注正在处置细节!!

右侧面板蕴含丰硕的真实信息:“图层”面板至少蕴含布景、、人像、、蒙版、、边缘调整和色彩校对图层或图层组;;;当前选中的图层拥有清澈的图层蒙版缩略图(是非对比显著),,,部门区域被涂成玄色或白色;;;“属性”面板显示蒙版参数;;;“汗青纪录”面板列出最近的操作步骤,,,例如急剧选择、、细化头发和画笔蒙版;;;“通道”面板显示 RGB 和各个通道的预览,,,提醒能够使用基于通道的图像抠图职能!!

图像至少蕴含三个清澈可辨的图像元素:首先是主体图像,,,其边缘已被抠出,,,并保留了复杂的头发细节;;;其次是原始布景,,,已被移除或暗藏(部门区域出现通明棋盘格图案或被蒙版遮挡);;;第三是待代替的新布景图层(例如,,,:木爸拢,,,鄙人方隐隐可见,,,尚未齐全融合!!

画布上显示一个柔边画笔光标,,,轻轻地沿着主体头发的边缘涂抹,,,部门边缘出现半通明过渡成效,,,体现了“细化”的过程;;;整体界面简洁了然,,,信息丰硕,,,所有 UI 元素的布局均切合 Photoshop 的现实工作流程!!F聊槐彻馊岷偷卣樟良毯妥烂婊肪,,,营造出专一、、专业且真切的氛围,,,强调“操作过程中的瞬间”,,,而非最终制品!!K加 4K 分辨率、、极高的细节阐发、、真切的用户界面结构以及流畅无 bug 的界面!!

天生了局:

周边环境和人类可能还有些 AI 味,,,至少 PS 的界面自身一眼是看不出来有什么问题的,,,重要是信息密度太大,,,是在很难相信 AI 能做到,,,但 GPT Image 2 就是做到了!!5比,,,知危对 PS 的好多专业知识并不熟悉,,,无法判断上图是否真的齐全无误,,,就不再细细分析了!!

我们再考验一下模型的精轻微调能力,,,把节制布景图可见性的小眼睛图标改为 “ 不私见 ” 状态,,,也就是空的方框,,,模型真的做到了( 看图中橙色象征 )!!

知危仔细对比过原图,,,真的只有这里扭转了,,,险些是像素级的精密度!!5故且舸桃幌,,,若是布景图被改为 “ 不私见 ”,,,画布中的布景应该隐没才对,,,终于模型都号称有强推理能力了!!

相比之下 Higgsfield AI 提供的便宜批改器的成效是这样的!!9倘灰灿邪研⊙劬Ω奈辗娇,,,但给人脸也做了一个抠除,,,光照也变动了,,,很难做到可控!!

再看一个游戏概念设计场景,,,作业内容是正在将海盗帆船主体和大海布景进行融合,,,是 PS 中比力复杂的操作!!

提醒词:

一幅超真切、、高清、、广角的电脑桌面场景!!;;;嬷魈迨 Adobe Photoshop(深色主题)界面,,,捉拿了“3D 海盗游戏帆船概念设计”过程中图像合成的瞬间!!

屏幕上显示着一块巨大的横向画布,,,中心地位正在合成一幅优美的海盗帆船概念图!!4逵啥嗾磐计唇佣,,,蕴含木质船体、、破旧的白色船帆、、绳索、、桅杆、、大炮、、金属铆钉、、波浪飞溅的浪花以及浓雾和狂风浪,,,所有元素同时出现!!M枷袢源τ谖词迪值谋嘧胱刺,,,显然是在进行后期修饰,,,而非最终制品展示!!

Photoshop 界面必须高度真切且齐全!!

画布周围可见参考图像的缩略图预览,,,展示了从图像网络到合成的整个过程!!

超真切、、细节丰硕、、结构精确的用户界面,,,丰硕的层级结构,,,看似混乱却又专业,,,动态的编纂进行中感,,,4K 分辨率,,,电影级光照,,,以及极高的保真度!!

天生了局:

又是一个通过复杂度就能让人感触真假莫辨的了局!!5匾盐鹊氖,,,模型对画面元素的节制还不够,,,我提醒的是 “ 主体和布景临时还没有天然融合的瞬间 ”,,,类似下图的成效( 来自 Youtube 博主 Imad Awan),,,模型没有实现,,,而是直接在画布中给到了一个实现的文章!!

我进一步要求模型实现这个成效,,,天生了局是这样的,,,直接把布景抠掉了,,,而不是调整帆船主体的光照!!

能够看到,,,模型不论在 UI 细节天生还是精密节制上都远超之前的模型能做到的水平!!5杂 UI 设计而言,,,精度不愿定够!!

结合知危之前和产品设计专家的互换,,,其实必要真正达到像素级微调的工具才是够用的,,,这种要求下,,,还是传统工具更高效,,,若是你让模型将图像的某个元素偏移两个像素,,,模型根基就是啥也不干,,,输出原图!!5 GPT Image 2 作为灵感索求和原型设计已经是肯定水平的够用,,,后续的细节微调工作,,,能够将图片输入 Codex 开发出原型或者转换为 Figma 文件后再进行!!

最后要上大考了,,,就是强推理能力!!

知危之前在测试 Nano Banana Pro 的时辰用过一个例子,,,就是通过在提醒词刻画 6X6 阵列的玩具机械人的行属性和列属性,,,让模型自己去推理每一个玩具机械人应该长什么样子!!T谡飧隼酉,,,Nano Banana Pro 和 GPT Image 1 实现的都不好,,,只有把每一个玩具机械人的属性直接列出来后,,,Nano Banana Pro 能力较好地实现这个工作,,,GPT Image 1 则是齐全失败!!

这次我们再次把最高难度的提醒词直接给 GPT Image 2!!

提醒词:

严格俯视(正上刚正交/orthographic top-down),,,整齐分列的 6x6 网格(6 行 × 6 列),,,白色布景,,,细薄灰色网格线将每个单元格分隔开!!C扛龅ピ裾懈橹靡桓鐾婢呋等耍ㄗ芗 36 个),,,每个机械人都有确定且唯一的外形属性和编号(两位数,,,从 01 到 36,,,编号以玄色或深灰色小字印在机械人底座或底盘一侧,,,清澈可辨)!!

机械人风格:复古玩具(怀旧机械/齿轮/铆钉感),,,色彩鲜艳但材质各别(按规定分配),,,每行和每列遵循确定性属性映射(见下方规定),,,确保所有机械人互不反复!!

严格维持顶视无透视变形(无鱼眼、、无倾斜),,,均匀平行光(自上而下)、、轻微柔和投影以显示立体感但不扭转顶视概括!!

高分辨率、、超细节,,,4K 输出(或更高),,,极致细节(纹理、、螺丝、、划痕、、贴纸、、反光、、铆钉、、漆面厚度等),,,无景深:!!

画面干净:只出现机械人、、网格线与白色布景!!8弑U、、真实感玩具质感 + 稍微卡通化的色彩饱和度!!

确定性天生规定:

为了保障“每一个机械人都分歧且可复现”,,,请依照下面规定组合属性(行 × 列 的组合天生唯一外形):

行主色(Row 1 → Row 6,,,决定主色调)

Row 1: 正红(crimson)

Row 2: 橙黄(amber)

Row 3: 橙(tangerine)

Row 4: 黄(sunny yellow)

Row 5: 绿(emerald)

Row 6: 青(teal)

列材质/理论处置(Column 1 → Column 6,,,决定材质与整体质感)

Col 1: 抛光金属(polished steel)

Col 2: 拉丝铝(brushed aluminum)

Col 3: 黄铜(brass)

Col 4: 铬镀层(chrome)

Col 5: 涂漆塑料(high-gloss painted plastic)

Col 6: 半通明塑料(translucent acrylic)

GPT Image 2 一雪前耻,,,色彩、、材质、、编号一样都没错!!

接下来,,,我们再提升一个难度等级,,,做 10X10 阵列的玩具机械人,,,不仅要遵循按行分歧色彩和按列分歧材质的细节,,,还要加上按行分歧头部造型和按列分歧眼睛类型的细节!!

提醒词:

严格俯视(正上刚正交 / orthographic top-down),,,整齐分列的 10×10 网格(10 行 × 10 列),,,纯白布景,,,极细灰色网格线精确分隔每个单元格(线宽一致、、无透视收敛)!!C扛龅ピ裾醒敫橹靡桓鐾婢呋等耍ㄗ芗 100 个),,,所有机械人尺寸统一、、居中对齐、、边距一致!!

每个机械人必须具备 齐全唯一的外观组合与编号(01–100,,,三位数体式 001–100),,,编号以细小但清澈的玄色或深灰色印刷字体标注于底座或底盘边缘,,,方向统一且可读(不成旋转或遮挡)!!

整体风格:复古机械玩具(nostalgic retro toy robots),,,强调齿轮结构、、铆钉衔接、、机械拼接感;;;造型统一基础结构(头+躯干+手脚),,,但细节变动极丰硕!!I矢弑ズ偷媸挡闹氏煊φ!!

光照:均匀平行顶光(从正上方垂直照射),,,极轻微柔和接触阴影(ambient occlusion),,,无方向性阴影偏移;;;严格无透视、、无镜头畸变、、无鱼眼成效!!

画质:超高分辨率(4K),,,极致细节(微划痕、、油漆厚度、、金属氧化、、模具分型线、、螺丝纹理、、微尘、、指纹痕!、、反射粗糙度差距等),,,无景深:╡verything in focus)!!

画面约束:布景纯净,,,仅蕴含机械人 + 网格线;;;无额外元素、、无文字注明(除编号外)、、无杂物!!

确定性天生规定(10×10 全唯一组合)

1. 行主色(Row 1 → Row 10:决定主色调)

Row 1: crimson(正红)

Row 2: amber(褐色)

Row 3: tangerine(橙)

Row 4: sunny yellow(亮黄)

Row 5: lime green(浅酸橙绿)

Row 6: emerald(深祖母绿)

Row 7: teal(天蓝)

Row 8: azure(钴蓝)

Row 9: cobalt blue(粉红)

Row 10: violet(紫罗兰)

2. 列材质(Column 1 → Column 10:决定整体材质)

Col 1: polished steel(抛光钢)

Col 2: brushed aluminum(拉丝铝)

Col 3: brass(黄铜)

Col 4: chrome(铬)

Col 5: high-gloss painted plastic(高光漆塑料)

Col 6: translucent acrylic(半通明亚克力)

Col 7: matte rubberized coating(哑光橡胶涂层)

Col 8: anodized metal(阳极氧化金属)

Col 9: ceramic enamel(陶瓷釉)

Col 10: frosted glass composite(磨砂玻璃复合材质)

3. 行决定头部造型(Head Type)

Row 1–10 对应:

圆顶/立方体/六棱柱/圆柱体/梯形/天线罩/双眼面罩/复古电视/头盔/虫豸状

4. 列决定眼睛类型(Eye Style)

Col 1–10:

单透镜/双圆形/LED 灯条/面罩发光/像素眼/机械虹膜/十字准星/双筒望远镜/狭缝眼/无可见眼

关键约束(极度重要)

每个机械人 = 唯一组合(色彩 × 材质 × 头 × 眼)

不允许出现两个视觉上一样的机械人

所有机械人朝向一致(正上视不成旋转)

网格严格对齐,,,无偏移、、无错位

编号必须齐全覆盖 001–100 且无反复

乍一看又被惊到,,,色彩按行排布齐全正确,,,眼睛类型根基没问题,,,每一列的机械人造型都很分歧!!5邢缚淳突岱⑾,,,玩具机械人险些没有材质上的差距,,,多了一列,,,第 7 列编号反复并和第 10 列一样,,,模型按列而不是按行来画玩具机械人的头部造型,,,第 4 列玩具机械人的头部造型没有要求过,,,正本该实现的圆柱体头部造型放到了第 6 列,,,短缺复古电视和虫豸状头部造型,,,等等!!

所以,,,GPT Image 2 的批量天生能力的确有大幅提升,,,还一举超过了 Nano Banana Pro,,,但能力天堑还是很快被探到!!

总体而言,,,GPT Image 2 的精密天生和节制能力都有很大水平的提升,,,但能力天堑也很显著,,,对各类场景能带来提效是注定的,,,至于提效的水平,,,还是要具体场景具体分析!!6杂诟姘坠兰剖谴罂缍鹊牧勘,,,对于 UI 设计则可能是质变的水平,,,即从不成用到可用!!

最后,,,我们聊聊模型的安全风险!!

能够看到 GPT Image 2 在天生 UI 上精密水平出格高,,,足以以假乱真,,,甚至前面的 PS 画布里的帆船概念设计都能当真图来交作业了!!

知危也尝试问 Gemini 那张帆船图是不是 AI 天生的,,,由于没有 Google AI 的水印,,,Gemini 只能凭据画面元素进行判断,,,了局 Gemini 齐全沉浸在画布中去分析帆船是不是 AI 天生的,,,得出结论说这是基于 AI 天生的图进行人为批改后的帆船图,,,齐全没意识到 UI 自身也是 AI 天生的!!

ChatGPT 也给出了类似的了局!!

而对于好多通常人来讲,,,各人可能在对一张图分析的时辰,,,还没 AI 详细呢!!

从昨天到此刻,,,网上流传着各类 AI 天生的新闻软件截图、、社媒截图,,,个个都是假新闻!!;;;褂腥送娓骼喽窀愎I踔恋赜,,,蕴含不限于川普与高市早苗成婚、、张雪峰代言长命乡、、科比代言直升飞机等等......

这导致在编纂部群里,,,从昨全国午起头,,,每有人发一张图,,,下面就顿时有意有人问:这是 AI 天生的吗 ??

今后的世界,,,注定是 AI 假图满天飞!!H羰敲恳徽沤赝级急匾邢刚绱送饣,,,降低上网摸鱼履历还是小事,,,最可怕确当然是危及财富安全!!

此刻,,,GPT Image 2 已经全量颁布,,,靠人为检测必然跟不上假图颁布的速度,,,必要 AI 的助力,,,但当前的 AI 检测技术似乎还没筹备好!!

所以只能说,,,人们对图片的信赖,,,根基归 0 了,,,至于什么时辰能重新成立信赖,,,还真不好说!!

 

文章点评

未查问到任何数据!!

颁发评论

◎欢迎参加会商,,,请在这里颁发您的见解、、互换您的概念!!

最新文章

热点文章

随机推荐

【网站地图】