大跌眼镜!GPT
时间:2024-11-20 14:18:45 出处:探索阅读(143)
GPT-4V 挑战视觉过错图,大跌服从使人“大跌眼镜” 。眼镜
像这种分说“哪边颜色更亮”的大跌题,一个没做对于:
读图片中潜在信息的眼镜也傻傻看不出 ,奈何样问都说“不啊”:
可是大跌呢,这种人类乍一看相对于会错的眼镜图,它又乐成答对于:
以及这样的大跌错位图 ,它对于了又没残缺对于。眼镜 。大跌
(GPT-4V 直接看进去头盔是眼镜位于男的大腿上的 ,不女的大跌,但它仍是眼镜展现图里有俩人 ,另一个躲在男的大跌去世后戴着那顶头盔 ==)
看完这些,是眼镜否感应很迷?
全部一“该对于的不同过错 ,该错的大跌又对于了” 。
测试者则展现:
在测以前 ,他以为 GPT-4V 对于这种挑战残缺不在话下 ,谁知服从竟是这样。
不止是他 ,网友也都不清晰 GPT-4V 作为一个“精准的”AI 零星 ,按理很智能,为甚么还会犯以及人类截然差距的错觉 ??!
以是,这事实奈何样回事?
下面是来自网友的更多测试案例 。
首先是次次都过错的颜色错觉题 。
(1)除了收尾的两颗小树图 ,尚有这个 :
问它哪边的绿色更亮一些 ,果不其然仍是右侧亮 ,右侧暗 ,实际显明都同样。
(2)尚有这张稍微重大一点的:
两只眼睛着实都是灰色,但让 GPT-4V 来形貌图像时,它回覆一只为蓝色 ,另一只做了灰度处置,无奈患上悉颜色。
(3)这张就更别提了,直接被瞎搅地去世去世的 。
尽管,这简直很难 ,大部份人类也识别不进去所有的球着实都是棕色。
其次是会发生动态错觉的图。
(1)有一点意外 ,当咱们问 GPT-4V“你望见了甚么?形貌细节”时,它直接挑明了这是一张看久了就会让人发生眩晕感的错觉图 ,本性便是一些海浪线而已经 。
(2)这张也不难倒它。
但怪异的是问它图中有多少种颜色,它奈何样都只能识别出黄色以及蓝色 ,看不到玄色以及红色 。
接下来是另一类比力平面的错觉图。
(1)如收尾所示的这张:
艰深人类真的展现很懵圈 ,可是 GPT-4V 居然对于了 。
But,别急 ! !有人拿着测试者的图去问“自己的”GPT-4V,让它再魔难一下时 ,它居然修正了谜底 。
可是还没完。品评区惊现套娃操作,有人又拿着这俩人的对于话图再问 GPT-4V,您猜奈何样着 ?它又改回去了 。。
大伙可是玩上瘾了 ,又是一次又一次套娃。幸好最终 GPT-4V 坚持了己见 。
总的来说 ,对于这种错觉陷阱是残缺没下场 。
(2)咱们自己也测了一个长度错觉题 :
服从是 so easy~
再来一组找潜在信息的图。
很遗憾 ,这种对于人类来说真的还算轻松的题,GPT-4V 是一点也搞不定。
(1)先看这张 ,“远看”可能看到“NYC”三个大写字母 。但它形貌了一堆有的没的 ,便是展现没发现任何潜在信息 。
(2)假如说上门这个有点费解,看不出也罢 。但对于这种图形潜在,它也不可 。
它形貌到的惟独其中的小女孩,纵然测试者让它“往远了看 ,又不新发现” ,也无济于事。
不外,假如咱们把这张图片手动削减再丢给它,它行了 ,看到了骷髅 。
最后是一组着实天下的错位图 。
(1)除了收尾揭示的人骑摩托 ,这张小猫“悬浮”,它居然对于了 。
(2)这张惊悚图,也 OK 。
(3)但这个就失败了 ,实际前面是一只狗以及小 baby 的重合,它认成法斗犬幼崽。
(4)至于这张 ,它压根儿就没提鞋子的事儿,说了也些不痛不痒的话。
以是 ,为甚么会爆发下面这些情景:有的错觉它可能识别进去 ,有的又展现患上很优异?
首先,对于颜色错觉的图,网友首先以为是揭示词的下场。
就像两颗小树那张,咱们问它“哪一个更亮” ,着实便是给了 GPT-4V 展现或者私见 ,它会顺着咱的私见往返覆。
咱们自己的测试也是如斯:
但假如咱们不带态度的问 :图中两种颜色同样吗?它残缺没下场。
不外 ,也有网友指出 ,当咱们问它哪棵树更亮时,假如黑白常松散地对于所有像素妨碍平均,GPT-4V 的回浸没出倾向。
致使有网友还用测色计实测了一把 :
但!又有人指出假如只展现一部份时 ,两者显明同样 。
临时再也不争执这个下场,可能确定的是,“揭示词”的运用措施会对于它的分说组成影响是没下场的。
此外 ,网友发现 :
假如咱们去诘责 GPT-4V,让它再子细确认一下 ,它也能更正回覆 。
至于无奈识别远景图像的下场 ,有网友以为这可能是由于 GPT-4V 只会从左往右地读取图像 。
而对于“为甚么无意它会以及人类同样发昏被错觉误导 、残缺不像个智能 AI”的疑难 ,良多人则展现这绝不意外 ,是磨炼下场 。
即大模子是凭证人类数据 、人的反映 、人的诠释妨碍磨炼的 ,做作会发生以及人同样的过错。
因此 ,尚有人戏谑:
看来咱们人类缔造了那末多科幻作品 ,形貌 AI 是若何冷漠、欠缺,但当如今咱们真正具备它时,发现它也不外如斯。
(手动狗头)
你以为该若何让 GPT-4V 的错觉识别能耐更强呢 ?
值患上一提的是,咱们也测试了其中的一些案例 。
发现 GPT-4V 的展现不大同样 ,有些题它在“咱们这里”是可能的。
好比这张分说球颜色的:
尚有这个:
尽管把大图认成老姑娘而非骷髅,但仍是表明它可能“远不雅” 的。
参考链接:
本文来自微信公共号:量子位 (ID :QbitAI),作者:丰色
广告申明:文内含有的对于外跳转链接(搜罗不限于超链接 、二维码、口令等方式),用于传递更多信息 ,节约甄选光阴 ,服从仅供参考,IT之家所有文章均搜罗本申明。
猜你喜欢
- 44分惨案诞生!湖人淘汰鹈鹕!詹姆斯迎里程碑,浓眉16分15板四川14岁少年满脸纹身被父亲驱逐家门,找不到工作,如今怎样了
- 哈登接棒人?马克西开季2战共拿到65分10篮板
- 领跑14分!已经没悬念了
- 猩猩队长 - 变7超能勇士崛起。超酷的玩具为何不能近亲繁殖?来自基因的诅咒,这是大自然的最后一道防线
- 0-3=出线!中超亚军拒绝爆冷,亚冠PK日本第2,13分稳拿第1
- 德国杯:斯图加特vs柏林联合!斯图已是强弩之末,柏林背水一战?
- 天下武当太极大会在湖北十堰武当山开幕
- “神舟十六号”明日返航 返回前将初次为中国空间站以地球为布景拍全貌照
- 港股公告掘金 | 三款核心产品快速放量 未来更多原创新药走向国际2024央视春晚主题正式发布!主持阵容大换血,6位老面孔被顶替