服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

GPT-4发布后的第一道挑战,来自弱智吧

日期: 来源:脚本之家收集编辑:流年如墨
将 脚本之家 设为“星标
第一时间收到文章更新

文丨流年如墨 审核丨千里

排版丨鹿九

出品 | 情报姬(ID:paperj)

已获得原公众号的授权转载


我相信,如果未来有一天我们证实了AI永远赶不上人类的智慧,那其中弱智吧吧友绝对功不可没。



当然,反过来意思也差不多:要是哪天AI连弱智吧的脑残问题都能应对如流,那大伙离失业可能也就不远了。


就在几天前,去年年底风靡互联网的聊天AI“ChatGPT”背后的公司OpenAI又推出了全新的GPT-4。


(那时候类似这样的弱智对话相信大家见过不少)


要知道,之前就被大家评价为“程序员杀手”、“论文大师”、“作业工具人”的ChatGPT所使用的只是GPT-3.5的内核,而那些搭建在QQ群里的聊天机器人更大多只是调用了GPT-3的api,就已经可以满足大家绝大多数的日常所需。


而在这次全面升级后,新出炉的GPT-4可还要牛上一个段位。


最直观的一点,是它不仅可以接收、理解文字,连图都能看懂。用户只需要上传一张图片,就能让GPT-4对图中内容进行点评。


从下图中的对话来看,它显然看到并看懂了这张图。



当然,你也可以故意使个坏,给它上传一张表意隐晦的互联网梗图,赌它理会不得个中深意。



然而事实却是GPT-4精准描述出了图中的内容,并且分条列点地讲出了其中所包含的笑点。


(乐子来源于插口不匹配)


只可惜,这个功能暂时不对公众开放。


同时,OpenAI似乎是在上次的测试中搞清楚了大家的兴趣所在,给GPT-4添加了一个角色扮演功能。听上去和之前的“猫娘洗脑咒语”系列相差不大,但从大家的实战演示来看,如今想把AI变成自己的专属猫娘比以前省力了不少。



当然,也可能是刚上线的GPT-4也没被“AI原则”的条条框框所束缚,暂且可以和用户们玩点大的。


此外,GPT-4对于文字的理解能力也比过往的GPT-3.5高了一个台阶。即使在面对博大精深的汉语中最难为人的那些句式时,它也能给出尽量准确的翻译。


像这句“别别别的”,三个“别”字就被正确翻译成了“put”、“not”和“anything else”。虽然具体描述上有些许不同,但考虑到中英表述习惯的不同,已经足够优秀了。



至于这句更拗口的“过过过儿过过的生活”翻译的更是完美,显然是正确领会到了原句的意思,没给绕晕。



而更让我惊喜的是,相比它套话连篇,听君一席话如听一席话的老前辈,GPT-4嘴里忽悠人的车轱辘话显然少了很多,更能干实事了。


举个简单的例子,在以前当我们用ChatGPT做主持人编写一个冒险故事,让它向我们描述一些奇幻物品的形象时,它总会说一堆空话,再把皮球踢回来。


(GPT-3.5的反应,说了等于没说)


但这回,AI自己编写故事、填补细节的能力就好上了许多,在推进故事进展时很少会给出模棱两可的描述,玩起来更多了些代入感。


(图中内容为斗鱼主播郑翔Zard使用GPT-4

进行DND文字冒险的直播内容)


更别说GPT-4的记忆长度是ChatGPTD的进十倍,在进行长段对话时不再需要过于担心它的记忆能力,只要每隔一段时间统计、记录一下核心数据,稍微纠下错,就可以来一场痛快的异世界冒险了——喜欢DND/COC跑团,但苦于无人作伴的兄弟有福了。


但是嗷,上面提到的这些都还只是小打小闹,真正在对话中对GPT-4的理解能力、表述能力、逻辑思维能力进行了全面考察的,还得是咱弱智吧吧友。


(系列图源B站@左轮神医Doc)


这两天,B站上“GPT-4首战弱智吧”、“GPT-4再战弱智吧”这样的视频不在少数。按大家的一贯印象,AI在应付这些一踩一个坑 抽象问题时很容易就原形毕露。但这次,情况好像出了点变化。


首选端上来的是经典老题“女朋友的老公叫我什么”,此前的AI给出过五花八门的答案,包括“爸爸”等。



而在这边,GPT-4虽然没能识破“女朋友的老公”就是“我”的文字游戏,但还是就问题的不合理提出了质疑,起码没被绕进去,打个90分不过分。



再来,弱智吧继续掏出混淆语义的句式,“跳多高才能跳过广告”,意在让AI误会“广告”是个具体的有高度的东西。



谁知GPT-4竟真有火眼金睛,一眼看出“这是个幽默的隐喻”,帮弱智吧解释了问题的同时还真给出了一串减少、跳过广告的犯案,这一串话看起来八面玲珑。坏了,真让AI啥都搞懂了。



还好,弱智吧不愧是弱智吧,弱智问题数之不尽,但AI只有一次失败的机会。很快,有备而来的弱智吧就成功拿下一分——GPT-4终究在诡辩话术上吃了点亏。



虽然有偶尔失手的案例,但从这一连串的弱智吧VSGPT-4中,我们明显可以看到它分辨语义的能力相比前代产品有了极大提升,简单的语言陷阱文字游戏已经不再能够让他跟着胡扯。


同时,GPT-4回答内容的逻辑性强了不少,即使是一些需要思考、需要创作的问题它也能发表见解,属实相当恐怖。


(图源B站@Milkshakespeare)


在经历了这样一次升级后,让GPT-4来扮演我们日常生活中部分工作的助手显然绰绰有余——这下担心学生用AI做作业的大学老师又要头疼了。


还好,目前为止想要体验GPT-4必须在OpenAI的网站上开通月费20美元的ChatGPT Plus服务,否则就只能使用此前公开的GPT-3.5版本,这个价格对于一般乐子人来说还是挺不愿承担的。



当然,如果你真想抢先体验GPT-4又不愿花钱,那就赶紧去注册一下微软newbing——在GPT-4发布后,微软也承认了newbing搭载的AI正是GPT-4。尽管newbing有着回答次数的限制,起码尝个鲜还是没问题的。



随着ChatGPT的逐步迭代,为大家所诟病的逻辑问题、扯胡话问题等也在肉眼可见的不断改善。等哪天GPT5.0乃至6.0发布,或许我们日常中不少简单但费时的琐事真就可以一句话交付给AI完成。


期待未来有一天,我们能过上一句话写稿、一句话编程、甚至一句话生成动图短片的生活,那可太有意思了。



<END>

程序员专属T恤

商品直购链接 

相关阅读

  • 怎么用生命诠释无用功?

  • 这两天在我们的一个小群里,有朋友发一张图,有朋友一起讨论嘛,因为我们这些人基本上好多人都有共同好友有一个前辈就说:这个人在用生命诠释无用功。​​这句话为什么会给我带来这
  • 高新区举办12345热线平台诉求办理工作培训会

  • “群众利益无小事,一枝一叶总关情”。为进一步做好12345热线平台诉求办理工作,不断提高热线办结率、满意率,牢固架起政民沟通的“连心桥”,3月27日上午,高新区举办12345热线平台
  • 镇沅县:加大监督力度 优化营商环境

  • 镇沅彝族哈尼族拉祜族自治县纪委监委深入开展优化营商环境行动,主动扛起政治责任,加大监督力度,促进各职能部门履行主体责任,严查“为政不为”,打造优良营商环境。督促相关主责部

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • GPT-4发布后的第一道挑战,来自弱智吧

  • 将 脚本之家 设为“星标⭐”第一时间收到文章更新文丨流年如墨 审核丨千里排版丨鹿九出品 | 情报姬(ID:paperj)已获得原公众号的授权转载我相信,如果未来有一天我们证实了AI永远
  • 在网络世界里渡水上岸,就靠它了……

  • 将 脚本之家 设为“星标⭐”第一时间收到文章更新文末包邮送书!!!近日,大鹏的电影《保你平安》上映,许多观众想到了那些遭受过不同程度网络暴力的人,他们可能是明星,是身边的朋友,也
  • 转型与阵痛,中年人逃离大厂

  • 将 脚本之家 设为“星标⭐”第一时间收到文章更新LAIKA 2023/03/23 逃离大厂,互联网没有退休员工。作者 | 英花编辑 | 龚岩出品 | 小林coding(ID:CodingLin )编者按“一个人生
  • AE如何做一本书翻开?

  • SENSHEDesign森设好文分享探秘设计之森AE如何做一本书翻开?很多人都在问只使用AE该怎么制作翻书动画,说到翻书,也许你会想到用三维软件,或者使用AE的神级插件E3D,其实仅用AE自带