未来已来?GPT-4刚上线就引发马斯克恐慌 一文梳理其与35版本区别
2024-05-22 【 字体:大 中 小 】
ChatGPT公司OpenAI隔夜上线了其最新人工智能模型GPT-4,轰动了整个科技界。据OpenAI自己称,GPT-4将是该公司里程碑式的模型。
在其概念视频中,OpenAI介绍新模型可以解决更复杂的问题、编写更大型的代码,并通过图片产生文字。此外,OpenAI还承诺GPT-4相比之前的模型,包括ChatGPT此前应用的GPT-3.5,将更加安全且具协调性。
用简单的话说,GPT-4模型改变了此前ChatGPT等历史人工智能的单一、文本短小等缺点,变身为一个能看图说话的高级“解语花”。
然而,这朵“解语花”也点燃了不少人的焦虑,比如硅谷最著名的企业家马斯克。
他在推特平台上发文称:人类还能做什么?我们最好使用Neuralink(来对抗人工智能)!
此外,他还回复了网友关于GPT-4内测的帖子,称他个人十分关切这个新模型,也认为这个新的人工智能看起来很有意思。
但马斯克关于GPT-4和Neuralink的评论还是让不少网友觉得尴尬,不少人嘲讽他的脑机广告听起来并不吸引人。相比于人工智能机器人取代人类,在大脑里植入设备似乎更让人头皮发麻。
不过,网友们关于GPT-4领导机器人占领世界的想法也是过于杞人忧天。
正如OpenAI强调的那样,GPT-4目前仍是并不完美的模型,其能力远不如人类。GPT-4仍有许多局限性,如社会偏见、幻觉和对抗性提示。
硅谷做题家
GPT-4现在最热门的话题莫过于它强大的应试能力。根据OpenAI的评估,GPT-4已经能轻松通过美国的律师考试,且考进了前10%的排名。相比之下,它的上一代模型GPT-3.5只能吊个车尾。
除了律师考试,GPT-4还在美国大学入学测试SAT中考到710分,虽然分数不高,但已经够上美国大学录取水平。更重要的是,GPT-4能在大学的基础微积分课程中获得4的成绩(5分为满分),这证明了该模型已经掌握了高等数学大部分的概念。
网友也对它的这些做题能力进行了进一步的测试。
比如让它分析柱状图,并回答图形背后的统计学意义,或者出一道用法语描述的物理题。令人欣慰的是,它竟然没有胡言乱语,而是有条有理地给出了正确答案。
另一方面,已经升级为GPT-4模型的ChatGPT,现在已经可以通过用户的简单需求直接生成代码,甚至网站。即便用户只是在餐巾纸上画了个简单界面,GPT-4都能直接搞出一个可运行的网站。
如此好用不废话的程序员,大概是每一个产品经理心中永远的神。
量子波动速读?
更让人嫉妒的是,曾经中国爆火的“量子波动速读”竟然也在GPT-4上获得了重现。这种被机构滥用的反人类教育噱头,在非人类的人工智能上却得到了完美的诠释。
有网友将一整篇论文上传给GPT-4,然后,GPT-4就在极短时间内完成了阅读,并给出清晰的总结摘要。
甚至,如果有人问它某个图是什么意思,代表了什么意义,GPT-4也能像模像样地给出解答。
与GPT-3.5相比,GPT-4将文字输入限制提升至2.5万字,这让其阅读体量大大增加,也让用户的文书处理工作变得更加简洁。
此外,强大的识图能力和显著提高的回答准确性,也保证了GPT-4在文字处理上的优越性,相较于GPT-3.5的答不上来就乱编,已经出现了长足的进步。
破解冷笑话
如果说昨天的ChatGPT还是一个不解人意的“老古董”,那么今天的ChatGPT就已经可以轻松理解网友心照不宣的冷笑话,即便是表情包,它也能说个子丑寅卯来。
比如鸡米花拼成的世界地图,ChatGPT就轻松回答出了网友想要的答案:这是个玩笑,用鸡米花和世界地图两个不相干的东西形成一种幽默。
虽然识图这一功能在人工智能领域并不罕见,谷歌搜索甚至连淘宝都具备识图功能,但这一功能还是首次亮相于ChatGPT。
而除了简单的识图之外,更可贵的是,ChatGPT现在还能解释图像的具体意义,并理解图像背后的隐喻含义,这在其他识图人工智能上仍十分罕见。
可惜的是,目前图像输入的功能仍只是预览阶段,还不能使用,即便是氪金玩家现在也只能按捺住好奇心。
Cosplay“受害者”
早在ChatGPT出来的时候,网友们就热衷于让人工智能玩角色扮演的游戏。什么假设你是一个财经编辑啦,假设你是一个程序员啦,假设你是小说家啦……总之,网友想到什么,ChatGPT就被迫成为什么。
而现在,这样的花活居然被OpenAI官方带头认可。
相比于GPT-3.5时期,现在鸟枪换炮的ChatGPT不再用一本正经的语气规劝网友,类似于“我只是个人工智能,我无法……”的表达,现在都用更具个性化的话替代。
OpenAI要求GPT-4拿出服务精神。既然用户希望得到一个定制的GPT-4,那么GPT-4就要表现出相应的人物性格和态度。
缺憾仍在
根据OpenAI的内部测试,GPT-4仍有GPT-3.5的老毛病,就是胡言乱语。专业地讲,GPT-4仍会产生幻觉,生产错误答案,并出现推理错误。
总的来说,GPT-4已经显著减轻了幻觉问题,在这一项上,GPT-4的分数比GPT-3.5要高出40%。但这可能也意味着GPT-4的乱讲话可能更隐蔽,更难以被用户察觉。
另一方面,GPT-4仍缺乏对数据截至日期后新进展的了解能力,即其无法在训练学习后,追踪新的信息来补足对某件事认知。此外,它也无法从经验中学习,并可能一直轻信人类。
在安全边界上面,GPT-4也得到了相应的加强,与GPT-3.5相比,它对违禁内容的回复率下降了82%,对敏感内容(如医疗建议)的响应率则提高了29%。
还有一个不太友好的地方在于,GPT-4的使用目前仅对ChatGPT Plus玩家开放,换句话说,需要付费。
目前OpenAI对GPT-4的训练规模、硬件、算力等一切保持缄默,只说会在未来陆续公布,可谓是吊足了外部观众的胃口。
不过,瑕不掩瑜,截至目前,科技人士对GPT-4的评估仍持正面态度。更多的人则在说:未来已来,迎接新世界吧。
猜你喜欢
柏楚电子(688188)7月22日主力资金净买入31576万元
中石化油服(01033)拟回购公司股份
长沙湘越中学:长沙叛逆学校的收费
合资品牌撑不住开始涨价,会被国产车打得退出市场吗?
【今日主题前瞻】里程碑合作,OpenAI将付费使用出版巨头的内容
方向前:227黄金白银螺纹纸浆等五大经典技术指标分析
概伦电子新注册《概伦FabATC 测试芯片版图自动化设计软件V10》项目的软件著作权
上汽与大众系列技术合作签约:将推出多款插电混动、纯电车型
59岁刘嘉玲晒新年照惹争议!穿艳桃红被指俗不可耐,与年龄不协调
80后怀集“新农人”打造全链条标准化农场
他名不见经传,却写出大唐最美的一首诗,堪称千古绝唱
惠州一业主投诉装修公司违约,追赔偿款屡遭延期,企业回应了
中触媒最新公告:上半年净利润同比增长14589%
麻绎文的国泰沪深300增强策略ETF发起联接A(021847)值得买吗?
政策加码直击行业痛点!这一方向有望乘风而起
世界最小体积芯片!存储巨头量产238层NAND闪存,受益上市公司梳理
上汽发布2024半年报 营业总收入28469亿元盈利663亿
柏楚电子(688188)7月22日主力资金净买入31576万元
无锡银行(600908)8月16日主力资金净卖出88333万元
良品铺子降价求生,零食赛道的“宇宙尽头”也是卷价格?