2024CTIS-文章详情页顶部

GPT-4刷屏,意味着什么?

钛度号
号称史上最先进的AI系统的GPT-4,和ChatGPT有什么不同?会给我们带来什么?GPT-4的发布,究竟意味着什么?

图片来源@视觉中国

文|根新未来,作者|陈根

3月15日,GPT-4刷屏。

如果说,ChatGPT的诞生是人工智能领域的一枚炸弹,那么,GPT-4的发布就是人工智能领域新一道惊雷。ChatGPT走火后,所有人都在讨论,人工智能下一步会往哪个方向发展。显然,我们并没有等太久,现在,OpenAI正式推出新品GPT-4,再次点燃了我们对人工智能的想象力。

那么,号称史上最先进的AI系统的GPT-4,和ChatGPT有什么不同?会给我们带来什么?GPT-4的发布,究竟意味着什么?

从测试品到GPT-4

实际上,在大多数人都惊叹于ChatGPT强悍的能力时,却少有人知道,ChatGPT其实只是OpenAI公司匆忙推出的测试品。

据美国媒体报道,2022年11月中旬,OpenAI员工被要求快速上线一款聊天机器人。一位高管称,该聊天机器人将被称为“Chat with GPT-3.5”,两周后将免费向公众开放。这与原本安排不符。近两年,OpenAI一直在开发名为“GPT-4”的更强大语言模型,并计划于2023年发布。2022年,GPT-4都在进行内部测试和微调,做好上线前准备。但OpenAI的高管改变了主意。

由于担心竞争对手可能会在GPT-4之前,抢先发布自己的AI聊天机器人超越他们,因此,OpenAI拿出了2020年推出的旧语言模型GPT-3的强化版本GPT-3.5,在此基础上进行了微调。这才有了新款的聊天机器人ChatGPT诞生。

不可否认,虽然ChatGPT已经让我们窥见了通用AI 的雏形,但ChatGPT依然面对许多客观的问题,在一些专业的领域,ChatGPT还存在着一些低级错误的现象。当然,这种情况是必然存在的,毕竟ChatGPT开放给公众的时间比较短,接受训练的领域与知识库也还相对有限,尤其是在有关数学、物理、医学等专业并带有一些公式与运算的方面。

与ChatGPT的匆忙发布不同,GPT-4是有所准备的结果。根据网传的消息,GPT-4早在去年8月就训练完成了。之所以现在才面市,是OpenAI需要花6个月时间,让它变得更安全。而图像识别、高级推理、庞大的单词掌握能力,是GPT-4 的三大特点。

就图像识别功能来说,GPT-4 可以分析图像并提供相关信息,例如它可以根据食材照片来推荐食谱,为图片生成图像描述和图注等。但是,出于对潜在滥用的担忧,OpenAI 推迟了图像描述功能的发布。也就是说,GPT-4 的图像输入功能还处于尚未公开的预览阶段,目前仅能在 OpenAI 的直播中观看效果。

就高级推理功能来说,GPT-4能够针对3个人的不同情况做出一个会议的时间安排,回答存在上下文关联性的复杂问题。再比如你问,图片里的绳子剪断会发生什么。它答,气球会飞走。GPT-4甚至可以讲出一些质量不咋地、模式化的冷笑话。虽然并不好笑,但至少,它已经开始理解“幽默”这一人类特质,要知道,AI的推理能力,正是AI向人类思维慢慢进化的标志。

就词汇量来说,GPT-4 能够处理 2.5万个单词的能力,GPT-4在单词处理能力上是 ChatGPT 的八倍,并可以用所有流行的编程语言写代码。其实,在随意谈话中,ChatGPT和GPT-4之间的区别是很微妙的。但在当任务的复杂性达到足够的阈值时,差异就出现了,GPT-4比ChatGPT更可靠、更有创意,并且能够处理更细微的指令。

并且,GPT-4还能以高分通过各种标准化考试:GPT-4 在模拟律师考试中的成绩超出 90% 的人类考生,在 俗称“美国高考”的SA阅读考试中超出 93% 的人类考生,在 SAT 数学考试中超出 89% 的人类考生。

而同样面对律师资格考试,ChatGPT背后的GPT-3.5排名在倒数10%左右,而GPT-4考到了前10%左右。在现场演示中,GPT-4 还生成了关于复杂税务查询的答案,尽管无法验证其答案。在美国,每个州的律师考试都不一样,但一般包括选择题和作文两部分,涉及合同、刑法、家庭法等知识。GPT-4 参加的律师考试,对于人类来说即艰苦又漫长,而 GPT-4 却能在专业律师考试中脱颖而出。

GPT-4 和ChatGPT有哪些区别?

除了具有优于ChatGPT的性能,GPT-4 和ChatGPT还有哪些区别?

OpenAI 声称,他们花费了六个月的时间,来让 GPT-4 比上一代更安全。该公司通过改进监控框架,并与医学、地缘政治等敏感领域的专家进行合作,以确保 GPT-4 所给答案的准确性和安全性。GPT-4 的参数量更多,这意味着它将比上一版更接近人类的认知表现。

根据OpenAI官网描述,相较于ChatGPT,GPT-4最大的进化在于:“多模态”和长内容生成。其中的关键,就是多模态这个词,顾名思义,就是不同类型数据的融合。使用过 ChatGPT的人们会发现,它的输入类型是纯文本,输出则是语言文本和代码。而 GPT-4 的多模态,意味着用户可以输入不同类型的信息,例如视频、声音、图像和文本。同样的,具备多模态能力的 GPT-4 可以根据用户提供的信息,来生成视频、音频、图片和文本。哪怕同时将文本和图片发给 GPT-4,它也能根据这两种不同类型的信息生出文本。

GPT-4模型的另一大重点是建立了一个可预测扩展的深度学习栈。因为对于像GPT-4这样的大型训练,进行广泛的特定模型调整是不可行的。因此,OpenAI团队开发了基础设施和优化,在多种规模下都有可预测的行为。为了验证这种可扩展性,研究人员提前准确地预测了GPT-4在内部代码库上的最终损失,方法是通过使用相同的方法训练的模型进行推断,但使用的计算量为1/10000。

尽管GPT-4功能已经更加强大,但GPT-4与早期的GPT模型具有相似的局限性它仍然不完全可靠,存在事实性“幻觉”并出现推理错误。在使用语言模型输出时应格外小心,特别是在高风险上下文中,使用符合特定用例需求的确切协议 。不过,GPT-4相对于以前的模型显著减少了幻觉。对于不被允许的内容请求,GPT-4 的响应可能性降低了 82%。在 OpenAI 的内部对抗性真实性评估中,GPT-4 得分比 GPT-3.5 高 40%。

在 OpenAI 推出 GPT-4 之后,其合作伙伴兼投资股东微软也立马有所回应。微软表示:“新的 Bing 正在 GPT-4 上运行,这是我们为搜索定制的。”显然,随着 OpenAI 对 GPT-4 以及更高版本进行更新,Bing 也从这些改进中受益。

另外,OpenAI 还宣布与语言学习应用程序 Duolingo、以及专为视障人士设计的应用程序 Be My Eyes 的背后公司建立合作,以便为残障人士提供支持。美国非营利教育机构可汗学院,将使用 GPT-4 为学生创建人工智能导师;冰岛政府将用其帮助维护冰岛本土语言;金融公司摩根士丹利,则使用 GPT-4 来管理、搜索和组织其庞大的内容库。

再进一步来看,在具体应用上,GPT-4 的高级推理技能,可以为用户提供更准确、更详细的回答;鉴于 GPT-4 具备更强大的语言能力和图像识别能力,因此可以简化市场营销、新闻和社交媒体内容的创建过程;在教育领域,GPT-4 可以通过生成内容、以及以类似人类的方式来回答问题,故能在一定程度上帮助学生和教育工作者。

GPT-4的发布意味着什么?

实际上,如果只按照是否能够执行多项任务的标准来看,此前发布的ChatGPT已经具备了通用AI的特性——ChatGPT被训练来回答各种类型的问题,并且能够适用于多种应用场景,可以同时完成多个任务,比如问答、对话生成、文本生成等。这说明ChatGPT不仅仅是针对某一特定任务进行训练的,而是具有通用的语言处理能力。

更重要的是,ChatGPT的成功证明了大模型路线的有效性。在OpenAI的GPT模型之前,人们在处理自然语言模型 NLP 时,都用的是循环神经网络(RNN),然后再加入注意力机制(Attention)。所谓注意力机制,就是就是想将人的感知方式、注意力的行为应用在机器上,让机器学会去感知数据中的重要和不重要的部分。但 RNN + Attention,会让整个模型的处理速度变得非常非常慢,因为 RNN 是一个词一个词处理的

所以后来,谷歌团队才提出来“不要RNN,只要Attention”。而这个没有 RNN 只有 Attention 的自然语言模型就是 Transformer ,也就是今天ChatGPT能够成功的技术基础。这个只有 Attention 的Transformer模型不再是一个词一个词的处理,而是一个序列一个序列的处理,可以并行计算,所以计算速度大大加快,一下子让训练大模型,超大模型,巨大模型,超巨大模型成为了可能

在这样的模型下,加以时日,或者开放端口给专业领域的组织合作,以ChatGPT的学习能力,再结合参数与模型的优化,将很快在一些专业领域成为专家级水平。GPT-4 其实就是ChatGPT进一步训练和优化的更强大版本

就像我们人类的思考和学习一样,比如,我们能够通过阅读一本书来产生新颖的想法和见解,人类发展到今天,已经从世界上吸收了大量数据,这些数据以不可估量、无数的方式改变了我们大脑中的神经连接。人工智能研究的大型语言模型也能够做类似的事情,并有效地引导它们自己的智能。

在这次开放给大众使用,并且数以亿计的人涌入与ChatGPT进行互动中,ChatGPT将获得庞大又宝贵的数据,于是,ChatGPT凭借着比人类更为强大的学习能力,其学习与进化速度正在超越我们的想象。

而现在,更强大的GPT-4甚至未来GPT-4的再下一代的推出,再结合OpenAI将其技术打造成通用的底层AI技术开放给各行各业使用之后,AI就能快速的掌握人类各个专业领域的专业知识。

在数学中,“奇点(singularity)”被用于描述正常的规则不再适用的类似渐近线的情况。在物理学中,奇点则被用来描述一种现象,比如一个无限小、致密的黑洞,或者我们在大爆炸之前都被挤压到的那个临界点,同样是通常的规则不再适用的情况。1993年,弗诺·文格(Vernor Vinge)写了一篇著名的文章,他将这个词用于未来我们的智能技术超过我们自己的那一刻——对他来说,在那一刻之后,我们所有的生活将被永远改变,正常规则将不再适用。

现在,GPT-4的诞生,把我们进一步推向了技术奇点,如何适应GPT-4的存在和同用人工智能的到来,已经成为当前无可回避的现实问题。

本文系作者 陈根谈科技 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

22:57

蚂蚁OceanBase 4.3版本推出列式存储引擎

22:45

阿联酋航空宣布定期航班已恢复

22:43

广东北江发生2024年第2号洪水

22:31

易纲:中国以相对平稳、成本更低的货币政策操作,保持了经济金融体系稳定

22:22

受天气影响,甬金铁路明天停运一天

22:21

北京绿色金融协会副会长马险峰:预计到2060年绿色金融有五百万亿规模需求

21:59

韩国医协称不能接受医学院在规定扩招范围内自主招生方案

21:50

小米汽车:新颜色的小米SU7车模已经开始研发

21:37

半导体石英制品企业强华股份完成C轮数亿元融资,临港项目预计年内投产

21:29

工信部:继续适度超前推进5G、千兆光网建设,优化算力设施建设布局

21:17

安恒信息发布安全大模型恒脑2.0,已至智能体形态

21:07

黑石提议以每股1.24美元现金收购音乐版权投资公司Hipgnosis

20:59

上海交大一个月内成立三所新学院,人工智能学院今日成立

20:38

内蒙古地区一季度生产总值5604亿元,同比增长5.9%

20:33

雷军称小米SU7不适合周鸿祎,等小米做SUV版时再推荐

20:21

高通与Meta达成合作,支持大模型Llama 3在骁龙终端上运行

20:18

知名基金经理一季度重仓股变化情况不大,林英睿:更深入地思考上行的潜在方向

20:14

4月20日新闻联播速览26条

19:46

中期协:要稳慎有序发展期货和衍生品市场,围绕强监管、防风险、促发展做好五项工作

19:42

重庆启动涉企行政复议“三跨三办”改革试点工作

扫描下载App