2024CTIS-文章详情页顶部

OpenAI 发布GPT-4,首批客户应用方式各不同

钛度号
首批客户包括语言学习应用程序 Duolingo、计算机视觉应用程序 Be My Eyes,以及使用 GPT-4 组织其内部知识库的摩根士丹利财富管理公司。冰岛政府正在使用 GPT-4 来保护自己的语言。

图片来源@视觉中国

图片来源@视觉中国

文 | Tech商业

美西时间3月14日  OpenAI 最新发布多模态大语言模型GPT-4。根据官方描述,该模型比以往任何人工智能系统都“更具创造性和协作性”,拥有更广泛的知识基础,更善于解决问题。作为一个多模态模型,除了文本之外,它还接受图像作为输入。

根据 OpenAI 的描述,GPT-4是结构化问题解决任务的“突破”。例如,GPT-4 可以提供分步说明来回答有关如何清洁水族箱的问题。在模拟律师考试中,GPT-4 预计得分在考试的前 10%,而GPT-3.5得分在后 10%。

据官方描述 GPT-4 在逻辑答案方面优于 ChatGPT。| 图片:OpenAI

GPT-4 可以处理超过 25,000 个单词,适合生成更大的文档和分析。GPT-4 的数据库来自 2021 年 9 月之前。据 OpenAI 称,GPT 3.5 是新系统的首次试运行。

OpenAI 表示,新的 AI 系统直接基于从对抗性测试程序中获得的经验教训和ChatGPT上的反馈。据称,在真实性和可操作性方面,它明显优于现有系统,尽管它仍然“远非完美”。

与 GPT 3.5 相比,GPT 4 在人类任务上的性能表现。| 图片:OpenAI

GPT-4 在常见的机器学习基准测试中也比其前身高出 16%,在多语言任务上比 GPT 3.5 高出 15%。

OpenAI 表示,它还开发了新方法来预测 GPT-4 在某些领域的性能,使用的模型训练仅需 GPT-4 千分之一的计算工作量。

在对 AI 功能的预测中,OpenAI 看到了一个重要的安全方面,鉴于 AI 的潜在影响,该方面没有得到充分解决。OpenAI 写道:“我们正在加大力度开发方法,为社会提供更好的未来系统预期指导,我们希望这成为该领域的共同目标。”

OpenAI 也开始使用 GPT-4 来帮助人类评估 AI 输出。该公司表示,这是其先前宣布的调整战略的第二阶段。

GPT-4 可以处理图像输入

GPT-4 最明显的新特性是它能够将图像作为输入进行处理。例如,它可以使用图像输入来解释模因或主题的独特性,它可以逐步分解信息图表,总结图表或解释它们的各个方面。

GPT-4 逐步解释了一个图像笑话。| 图片:OpenAI

在常见的标准测试中,GPT-4 已经优于现有的文本图像模型。OpenAI 表示它仍在挖掘 GPT-4 在图像解决上“新的和令人兴奋的任务”。

为了控制模型,OpenAI 依赖于 API 客户端的系统消息。在某种程度上,这些可用于确定模型响应的特征——即 GPT-4 的响应更多是好莱坞演员的风格还是苏格拉底式的方式。

与此前 GPT 模型类似的限制

尽管在推理和多模态方面取得了重大进展,但 GPT-4 与其前身具有相似的局限性。例如,它仍然不完全可靠,容易产生幻觉。然而,在 OpenAI 的内部对抗性真实性评估中,GPT-4 的表现平均比 GPT 3.5 高 40%,平均准确率得分在 70% 到 80% 之间。

GPT-4 幻觉比 GPT 3.5 少,但问题远未解决。| 图片:OpenAI

GPT-4 还继续制造偏见或强化现有偏见——OpenAI 承认,“还有很多工作要做”。在此背景下,该公司指出了最近宣布的可定制 AI 语言模型的计划,这些模型可以反映不同用户的价值观,从而代表更大程度的意见多样性。

OpenAI 显着提高了模型不应回答的查询的安全性,因为它们违反了 OpenAI 的内容政策。与 GPT 3.5 相比,据说 GPT-4 对关键查询的回答减少了 82%。据称,针对敏感查询(例如与医学主题相关的查询)提供符合 OpenAI 政策的答案的可能性要高出 29%。

GPT-4 通过 ChatGPT Plus 启动,API 通过候补名单启动

OpenAI 最初将 GPT-4 提供给ChatGPT Plus的付费客户。该服务每月收费 20 美元,可在全球范围内使用。与以前的模型一样,开发人员将通过 API 获得访问权限。当前开发者可以通过等待GPT-4 候补名单加入。

GPT-4 的上下文长度限制在大约 8,000 个token,或大约 25,000 个单词。还有一个版本可以处理多达 32,000 个token,或大约 50 页,但 OpenAI 目前限制访问。

价格为每 1000个提示token 0.03 美元和每 1000个 完成token(8k)0.06 美元,明显高于 ChatGPT 和 GPT 3.5 的价格。最便宜的模型 gpt-3.5-turbo,每 1000 个token的成本仅为 0.002 美元。

当前的 OpenAI 报告没有提供相关架构(包括模型大小)、硬件、训练计算、数据集构建等的更多详细信息。

OpenAI 没有公开参数数量,也可以解释为该公司在其 PR 中不再对参数数量具有决定性的重视,因为仅此一项对模型质量没有意义,但许多人们认为确实如此。

在 GPT-4 演示的准备阶段,社交媒体中提到了一些荒谬的参数数字,以可视化 GPT-4 的性能并助长炒作。在之前的所有模型中,OpenAI 都将模型大小作为一种差异化特征进行传达。

据 OpenAI 称,GPT-4 的首批客户包括语言学习应用程序 Duolingo、计算机视觉应用程序 Be My Eyes,以及使用 GPT-4 组织其内部知识库的摩根士丹利财富管理公司。冰岛政府正在使用 GPT-4 来保护自己的语言。OpenAI 首席执行官 Sam Altman 表示:“我们已经完成了 GPT-4 的初步培训,但我们花了很长时间和大量工作才准备好发布它。”

在 OpenAI 的 GPT-4 披露之后,微软还透露 Bing Chat从一开始就在使用 GPT-4。因此,过去几周与“Sydney”互动过的任何人都可能已经对 GPT-4 的功能有了一些了解。

参考文章:

  • https://openai.com/research/gpt-4
  • https://the-decoder.com/open-ai-gpt-4-announcement/
本文系作者 Tech商业 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2024-04-26 23:03

大商所、郑商所夜盘收盘,烧碱跌近3%

2024-04-26 23:00

美股半导体股集体走强:英伟达涨超5%,博通涨超4%

2024-04-26 22:43

宝马计划对沈阳生产基地增加投资200亿元

2024-04-26 22:42

现货黄金短线下挫8美元

2024-04-26 22:40

美元兑日元站上157关口,为1990年5月来首次

2024-04-26 22:35

光峰科技:2024年第一季归母净利润4454.33万元,同比大幅增长226.21%

2024-04-26 22:31

花旗现预计美联储将于7月降息

2024-04-26 22:30

昆明优化公积金住房套数认定标准:不再将个人住房商贷记录纳入认定范围

2024-04-26 22:25

中国船舶:第一季度归母净利润4.01亿元,同比增长821.12%

2024-04-26 22:23

纳斯达克指数涨幅扩大至2%,科技巨头全线上涨

2024-04-26 22:18

谷歌大涨超11%,再创历史新高,总市值突破2万亿美元

2024-04-26 22:11

研究显示到2025年底全球利率升幅只会砍一半,重塑投资格局

2024-04-26 22:09

台达电加码印度投资,预计增资6200万美元

2024-04-26 22:08

标普500指数涨1%至盘中高点

2024-04-26 22:07

上海航交所:本周中国出口集装箱运输市场行情表现良好,远洋航线运价上涨

2024-04-26 22:06

中基协:3月证券期货经营机构私募资管产品备案规模环比增长127.51%

2024-04-26 22:05

美国4月密歇根大学消费者信心指数终值为77.2,前值77.9

2024-04-26 22:04

美国消费者4月份对未来一年通胀率预期由2.9%升至3.2%

2024-04-26 22:00

东风着陆场完成最后一次全系统综合演练,准备就绪迎接神十七航天员回家

2024-04-26 21:54

中概股指数涨幅扩大至3.5%,小鹏汽车涨近10%

扫描下载App