我们让ChatGPT总结了微软154页GPT-4研报,抽象思考能力优于数学运算|钛媒体焦点

微软团队利用1994年国际共识智力定义执行多个实验测试,以观察GPT-4在推理、解决问题、抽象思考、理解和快速学习等方面能力,最终现实,GPT-4拥有对世界的常识并在这基础上做出推理的能力。不过,在另一个实验中,简单数学运算问题方面,GPT-4却表现缺乏工作记忆和数学的能力。

(图片来源@视觉中国)

(图片来源@视觉中国)

随着美国OpenAI公司推出的人工智能(AI)对话模型ChatGPT风靡全球,该公司背后核心投资方微软开始评估GPT-4对未来人类的影响。

钛媒体App 3月29日消息,微软雷蒙德研究院机器学习理论组负责人Sebastien Bubeck以及2023斯隆研究奖得主李远志等人组成的科研团队,近日在预印版平台arxiv上发布长达154页的论文《通用人工智能的火花:GPT-4早期实验》。

鉴于最近ChatGPT的爆火,钛媒体App利用ChatGPT API的相关翻译开发平台,将微软这篇GPT-4研究报告用ChatGPT进行翻译、梳理和理解,并且通过多次Prompt提示词、对话方式,试着让ChatGPT介绍和评价微软这篇长达154页、关于GPT-4的论文。

据悉,微软是离ChatGPT和其母公司OpenAI最近的科技巨头之一。

今年1月24日,即ChatGPT发布第二个月,微软宣布数十亿美元投资 OpenAI,并且计划在算力、商业化以及 AI 技术方面进行长期合作。据报道,本轮融资后OpenAI公司估值高达290亿美元,接近2000亿元人民币。随后2月7日,微软推出ChatGPT版Bing(必应)搜索引擎和Edge浏览器,并在3月更新GPT-4后同时升级,引发全球广泛关注。

如今新的 AI 浪潮下,微软开始希望全面评估GPT大模型对于人类、整个 AI 技术行业发展的影响。

具体来说,本论文核心主题是关于GPT-4的人工智能系统,它展示了人工智能的一种形式,即人工通用智能(AGI)。论文通过实验研究与讨论GPT-4在推理、创造力、演绎等核心思维能力方面的表现,以及它在文学、医学和编码等领域获得专业知识的范围,和它所能执行的各种任务。此外,该文件还探讨了如何定义AGI本身,构建缺失组件以实现AGI,并更好地理解最近LLMs所展示的智能起源。

论文指出,微软团队测试了语言理解方面的反馈。最终,GPT-4很好地完成了多个任务并超过ChatGPT水平。另外,微软团队还利用1994年国际共识智力定义执行多个实验测试,以观察GPT-4在推理、解决问题、抽象思考、理解和快速学习等方面能力,最终现实,GPT-4拥有对世界的常识并在这基础上做出推理的能力,甚至可以用ABC记谱法创作音乐,并按人类要求修改。

 左侧是GPT-4扮演老师给两个作业打分,右侧是用GPT-4创作音乐(来源:论文)

不过在另一个实验中,简单数学运算问题方面,GPT-4却表现缺乏工作记忆和数学的能力。当数字在0-9之间均匀选取时,GPT-4准确率只有58%;范围在10-19、20-39时,GPT-4准确率下降到16%和12%;范围在99-199时准确率下降到0。

所以结果表明,微软认为,GPT-4是一种非常强大的人工智能系统,它在许多任务和领域中表现出了惊人的能力,并且在某些方面甚至可以与人类相媲美。然而,GPT-4仍然存在一些局限性和挑战,需要进一步研究和发展才能实现更深入、更全面的AGI系统。此外,该论文还探讨了GPT-4对社会的影响以及未来研究方向。

“GPT-4可被视作 AGI 的早期版本。”微软研究团队表示,GPT-4代表了迈向AGI的进展,但并不意味着它是完美的。“我们相信,GPT-4 AI 标志着计算机科学领域及其他领域真正的范式转变。”

事实上,不止是微软,OpenAI此前发布的一份官方研究估算,对于美国19%的岗位,至少50%的工作内容会被影响;对于80%的岗位,也至少有10%的工作内容被或多或少地波及;数学家、会计师和审计师、新闻分析师、法律秘书和行政助理、报税员等职业最容易受到GPT的影响。苏黎世大学的研究则认为,ChatGPT在文本标注任务中的表现超过亚马逊的众包工人,甚至ChatGPT标注成本每条不到0.003美元,是众包工人薪资的二十分之一。

高盛3月27日发布报告指出,全球预计将有3亿个工作岗位最终被 AI 取代。假设生成式 AI 实现了各企业承诺的能力,劳动力市场将面临挑战,AI 可以接手美国和欧洲高达四分之一的工作。报告预计,随着劳动生产力提高,AI 应用有望使全球在下一个10年内,推动全球GDP(国内生产总值)年复合增长率将达到7%。

“最近出现的生成式 AI 将降低劳动力成本和提高生产率。尽管 AI 的潜力存在很大的不确定性,但它可以生成与人类创造成果无法区分的内容,并能打破人机沟通障碍,反映出具有潜在巨大宏观经济影响的重大进步。AI 不仅节省劳动力成本,还能创造新的就业机会以及提高在岗工人的生产率。AI 的革命性就像早期通用技术(如发电机和个人计算机)一样能为社会带来繁荣。”高盛研报称,美国六成 AI 从业者中7%的工作,有一半以上的流程可以由 AI 自动化完成,或将给经济和人才发展带来重要影响。

3月27日公布的麻省理工学院研究科学家Lex Fridman节目中,OpenAI公司CEO奥特曼(Sam Altman)提到,强大的 AI 杀死人类有一定可能性。很多关于 AI 安全和挑战的预测被证明是错误的,我们必须正视这一点,并尽早尝试找到解决问题的方法。”

百度创始人、CEO李彦宏预测,十年以后,全世界有50%工作会是提示词工程岗位,不会写提示词(prompt)的人会被淘汰。

但是,ChatGPT引发的风险挑战不可忽视。早在3月20日,有海外用户发现ChatGPT聊天历史栏出现了不是自己的聊天记录标题,OpenAI方面证实了这一消息。而且,ChatGPT 在隐私安全、知识版权方面存在多个漏洞问题。

奥特曼在推特上致歉:“由于开源库中的错误,我们在ChatGPT中遇到了一个重大问题,现在已经发布了修复程序,我们刚刚完成验证。一小部分用户能够看到其他用户对话历史的标题。我们对此感到很抱歉。”

最近的一份报告中,数据安全服务Cyberhaven检测到并阻止了其客户公司160万名员工中4.2%的人将数据输入 ChatGPT 的请求,因为存在泄露机密信息、客户数据、源代码或监管信息的风险。目前,摩根大通已经限制员工使用 ChatGPT,亚马逊、微软和沃尔玛也已向员工发出警告,要求员工谨慎使用生成式 AI 服务。(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 简单数学运算问题方面,GPT-4却表现缺乏工作记忆和数学的能力

    回复 2023.03.29 · via h5
  • 评估GPT-4对未来人类的影响

    回复 2023.03.29 · via android
  • 高盛3月27日发布报告指出,全球预计将有3亿个工作岗位最终被 AI 取代

    回复 2023.03.29 · via pc
  • 社会因为AI能进化吗

    回复 2023.03.29 · via iphone
  • ChatGPT引发的风险挑战不可忽视

    回复 2023.03.29 · via h5
  • GPT-4拥有对世界的常识并在这基础上做出推理的能力

    回复 2023.03.29 · via iphone
  • 强大的 AI 杀死人类有一定可能性

    回复 2023.03.29 · via h5

快报

更多
33
7
17

扫描下载App