我们让ChatGPT总结了微软154页GPT-4研报，抽象思考能力优于数学运算

微软团队利用1994年国际共识智力定义执行多个实验测试，以观察GPT-4在推理、解决问题、抽象思考、理解和快速学习等方面能力，最终现实，GPT-4拥有对世界的常识并在这基础上做出推理的能力。不过，在另一个实验中，简单数学运算问题方面，GPT-4却表现缺乏工作记忆和数学的能力。

（图片来源@视觉中国）

随着美国OpenAI公司推出的人工智能（AI）对话模型ChatGPT风靡全球，该公司背后核心投资方微软开始评估GPT-4对未来人类的影响。

钛媒体App 3月29日消息，微软雷蒙德研究院机器学习理论组负责人Sebastien Bubeck以及2023斯隆研究奖得主李远志等人组成的科研团队，近日在预印版平台arxiv上发布长达154页的论文《通用人工智能的火花：GPT-4早期实验》。

鉴于最近ChatGPT的爆火，钛媒体App利用ChatGPT API的相关翻译开发平台，将微软这篇GPT-4研究报告用ChatGPT进行翻译、梳理和理解，并且通过多次Prompt提示词、对话方式，试着让ChatGPT介绍和评价微软这篇长达154页、关于GPT-4的论文。

据悉，微软是离ChatGPT和其母公司OpenAI最近的科技巨头之一。

今年1月24日，即ChatGPT发布第二个月，微软宣布数十亿美元投资 OpenAI，并且计划在算力、商业化以及 AI 技术方面进行长期合作。据报道，本轮融资后OpenAI公司估值高达290亿美元，接近2000亿元人民币。随后2月7日，微软推出ChatGPT版Bing（必应）搜索引擎和Edge浏览器，并在3月更新GPT-4后同时升级，引发全球广泛关注。

如今新的 AI 浪潮下，微软开始希望全面评估GPT大模型对于人类、整个 AI 技术行业发展的影响。

具体来说，本论文核心主题是关于GPT-4的人工智能系统，它展示了人工智能的一种形式，即人工通用智能（AGI）。论文通过实验研究与讨论GPT-4在推理、创造力、演绎等核心思维能力方面的表现，以及它在文学、医学和编码等领域获得专业知识的范围，和它所能执行的各种任务。此外，该文件还探讨了如何定义AGI本身，构建缺失组件以实现AGI，并更好地理解最近LLMs所展示的智能起源。

论文指出，微软团队测试了语言理解方面的反馈。最终，GPT-4很好地完成了多个任务并超过ChatGPT水平。另外，微软团队还利用1994年国际共识智力定义执行多个实验测试，以观察GPT-4在推理、解决问题、抽象思考、理解和快速学习等方面能力，最终现实，GPT-4拥有对世界的常识并在这基础上做出推理的能力，甚至可以用ABC记谱法创作音乐，并按人类要求修改。

左侧是GPT-4扮演老师给两个作业打分，右侧是用GPT-4创作音乐（来源：论文）

不过在另一个实验中，简单数学运算问题方面，GPT-4却表现缺乏工作记忆和数学的能力。当数字在0-9之间均匀选取时，GPT-4准确率只有58%；范围在10-19、20-39时，GPT-4准确率下降到16%和12%；范围在99-199时准确率下降到0。

所以结果表明，微软认为，GPT-4是一种非常强大的人工智能系统，它在许多任务和领域中表现出了惊人的能力，并且在某些方面甚至可以与人类相媲美。然而，GPT-4仍然存在一些局限性和挑战，需要进一步研究和发展才能实现更深入、更全面的AGI系统。此外，该论文还探讨了GPT-4对社会的影响以及未来研究方向。

“GPT-4可被视作 AGI 的早期版本。”微软研究团队表示，GPT-4代表了迈向AGI的进展，但并不意味着它是完美的。“我们相信，GPT-4 AI 标志着计算机科学领域及其他领域真正的范式转变。”

事实上，不止是微软，OpenAI此前发布的一份官方研究估算，对于美国19%的岗位，至少50%的工作内容会被影响；对于80%的岗位，也至少有10%的工作内容被或多或少地波及；数学家、会计师和审计师、新闻分析师、法律秘书和行政助理、报税员等职业最容易受到GPT的影响。苏黎世大学的研究则认为，ChatGPT在文本标注任务中的表现超过亚马逊的众包工人，甚至ChatGPT标注成本每条不到0.003美元，是众包工人薪资的二十分之一。

高盛3月27日发布报告指出，全球预计将有3亿个工作岗位最终被 AI 取代。假设生成式 AI 实现了各企业承诺的能力，劳动力市场将面临挑战，AI 可以接手美国和欧洲高达四分之一的工作。报告预计，随着劳动生产力提高，AI 应用有望使全球在下一个10年内，推动全球GDP（国内生产总值）年复合增长率将达到7%。

“最近出现的生成式 AI 将降低劳动力成本和提高生产率。尽管 AI 的潜力存在很大的不确定性，但它可以生成与人类创造成果无法区分的内容，并能打破人机沟通障碍，反映出具有潜在巨大宏观经济影响的重大进步。AI 不仅节省劳动力成本，还能创造新的就业机会以及提高在岗工人的生产率。AI 的革命性就像早期通用技术（如发电机和个人计算机）一样能为社会带来繁荣。”高盛研报称，美国六成 AI 从业者中7%的工作，有一半以上的流程可以由 AI 自动化完成，或将给经济和人才发展带来重要影响。

3月27日公布的麻省理工学院研究科学家Lex Fridman节目中，OpenAI公司CEO奥特曼（Sam Altman）提到，强大的 AI 杀死人类有一定可能性。“很多关于 AI 安全和挑战的预测被证明是错误的，我们必须正视这一点，并尽早尝试找到解决问题的方法。”

百度创始人、CEO李彦宏预测，十年以后，全世界有50%工作会是提示词工程岗位，不会写提示词（prompt）的人会被淘汰。

但是，ChatGPT引发的风险挑战不可忽视。早在3月20日，有海外用户发现ChatGPT聊天历史栏出现了不是自己的聊天记录标题，OpenAI方面证实了这一消息。而且，ChatGPT 在隐私安全、知识版权方面存在多个漏洞问题。

奥特曼在推特上致歉：“由于开源库中的错误，我们在ChatGPT中遇到了一个重大问题，现在已经发布了修复程序，我们刚刚完成验证。一小部分用户能够看到其他用户对话历史的标题。我们对此感到很抱歉。”

最近的一份报告中，数据安全服务Cyberhaven检测到并阻止了其客户公司160万名员工中4.2%的人将数据输入 ChatGPT 的请求，因为存在泄露机密信息、客户数据、源代码或监管信息的风险。目前，摩根大通已经限制员工使用 ChatGPT，亚马逊、微软和沃尔玛也已向员工发出警告，要求员工谨慎使用生成式 AI 服务。（本文首发钛媒体App，作者｜林志佳）

发表评论

0 / 300

根据《网络安全法》实名制要求，请绑定手机号后发表评论

请登录后输入评论内容

你说你说你说
简单数学运算问题方面，GPT-4却表现缺乏工作记忆和数学的能力
回复 2023.03.29 · via h5
心诚则不散
评估GPT-4对未来人类的影响
回复 2023.03.29 · via android
我的心傻了
高盛3月27日发布报告指出，全球预计将有3亿个工作岗位最终被 AI 取代
回复 2023.03.29 · via pc
日照褪尽
社会因为AI能进化吗
回复 2023.03.29 · via iphone
理财小能手
ChatGPT引发的风险挑战不可忽视
回复 2023.03.29 · via h5
流年倾听
GPT-4拥有对世界的常识并在这基础上做出推理的能力
回复 2023.03.29 · via iphone
Latentperiod111
强大的 AI 杀死人类有一定可能性
回复 2023.03.29 · via h5

我们让ChatGPT总结了微软154页GPT-4研报，抽象思考能力优于数学运算｜钛媒体焦点

敬原创，有钛度，得赞赏