“硅谷创投教父”Steve、沈向洋、徐立现身GDC大会，上海已有24款大模型获备案

（图片来源：钛媒体App编辑拍摄）

3月23日，2024全球开发者先锋大会（GDC）在上海开幕。

本届GDC大会以“模速空间—开发者的模力之源”为主题，围绕大模型上下游产业链及应用场景，超过100个国内外知名生态社区代表、100多家国内外知名投资机构，线下开发者超3万人次参与，涵盖1场开幕式、1场顶尖青年开发者交流会、5场前沿技术讲坛、10+场平行技术讲坛，以及数百位嘉宾线下演讲。

同时，大会期间还将展示超过100个国内外知名模型、最新趋势和创新成果等。就在23日上午，阶跃星辰、商汤、RWKV、上海人工智能实验室、幂方科技等企业的六款最新大模型全面亮相。

据上海市人民政府副市长陈杰披露，目前上海有24款大模型进行了备案，多款人形机器人也即将发布。

23日的开幕式上，“空间计算之父”、RealityPrime和XR Guild主席Avi Bar-Zeev；美国硅谷创业教父、创业孵化器Founders Space创始人史蒂夫·霍夫曼（Steve Hoffman）；OpenAI前全球商业化负责人Zack Kass；美国国家工程院外籍院士沈向洋；商汤科技董事长兼首席执行官徐立；上海人工智能实验室主任助理、领军科学家乔宇等人展开演讲。

硅谷创业教父：AI 不是一种商业模式

事实上，AI 是新一轮科技革命和产业变革的重要驱动力量。当前，以大模型为代表的生成式 AI 等前沿技术正在持续迭代发展，与社会生产生活各方面加速融合，形成新质生产力，也引发了创新创业的热潮。

据工业和信息化部副部长王江平披露，截至2023年底，中国软件产业规模超过12万亿元。

在3月23日上午的开幕式上，被称为硅谷“船长”的创业教父、创业孵化器Founders Space创始人史蒂夫·霍夫曼（Steve Hoffman）在2024 GDC大会开幕式上表示，AI不是一种商业模式，而是一种技术。

“大家经常会搞混，如果我有AI，我的企业就成功了，不是这样的。众多企业只用一下AI，不一定能成功，而是AI能够为你的客户带来什么，企业最终还是要服务客户，因为客户提出了对产品和服务的需求，利用AI能够给你的客户带来独创价值，竞品无法做到，您就会鹤立鸡群。”霍夫曼表示。

他在演讲中坦言，“大家（企业）要思考自己的“护城河”，这比历史以往更加重要，单单考虑应用AI还不够，你需要在自己的业务周围建立护城河。这个不是来自于AI本身，因为大家都可以利用AI，利用API，利用ChatGPT的API，每个人都可以做到。单单使用API，你没有竞争优势，超越竞品要有更加广泛的思考，我如何让用户获得更好的服务，如何和客户建立更加独特的关系，我能够将什么技术申请专利，我有什么样的自有数据得以在我公司生成，这些是你利用AI成功的要点，你要超越AI本身。你要记住，如果你在大平台公司，比如OpenAI、谷歌，前进道路上的过程当中，他们会将你压碎，你只会成为他们公司产品的一个特征。”

不过，霍夫曼也认为，AI 发展很快，已经开始做了一些事情。比如，AI 可以做一个面试官，替你选人才，从而可以节约你的时间和资源。同时，AI可以帮助他们进行员工训练，所以你就不需要投入相关的资源去训练新入（职）的员工。

“这个员工是否要辞退或者雇佣，很多管理者的决策可以基于AI。”霍夫曼表示，AI可以解决很多复杂、困难的问题。而利用数据，利用 AI 赋能各种行业，可以帮助你决策等。

霍夫曼非常看好人形机器人、数字孪生、程序化的搜索引擎优化等各种新的行业，预计将被 AI 技术所赋能和加速发展。

“大家都在讲Sora，Sora之所以特别棒，它不仅可以创建某一个视频，它能够对其进行编辑。到此时此刻，我们直接可以和视频对话，然后进行改变，改变这个人戴的帽子，改变他的面孔。我们和视频进行对话，和视频对话能够进行编辑，生成难以置信的质量。在未来5年，这样的视频不会只有1分钟，可以长达1小时，任何人在家里都可以创建专业质量的视频。”霍夫曼称。

Founders Space创始人史蒂夫·霍夫曼（Steve Hoffman）

在演讲之后的“开发者十问”圆桌上，霍夫曼直接表示，在 AI 领域，初创企业不要和大厂直接竞争，和大厂竞争太难。

他直言，企业在做战略规划时，要看看自己的专业能力和核心技术。

“在正确的赛道才是大热门，如果不是AI初创企业，现在就拿不到任何资金支持，现在太难了，很多企业在死亡。”霍夫曼表示，不管是生命科学、金融科技，还是客户服务、销售，利用 AI 的各个行业都需要关注 AI 如何给你带来更好的竞争力。

霍夫曼强调，Midjournuy原来做得也很好，非常棒的开发工具，但是谷歌、微软现在把众多的产品免费了，Midjournuy就“死”掉了，所以，如Pika这家公司现在要和Sora竞争的话，需要要思考如何开发新产品，而不是直接和大的平台进行竞争。

OpenAI Zack Kass：2030年AGI时代将会到来

OpenAI前全球商业化负责人Zack Kass在GDC演讲中表示，在未来10年内，计算机、手机等设备将经历重大变革，人们甚至可以通过戴眼镜来操作电器，电器将变成公共工具，我们的生活也将因此发生改变。

“2030年AGI（通用人工智能）时代即将到来。”Zack Kass表示。

OpenAI前全球商业化负责人Zack Kass（图片来源：钛媒体App编辑拍摄）

Zack Kass认为，AI技术的发展可以分为三个阶段：首先，应用增强阶段，AI功能日益强大，如ChatGPT的出现，使得我们通过简单的手机操作就能享受到AI的便利；其次，AI自动化阶段，预计在未来两年内实现。在这一阶段，AI能够自动执行任务，无需手动打开应用程序。用户可以通过语音命令或耳机传达指令，实现直接操作。最后是AI赋能的操作系统阶段，这将是一个更加革命性的变革。随着CPU的发展，人们对工具和设备的期待也在不断提高。

当下AGI的时代已经到来，我们该如何做好准备？Zack Kass称，面对技术的发展，非常重要的一点是一定要学会区分技术能做什么，能为我们服务什么。AGI技术的发展，对每个开发者来说，意味着技术的成本越来越低。ChatGPT 3.0刚开始问世的时候，成本非常高，而现在已经接近于零成本。

“而且开发者一定要牢记哪些是当下我们面临的技术瓶颈，比如每年在高速公路上或者无人驾驶的事故率也有很多，我们应该进行风险评估。”Zack Kass称。

Zack Kass也提到要警惕AI技术发展产生的陷阱。他提到，AI能够解决许多个性化的需求，也会让人们对这类AI工具产生依赖，这可能会导致人类智力的退化。此外，AI的普及可能引发人们对身份认同的困惑，许多人担心失业问题。

针对当下的“AI复活”技术，Zack Kass指出，“我们需要分清人类与技术的界限，我自己在生活中更愿意与人互动，而不是和机器互动，人与人的互动是非常重要。”

Zack Kass认为，机器缺乏灵魂，而人的复活在现实中是不可能的。AI“复活”亲人是一种奇怪的想法，并不是我们生活的现实世界。Zack Kass表示，人是什么，机器是什么，我们需要分清界限。在生活当中，他更愿意和人互动，而不是和机器互动，这些互动不是做很多实验、做很多研究可以替代的，机器无法读出人类的想法。

大会圆桌期间，AI创业还面临高投入、变现难等问题。Zack Kass坦言，这是一个老问题，但乐观的是，整个价格或者开发的成本会变，很多依赖于ChatGPT，会发现成本削减了一半，因为由于大模型的开发成本不断地下降，大模型的开发成本慢慢在变低，甚至接近到零。营运成本还需要密切关注，一定要让大模型商业运营，商业化很重要。

“另一个是成本的投入，可能对于初创企业来说，成本投入很重要。”Zack Kass表示。

在演讲最后，Zack Kass建议大家要规划好个人生活，要去思考，AI把人类的知识技能商业化之后，我们人类还能做什么。

沈向洋：大模型将横扫所有垂直行业，算力是门槛

“大模型大到一定地步以后就涌现出来。多大才涌现出来？没人讲得清楚。”23日开幕式上，美国国家工程院外籍院士沈向洋在《大模型时代的机遇和挑战》的演讲中分享了对大模型的思考。

沈向洋博士（图片来源：钛媒体App编辑拍摄）

首先，沈向洋表示，AI 技术蓬勃发展，但人们对智能的本质并没有清晰认知。物理学是Theory of Everything，而深度学习就是Theory of Anything。

过去这几年，大模型的发展风起云涌，Text to Text、文生图、文生视频等形式不断涌现。

沈向洋认为，文生图使得一言胜千图，一个简单的提示就可以做出了不起的图片。ChatGPT使得一句顶一万句，提出一个问题可以得到很多答案。Sora的出现使得输入几句提示就能产生大片效果。

“大模型这个事情出来以后，国内已经有非常多的公司，很多开发者已经在做这方面的工作了。有一个数字说，全中国大概有200多家做大模型的公司，所以叫百模大战不夸张，我觉得更像是‘群模乱舞’。”沈向洋表示，大模型对开发者和做科研的人来讲是很振奋的事情，它给我们一个机会，实际上你把科研做好的话，创新非常重要，而且需要有影响力。

这三件事让人们产生一个个焦虑，未来开发者的机会在哪里？沈向洋认为是多模态。他认为，多模态是AGI的必经之路，以OpenAI代表的技术实际上是对不同模态的理解。

“OpenAI的内部有两套体系，一是从文生图延展到文生视频，走的是Stable Diffusion路线，二是文生文，走的是Transformer路线。到现在为止，这两条线路还没完全统一起来，相信接下来中国的开发者、世界的开发者，很快会有这方面的突破。”沈向洋称。

随后，沈向洋分享了关于大模型的五方面思考。

第一，大模型的到来，强迫人类重新思考人机关系。“我们受到的冲击，到底有多少是机器智能的发展，有多少是人机交互的震撼。”他认为，不管是什么技术，最终目的是帮助人更好运用机器，不忘初心。

第二，大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。“一个通用大模型如果没有万卡、不上1万亿参数，基本上以后就不太好意思说这是一个通用模型了。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。最有意思的是个人大模型，利用个性化参数，结合云和端，这是非常有意义的。”

第三，算力是门槛。影响算力的两大因素是模型大小和数据规模，随着参数增加，对算力的需求几乎是几何级的。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力，现在贫穷可能扭曲想象力，因为如果没有卡，能想象要做的项目可能就不太一样了。”

第四，AI带来社会冲击。这些冲击包括对民众的冲击、企业的冲击、政府监管的冲击、社会发展的冲击，带来一本正经胡说八道、深度伪造等伦理问题，很多国家开始立法，这需要共同推动治理、向前发展。

第五，智能的本质。AI 蓬勃发展，但人们对智能的本质并没有清晰认知。

“大模型改变了几乎所有的事情，”沈向洋表示，“很多人相信scaling law（规模法则），但今天的深度学习，理论非常欠缺。从宇宙到量子，物理学有一套大一统的理论统一起来，叫作Theory of Everything。今天深度学习没有这样的理论，所以叫作Theory of Anything。”

最后，沈向洋指出，他相信创新有三个层次：一个是技术的创新，一个是产品的创新，一个商业模式的创新。有计算和没计算机完全两码事，没有互联网就不存在电商这件事情，这三件事情最根本的创新，特别是对开发者来讲肯定是技术的创新。

“所以以前大家都非常激动地讲，做得好的话要做一个PMF（product market film），今天大模型时代给我们带来更大冲击的是TFF（technology market film），出道即巅峰，ChatGPT一出来两个月一亿用户，这些都会给我们开发者，特别是在上海的开发者一些鼓励，（大模型）系统好好地建立起来。”沈向洋在演讲结尾称。

空间计算之父：“元宇宙”将改变未来的网络生态

演讲开始的时候，“空间计算之父”、RealityPrime和XR Guild主席Avi Bar-Zeev戴上了苹果Vision Pro设备，展示了虚拟现实设备画面。

“我戴的这个眼镜用了很长时间。但我不代表苹果，我代表的是整个团队，他们一起开发了这个产品——这就是空间计算。我们把电脑放弃，直接来看这样一个苹果Apple Glasses，大家看到我前面的屏幕，对于大家来说不是3D的，但对我来说是3D，也就是说我进入了一个新世界。”Avi Bar-Zeev表示。

Avi Bar-Zeev详细谈及VR（虚拟现实）、AR（增强现实）和空间计算之间的区别。他指出，空间计算是指我坐在椅子上体感中看到的手、头等与计算机进行交流（突破屏幕的交流），当然有很多冲突（包括利益冲突）。与VR、AR相比技术是类似的，需要及时区分。“空间计算有不同的层次和维度，其实它们之间没有真正的冲突，实际上是可以共存的，它们之间的界限已经非常模糊了。”

对于“元宇宙”和空间计算的区别，Avi Bar-Zeev指出，它们之间有重大的区别。其中一点是，在同一房间里对于“空间计算”和“元宇宙”中的物品感知——一个是现实、一个是世界。空间计算更加安全、更个性化，所以大家可以有不同的感受。“它（空间计算）是一个起点，之后我们可以进军到‘元宇宙’。”

Avi Bar-Zeev认为，那些炒作“元宇宙”会让大批人失业，对社会造成冲击等，实际不然。从一个“金字塔”学术角度看，技术是以人为本，这与我们以往的世界是不一样的。

“‘元宇宙’改变了未来的网络生态，我们一定要解决一对一、一对多的小规模的互动。”Avi Bar-Zeev强调，未来“元宇宙”相关设备会对娱乐业产生影响，体验XR设备的机会可能更多一些。

徐立：基于 AI 的生产力工具目前只能解决10%以下问题，突破或有限

3月23日上午的开幕式上，AI 上市公司商汤科技董事长兼CEO徐立发表了主题为《AI 2.0时代的新质生产力工具》的演讲。

徐立表示，以ChatGPT为代表的生成式 AI 技术推动人类进入AI 2.0时代。中国对于ChatGPT、Copilot、生产力工具、英伟达Blackwell等词语的关注度最高，位居所有国家的榜首。这代表着，中国近千万的开发者以及普罗大众对于“AI 能够带来什么样变化”的热切关注。

然而，徐立直指，尽管人们对于生成式 AI 技术提高生产效率的需求不断提升，但现状却是，这些AI 2.0时代的生产力工具当前的情况并不尽如人意，目前解决的问题在10%以下，生产链上能带来的突破可能还有限。

“虽然中国对于这部分的关注度非常高，但我们真正在使用这部分的应用当中排在了美国印度之后，我想这里面还有一个问题——语言问题。如果用自然语言来完成编程的任务、设计的任务，目前来说英语和现在的程序匹配非常得完整，有大量的现成的数据，但是到中文相信需要有更好的中文语言的工具。”徐立称。

徐立提到，有意思的是，大家的认知中，如果我的编程经验越丰富，越能够用好新的生产力工具？事实上统计数据显示是相反的：经验在五年以下的程序员，往往能够用到生产力工具解决的问题时长是超过一小时的，但是五年以上的程序员，每周能节省的时间反倒是更短的。这代表，越是高阶的任务、越是复杂的任务，对于大家用好现在的 AI 工具来说还是有一定的挑战。

徐立称，生产力工具的 AI 模型分成能力圈的三层（KRE），之间互有依赖但不完全相关：第一层知识层Knowledge；第二层推理层（Reasoning），第三层是执行层Execution。

徐立十分看好“具身智能”和人形机器人领域发展。他提到，从某种意义上来说，执行就是“具身智能的大脑”，预计未来会有很大的突破。

近期，商汤推出了代码小浣熊——基于商汤大语言模型的软件智能研发助手，覆盖软件需求分析、架构设计、代码编写、软件测试等环节，满足用户代码编写、编程学习等各类需求。代码小浣熊支持Python等90+主流编程语言和主流IDE。

在实际应用中，代码小浣熊可帮助开发者提升编程效率超50%。徐立则透露，代码小浣熊至少能节省30%的工作量。

徐立强调，未来，AI2.0时代的生产力工具如果在知识能力、推理能力、执行能力上有所突破，首先受益的是广大开发者以及场景化的核心应用。“对于我们来说，我们会把我们的办公小浣熊全部免费推广给所有开发者。”

上海人工智能实验室乔宇：数据、算力、人才等创新要素都具备下，才能超越OpenAI

上海人工智能实验室主任助理、领军科学家乔宇在题为《书生通用大模型体系：进展与趋势》的演讲中表示，与现在相比，大模型至少还有1~2个数量级的提升。预计到2030年，我们需要再把大模型提高两个数量级，才有可能实现真正的 AGI。

那么，大模型是按照什么规律在演进？

乔宇认为，大模型是按照Scaling Laws（缩放定律）的方法演进，这意味着下一代的模型一定比上代模型如果能力有明显提升的话，算力、数据往往要大一个数量级，这是为什么从GPT2到3再到GPT4、5每次都是数量级的提升，未来大模型将向多模态、具身方向演进。

乔宇指出，“大模型的本质是什么？有人说大模型的本质是人的智能，用一个词让我概括的话，我愿意选择“生成式压缩”。以Lama2为例，我们需要把一个10Tb的文本压缩到一个100GB的模型文件，这里面大概是上千，甚至是上万倍的压缩。

“我们正处于专用智能时代到通用智能时代的关键阶段。”乔宇表示，面向未来的AGI，有两条发展路线，一是延续大模型路线，用更大的算力扩大模型规模，拓宽能力边界，向产业渗透；二是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。这两条技术路选并非孤立和互相替代的，而是要通过探索新的技术路线解决大模型现有路线中的固有问题。

作为诞生在上海的 AI 领域新型研究机构，上海人工智能实验室构建了全链条的开源体系，用开源支持创新和应用生态的发展。

“一方面大模型目前面临着效率可信、安全等很多挑战，而解决这些挑战不是光靠工程就可以的，我们需要原始的创新。在过去两年中间在实验室里，我们获得了关于CVPR国际顶级会议的论文奖励。第二，我们要通过原始创新，驱动大模型性能能力的提升；最后一点是开源开放，通过开源的方式，我们可以为学术社区、产业社区提供高性能、更安全、更方便易用的大模型。”乔宇坦言，这是其做大模型的三个初衷。

乔宇强调，现在的AGI大模型已经不再是一个简单的软件工具，所以需要用更多的系统性思维，来审视大模型的安全。

“大模型有智能涌现，我们是不是能把安全或者跟相关智能技术，也成为现在大模型体系发展的一个重要基础？”在演讲结尾，乔宇发出这样的思考。

而谈及当前到底是模型还是应用创造价值，乔宇回应称，“到底是应该更关注模型，还是关注应用。模型和应用事实上是不可或缺的一体两翼，现在基础模型的提升能为我们建立应用创造更大的空间，特别是现在在应用中间，包括幻觉、效率很多瓶颈，事实上都取决于我们在基础领域突破才能解决的。另外，大模型的发展绝对不是为了显示自己有多强，更重要的是能够推动应用的发展，能够在应用中产生实际的效益和价值，从而为人类创造更加美好的生活。所以基础大模型的发展也需要应用的牵引，需要统筹来看一体两翼的问题。”

百余个 AI 模型“群魔乱舞”，机器人、芯片、编码应用全面展示

除了开幕式演讲，3月22日、23日两天，钛媒体App编辑也探访了大会展馆，整体来看，主要分为四个板块：AI模型和基础设施，AIGC应用，AI+机器人，以及 AI 人才。

首先是AI模型和基础设施方面，联通、阿里云、MiniMax、HiDream、百川智能、无问芯穹、蜜度等厂商均有参展。

其中，阿里云在此次大会期间公布阿里云魔搭社区“ModelScope-Sora开源计划”，将为类Sora模型开发提供一站式工具链，涵盖数据处理工具、多模态数据集、类Sora基础模型、训练推理工具等。现阶段，魔搭发布了业界首个开源的多模态数据处理系统Data-Juicer，包含100多种高效算子，可大幅提升视频数据处理效率和质量。

据透露，阿里云魔搭目前已汇聚3000多款优质模型及上千数据集，为超过400万开发者提供模型及免费算力服务。

MiniMax则在本届展会期间展示MiniMax开放平台面向企业级用户和开发者的大模型应用解决方案。

蜜度则展示两个自研垂类大模型——蜜巢和文修，其最新落地应用页同步亮相，以及好玩、有趣的“AI变身秀”——文生图应用进行互动体验。

据蜜度透露，“AI变身秀”的背后，是多模态融合生成技术的应用成果。该技术集成了多项先进算法，通过利用生成式扩散模型生成多类动漫风格形象，同时通过对色彩、光影、构图等进行精细调整，结合特征条件提取和AI超分等技术，进一步提升了“AI变身秀”富有个性化的画面。

其次，AIGC应用方面，中国农业银行、Rokid、Dify、思岚、Xmind、中科曙光、Zilliz等公司展示了基于全新 AI 技术的重要场景应用。

有观众在Rokid展区体验拥有 AI 技术的人机交互设备产品

再次，本届GDC展区，机器人是其中重要的展示方向。云深处科技、宇树科技、傲鲨智能、开普勒、如身机器人、梅卡曼德等公司展示了人形机器人、四足机器人、服务机器人等多款产品，机器人行走活灵活现，十分有趣，观赏性十足。

而在展区外面，特斯拉Cybertruck皮卡也引起很多人驻足观看。

最后，AI 人才方面，展区专门搭建了 AI 人才招聘区域，猎聘、万兴、上海人工智能实验室、特斯拉、数坤等企业均开启了招聘通道，包括开发工程师、算法工程师等职位。很多 AI 企业都希望在“金三银四”时期招揽新 AI 时代人才。

整体来看，随着2024年中国大模型进入落地年，金融、文字、医疗等大量领域和场景将会被 AI 所变革。面对50万亿数字经济市场，中国在全球 AI 模型竞争下半场当中会获得大量优势。

陈杰表示，面对 AI 的蓬勃发展，作为上海重点发展的先导产业，上海 AI 产业将进一步发挥超大城市的综合优势，加快建设具有更高影响力的 AI 高地。

他指出，第一，上海将加强核心技术突破，打造更多元开放的智能计算生态，支持通用大模型和垂直大模型研发，积极推进大模型和具身智能的融合发展；第二，进一步加大开源开放力度，探索大模型的新型开源和推广模式，降低广大创新创业团队、中小企业等大模型训练门槛，推出更多具有示范性、标志性的应用场景，牵引大模型在金融、教育、医疗、制造等典型领域的垂直应用；第三，加快培育创新创业生态，深化载体建设，提升服务能级，完善标准体系、安全准则、伦理规范，推动 AI、区块链、元宇宙等前沿技术的开发和应用。

“我们希望今天所有的嘉宾和所有 AI 的开发者，都能够在穹顶之下仰望苍穹，共同为 AI 的全球治理，为 AI 更高质量的发展作出更大的贡献。”陈杰表示。

（本文首发钛媒体App，作者｜林志佳）