2024CTIS-文章详情页顶部

谁能治好英伟达“依赖症”?

钛度号
“它没那么强,我们或许有机会”。

文 | 数科星球,作者丨苑晶,编辑丨大兔

在AI圈,除了OpenAI,就属英伟达(NVIDIA )最为知名。

对于广大生成式AI企业而言,这家企业的重要性是毋庸置疑的。它为前者既提供着GPU硬件,又提供名为“CUDA”的并行计算平台和编程模型。

一直以来,“转译”兼容英伟达CUDA,成为了非生态开发人员的既有工作模式。这样做可以在不依赖硬件的前提下,享受到其GPU加速软件所带来的相关好处。

但日前,这种“坐车不买票”的便宜被占到头了。

在最新版本的CUDA里,英伟达开始禁止以转译模拟的方式兼容CUDA。一些熟悉平台的开发者倍感头疼,但好处是,这项规定也客观推动着国产GPU行业的发展。

我们有可能治好“英伟达依赖症”吗?

三种挑战者

极盛之后,便是多事之秋。

就在最近,英伟达经历了股价暴跌5.6%的事件。据数据,其市值缩水1300亿美元,且创下美股单日市值暴跌最高纪录。似乎,美资本市场正在大幅撤资科技概念,这无疑为红得发紫的AI巨头们蒙上了一层阴影。

对于英伟达而言,如今面对的,更是前有群狼、后有猛虎的格局。所以,业界产生了一种质疑:英伟达的生态壁垒,能否扛住此次对手的竞相分食。

应该说,长期以来,CUDA是成功的。“我认为,英伟达的生态壁垒仍旧稳固,在过去,Intel、AMD等公司尝试打破格局,但都失败了”,一位问询者回答数科星球。

技术上,其平台拥有面向AI和HPC(高性能计算)的多种算法框架。另外,CUDA还拥有一套编程工具和库,使得开发者能够使用如C、C++或FORTRAN等语言编写高效能的代码。

用个游戏平台的例子横向比较下,CUDA很像Steam,而Epic、Origin等平台多年来未对Steam形成超越的原因,是前者内置的游戏多、玩家多。

现在,CUDA同样拥有天量开发者和软件配套。

按照软件的通用逻辑,规模经济下,英伟达的优势很难被打破。但在新的竞争格局中,变革的速度显然正在加快。截至目前,至少有三种力量试图打破这一垄断:

其一,是生成式AI公司发起的“革命”。逻辑是,现在,英伟达几乎挡了所有生成式AI公司的盈利之路。在此前披露的财报中,其全年营收达到了600多亿美元,同比增126%,利润达到了近300亿美元,同比增长581%。

“我估摸,去年OpenAI应该有18亿美元的收入,整个生成式AI大概有60-70亿美元收入,英伟达一家涨这么多,不合理吧。”一位行业高管称。不合理之处在于,以OpenAI为首的企业已对“自己干活、英伟达赚钱”的模式颇为不满,并已纷纷投入到自研芯片的进程之中。

其二,是来自华为等企业的挑战。在国内的IDC或智算中心的建设项目中,华为已借助强大的政企资源获得了数量可观的订单。这样的情况同样在摩尔线程、壁仞科技等企业中发生。

在运算效率上,国产卡还赶不上NVIDIA ,属“三块顶一块”的程度,成本也略高。但乐观者分析,当海量订单转化成规模优势,制造成本也将随之降低,届时,国产GPU芯片将复制国产电动汽车行业的成功。

其三,是来自Intel和AMD的“怨念”。作为CPU行业的两大巨头,实际上,二者在GPU领域同样拥有顶尖产品。这些年,CPU行业极其眼红GPU的发展,但却无处下嘴。在经历了长时间的“跟随式”竞争后,两个大厂已摩拳擦掌、准备趁虚而入。

AIGC还有时间说No

由此可见,英伟达对转译甚至反汇编的担忧不无道理。

另外,业界预测,GPU行业将很快迎来下一轮发展周期。一位技术专家对数科星球表示,今后的GPU行业极有可能快速进入到大并联时代。而届时,随着算力成本进一步降低,生成式AI的市场将更加广阔。

新的产品,已在酝酿,而这块蛋糕,也是英伟达的必争之地。

当下,英伟达想留住市场和用户,但它的竞争对手却不这么想。其实,从生成式AI的角度而言,开发者对CUDA的依赖是有可能扭转的。

“我认为,本质上,CUDA不是技术有多牛,而是开发者习惯了”,一个AI从业者回答。在他看来,在竞争对手中,都拥有类似CUDA的编码器。缺少的,只是开发者。

我们曾在一篇文章中谈及此事。以往,开发者迁移这件事并非从未有人染指,就在去年,华为鸿蒙就曾以“刷屏”的方式,让国内主流互联网企业加入了其中。

截至去年9月,鸿蒙版App就已逾5000款应用上线。

“我认为,对软件开发者来说,这不是一个技术问题,而是利益分配的问题”,一名ISV开发者说。据他了解,诸如用友等公司在加入中国软件为主导的国产系统项目开发后,投入了巨大的成本重新开发应用。

让厂商为此事买单的核心逻辑是,补贴到位、一切好谈。

还有,生成式AI行业仍属早期。对比较为成熟的并行计算场景,对大多数企业而言,改弦易辙似乎还有时间。

另外,对国有创新项目而言,技术自主化又是必须的。目前在数科星球所接触的企业中,就有相当多的公司面对国央企下发的海量订单。

在以上因素的加持下,信创CUDA似乎是一件可以被期待的事情。

国内GPU的机会

英伟达为何如此成功?国内企业的反超机会在哪里?

纵览这家公司的发展历史会发现,其先后赶上了区块链(挖矿)、自动驾驶和大模型几轮浪潮,市值超越2万亿美元。更为关键的是,它不仅是硬件生产商,也是一家软件企业。

在破解英伟达软件护城河的方向上,业界给出了两种思路:即“直道赶超”和弯道超车。而前者要在底层编程上和它硬碰硬,后者的机遇则在推理型AI算力之中。

“我们的看点是,哪家能依据自己的工具,培养出一批极其有活力的开发者”,亚杰基金合伙人谭茗洲对数科星球说。在这条道路上,国内的科学家要能利用国产软件进行诸如气象、电磁物理等科学实验。

在AI推理领域,国内的机会在于提升卡与卡之间的通信效率。“原理上,只要通信带宽足够大,训练、推理就会非常快”,西安电子科技大学电子工程学院教授吴家骥回答。

根本而言,提升单卡算力存在极限。其背后是单位密度的晶体管数量存在物理极限。而在“带宽派”的看法中,卡和卡之间的集群计算能力才是未来GPU行业竞争的关键,在这一点上NVIDIA NVLink-C2C中就可实现每秒900GB乃至更高的一致互联带宽。

“我认为,硬件上,我们十分有信心实现追赶”,一位从业者说。这一点,在牺牲流片良率的麒麟9000s和牺牲机器尺寸的EUV光刻工厂的案例中均有体现。只是,难点仍然是软件生态。

“形象的比喻是,你或许可以做出电脑,但没法做出操作系统”,吴教授补充说。在他的理解中,若国内在本轮算力中心建设浪潮中,未培养足够专注并行计算的人才,那么很有可能在未来的商业竞争中,该产业的发展仍处于受制于人的局面。

本文系作者 数科星球 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App