2024T-EDGE文章顶部

独家对话天数智芯吕坚平:一家实现2亿营收的中国GPU芯片独角兽是如何炼成的

“半导体一定是一个长期技术积累,以及收割期长的产业体系,大家应该要走正确的路,不要被资本或互联网模式带偏。”

天数智芯首款高性能云端7nm GPGPU芯片

尽管下游需求出现波动,资本市场不断承压,但半导体产业的投融资情绪依然处于高位。

近日,钛媒体App 从企查查方面获悉,2021年,中国芯片半导体赛道投融资事件为492起,披露融资总金额超3876亿元人民币,同比增长253.1%。而2022年前三个月,芯片行业投融资事件共310起,是2021年同期的4.6倍,披露融资总额超350亿元。

“这段时间(部分)半导体股可能会跌,主要原因包括,过去全球半导体产业体系,是围绕智能手机转的,如今当手机(消费电子)需求量降低后,芯片半导体产业整体会看起来低落;而且国内半导体产业本来就是要看久一些,这是一个回收成本周期很长的产业,股市不了解半导体行业走向。”天数智芯首席技术官(CTO)吕坚平博士接受钛媒体App独家采访表示,经过长时间的坚持,如今半导体好不容易走向正轨,需要良性发展。

实际上,芯片是一个典型的受资本周期影响的行业,处于“需求过热—投资扩张—产能过剩—投资回落—下一轮需求过热”这样的往复循环当中。拉通来看,芯片行业在一个周期中的整体回报率是不高的。

吕坚平强调,半导体一定是一个长期技术积累,以及收割期长的产业体系,大家应该要走正确的路,不要被资本或互联网模式带偏。

吕坚平任职的天数智芯,是中国第一家通用GPU(GPGPU)云端芯片及超级算力系统提供商。公司现任董事长兼CEO刁石京,曾任工信部电子信息司司长、紫光集团联席总裁等。

2021年3月,天数智芯完成C轮12亿元融资,投资方包括大钲资本、沄柏资本、粤民投资管、联通资本等。根据长城战略咨询以及CB Insights发布的最新报告显示,天数智芯已成为全球独角兽企业。

同年的3月31日,天数智芯发布全自研的通用GPU“天垓100”芯片及天垓100加速卡,成为中国唯一量产的通用GPU产品。

吕坚平毕业于耶鲁大学并获计算机科学博士学位。去年9月加入天数智芯之前,他曾任三星全球副总裁、联发科资深总监、英伟达全球资深GPU架构师、高级架构经理等职务,拥有近30年芯片研发技术经验,是GPU技术领域的专家。

今年4月1日,天数智芯宣布,目前天垓100产品累计订单金额已经接近2亿元,覆盖新华三等多个头部企业。而且,天垓100已支撑近百个客户在人工智能(AI)领域进行超过两百个不同种类模型训练,性能接近国际市场主流产品。

本次钛媒体App独家专访中,吕坚平博士向我们详细阐述了天数智芯在技术与产品、人才、商业化方面的方案与进展,以及天数智芯这家中国GPU芯片公司,到底是如何实现2亿营收,并挤进行业头部的。

坚持自研通用GPU体系思路,下一代芯片今年量产

2021年3月31日,天数智芯正式发布7nm 通用GPU(GPGPU)“天垓100”芯片及天垓100加速卡。

通用GPU(GPGPU),也有人称之为GP2U(GP的两次方U)。两个GP代表着不同的含义:后边的GP表示图形处理(Graphics Processing ),和U组合一起是GPU(图形处理器);前一个GP则表示“通用目的”(General Purpose)。

自从英伟达推出首款GPU芯片,以及随着GPU芯片技术不断演进,逐渐进化出越来越多的通用属性,也即可编程性,实现高性能异构计算。最终,通用GPU这种解决方案成为行业新的发展方向。
通用GPU与AI、图形关系图(来源:受访者提供)

通用GPU与AI、图形关系图(来源:受访者提供)

据介绍,天垓100芯片基于7nm工艺,采用全自研的架构、计算核、指令集及基础软件栈,2.5D CoWoS晶圆封装技术,包括240亿个晶体管,据称能以同类产品1/2的芯片面积、更低的功耗,提供匹敌主流厂商产品的性能。

天数智芯坚持自研通用GPU体系思路,天垓100适配x86、ARM、MIPS等架构CPU指令集,业界标准的软件API(应用程序编程接口)支持垂直类行业应用开发,支持国内外各种深度学习开发框架,以及软硬件全栈支持等,广泛应用于互联网、运营商、生物医疗、教育科研、智算中心等不同行业众多应用场景。

如生物医疗领域,天垓100能够支持基因检测、X光图像识别、远程肠胃镜图像识别等应用场景;智能安防领域,天垓100能够支持视频图像分析、监控物体识别、跨街区事件分析、物品检测等应用场景;智慧教育领域,天垓100能够满足姿态识别及纠正、智能教学等。

不过,行业内有一种观点认为,相比于英伟达长期实践的GPU大芯片,通用GPU技术与产品表现上难度不大,更像是AI 加速器。但吕坚平指出,这种看法是错误的。

“我觉得广意的GPU有三大挑战:一是图形的硬件基础,二是(从手机,桌面到)数据中心等场景需要的可扩充性,三是通用计算性。这三个技术都很难,尤其我们团队大部分都在解决后面两个问题。”吕坚平对钛媒体App表示,不管是GPU,还是DPU、IPU芯片,都属于高精尖技术领域,很难用是否容易来简单形容。

吕坚平强调,天数智芯研发的天垓100就是GPU芯片,并非外界认知的 AI 加速器产品。
天数智芯CTO 吕坚平博士(来源:受访者提供)

天数智芯CTO 吕坚平博士(来源:受访者提供)

吕坚平表示,天数智芯坚持走自研通用GPU体系思路,不受国外IP制约,研发团队一半以上都在做算法技术调试,可以为客户提供更安全的技术保障。天眼查显示,天数智芯旗下专利信息和著作权共79件。

关于下一代芯片产品,吕坚平透露,新品会沿用天垓100 自研架构,其中AI推理芯片“智铠100”今年5月回片,预定今年量产;天垓200将在今年底流片,明年量产;今年团队将利用天垓100加速卡组成的计算集群,不断获取新客户及提高交付量。预计2024年,天数智芯将量产AI与图形融合的通用GPU芯片“天垓300”。

“我们不会跟随英伟达路线,要走出自己的一条路,后期计算、AI、图形融合发展一定是重要发展路径,也是客户未来的根本需求所在。”吕坚平说。

拥有顶尖CTO和完整的端到端研发团队

当“金三银四”来临时,互联网大厂裁员、90后不想工作而回归校园、考公务员,成为了社会的新课题,也是半导体产业的新现象。

据半导体行业协会数据显示,2020年,中国直接从事集成电路产业的人员约54.1万人,预计到2023年前后,全行业人才需求将达到76.65万人左右,但其中有经验的行业专家,和应用技术研发人才严重不足。

吕坚平对钛媒体App表示,人才不足的主要原因,在于国内没有一个良好的产学研体系,集成电路教育存在“一窝蜂”现象。尤其下游制造端需要化工人才,但现在有相关技术经验的人才越来越少。

他认为,很多年轻技术人员没有实际经验,也没有累积技术失败的过程,就难以领导芯片研发。而芯片设计不能靠几个少数的领头人就能解决问题。此外,毕业人才直接在芯片领域创业,做PPT拿到资本支持,本身就违背行业规律。

“我觉得核心还是在于人才的虚浮、不合理的估值。目前芯片行业的毕业生,能拿到最高三倍的薪水,甚至乱开价。”吕坚平表示,从技术人才搭建来说,通常具有多次在成功与挫败中不断历练成长的二、三十年的经验,才能成为芯片行业顶尖领导人才。

吕坚平告诉钛媒体App,公司各个环节上的各种岗位都非常需要大量人才,包括性能优化工程师、IC验证工程师等。

目前,天数智芯团队规模超300人,其中研发团队占比公司总人数80%以上,既有一批行业经验超过20年的世界级技术专家,也有一批拥有10年以上业界经验的核心技术骨干。

“天数智芯拥有全球顶尖的CTO和完整的端到端研发团队,提出AI与图形融合的发展新思路。”天数智芯认为,这是其最大的人才独特优势。因为芯片产品的流片到量产,需要完整团队有成熟的流片经验,而团队是具备的。

吕坚平表示,芯片产业不仅是制造业,更是脑力密集型产业。

“芯片从一个设计变成多个,是制造业。但对于芯片设计来说,我认为更是脑力密集型产业,因为它有智能软件虚拟体系,经过一些工具链,把软件转成晶体管,还需要保持温度下进行验证,这一步骤比制造部分更重要。”他对钛媒体App表示。

吕坚平强调,“芯片人才的薪资贵,不仅是行业热潮来临,更是脑力密集这个过程被产业所关注。最后制造封装中,只有大量生产才能赚回脑力的投资、成本,所以很多人都想做芯片设计。”

从底层到软件实现独立开发,确保自主知识产权

此前有国内外媒体报道,部分国内企业量产的GPU芯片,IP(知识产权)方面并非自研,而是采购了英国芯片设计商Imagination公司的授权,从而芯片研发周期从3-5年,大大缩短至18个月内。

对此,吕坚平表示,目前很多公司GPU核心之外,都是取自国外GPU IP授权,而且这种IP并非买断式,更多是花钱在固定的时限内使用授权。

“国内很多企业都在采用GPU IP 授权,但这种芯片并非产业自主,而且海外 IP也很难保障国内客户的信息安全。”吕坚平对钛媒体App表示,中国GPU赛道不能忽视“开发全自主、技术广通用”重要性。

从天数智芯自身来看,吕坚平表示,他们团队从底层硬件到上层软件独立设计开发,一行一行地写代码来实现GPU的核心功能。“不拿国外GPU IP授权的捷径,才能确保完全自主知识产权,掌握未来发展的自主性。”

而他也认为,从底层到软件实现独立开发、确保自主知识产权的整个过程需要行业一起来执行。

在吕坚平看来,中国GPU产业要实现快速发展,GPU企业之间需要自主创新、深层合作及良性竞争。

天数智芯在2021世界人工智能大会上展示首款GPGPU芯片“天垓100”(来源:由钛媒体App编辑拍摄)

天数智芯在2021世界人工智能大会上展示首款通用GPU芯片“天垓100”(来源:由钛媒体App编辑拍摄)

据悉,此前英伟达发布的最新H100 GPU,是通过DSA(领域专用架构)带来性能加倍。在制程以外,相较于A100贡献30%效能提升。

吕坚平认为,这种DSA优化趋势是GPU长久以来的一种底层基础演化方向,并非所谓人工智能DSA芯片所独有。但在GPU框架下,DSA能与GPU编程生态兼容,达到DSA通用化。国内GPU发展还需要不断探索自己DSA通用化方向。而更多GPU芯片企业应该与国内客户合作,做出适合国内市场的DSA通用化,实现国内自主发展优势。

尽管互联网厂商都在投资或自研芯片,但吕坚平指出,从全球规模来说,目前只有苹果公司做在芯片领域发展壮大。

“苹果的特色就是内需非常强,内需就足以支撑芯片开发的风险跟投资。”吕坚平表示。

对于良性竞争话题,吕坚平对钛媒体App表示,行业存在一些“劣币驱逐良币”的现象,他认为这应该避免,且需要良性看待行业长期发展。

他表示:“中国企业要想在GPU行业取得突破,需要走不一样的路,不管是自主创新,还是技术深度及广度上都有实现深度优化,并且在国内芯片生态方面实现深层合作及良性竞争,彼此互相合作,做大联盟。当前全球复杂情况下,国内芯片企业需同心一致。”

吕坚平强调,对于天数智芯来说,接下来他们将在测试、客户适配、稳定供货,成功量产并实现规模应用等方面与国际芯片巨头对标,实现产业大规模商用。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App