·从7纳米走到5纳米,或者甚至说5纳米走到3纳米,其实现在反过来在各方面的花费都是加倍,比如说光照要加倍, IP要加倍……如果说我们把摩尔定律当作一个性价比加倍的定律的话,实际上现在完全倒立过来了。
·上海城市的基因就是一个开放性,这是非常重要的,因为一定要有国际化的视野,然后大家一起来合作做这个事情,否则根据熵增定律,就变成一个封闭性的,我觉得是不行的。
【编者按】2022年9月1日至3日,上海,2022世界人工智能大会期间,澎湃科技在上海世博中心主会场首设“元宇宙聊天室”,来自企业界、学术界的众多科技领域嘉宾在大会现场共同探讨前沿话题,洞察行业趋势并展望未来图景。在第四场“元宇宙聊天室”中,天数智芯CTO吕坚平、登临科技联合创始人王震宇与澎湃新闻元宇宙观察员周玲围绕“芯片产业把脉:国产GPU如何崛起”这一主题,就国产芯片应用与发展等话题展开讨论。以下为实录,略有删节。
9月3日,天数智芯CTO吕坚平(中)、登临科技联合创始人王震宇(右)与澎湃新闻元宇宙观察员周玲(左)就国产芯片应用与发展等话题展开讨论。
元宇宙并不如梦似幻
澎湃科技:请两位嘉宾分别介绍一下自己。
吕坚平:我是天数智芯的首席技术官吕坚平。我应该算是有30年以上做GPU(图形处理器)的经验,过去也对AI理论有些研究,目前在天数智芯是负责技术的方向和战略。
王震宇:我是登临科技的王震宇,我比吕博(吕坚平)时间短一点,大概有20年的业内经验。早期在龙芯做过CPU(中央处理器),后来做过大概8年的GPU,再后来在百度的美国研究院做过两年自动驾驶,然后回国做现在这个公司,已经做了5年了。
澎湃科技:今年世界人工智能大会上元宇宙是热点,如梦似幻的元宇宙世界背后可能有很多技术去支撑,所以我们今天就聊聊它背后的芯片需要哪些技术支撑,才能达到比较好的现实世界与虚拟世界的交融?
吕坚平:其实你说到如梦似幻,可能是想到像《黑客帝国》这种,人身在其中,不知道到底哪个是虚拟哪个是现实,要吃下药丸才能够梦醒过来。元宇宙事实上不是这样子,不是如梦似幻,至少就我所知道的是,元宇宙刚开始很简单。
比如一个工厂就是一个微观的元宇宙,起码英伟达的Omniverse,就是英伟达版的元宇宙是这样。建筑师心目中这工厂该长成什么样子,他自己的设计图是可以深度空间成型的,另外机器手的设计师也有自己的想法,知道机器手是怎么样设计、怎么样动的,然后设计流程的人的想法是工厂该怎么运行。在元宇宙之前大家各自努力,各自交流,去了解这工厂该长什么样子,建筑师也是靠着机具的大小知道工厂里面要放什么东西,但是到时候搭配起来可能就会出错。曾经有发生过,比如说我记得有人要挖隧道,从两边挖,发现中间没办法接起来。
但元宇宙不一样,你可以把各自三度空间的模型在微观元宇宙里面搭建起来,也就是说当设计还没成型的时候,彼此之间就可以用沉浸的方式去互动,建筑师就更能了解机具运行的时候该是什么样,机器手设计师也知道他的机器在工厂要怎么放。
元宇宙当然有如梦似幻的部分,所谓游戏的部分,但其实元宇宙主要是希望从业人员可以沉浸甚至以游戏的方式去使用。
所以,算力很重要,其中一件事情就是可视化,一定要能够做出很正确、很逼真的渲染,同时它的物理动作也要符合物理定律,人才能沉浸其中,所以要很强的图形渲染、物理模拟,这是第一个。
第二个,大家的模型都是自己的知识产权,我为了能够制造一个微观元宇宙,把你的建筑设置或者画图拿去告诉别人怎么办,那就有隐私的问题。
另外,你的数据模型是分散在各个地方的,要有个集群的管理。
所以说,芯片起码要提供三种能力,一个是图形可视化的能力,包括图形渲染跟物理模拟;然后能够做隐私计算,能够保障所有的知识产权和在微观世界里面的数字资产;第三个是能够得到技术的管理。希望我们天数智芯的GPU可以提供以上这三种能力。
澎湃科技:所以说GPU对元宇宙很重要。
吕坚平:非常重要,几乎可以说没有GPU,就无法去谈元宇宙。
王震宇:吕博其实已经说得非常到位了,尤其在GPU这个领域,英伟达的Omniverse是一个非常典型的场景。
我稍微补充一点,元宇宙在我的理解中除了物理世界的构建,可能还会有虚拟的经济体相关的一些能力,比如说一个身份的证明,比如说现在金融体系里数字经济价值的提供,包括将来在虚拟世界中的一些价值交换。
然后在图形显示方面,刚才吕博已经说得非常多了,我就想补充一点,就是传统的显示是通过GPU本身的,我们称之为Graphics或者Render这样的渲染能力去进行的。今天AI发展非常迅速,所以在AI跟渲染的结合上,现在有非常多前沿的进展。包括谷歌,包括英伟达,还包括外面很多的创业公司都在做这样一些事情,就是结合AI提供更强的渲染能力或者更高精的图像,比如说电影业去渲染一个特别逼真的图像,可能以前花了几十个小时,现在借助AI花几十秒就可以做到了。
澎湃科技:对,我觉得这个技术距离老百姓用起来越来越近了。我也去展台看了,可能就两分钟,它可以给你一个简单的虚拟人。
通用算力的重要性
澎湃科技:我们从元宇宙走入现实世界。普通人其实原本对芯片的认知比较简单,基本上可能就买个手机、买个电脑选择芯片,但现在芯片已经越来越多地进入到我们的生活,我们现在买个电动汽车,都会选择是哪家的方案,对吧?芯片成为消费者选择产品的一个重要参考,除了品牌的力量外,可能技术被越来越多的人认可。两位怎么看待这种现象?背后的原因是什么?未来芯片对整个社会的支撑越来越重?
王震宇:其实郑纬民院士昨天做了一个报告,我还是蛮认可他的观点的。他说,上一个时代实际上是电力时代,电力时代的一个标志就是电力,作为基础设施,电力无处不在,你随时可以接触到电力。
现在从某种程度来讲逐渐进入算力时代,当然大家可能还有一定的争议,但确实是可以看到在老百姓的生活中涉及算力的越来越多了,后面可能就变成算力在很多地方都非常重要,无论是以前电脑的算力,后来手机的算力,还是现在的车载算力,车载现在大家基本上都在拼算力。所以,我觉得算力的重要性也慢慢地深入到各行各业和大家的认知当中,这是我对这个现象的一个理解。
吕坚平:我也稍微做点补充。其实目前为止,我们在看到芯片显著的地位之前,芯片已经无所不在了,甚至LED的灯泡里面都有,然后我们很早以前大家都玩过CD,CD里面也有芯片。各行各业每一个地方,甚至传统汽车的自动刹车系统里面也有芯片。其实我们老的手机里也有芯片,只是我们不会去问,比如像现在会问苹果手机是哪一代的处理器。
但是在这个时代,买PC我们会问,主频是多少?算力是多少?虽然说普通老百姓都不知道这个主频是啥,但是他会去比。
算力是很重要的,但主要是通用算力。为什么?因为PC里面的CPU做的事情不只是一件,是做很多事情,所以我们老百姓才会在乎,厂商才会宣传主频是多少。同样,自从手机走向智能之后,手机做的事情突然多了,打电话是最其次的了,几乎是最少用的一个应用。也是因为通用,有了通用之后,我们就会问你这个主频是多少,带宽是多少。
其实汽车也是,因为有电动车之后,你会发现你的娱乐更加复杂,不再是CD之类的,你可以上网,可以查资讯,这个不再叫做entertainment,而叫infotainment,也是通用,而且还可以玩游戏,所以自然你就会去问汽车芯片的功能。自动驾驶更是,因为自动驾驶非常复杂,它上面的一颗芯片要处理各式各样的物件,所以也需要某种程度的通用。
澎湃科技:对,算力真的关系到每个产品的体验,所以我们很在意。如果未来社会大量芯片被植入到产品中,给我们带来更好的生活,是不是意味着芯片产业前景非常光明,是一个蓬勃发展的大产业?
吕坚平:我相信现在是挑战也是机会。我跟震宇总(王震宇)都经历过摩尔定律的黄金时代,只要换个CPU,就会提高效能。从芯片设计来说,摩尔定律自动可以提供不少效能加持。但是摩尔定律衰落之后,对芯片设计是个很大的挑战,更加困难,但是这个时候正好大家需要提升通用算力,所以我相信这是个挑战也是个机遇,因为有挑战,努力工作的人、有创意的人才能够胜出。
澎湃科技:震宇总之前也是从海外回来创业,也是觉得这个市场很有前景?
王震宇:对,我觉得从国际上的大形势而言,长期一定是一个大增长,因为芯片现在已经深入到千家万户,各行各业,非常多的地方。中期的话,Gartner(信息技术分析机构)对于明年的预期实际上是会有一定的放缓。
如果看国内市场的话,我认为这个增长还是会非常迅猛,因为国家有一个70%自主率的目标,今天可能还有一定距离。在这个情况下,整个产业的发展,包括各行各业的进一步深入,其实机会还是非常多的。
澎湃科技:在两位所在的通用GPU这个行业,我们本土可能也是有大量市场空间的,也是两位在这个行业创业的一个重要原因。你们怎么看GPU市场在中国的市场前景?
王震宇:一般GPU市场我们分为,比如说图形、AI,然后可能还有一些其他的细分,比如车载之类,我们其实相对来说比较偏向于数据中心尤其AI相关的产业。
我举一个例子,英伟达现在是AI市场第一,它的市场从2015年到去年经历了几十倍增长。如果看AI芯片增长的话,过去几年对未来的预期大概是50%的复合增长率,非常快速的增长。
中国市场,举个例子,去年的云端推理市场,我印象中是189亿元人民币,今年的话是320亿元人民币,明年是400多亿元人民币,再加上训练市场有700多亿元人民币,所以数据中心的增长曲线是非常快速的。因为很多因素,包括5G的因素、云计算的因素、元宇宙的因素,我觉得这其实给GPU行业带来很多机会,当然也带来很多挑战。
吕坚平:的确,就过去这几年来看,我们的认知都相同,GPU在数据中心的成长相当快,特别是在国内。
之所以会往数据中心走,也跟摩尔定律有关系。因为一直说,在同样价钱同样功耗之下,性能会不断提升,但现在看来性能功耗比提升的速度会稍微慢一点。所以难点是,比如说,我现在的显卡是300瓦,有可能会继续往上走。在元宇宙的世界里,图形渲染会让你感受更逼真,更深入其中。这种东西需要非常高端的渲染,不太可能说一个人带着500瓦的卡到处走,这是不可能的事情。
未来往数据中心走,除了现在的AI训练推理——当然这是数据中心的老本行,将来图形渲染也不得不面临网络数据问题。所以说,对于GPU的挑战会非常多,是个很好的机会。虽然我们是由通用GPU出发做AI的训练跟推理,但是将来还是会走到图形,毕竟这些事情都会发生在云端。
澎湃科技:元宇宙是芯片市场一个重要的推动器,但我们现在也看到汽车的电气化风潮,包括新能源光伏类的,也是驱动我们芯片的两个重要方面。所以请两位谈一下,你们觉得这两块对芯片市场的推动力如何?
吕坚平:关于自动驾驶很有趣的一件事情是,它推动的不只是汽车芯片的发展。
其实自动驾驶就是一个元宇宙,因为你一定是把你能去的地方都已经事先规划好,事先训练好了。算法都是由AI推理做出来的。
我之前提到,传统汽车也用到芯片,最老的CD里面也有芯片,但是自动驾驶对芯片带来的最大改变是,需要更大更通用的算力,所以才会造成对芯片完全不一样的期待,以前对PC的那种期待,现在完全移植到自动驾驶。
澎湃科技:市场有可能会像PC市场那样?
吕坚平:会像PC那种方式成长,因为以前在其他领域是没有的。我记得在上家公司,我们是DVD播放器的世界第一。销售说我们今年又是世界第一,但我没有什么很兴奋的感觉,因为没有成长,但是当计算领域走向通用,走向像PC这种领域的时候,就完全不一样了,你每年会看到它的成长率。以前做芯片有点有气无力,因为芯片价值不会增加。营业额越来越大,但是营收甚至有可能还有下降。当你走向通用算力的时候,算力需求是永无止境的,比如说图形的特殊效果是永无止境的,同样对自动驾驶的要求比如安全度也是永无止境的,这是自动驾驶跟新能源对芯片带来的一个很大转变。
王震宇:我之前做过自动驾驶,所以稍微补充一下。首先新能源车包括自动驾驶是一个非常明确的趋势,现在新能源车在中国非常火爆,新势力包括整个的国际布局都在非常快速地增长。自动驾驶全方位的落地可能会比大家预想的稍微晚一些,但我觉得这个趋势是非常明显的,因为技术进步一定是往这个方向走的,带来了整个汽车产业相关的芯片的发展。
其实车载现在说白了就是一个算力的军备竞赛,大家都在拼高算力,同时也带来了一些比如传感器的芯片、激光雷达的芯片等,整个行业的发展非常迅猛,但是我觉得也带来一些挑战,因为这个行业太新,发展太快了,很多人都准备得不够充分,但是以特斯拉为代表走得又非常快。大家一起往前走,这个过程就带来非常多的挑战。
从我的角度去看,一方面算法在高速迭代,是不是要保持车载上的硬件具备一定的通用性,这是一个非常重要的点,因为现在大家有一个非常重要的词叫做“算力预埋”,就是我提前在车上要多录一些算力,因为我这个车将来可能还要再跑5年甚至10年,所有现在这种高端的车载芯片都是OTA的,都是可以实时升级的,你要为未来的算力留一定的预埋,同时未来的算法要具备一定的通用性,这些考虑非常重要。
另外一个是能耗比。大家现在对双碳和能源的效率很关心,包括车载和续航里程都有点相关性,这方面也是我们公司聚焦的两个点。我想,这可能是在车载大行业里大家需要关注的一些因素。
Chiplet的技术挑战
澎湃科技:一方面市场新的需求不断涌现,但是我们看到芯片工艺的叠加、演进也非常快,也非常耗钱,现在都是3纳米量产,2纳米已经在路上。刚才吕博也说摩尔定律走得相对比较慢了,整个芯片的工艺推进有所挑战,另一方面今年市场上流行这种堆叠的封装测试来跨越摩尔定律的挑战。两位对芯片工艺这块的机遇和挑战有什么看法吗?
王震宇:摩尔定律现在在我看来是失效了,因为单芯片靠工艺提高频率,这些路径已经不成立了,老的这种靠一个核堆成多个核的,也走到一定的瓶颈了,现在产生出很多新的手段,包括Chiplet(芯粒),也包括存算一体这种新的技术。其实从我的角度来讲,这些技术有一定的挑战性,这些新的架构在演变时,会有一定的通用性问题。
今天GPU产业的生态还是一家独大,英伟达占据了至少95%以上的市场,所以生态力量非常强大,如何在生态上进一步演进,尤其让中国企业可以比较快速地落地,我觉得这是一个非常重要的点。
另外工艺上的发展,包括Chiplet这样的技术,像我们做大芯片,其实带来一个非常大的挑战,就是热密度太高了。因为工艺并没有下降,比如说没有下降到2纳米、1纳米这种,功耗还是很高的,那这么多高功耗的芯片封在一起,对热的挑战非常严峻,所以可以看到很多大芯片,甚至现在有上到700瓦的,都是水冷了,就非常有挑战。
另外一个就是成本。因为这方面的新技术演进要一定时间,前期的成本投入要求非常高。
吕坚平:我非常赞同这种说法,摩尔定律基本上是失效了。从经济角度来说,其实摩尔定律是经济领域的,用比较通俗的说法,是说我可以用相同的成本买到两倍以上的性价比,现在反过来了,从7纳米走到5纳米,或者甚至说5纳米走到3纳米,其实现在反过来在各方面的花费都是加倍,比如说光照要加倍, IP要加倍……如果说我们把摩尔定律当作一个性价比加倍的定律的话,实际上现在完全倒立过来了。
澎湃科技:目前为止性价比已经没有了。
吕坚平:已经完全没有了,事实上是已经没有摩尔定律当初的精神了,因为摩尔定律这个性价比加成很重要,20年前占据整个仓库的超算现在可以在你的手机上实现,因为性价比不断地指数性成长,才有办法做得到。
未来这样的魔术就不会再发生了,这对整个经济是很大的伤害,因为经济都是讲增长率,所以大家都遇到类似的挑战,虽然说至少会持续往前走,但是老实说这个制程会不会像以前一样,比如说从28纳米走到14纳米,这种戏剧化的增长就没有了。
所以刚才提到芯粒,就是Chiplet,除了解决功耗密度问题之外,很重要的是不用再拘泥于一定要转到下一个新制程,因为在芯片上面模块对新制程的要求是不一样的,就比如说芯片的某些部分走到新制程,性能会很明显地提升,某些部分可能就没用,比如说逻辑部分可能会很快提升,但是记忆体就还好,甚至于有点停滞不前,或者接口的IP,接口的部分何必要走3纳米?你留在7纳米不是很好吗?而且又便宜;从7纳米走到5纳米,接口的IP可能7纳米的价钱只有5纳米的一半,所以芯粒就是让你可以把不一样制程的IP组起来,就不是非要走下个制程,因为走下个制程成本太高了。我可以只有一部分去提升性能,但有些部分可以有比较好的性价比,用原有的制程。我想这是芯粒技术一个很重要的关键之处,我相信它会解决一些摩尔定律衰退或者失效的问题。
“上海芯片产业的机会非常好”
澎湃科技:最后一个问题。我们谈谈上海芯片产业群的布局。有一个数据说去年开始17块AI的芯片被点亮,其中推理芯片7块、训练芯片4块,车载智能芯片3块,你们对上海整个集成电路产业的政策有什么想说的?
王震宇:首先我觉得上海是一个国际化的城市,上海的产业氛围也是个国际化的氛围,也是跟国际的各方面接轨的。与国际上的一些芯片技术合作还是非常紧密的。我觉得上海城市的基因就是一个开放性,这是非常重要的,因为一定要有国际化的视野,然后大家一起来合作做这个事情,否则根据熵增定律,就变成一个封闭性的,我觉得是不行的。但现在确实有很多挑战,包括国际性的一些挑战。
我觉得上海市有一个非常高效的产业环境,有这么多的外企、海外归国的人才,所以整个上海尤其是高端的大芯片的人才非常多。很多公司的总部在上海,包括我们的总部也在上海,这是一个非常重要的原因。当然我们也希望上海市政府将来对我们这样的中小企业多一些扶持。
吕坚平:我来上海的时间比较短,但是我对上海是蛮惊讶的,因为上海的确是非常的国际化,另外人才非常充足、非常优秀。
我在公司发现人才济济。我一开始以为会没有人才,但是都非常充足,甚至在理论、数学各方面也都有,因为芯片是个很特别的产业,它需要很多软件的人才,还有一些算法理论的,各个环节的人才都非常需要。上海毕竟是一个人才聚集地,大家也愿意来。
另外,我印象深刻的是它的产业链也非常完整,从最前端到中间和后面有很长的供应链,下游又有封装各方面,然后还有基层,所以上海这方面还是让我蛮意外的,整个产业链非常的完整。
刚才提到点亮,但是其实最重要的事情是我们有量产,有量产的训练GPU。
澎湃科技:登临科技的产品都是量产的吧?
王震宇:对,我们其实是第一家规模化、商业化量产的公司。
吕坚平:其实老实说流片点亮在芯片都不是重点,量产才是。
上海也是率先量产AI芯片,我相信,因为上海在芯片业已经是全国龙头,再加上有AI的制高点,又加上GPU是AI的制高点,所以我相信上海的机会非常好。
王震宇:对,我稍微补充一下说,其实长三角这边已经形成了非常好的产业链,包括苏州、无锡、南京,整体形成一个非常好的互动,所以从这个角度来讲,整个长三角是非常有活力的一个大的区域。
澎湃科技:所以对创业公司来说,还是有很不错的环境。
王震宇:非常好的环境。像刚才吕博提到量产,其实很多量产就在长三角发生,有事情大家在这个区域内就解决了。
(本文由方晓根据直播实录整理。)