国产AI芯片发展如何?华为代表最高水平,创业公司称快被“卷死了”

人类历史上,领土、黄金和能源这些具有稀缺性的资源往往会引发战争。而现在,伴随着大模型的极速狂飙,人类对机器智能的极度推崇下,AI芯片成了世界上最关键的资源和技术之一。

就像火箭升空需要燃料燃烧推动,大模型训练、推理则需要算力作为支撑, 比如ChatGPT的训练门槛是1万张英伟达V100芯片,于是乎“大力出奇迹”成为人们的信仰。

企业是如此渴望算力,以至于一张和扑克牌大小差不多的英伟达H100显卡,一度被炒到4万美元以上。英伟达现在的市值超2万亿、目前位居全球第四,相当于11个阿里巴巴。

谁有足够强大的AI芯片,谁便掌握了AI时代的大动脉。如今,英伟达以超过80%的全球市占率占据了绝对的垄断地位,而这在美国限制芯片出口的背景下并不是件好事情。

不过,国产AI芯片的发展似乎曙光已现。就在最新的财报会上,百度创始人李彦宏透露,虽然百度无法获得最先进的AI芯片,但国产芯片也能确保用户体验不受影响。

国产AI芯片发展得怎么样了?谁能代表最高水平吗?算力是导致中美大模型差距的核心因素吗?带着这些疑问,旺旺屋和多位行业人士进行了交流。

华为最新AI芯片已商用落地,

或代表国产最高水平

在这场AI芯片战争中,华为依旧冲在最前锋。

Mate60系列手机的面世,吹响了华为回归的号角。时隔美国管制4年,华为在解决芯片关键制程工艺的制造难题,用麒麟9000 5G芯片证明了自己绝地重生的勇气和实力。

手机只是起点,海思作为国内顶级芯片设计巨头,触角还布及服务器、基站、路由器等领域。麒麟之后,华为自研昇腾AI芯片也迎来秘密更新。

目前,华为昇腾最新AI芯片在国内已经实现商用落地,这也让英伟达产生了不小的“危机感”,英伟达CEO黄仁勋直言——华为是重要的竞争对手。

旺旺屋了解到,华为昇腾最新AI芯片的价格大概在“十几万”,作为对比,英伟达对华专供的阉割版AI芯片H20大概是在“十万以内”,性能上华为昇腾最新AI芯片略逊色于H20。当然,芯片价格也随客户需求规模变动,所以准确价格还要视具体交易情况。

有相关人士告诉旺旺屋,由于产能有限,华为内部的策略是优先保证大客户的供应。百度、OPPO等公司均有采购华为AI芯片,量级在数千颗。

AI芯片创业公司千芯科技董事长陈巍判断,目前华为海思AI芯片在国内的出货量应该能排到前三,大部分不是以单独的芯片或加速卡出货,而是以整机的方式去交付。

大部分业内人士认为,海思昇腾代表了国产AI芯片的最高水平。

一般来说,性能、灵活性、同构性、成本、功耗均是评价芯片水平的重要维度,其中以算力为代表的性能尤其被外界关注。

一位对国内AI芯片颇有了解的清华教授告诉旺旺屋,从已经量产落地的产品中来看,华为做的相对是最好的,比大部分创业公司都靠谱。“比如和寒武纪相比,华为的峰值性能高了超1倍,灵活性也有优势,900多个Pytorch的算子,寒武纪只支持500多个,华为基本都支持。”

某摩尔线程员工向旺旺屋表示,除了海思有能和英伟达PK的设计水平,其他公司人员规模、设计水平、产品经验等方面都不行。

他表示,其实昇腾芯片的量产也是一直没有停过,这波禁售可能受益最高的就是华为,因为手机芯片都能做出来,其实也意味着计算芯片的工艺条件是满足的。

芯片创业公司:

被华为“卷死了”

华为最早在1991年成立了集成电路设计中心,在2004年成立海思半导体。2018年10月,华为才正式发布首款AI训练芯片昇腾910与AI推理芯片昇腾310,并于2019年正式投入商用。

在华为、中兴事件的影响下,AI芯片行业前几年也掀起过一股创业热潮,大批人才立志向英伟达看齐,于是壁仞科技、摩尔线程、燧原科技、沐曦等等明星公司不断涌现,希望补上国内市场的空白。

拿到巨额融资后,部分创业公司也交出了不错的成绩单,比如壁仞首款通用GPU芯片BR100峰值算力超越英伟达A100。不过就在去年10月17日,美国宣布对中国的GPU/AI芯片企业实施全面的出口管制和制裁,摩尔线程、壁仞科技及其子公司被列入实体清单。

“1017事件”一度被视为中国AI芯片的至暗时刻,行业也进入了低迷期,收缩和裁员难以避免。孙杰(化名)最近刚被裁员,他此前一直在壁仞、燧原等公司负责产品的市场化工作。

“制裁之后,投资人和公司的信心发生了巨大的变化,生产几乎都要到美国的BIS进行申请,国内高端工艺又没有很好量产,所以公司也是在慢慢裁员,每批大概5%的人。”

在孙杰看来,几乎所有AI芯片创业公司面临的挑战在于——客户会考虑你究竟有没有持续供应能力?因为GPU是基础设施,项目也不小,一旦面临管制,芯片量产落地是大问题。

并且,国内厂商做同样性能的芯片,成本要比英伟达更高,而近两年国内融资环境正逐渐恶化,投资人也没那么多钱了。

更为重要的是,随着华为的回归,壁仞、燧原、摩尔们,需要直面与华为的竞争。

“这一波制裁,华为快把全国厂家全部卷死了。”孙杰向旺旺屋表示,因为在制裁下,华为有生存能力,其他业务有现金流,有钱、人才、政策去突破制造难题,现在大的国家算力集群、运营商都只会用华为的产品,“创业公司几乎是没办法生存了”。

当然,并不是所有从业者都像孙杰一样悲观,来自摩尔线程的飞飞(化名)认为其实被制裁是一个积极的信号,因为这意味着国家一定会大力扶持这个行业,资金、人才都会进来。“以前清北的学生不太会主动来关注我们公司,现在肯定都会主动来问。”

在他看来,这两年行业处于泡沫之后的整合阶段,现在不是给个PPT就有人投钱,所以越来越多公司慢慢就消失了,后续会稳定到良性竞争的状态。

PK英伟达?

硬件上有3-5年差距

软件上有5-10年差距

即使国内AI芯片正奋力追赶,英伟达的垄断地位目前仍是牢不可破。

Gartner最新数据显示,英伟达在全球AI芯片市场的市占率预计达到90%,创下新高。此外,英伟达计划在2024年销售约150万-200万张GPU,这可能将是去年销量的三倍。

聚焦国内市场,去年上半年中国本土AI芯片品牌出货超5万张,市占率为10%。市占率鸿沟的背后,是英伟达深耕GPU市场三十余年建立起的强大壁垒。

从最新芯片的性能来看,国内企业产品与英伟达四年前发布的A100尚有PK的底气,可面对最新推出的H200就毫无招架之力。

以华为昇腾910B芯片为例,其算力和英伟达A100差不多,但是和英伟达H100还有大概3.5倍的差距,何况英伟达已发布、暂未上市的H200又比H100快了90%。

在业内人士看来,华为和英伟达在硬件上有3-5年的差距,在软件上可能有5-10年的差距。

一边是芯片先进制程工艺上存在差距,华为解决了7nm芯片的生产制造问题,但英伟达已经更新到4nm。上述清华教授告诉旺旺屋,“国内用7纳米就已经到头了,更先进的短时间内很难搞定。”

要知道,半导体工业的技术壁垒是台湾用几十年积累起来的。芯片制造有几十道、上百道工艺流程,每一道流程上用到的精密仪器设备,国内几乎都是需要去补齐短板的。

另一边,甚至“软件比硬件的垄断还要厉害”。据了解,在类似于GPU这种复杂芯片产品当中,软件工作量可能占70%,大部分是指令驱动相关的东西。一个芯片公司里面一百个做芯片研发的,软件可能会到三四百人。“中国这几年发展互联网有很多开发APP的人才,但是贴近硬件的软件、比如芯片驱动的人非常少,甚至比研发芯片的人还要少。”

和操作系统同样类似,一旦用户习惯iOS/安卓,再想替换的代价就非常高,这便是英伟达CUDA生态的强势之处。

一名大模型行业创业者吕亚(化名)告诉旺旺屋,大公司采购华为的芯片很正常,因为华为可以给他们做针对性的适配,但小公司就没办法了。“英伟达用的人多,遇到什么问题都可以在相关论坛找到解决方法。”

另外,有厂商也是在兼容英伟达CUDA生态,虽然可以用,但是效率、成本会有差距。“比如说在原生的软件平台跑一个模型推理只用一小时,但在兼容平台上可能要跑三个小时。”

算力限制下,

中美大模型差距或不断拉大

一般来说,算法、算力和数据被认为是人工智能三大核心要素。

有中科院教授向旺旺屋感叹到,中美大模型大概有相当于一年半到两年的差距,但实际上这个差距正不断拉大,因为高端芯片的获取受到限制。“算力是核心的竞争力,如果没有足够的GPU,不可能训练出特别领先的东西。”

上述大模型视频行业相关创业者吕亚(化名)认为,即使是算法,也是和算力息息相关的,因为如果没有足够的算力,很难支撑算法的实验。

“举个例子,跑一次实验,只能验证一组参数,参数组合有成千上万种,所以我们需要通过多轮的实验去证明算法的有效性。”

所以,算力对于大模型从业者来说是异常珍贵的资源。算力成本高企,让大部分小型创业公司主要关注大模型的应用,而非基础大模型。

千芯科技董事长陈巍告诉旺旺屋,国内多数大模型厂家,是基于国外LLaMA开源大模型训练的,所以主要是百度、腾讯、字节等头部厂商有自己从零进行模型训练的需求,在算力上的压力比较大。

以吕亚所在的AI视频行业来说,基本上没有公司有千卡以上规模的技术,因为大部分资源都集中在语言大模型,普通公司不会买GPU,大部分是选择租用的方式。“一般一台机器8张卡,市面上的价格一个月4~6万不等,按照6万来算的话,千卡需要128台机器,也就是1000万左右的成本。”

从本质上来说,基础大模型是巨头才能玩的游戏,这是一场关于算力的军备竞赛。有相关从业者指出,OpenAI有30万块GPU,而国内有1万块GPU的厂商可能找不出一两个。

国内还存在算力资源分散的问题,就连李彦宏也抱怨过,“好几百个基础模型,是对社会资源巨大的浪费,尤其在我们算力还受限制的情况下”。

目前AI对算力的需求还没有达到顶峰,陈巍认为等到大模型(包括多模态和视频大模型)后面真正铺开落地,算力需求估计是现在的100倍以上。

马斯克最近也提到,AI的发展速度前所未见,几乎每过6个月的时间算力就会增加10倍,远远超出摩尔定律每18个月翻番的速度。

在如此强劲的需求下,多位业内人士认为布局国产AI算力是非常紧迫的。“国产AI芯片发展还是要聚焦硬件开发和软件生态的构建,这些都是不能一蹴而就、半途而废的。”

© 版权声明
THE END
点赞5赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容