10月17日,流传了半个多月的一则传言终于落地,美国宣布新一轮禁令,进一步收紧了对中国的芯片出口,并将壁仞、摩尔线程等13家公司列入实体清单。
新禁令几乎将所有英伟达、AMD、英特尔等厂商的高性能算力芯片一网打尽,即便英伟达在去年10月第一轮禁令后推出的阉割版A800和H800以及高端游戏芯片4090,也被列入限售名单。
不可理喻是几位受访者对此禁令的第一反应,但相较去年,大家对国产算力替代的信心足了许多。
01 短期的平静
信心来自华为。今年8月举行的2023亚布力中国企业家论坛第十九届夏季高峰会上,科大讯飞创始人刘庆峰一言激起千层浪:华为的GPU能力已经可以对标英伟达A100。彼时有媒体透露,用于讯飞星火大模型训练的是华为最新昇腾芯片910B。
时隔两月,《IT时报》记者从多个信源获悉,基于华为昇腾910B芯片的全套国产智算集群,正在国内多个智算中心、大模型厂商、电信运营商处进行测试,尽管在通用性上与A100仍有差距,但调优之后,在某些模型上的确与A100几可比肩。
之前产业链普遍担忧,基于NPU的昇腾910B因为需要个性化调优,很难像英伟达一样提供普遍性服务,但此次新禁令却恰似一剂强心针,如果大家都没得选,反而会刺激生态,基于昇腾芯片的生态玩法会变得很多,参与者也会增多。最终足够普遍的个性化,也就有了通用性。一位深度参与昇腾生态的专业人士告诉《IT时报》记者。
没有另一个中国,只有一个中国,今年上半年,英伟达(NVIDIA)公司首席执行官黄仁勋在接受媒体采访时发出的中国市场不可替代的呼吁,显然并没有得到期待的回应。
尽管英伟达在谈及新禁令时表示,鉴于全球对我们产品的需求,我们预计(新规)短期内不会对我们的财务业绩产生实质性的影响。但谁都知道,表面的平静只可能是短期。
02 国内云商静观其变
这是一次被称为有着精准刀法的切割。
美国商务部重新修改了去年对高性能芯片的定义,新增性能密度阈值条款,将原本不受限制的芯片都纳入了管制。以目前中国厂商购买最多的A800为例,按照美国2022年禁令,NVLink互联带宽不得超过600GB/s,因此英伟达将原本支持600GB/s的A100带宽降至400GB/s,并以A800的型号对中国销售。但更新后的禁令规定,只要芯片总算力大于或等于4800TOPS,不论互联带宽多少都受管制。
目前,英伟达已确认,此次出口管制涉及的产品包括但不限于:A100、A800、H100、H800、L40、L40S以及RTX 4090。也就是说,目前人工智能所需要的高性能算力芯片,基本都在被限范围。
美国政府的临时最终规则将在发布后的一个月后正式生效(11月17日)。一则坊间流传的消息称,英伟达建议客户在10月17日晚12点前增补订单,这似乎意味着,在此时间节点后,新增订单将很难获得供货保证。
《IT时报》记者咨询国内几大云商新禁令的影响,均未获得有效回应。
一位云商内部人士透露,公司有过几轮小范围讨论,但还在静观其变,受影响的应该不止我们一家,大家等着互相看看各有什么对策。另一位人士则表示,按照常规,之前签了合同的订单应该还会正常履行,但以后应该没办法再买了,而且有些合同是云商和服务器厂家签的,对芯片厂商没有约束权,最后能否拿到货,只能取决于服务器厂商和英伟达的合同是怎么签的。
不过国内的英伟达服务器市场还是应声而涨。10月19日晚,一位经销商在某个资源群发布消息,H800,年底交货,226万/台。此前,八卡的H800服务器售价曾相对稳定在200万元左右。短短两天,上涨10%。
03 被奉送的市场
消息公布后,美东时间10月17日和18日,英伟达连跌两天,跌幅达8.64%。
此前,根据英国《金融时报》报道,中国互联网巨头正争相采购对构建生成式人工智能系统至关重要的英伟达高性能AI芯片,今明两年的订单价值达50亿美元。其中,2023年10亿美元,2024年40亿美元。
今年的应该没问题,明年能否正常履约现在还不确定。对于英伟达能否能将这40亿美元入袋,业内各种猜测声都有,但不可否认,此次一刀切的限制,绝不是英伟达想听到的消息。
英伟达首席财务官科莱特·柯蕾丝(Colette Kress)在7月30日的2024财年第二财季业绩会上表示,大部分人工智能芯片需求仍来自中国,中国买家投资占据了数据中心产品总收入的20%至25%。数据显示,英伟达第二财季中,数据中心业务营收为103.2亿美元。
根据新禁令,或许,这部分营收占比的大部分会消失,甚至连表现平平的游戏业务也可能受影响,因为高端游戏芯片4090,这次也被禁了。
英伟达会再出二次阉割版的A100吗?或许会有,但由于此次禁令过于精准,不仅限制了总算力,对性能密度也做了精确说明,就算再有低于新标准的A700、A600(假设名),对中国的人工智能和大模型训练厂商有多大吸引力,确实很难说。
如果没有可接受的替代方案,预计明年下半年,英伟达将为中国国产算力芯片厂商空出一片巨大的市场。
04 期待国产算力的春天
10月15日,中国电信AI算力服务器(2023-2024年)集中采购项目公布候选人,总集采金额超84亿元。
仔细分析这份中标候选表单会发现,国产算力的商业化已经有相当规模。比如在两个标包中排在第一中标候选人位置的四川华鲲振宇智能科技有限公司,此次投标报价为27.82亿元。
华鲲振宇是华为生态伙伴。据华鲲振宇官网,公司全面负责基于华为鲲鹏+昇腾处理器的天宫自主品牌服务器、存储、PC、机器视觉等系列产品的设计、生产、销售及服务,目前已获得华为生态伙伴中唯一鲲鹏+昇腾双领先级认证。
国际数据公司(IDC)发布的《中国半年度加速计算市场(2023上半年)跟踪》报告显示,2023年上半年,中国加速芯片的市场规模超过50万张,本土AI芯片品牌出货超过5万张,比整个市场10%左右的份额。
一位华为昇腾工程师告诉《IT时报》记者,基于昇腾910B的大规模智算集群基础设施,已经在全国一些智算中心和电信运营商内部开始测试,华为工程师都是每天驻场,解决包括服务器、路由器等软硬件在内的各种问题,首批商业伙伴也都在测试中。
除了华为,我们认为中科曙光也具备成为国产算力主流提供商的能力,毕竟这是一个高投入、强生态的产业。中科曙光旗下的海光 DCU,也是国内目前公认的可用于科学计算、人工智能模型训练和推理的国产芯片,一位人工智能专家期待,国产算力厂商能抓住时机,百花齐放。
目前,国产AI相关芯片企业有寒武纪、景嘉微、海光信息、百度昆仑、阿里含光、燧原、沐曦、壁仞、摩尔线程、天数智芯等,不过,能够进行大模型预训练的芯片,仍只有华为、海光等寥寥数家。