必一运动随着AI大模型成为新型智算基础设施,行业巨头在AI芯片赛道上打得愈发火热。近日,除了微软首次推出两款自研芯片,英伟达也发布了堪称“地表最强”AI芯片H200B-Sports,性能相较前代H100提升60%到90%。时间往前推移,英特尔在其On技术创新大会上首次公开了三代AI芯片路线图,计划明年将推出算力提升达两倍的Gaudi 3。而AMD此前则重磅发布了其最新AI芯片GPU MI300X,更大的HBM内存和带宽直接叫板英伟达的H100。
一定程度上,英伟达对H200的升级幅度可谓“挤牙膏”,即不卷频率卷内存和带宽。尽管其日前声称将从每两年发布一次新架构转向每一年发布一次,但H200依旧采用了Hopper架构,因此浮点运算速率基本与H100相同。但在内存容量和带宽方面,H200以每秒4.8 TB的速度提供141GB的HBM3e内存,与H100相比容量提升76%、带宽提升了43%。基于此,H200在Llama 2(700亿参数的LLM)上的推理速度比H100快了一倍。
不过,英伟达H200的更新迭代也称得上“刀法精准”,因为AMD此前发布对标H100的AI芯片MI300X最大亮点就是内存和内存带宽,即拥有192GB的HBM3内存,是H100的2.4倍;内存带宽为5.2TB/s,是H100的1.6倍,理论上可以运行更大的AI模型,以及实现更快的数据传输。虽然MI300X在内存和带宽参数上仍高于H200、H100,但也遭遇生产成本和销售等质疑,尚不足以挑战H100当前在大模型训练芯片领域的霸主地位。然而,在H100产能紧张以及业界寻求“二供”背景下,MI300X仍有一定的抗衡战力。
在AI芯片上逐渐被英伟达、AMD甩开差距后,英特尔近年来在相关战略布局愈发“激进”,颇显示出“三分天下必有其一”之志。9月,英特尔在其On技术创新大会上首次亮出三代AI芯片路线nm制程的AI芯片Gaudi 3将于明年推出,算力将会是前一代Gaudi 2的两倍,网络带宽、HBM容量则会是Gaudi 2的1.5倍。而其下一代Max系列GPU芯片Falcon Shores,HBM3规格将达到288GB,支持8bit浮点运算。
毫无疑问,在巨头争抢AI芯片形势下B-Sports,中国将成为最关键的市场之一。数据显示,2022年我国AI芯片市场规模达到850.2亿元,同比增长99.2%,预计2025年市场规模将翻倍增长至1780亿元。单从体量上看,任何芯片企业都不想错过如此庞大的增量市场,但这却遭遇了国际地缘的强制“割裂”。根据美国最新的芯片出口管制条款,只要芯片总算力大于或等于4800TOPS,或芯片总算力低于4800 TOPS但性能密度达到一定阈值都将受到管制。
对此,英伟达曾称,新一轮出口管制涉及的产品包括但不限于:A100、A800、H100、H800、L40、L40S以及RTX 4090,而最新发布的H200如果没有获得出口许可证同样将无法在中国市场销售。但英伟达并没有打算放弃中国AI芯片市场,计划再推出三款针对中国市场的“”AI芯片,即HGX H20、L20 PCle、L2 PCle,其中HGX H20就是“缩水版”的H100。据悉,H20计算密度被大幅削弱以符合出口新规,比H100芯片下降80%左右,但内存带宽等方面保持较高水准,因而在业内仍然是一个具备竞争力的选项。
显而易见,针对中国市场推出版产品,已然成为芯片巨头在地缘政治和商业利益之间取得平衡的重要举措。除了英伟达,英特尔也曾于7月推出针对中国市场的定制版AI处理器Gaudi2,具备96GB HBM2E内存容量和2.1TB/秒的总内存带宽等,可用于加速AI训练及推理。而在美国更新芯片出口管制条款后,据称英特尔也在计划推出Gaudi 2改良版。此外,AMD也曾表示将调整其相关AI芯片的参数规格,以在合规情况下向中国市场出货。
从多重角度来看,英伟达、AMD和英特尔都绝不甘心缺席中国AI芯片市场。首先,数据显示,这三家芯片企业在中国市场的营收占比落在达20%-30%的区间,而迅速发展的中国AI芯片市场将成为其未来增长的关键动能之一。其次,地缘政治催生的相关割裂反而为中国AI芯片企业带来前所未有的机遇,将倒逼国产替代加速落地。另外,更深层的原因在于“政产学研”各界的重视和大力推动下,中国势必将成为举足轻重的AI技术产业革新阵地,依托国内市场完全有信心、有能力、有条件对国际AI芯片现有格局发起有力冲击。
可见对于英伟达、AMD和英特尔等美国芯片企业长远发展而言,在中国市场的经营正愈发显得至关重要B-Sports,否则将在历史潮流中逐渐江河日下。一定程度上,其针对中国市场推出的“版”、“定制版”已成为特殊的时代符号,显示出国际科技创新合作正被压制在极为逼仄的空间。正所谓“宽广的地球完全容得下中美各自发展、共同繁荣”,中美两国作为全球人工智能发展引领者,完全有责任、有义务打破相关壁垒,携手推动全球AI技术进步和产业发展繁荣。
【禁售】德法院裁定英特尔侵犯R2半导体专利,部分CPU禁售;美国组建人工智能安全研究所联盟,200多家实体加入;劲量新款手机公布
机构:2023年印度智能手机出货量表现平稳,三星、vivo和小米位列前三
美国组建人工智能安全研究所联盟,微软、OpenAI和谷歌等200多家实体加入
【禁售】德法院裁定英特尔侵犯R2半导体专利,部分CPU禁售;美国组建人工智能安全研究所联盟,200多家实体加入;劲量新款手机公布
【扩大】Synaptics将扩大印度业务,打造第二大设计中心;传苹果正制造两款折叠屏iPhone;中国折叠手机市场份额 华为领先
【放缓】机构预测特斯拉2024年电动汽车销量疲软;2023年印度智能手机,三星、vivo和小米位列前三;三星工会要求涨薪5.4%
【裁员】阿里巴巴2023年裁员近20000人;华为辟谣网传任正非最新讲线亿元增资获批;全球动力电池排行公布
【跟进】台积电加码日本投资,带动芯片检测分析厂商跟进;2023年Q4全球智能手机增长8% 华为中国第四;谷歌AI助手更名