欲与英伟达决高下,英特尔推中国定制版AI芯片

 人参与 | 时间:2024-11-19 04:28:48

21世纪经济报道记者倪雨晴 北京报道 AI芯片的欲英战争正愈演愈烈。

7月11日,伟达英特尔面向中国市场推出了AI芯片 Habana Gaudi 2 ,决高Gaudi 2直接对于标英伟达GPU的下英芯片100系列,欲争取AI算力市场的特尔推中宝座。

家喻户晓 ,国定当初GPU资源紧缺,制版英伟达的欲英100系列在国内禁售 ,而百模大战之下算力的伟达需要还在飙升。对于中国市场而言  ,决高之后急需AI芯片“解渴”,下英芯片对于英特尔而言,特尔推中眼下正值算力紧缺的国定窗口期  ,也是制版侵略的绝佳机缘。

英特尔也夸张 ,欲英Gaudi 2芯片是专为磨炼狂语言模子而构建 ,接管7纳米制程,有24个张量处置器中间。事实上 ,去年英特尔就已经在外洋宣告了Gaudi 2 ,这次在中国推出的是“中国特供版” 。

由于列国的进口操作限度,外界主要体贴的是AI芯片在中国市场的提供可不断性 。对于此  ,英特尔公司实施副总裁  、数据中间与家养智能事业部总司理Sandra Rivera在接受21世纪经济报道记者采访时做出了确定的回覆 。

Sandra Rivera说道 :“这张卡也是中国定制版的产物,对于进口概况是反对于中国的客户是不任何下场的 。英特尔确定是正当合规地在中国不断反对于咱们的客户 ,不论是Gaudi 2概况是未来的Gaudi 3,咱们确定是在正当合规的情景下做出一些中国定制的产物 ,以知足中国的客户的需要 。”

同时 ,芯片的功能并无打折 ,她展现 :“在收集速率上 ,(中国版)以及国内版比照 ,是从24个网口酿成21个网口 ,可是部份功能仍是根基不同的。”

“中国定制版”瞄准大模子  

随着大模子的一劳永逸,英特尔在近多少个月内环抱着Gaudi2不断妨碍优化。

Sandra Rivera介绍道 ,在功能上 ,凭证机械学习与家养智能凋谢财富同盟MLCo妹妹ons在六月尾宣告的AI功能基准测试MLPerf Training 3.0服从展现  ,Gaudi 2是除了英伟达产物外,仅有能把MLPerf GPT 3.0模子跑起来的芯片。

在宣告会现场 ,英特尔也直接将Gaudi2以及英伟达的A100妨碍比力 ,其野心可见一斑 。凭证英特尔宣告的数据 ,从合计机视觉模子磨炼到1760亿参数的BLOOMZ推理,Gaudi 2每一瓦功能约A100的2倍 ,模子磨炼以及部署的功耗飞腾约一半。

同时 ,英特尔高管还介绍道,当初比照A100,Gaudi 2价钱更有相助力 ,且功能更高。接下来到9月  ,接管FP8软件的Gaudi 2估量可能提供比H100更高的性价比 。

部份而言,除了芯片,在这次宣告会上,英特尔揭示了一系列反对于大模子的算力处置系统 ,接下来详细的落地运用以及产物迭代情景也受到关注。

一方面 ,当初在中国市场上 ,英特尔已经以及浪潮信息 、新华三、超聚变等国内主要的效率器厂商相助 ,其中,浪潮信息的NF5698G7是专为面向天生式AI市场的新款AI效率器,反对于8颗OAM高速互联的Gaudi2减速器 ,

而在终端客户方面 ,Sandra Rivera展现 :“中国市场对于家养智能处置妄想的需要颇为单薄 ,咱们正在与简直所有传统客户洽谈 。咱们的云效率提供商、通讯处事提供商都是企业客户,因此对于家养智能处置妄想有着强烈的需要。”

另一方面 ,在产物道路上 ,英特尔近些年不断夸张XPU ,即多样化、多组合的异构合计 。在AI相关的产物线上 ,既有集成AI减速器的CPU处置器 、有GPU产物、以及Habana Gaudi系列代表的ASIC规范AI芯片  。

Habana Labs建树于2016年 ,主要研发倾向为家养智能、深度学习合计等 ,守业早期就患上到了英特尔的投资,而后在2019年12月以20亿美元被其正式笼络 。

对于GPU以及AI芯片的组合,Sandra Rivera泄露  :“Gaudi是一总体工智能减速的专属产物,在英特尔产物里 ,假如是针对于大模子这个使命负载,它是功能最佳、最优的一个产物。明年咱们还会有下一代产物Gaudi 3宣告 。在2025年的时候 ,咱们会把Gaudi的AI芯片跟GPU道路图合二为一 ,推出一个更整合的GPU的产物。”

算力市场争霸减轻

大模子的火热还在不断拉动AI芯片的需要。

Sandra Rivera见告21世纪经济报道记者:“在4月份回顾一季度的情景时 ,咱们看到了种种家养智能带来的芯片需要 ,搜罗Gaudi在内  ,需要至少翻了两倍以上  。”

TrendForce集邦咨询向21世纪经济报道记者提供的数据展现,目上主要由搭载NVIDIA A100 、H100 、AMD MI300 ,以及大型CSP业者如Google、AWS等自主研发ASIC的AI效率器妨碍需要较为单薄,2023年AI效率器出货量(搜罗搭载GPU 、FPGA  、ASIC等)出货量预估近120万台,年增率近38% ,AI芯片出货量同步看涨 ,可望妨碍突破五成。

芯片厂商们也在AI规模开足马力。英伟达不用多言,之后不论是100系列仍是800系列,都颇为紧缺,在AI芯片市场上占当先发优势;在6月中旬 ,AMD推出了新一代AI芯片 、数据中间CPU 、以及DPU ,其中AI芯片Instinct MI 300X,直接对于标英伟达H100;此外,google 、亚马逊 、baidu等大厂也都在自研AI芯片,在算力市场上的相助维度愈加丰硕 。

而除了硬件之外,软件也同样关键 。好比,当初大部份AI芯片都绕不开英伟达的CUDA平台,CUDA建树了一套软硬件间的开拓尺度。若何从CUDA迁移、若何建树自己的优势生态都是挑战者的紧张课题。

对于软件生态的相助 ,Sandra Rivera展现:“软件开拓概况是开拓者生态 ,着实是英特尔多年的一个刚强 ,在全部数据中间规模中的软件生态中,一个是x86的软件生态,另一个是CUDA 。而且咱们留意到,随着越来越多的公司愿望运用家养智能  ,软件生态零星也正在减速开掘更多硬件潜能 ,以大幅后退花难题  。”

她进一步谈道:“英特尔愿望能在多种语言情景中 ,可能提供更啰嗦的运用。经由软件、库以及工具提供一种模块化的措施,来优化并减速跨多种架构的异构负载 。尽管在家养智能概况是AI运算的时候,简直良多人在用CUDA,可是大部份开拓者不会做那末底层的开拓,他们是在一个比力高的框架 ,好比说在PyTorch 、TensorFlow下面去立异 。”

Habana Labs首席经营官Eitan Medina进一步向21世纪经济报道记者指出 :“在Gaudi2以前  ,咱们已经有一代产物,在软件上也做了好多少年的积攒 ,底层的软件库都已经开拓好了 ,咱们愿望闪开拓者可能在最下层的20%的比例可能做他的开拓 ,这里的开拓以及CUDA并无那末直接的分割关连。”

Gaudi系列作为英特尔AI的一支旗舰,外界也刮目相待Gaudi 2在实际运用中的功能展现、算力实力。从硬件迭代到软件生态 ,AI芯片的相助故事还将不断 。

(作者:倪雨晴 编纂 :张星)

顶: 4394踩: 2153