欢迎访问黑料吃瓜网

10年专注吃瓜

吃瓜质量有保 售后7×24小时服务

24小时咨询热线:4006666666
联系我们
tel24小时咨询热线: 4006666666

手机:13999999999

电话:010-8888999

邮箱:[email protected]

地址:经济开发区高新产业园

您的位置:首页>>网友吃瓜>>正文

网友吃瓜

AI算力大战敞开:英特尔AI芯片功能逾越H100,谷歌云推出最强ARM芯片|钛媒体AGI

发布时间:2025-05-02 点此:218次

北京时刻4月10日清晨,美国亚利桑那州Intel Vision 2024会议上,芯片巨子英特尔(Intel)发布功能最强的新一代Gaudi3 AI 加快芯片,以及全新的下一代英特尔至强6处理器等产品。

细腻的AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI的图像

其间,英特尔Gaudi 3 AI芯片选用台积电5nm工艺,支撑128GB HBMe2内存。比较上代产品,英特尔Gaudi 3带来4倍(400%)的BF16 AI核算才能前进,1.5 倍的内存带宽以及 2 倍的网络带宽前进。一起,在AI模型算力中,比较于英伟达H100 GPU,Gaudi3 AI芯片的模型练习速度、推理速度别离前进40%和50%,均匀功能前进 50%,能效均匀前进40%,而本钱仅为H100的一小部分。

英特尔估计,Gaudi 3将于2024年第二季度起出货,戴尔、惠普、联想、超微电脑等企业将成为第一批客户。

与此一起,今晨举办的谷歌云年度大会Cloud Next 2024上宣告推出一款根据ARM架构的服务器芯片Axion,其功能比通用ARM芯片高30%,比英特尔出产的x86最新芯片功能前进50%。谷歌旨在削减对英特尔和AMD x86芯片的依靠。

全球环绕 AI 算力战役现已拉开帷幕。

“现在的半导体比赛是一场工业战役,也是一场全面的国家战役。”韩国总统尹锡悦4月9日宣告该国全面押注 AI 半导体开展,投入9.4万亿韩元(约合500亿元人民币),以协助韩国成为与我国、美国齐头并进的全球三大AI半导体国家之一。

英特尔突袭英伟达H100,新AI芯片练习快40%,推理快50%

就在深夜,英特尔CEO帕特·基辛格(Pat Gelsinger)手舞足蹈地亮出了最新AI芯片——Gaudi3。

新一代Gaudi 3 AI加快器专为高功能、高功率的生成式 AI 核算而构建,每个加快器都具有一起的异构核算引擎,由 64 个 AI 定制和可编程TPC和 8 个 MME 组成,每个Gaudi 3 MME 都能够履行 64000个并行运算,支撑128 GB HBMe2 内存容量、3.7 TB 内存带宽和 96 MB 板载静态随机存取内存 (SRAM) 。

一起,每个Gaudi 3当中都集成24个200 Gb以太网端口,供给灵敏且敞开规范的网络。而Gaudi 3 的PCIe 功率为600w,带宽为每秒 3.7TB。

功能方面,模型练习层面,Gaudi3比英伟达H100快40%;推理层面Gaudi3比英伟达H100快50%。即便比较最新英伟达H200,Gaudi3 AI芯片的推理速度居然也前进了高达30%。

英特尔CEO帕特·基辛格(Pat Gelsinger)

实际上,跟着ChatGPT爆火,AI 模型、数据、算力根底设施成为生成式 AI 技能开展的三大要素。

据Gartner数据显现,2024年,企业在生成式 AI 方向上预期开销达400亿美元,到2027年这一数据增至1510亿美元。与此一起,到2026年,企业对生成式 AI 运用程度达80%,一起至少有50%的边际核算布置将与AI、机器学习(ML)等方向有关。

但是,AI 技能的悉数潜力并没有彻底释放出来。仅10%的企业安排上一年推出面向出产的生成式 AI 方案;一起,有46%的的专家指出,根底设施是将大模型产品化的最大应战。

因而,英特尔期望能够运用长时刻的 AI 技能堆集,经过敞开生态体系的力气,乘上 AI 热潮。与英伟达部分相似,英特尔也将供给一整套 AI 算力根底设施方案,然后“解锁”企业 AI,推进生成式 AI 的广泛使用和快速商业化,有望协助企业应对 AI 项目时所面对的应战。

基辛格在会上表明,到2030年,半导体商场规模将达1万亿美元,而 AI 是其间的首要推进力。

从全体路线图来看,AI PC、Edge AI(边际)、Data Center AI(数据中心)将成为英特尔三大重要的核算生态体系,比英伟达覆盖面积更广,加上其敞开、可扩展的软件和算法特性,广泛适用于多个 AI 范畴,然后推进英特尔继续为企业客户打造全新 AI 方案。

详细到技能产品层面,除了英特尔Gaudi3之外,此次开幕活动上还发布了其他四个方向的重要开展:

1、全新英特尔至强6处理器品牌,使用于数据中心、云和边际场景。

现代的AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI的照片

其间,与第二代至强处理器比较,装备能效核(此前代号为Sierra Forest)的全新至强6处理器每瓦功能前进2.4倍,机架密度前进2.7倍,客户能以近3:1的比例替换旧体系,大幅下降能耗,估计将于2024年第二季度推出;而装备功能核的英特尔至强6处理器,可将下一个令牌(token)的延迟时刻最多缩短6.5倍,能运转700亿参数的Llama2模型,估计不久后推出。

2、预览下一代英特尔酷睿Ultra处理器。英特尔宣告将推出下一代酷睿Ultra客户端处理器宗族(代号Lunar Lake),将具有超越100 TOPS渠道算力,以及在神经网络处理单元(NPU)上带来超越46 TOPS的算力,然后为下一代AI PC供给强壮支撑。据悉,英特尔估计将于2024年出货4000万台AI PC设备。

3、面向网络互连层面的新品布置。与NVLink相同重要,经过超以太网联盟(UEC),英特尔发布面向AI高速互联技能(AI Fabrics)敞开技能的以太网解决方案,运用高速互联技能支撑AI模型练习和推理,产品组合包含英特尔AI网络衔接卡(AI NIC)、集成到XPU的AI衔接芯粒(Chiplet)、根据Gaudi加快器的体系,以及一系列面向英特尔代工的AI互联软硬件参阅规划。

4、全面更新的边际核算和Tiber事务组合。英特尔还发布新的Edge芯片产品,包含酷睿TM Ultra、酷睿TM、凌动处理器以及面向Edge的英特尔ArcTM GPU,估计全部新品将于本季度上市,使用于包含零售、工业制作、医疗保健等要害范畴,并将于本年取得英特尔Tiber边际渠道的支撑。别的,英特尔还发布Tiber事务解决方案组合,以简化企业对生成式 AI 软件服务的布置作业,估计Tiber方案将于本年第三季度全面推出。

英特尔发表,到现在,英特尔边际核算处理器销量达2亿块,已边际布置超越9万个解决方案。

别的,英特尔还宣告联合Hugging Face、RedHat、SAP、VMware等15家公司,将一起创立一个敞开、多供货商的生成式AI体系渠道,经过RAG(检索增强生成)技能,供给运转许多现存专有数据源得到增强版敞开大模型。

英特尔着重,公司不只将供给包含硬件、软件、结构和东西,并且期望设备制作商、数据库供给商、体系集成商、软件和服务供给商等参加其间,推进英特尔AI敞开生态体系的构建,以及将生成式AI技能进行场景落地。

全体来说,根据英特尔5nm Gaudi3 AI芯片,以及至强6处理器和软件栈,该公司正逐步构建 AI 范畴的算力根底设施生态,全面应战英伟达以及现有 AI 芯片商场格式。

英特尔方面上一年7月对钛媒体App表明,商场需求替代品。客户十分欢迎英特尔Gaudi方案在向群众布置 AI 方面发挥重要的领导效果。“几十年来,英特尔一向致力于把新的技能遍及、普惠到各行各业。经过下降进入门槛,前进商场参加度,然后加快立异速度。”

基辛格在会上着重,“立异技能正在以史无前例的速度开展,每家公司都在加快成为AI公司,这全部都需求半导体技能供给支撑。从PC到数据中心再到边际,英特尔正在让AI走进千行百业。”

为削减对英伟达依靠,谷歌推出ARM服务器芯片

与微软、亚马逊相同,谷歌也推出了多款自研芯片,以削减对英伟达GPU芯片的依靠。

美东时刻4月9日周二,谷歌在本年的年度云核算大会Cloud Next 2024上宣告推出一款根据Arm架构的数据中心芯片Google Axion,以及更新TPU v5p芯片。

谷歌表明表明,Google Axion处理器根据Arm Neoverse V2 CPU构建,以Titanium为根底,功能比通用ARM芯片高30%,并且比英特尔出产的当时一代 x86芯片高50%。估计Axion用于多种谷歌服务,并在“本年晚些时候”向大众敞开。

谷歌云副总裁兼核算和机器学习根底设施总经理 Mark Lohmeyer 表明:“咱们正在让客户轻松地将现有作业负载转移到 ARM。Axion 建立在敞开根底之上,在任何地方运用ARM的客户都能够轻松选用 Axion,而无需从头架构或从头编写使用程序。”

“谷歌推出的新式 Axion CPU 标志着交给定制芯片的一个重要里程碑,该芯片针对谷歌的根底设施进行了优化,并构建在咱们的高功能 Arm Neoverse V2 渠道上。数十年的生态体系出资,再加上 Google 的继续立异和开源软件奉献,保证为在各地运转 Arm 的客户最重要的作业负载供给最佳体会。”Arm 首席履行官 Rene Haas表明。

事实上,Axion 仅仅许多定制发一份芯片中的最新产品。自2015年以来,谷歌现已发布了五代张量处理单元(TPU);一起,2018年,谷歌发布了第一个视频编码单元 (VCU),视频转码功率前进了33 倍;别的,2021年,谷歌经过出资“片上体系”(SoC) 规划,加大了定制核算的投入,并发布了用于移动设备的三代Tensor芯片中的第一款。

现在,谷歌推出新的芯片意味着,该公司正在追逐亚马逊和微软这些云范畴比赛对手的脚步。亚马逊和微软2021年就现已推出Arm架构的CPU,作为供给差异化核算服务的一种方法。而谷歌之前为YouTube、AI及其智能手机推出过定制芯片,但还没有打造过CPU。

详细来说,Axion将适用于一系列使命,包含支撑谷歌的搜索引擎和 AI 相关的作业。谷歌表明,该芯片能够经过协助处理许多数据并为数十亿用户布置服务,在AI范畴发挥重要的支撑效果。一起,未来谷歌逐步转移到根据Arm云服务器用例上运用,Datadog、Elastic、OpenX 和 Snap都方案选用 Axion。

AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI的图片

除了Axion之外,谷歌还宣告全面推出 TPU v5p,用于练习和推理的最强壮、可扩展且灵敏的 AI 加快器,其核算才能是上一代的 4 倍(400%)。

谷歌CEO桑达尔·皮查伊表明,生成式 AI的前进需求强壮的底层根底设施。谷歌 AI 超级核算机结合了咱们的 TPU、GPU、AI 软件等,为练习和服务模型供给功能和本钱优势。现在,抢先 AI 公司和 Google Cloud 客户(例如 Anthropic、AI21 Labs、Contextual AI、Essential AI 和 Mistral AI)正在运用其根底设施。

数据显现,虽然广告仍然是谷歌最大收入源,但云核算的添加更快,在谷歌的收入中占比不断前进,已挨近占公司总收入的11%。据Gartner预算,2022 年,谷歌占云根底设施商场 7.5% 的比例,而亚马逊和微软算计操控着 62% 左右的比例。

谷歌表明,现在现已有超越 90% 的 AI 独角兽企业在运用谷歌的核算资源、模型和开发环境。

现在,谷歌成为继微柔和亚马逊之后,第三家用ARM架构推出数据中心CPU的科技巨子,这显现了新的趋势。并且,谷歌还运用TPU优势,全面供给服务器和数据中心闭环服务,下降英伟达、英特尔、AMD芯片的依靠。

有评论称,谷歌开发新芯片是在 AI 比赛白热化之际削减对外部厂商的依靠。不过,谷歌的官员并没有将芯片新品视为一种比赛之举。谷歌担任自研芯片事务的副总Amin Vahdat说:“我觉得这是做大蛋糕的根底。”

从全体来说,Google Next 2024上展示了整个谷歌云构建的 AI 敞开和笔直优化技能栈。

  • AI Hypercomputer (算力层):TPU v5,Axion,2025年将上线的英伟达Blackwell GB200,以及新增 A3 Mega 核算单元。
  • Gemini Models(模型层):今日谷歌正式开发 Gemini 1.5 Pro API,新增语音模态理解才能、文件拜访 API、体系指令以及 JSON 形式等功能。
  • Vertex AI(容器环境层):最便利的 AI 使用开发和运转环境,集成了除 OpenAI 之外的全部模型,便利调用、微谐和各种开发测验。
  • 使用层:谷歌供给Gemini for Cloud、Workspace & Agent等产品组合中,即Gemini AI 产品将全面集成到 Cloud 与 Workspace 两大产品线,并且还预开发了一堆 AI Agent(署理),支撑客服、雇员、构思、代码、数据、安全署理等等。

英伟达真的风险了吗?黄仁勋:仍然很稳

那么,前有谷歌、微软、亚马逊“造芯”,后有英特尔“弯道超车”,英伟达真的风险了吗?

2023年12月初,AMD高调推出了MI300系列产品。据介绍,MI300X芯片具有超越1500亿个晶体管,内存密度是现在英伟达H100的2.4倍,内存带宽是其1.6倍。AMD首席履行官苏姿丰称,这款新芯片在练习 AI 软件的才能方面与英伟达的H100适当,并且在推理方面体现得更好,不过这一说法也未得到独立验证。

本年3月底,英伟达正式发布了新一代人工智能核算芯片B200。英伟达CEO黄仁勋表明,B200 GPU的AI运算功能在FP8及新的FP6上都可达20 petaflops,是前一代H100运算功能的2.5倍。

现在,跟着Gaudi 3的正式发布,当时AI芯片商场呈现出英伟达B200、AMD MI300系列和英特尔Gaudi 3"三巨子"比赛的格式。英伟达在AI芯片范畴"一家独大"的局势面对来自别的两家厂商的应战。

不过,从黄仁勋视点来看,英伟达的生态体系很安稳,在当时AI算力"军备比赛"中,英伟达仍旧暂时是商场的佼佼者。

黄仁勋前段时刻这段话其实表达的十分清晰:“数据中心需求你运营它。购买和出售芯片的人考虑的是芯片价格。运营数据中心的人考虑的是本钱,咱们总具有本钱(TCO)十分好。即便比赛对手芯片是免费的,他们也不如咱们,客户也不会买。咱们的方针是添加更多的价值。但这背面需求许多尽力,咱们有必要不断立异、咱们不能把任何事情视为天经地义、咱们有许多比赛对手。”

事实上,AI 芯片是一个不断向前“奔驰”的高技能职业。它没有独占,只要不断立异供给更大价值,才有可能让企业继续坚持抢先地位。因而,无论是英伟达仍是英特尔,他们都有十分强壮的商场比赛力,也都有望成为 AI 加快核算商场的“抢先者”。

现在,在服务器商场,AMD正在逐步蚕食该公司的商场比例。据商场调研组织Mercury Research所发布的2023年第四季度AMD处理器商场比例统计数据,AMD EPYC现已拿下了23.1%服务器商场比例,比例占比再次扩展。虽然EPYC作为通用处理器,算力上不如GPU加快器,不过该产品可与GPU加快器、AI加快器等协同作业,完成功率的最大化。

而全新英特尔 AI 芯片Gaudi,估计将不太会在我国大陆商场出售。但从全球来看,它是否真的能如其所言的,凭仗功能优势、极具比赛力定价优势而占据更大的商场比例,全部还有待时刻的检测。

(本文首发钛媒体App,作者|林志佳)

告发/反应

相关推荐

在线客服
服务热线

24小时咨询热线:

4006666666

微信咨询
红领巾黑料网
返回顶部