英伟达处理器正遥遥领先，英特尔紧随其后_产业_产业

产业

英伟达处理器正遥遥领先，英特尔紧随其后

来源：新浪VR
2023-11-14 21:38

英特尔还分享了一些数据，显示4节点Xeon系统（包含AMX矩阵引擎）可以在不到五分钟的时间内对图像生成器的稳定扩散进行微调。微调是将已经训练好的神经网络专门用于某项任务，例如，英伟达的芯片设计AI就是对现有大型语言模型NeMo的微调。

AI基准测试平台MLPerf最新训练测试结果显示，英伟达处理器正遥遥领先，英特尔紧随其后，谷歌则远远落在了后面。针对计算机系统训练机器学习神经网络的公平测试（apples-to-applestest），已全面进入生成式人工智能时代。

今年年初，MLPerf增加了一个用于训练大型语言模型（LLM）的测试，主要是针对GPT-3。而就在本月，MLPerf又增加了一个基于文本生成图像的测试Stable Diffusion。英伟达和英特尔的处理器参与了该基准测试，而在训练GPT-3时，谷歌也加入到了测试行列中。

PS：MLPerf（Machine Learning Performance）基准测试是由学术界和工业界共同组成的非营利性组织，旨在建立一个公平、透明且可复现的机器学习性能评估平台。该项目于2018年启动，得到了全球范围内众多知名学术机构和科技公司的支持与参与。其目标是为机器学习研究者和开发者提供一个统一的标准和基准测试工具，以促进机器学习系统的性能提升和相互比较。

三家公司都为这项任务投入了庞大的系统。其中，英伟达的10000GPU超级计算机是有史以来测试过的最大的超级计算机，而这种规模的超级计算机在生成式人工智能中是必不可少的。但即使这样，该计算机也需要八天的时间才能完全完成LLM的训练任务。

本次测试共计有19家公司和机构提交了200多项测试结果，测试结果表明在过去五个月中计算机处理器性能提升了2.8倍，自五年前MLPerf成立以来则提升了49倍。

10752个GPU的超级计算机

在MLPerf基准测试中，英伟达公司的H100 GPU系统继续占据主导地位。但最令人惊喜的是该公司新推出的人工智能超级计算机Eos，该计算机拥有高达10752个GPU。利用所有这些GPU完成GPT-3训练基准的任务，Eos只用了不到4分钟时间。微软的云计算部门Azure测试了一个大小完全相同的系统，结果却是仅以几秒之差落后于Eos。（Azure为GitHub的编码助手CoPilot和OpenAI的ChatGPT提供训练支持）。

Eos的GPU每秒可进行426亿亿次浮点运算（exaflops）。这些GPU与英伟达的Quantum-2 Infiniband互联，传输速度高达每秒110万亿字节。英伟达人工智能基准测试和云计算总监戴夫-萨尔瓦托雷说：“其速度和数据规模令人难以置信。这是一台能力惊人的机器。”

Eos将单台机器上绑定的H100 GPU数量增加了三倍，这三倍的增长换来了2.8倍的性能提升，即93%的扩展效率。高效的扩展是持续改进生成式人工智能的关键，而生成式人工智能每年都在以10倍的速度增长。

Eos所解决的GPT-3基准测试并不是对GPT-3的完整训练，因为MLPerf希望大多公司都能做到这一点。相反，Eos的任务是将系统训练到某个检查节点，以证明如果有足够时间的情况下，训练将能达到所需的准确度。

而这些训练确实需要时间。从以Eos在这4分钟内的训练速度推算，完成所有训练需要8天，而这还是在迄今为止最强大的人工智能超级计算机上完成的。如果是一台普通的512 H100，则需要4个月时间。

英特尔步步紧逼

英特尔提交了使用Gaudi 2加速芯片系统的测试结果，以及完全不使用加速芯片、仅使用第四代Xeon CPU系统的测试结果。与上一组训练基准相比，最大的变化是英特尔启用了Gaudi 2的8位浮点运算（FP8）功能。

过去10年中，GPU性能的提升主要归功于FP8等低精度数字的使用。在GPT-3和其他Transformer神经网络中使用FP8，其低精度不会影响准确性，这已经在英伟达H100的测试结果中得到了验证。现在，在Gaudi 2上也看到了这种提升。

英特尔Habana实验室首席运营官艾坦-梅迪纳表示：“我们预计使用FP8会带来90%的提升。最终结果超出了预期——384加速器集群的训练时间缩短了103%”

这一新成果使Gaudi 2系统的单芯片速度略低于英伟达系统的三分之一，是谷歌TPUv5e的三倍。而在新的图像生成基准测试中，Gaudi 2的速度也只有H100的一半左右。GPT-3是本轮唯一启用FP8的基准测试，但梅迪纳说他的团队正在努力为其他基准测试启用FP8。

梅迪纳继续说明，Gaudi 2的价格明显低于H100，因此在价格和性能的综合指标上具有优势。梅迪纳预计，随着下一代英特尔加速器芯片Gaudi 3的问世，这一优势将进一步扩大。该芯片将于2024年量产，采用与英伟达H100相同的半导体制造工艺。

另外，英特尔还提交了仅基于CPU的系统结果。同样，几项基准测试的训练时间都在几分钟到几小时之间。

除了MLPerf基准之外，英特尔还分享了一些数据，显示4节点Xeon系统（包含AMX矩阵引擎）可以在不到五分钟的时间内对图像生成器的稳定扩散进行微调。微调是将已经训练好的神经网络专门用于某项任务，例如，英伟达的芯片设计AI就是对现有大型语言模型NeMo的微调。

英伟达处理器正遥遥领先，英特尔紧随其后

关键词

相关阅读

英特尔助力医疗智能化高质量发展

英特尔和AMD先后发布第三季度财报证明个人电脑市场正在加速复苏

联想与英伟达公布重大计划：推出混合AI解决方案

英特尔正在为客户构建类似 ChatGPT 的人工智能应用

富士康与英伟达合作打造AI工厂——新型数据中心

梅赛德斯-奔驰宣布与英伟达合作

摩根士丹利：以暴涨两倍的英伟达为风向标 AI泡沫已逼近顶峰

AI大模型加持，全新鸿蒙智能座舱“遥遥领先”了吗？

钛媒体科股早知道：苹果、英伟达携手成立联盟，制定元宇宙3D图形标准

苹果、英伟达、皮克斯、Adobe等成立联盟以推行3D内容开放式标准

24快报

北京联通携手华为、工体元宇宙在新工体打造全球领先的5G-A立体组

香港eTeam：打造元宇宙“异世界”，为玩家带来电影级沉浸体验

Meta自2020年以来元宇宙部门亏损超580亿美元

苏州市精准布局元宇宙赛道，总产值达5万亿元

天津市新政：创办元宇宙未来产业企业最高获30万元支持

首个红色文化元宇宙XR数字展览《中轴之核-天安门印迹》亮相

OpenAI频陷侵权风波，印度媒体索赔2000万卢比

重庆大足石刻景区：虚拟数字人上线，元宇宙技术让古老石刻会 "

元宇宙VR大空间展现多领域发展潜力，将电影场景变为现实

元宇宙文旅热潮“解锁”文化消费新业态

中国移动咪咕发布鼓浪屿元宇宙商业生态合作计划

“元宇启新梦·虚实创未来”江西省互联网大会元宇宙分论坛在南昌

深耕元宇宙，瓣鼎科技CEO史明荣获行业大奖

强制出售Chrome？OpenAI或成潜在买家

工信部：AI大模型公共服务平台启动！加快大模型技术迭代和产品升

擅自收集敏感数据韩国处罚“元宇宙”1560万美元

阿里元境调整元宇宙行至岔路口

瓣鼎科技持续在元宇宙行业释放魅力，致力开启潮流新篇章

二六三：公司在元宇宙方向上主要聚焦在3D虚拟直播及数字人的探索

韩国对Meta罚款1560万美元！Meta擅自收集敏感数据