惠安汇通石材有限公司惠安汇通石材有限公司

两丈等于多少米

两丈等于多少米 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大(dà)赢家之一、英(yīng)伟达背后的那个(gè)身(shēn)穿黑色皮衣的(de)男人又(yòu)来了。

  前脚才交出(chū)亮眼业绩狂拉股价,英伟达CEO黄仁勋后(hòu)脚就在昨日的COMPUTEX大会上宣布(bù),“我们(men)已到达生成式AI引爆点。从此,全世界的每个(gè)角落,都会(huì)有计(jì)算需(xū)求。”

  如今英伟达掌握着全(quán)球多家(jiā)科技公司(sī)“算力(lì)命脉”,而(ér)在这场大会上,黄仁勋激(jī)情演讲2个小时(shí),甩出了多项重磅新发(fā)布(bù),包括算力“杀(shā)器”DGX GH200超级计算机(jī)、针对游(yóu)戏的ACE代工服务、MGX服(fú)务器规范等内容。

  算力“杀器”:DGX GH200超级(jí)计算(suàn)机+GH200超级芯片

  先看“集(jí)成(chéng)了英(yīng)伟达最先进加速计算和(hé)网络技术”的(de)DGX GH200人工(gōng)智(zhì)能超级(jí)计算机

  这款超(chāo)算专为大规模生成式AI的负载所(suǒ)设计,由256块GH200超级芯片(piàn)组(zǔ)成,拥(yōng)有1 exaflop超凡AI性能、144TB内存(是英伟达(dá)目前DGX A100系统(tǒng)的近500倍)、150英里(lǐ)光纤、2000多(duō)个(gè)风扇。

  DGX GH200重(zhòng)达40000磅(约(yuē)合(hé)18143千(qiān)克),堪比(bǐ)四只成年(nián)大象的体(tǐ)重。

  预计DGX GH200将于今年年底(dǐ)投入问世,英伟(wěi)达暂未公布价(jià)格,而谷(gǔ)歌云、Meta与微(wēi)软(ruǎn)将是首批用户

  同时,英(yīng)伟(wěi)达也正在(zài)打造自家基于DGX GH200的(de)大型(xíng)AI超(chāo)级计算机NVIDIA Helios,以(yǐ)支持其(qí)研究和开(kāi)发团队(duì)的工作。其中(zhōng)采(cǎi)用4个DGX GH200系统(tǒng)、1024颗Grace Hopper超(chāo)级芯片,每个都将(jiāng)与英伟达Quantum-2 InfiniBand网络连接,带宽(kuān)高达400Gb/s,将于今(jīn)年(nián)年(nián)底(dǐ)上(shàng)线。

  值(zhí)得一提的是(shì),黄(huáng)仁勋透露,DGX GH200集成(chéng)的GH200 Grace Hopper超级(jí)芯(xīn)片已进入全(quán)面生产

  “拉踩”CPU:成本、功耗、处理数(shù)据量不如GPU

  在(zài)本次(cì)大会上,黄仁(rén)勋还“拉踩”了(le)一(yī)波CPU。他从功耗、处理数据量(liàng)等方面,指出使用GPU胜过CPU。

  举例来说,花(huā)费(fèi)1000万美元,可(kě)以(yǐ)建设一个有960颗(kē)CPU的数据中(zhōng)心,其可处理(lǐ)1X LMM(大语言(yán)模(mó)型)数据量,需(xū)要11GWh功耗;

  同样成(chéng)本下,也(yě)可以建(jiàn)设(shè)一个有48个GPU的数据(jù)中心,其可处(chù)理44X LLM数据(jù)量,仅需要3.2GWh功耗(hào)。

  若只想处(chù)理1X LMM数据量,则只需(xū)40万美(měi)元,便可(kě)拥有(yǒu)一(yī)个(gè)搭(dā)载2个GPU、功耗仅0.13GWh的数据中心。

  “买越多,省(shěng)越多(duō)(The more you buy, the more you save)。”黄仁勋(xūn)再次表示。

  同时(shí),他也列(liè)出了数(shù)据(jù)中心成(chéng)本公式(shì):数(shù)据中心(xīn)总持有成本=f[成本(芯片、系统、硬(yìng)件生(shēng)态系统(tǒng))、吞吐量(GPU、Algo软件、网络、系统软(ruǎn)件、软(ruǎn)件生态系(xì)统(tǒng))、使用率(lǜ)(Algo Lib, 软件(jiàn)生态系统)、采购运营、生命周期最(zuì)佳化、电力]

  ACE代工服务:用AI激活NPC生命(mìng)

  游戏一直是备受关注的(de)一大AI应用落地领域。英伟达也在大会(huì)上宣布,推出面向游戏的定制AI模型代工服(fú)务NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非(fēi)玩家角色(NPC)更智能且不断进化的对话(huà)技能,中间(jiān)件、工具(jù)和游戏开发者可使(shǐ)用它来(lái)构(gòu)建和部署定(dìng)制的语音(yīn)、对话和动画(huà)AI模(mó)型

  其中(zhōng)包括:英伟达NeMo,使用专有(yǒu)数据(jù)构(gòu)建、定制和部(bù)署(shǔ)语言模型;英(yīng)伟达Riva,用(yòng)于(yú)自动语音识别和文本转语音实(shí)现实时语音对(duì)话;英伟达Omniverse Audio2Face,用(yòng)于(yú)即时创建游戏角色表情动画,以匹(pǐ)配任何(hé)语音轨道。

  开发人员可选择集成整个NVIDIA ACE for Games解决方案,也可仅使用需要(yào)的组件。

  新参考工作(zuò)流(liú)程:帮助建(jiàn)设数字(zì)化智能工厂

  黄仁勋(xūn)表示(shì),全球电子制造商正在(zài)使用一种全新的综合(hé)参考(kǎo)工作(zuò)流程推(tuī)进(jìn)工(gōng)业数(shù)字化两丈等于多少米工作,该工(gōng)作流程结合了英(yīng)伟达用于生(shēng)成式AI、3D协作、仿真(zhēn)和自主机器的技术,包括:

  英(yīng)伟达Omniverse,其连接了顶级计算机辅助(zhù)设计应用以及生(shēng)成式AI的API和(hé)前沿框(kuāng)架;用于模拟和测试机器人(rén)的英伟达Isaac Sim应用程序(xù);英(yīng)伟(wěi)达Metropolis视觉AI框(kuāng)架,用(yòng)于自动光学检测。

  同时,黄仁勋(xūn)现场展示了一个完(wán)全(quán)数字化的智能(néng)工厂(chǎng)的演(yǎn)示。

  目前富士(shì)康工业互联网(wǎng)、宜鼎国际、和硕、广达和纬创正(zhèng)在使用这一参考工作流程,具体用例包括电路板质保(bǎo)检测(cè)点自动化、光学检(jiǎn)测自动化(huà)、建(jiàn)设虚(xū)拟(nǐ)工厂(chǎng)、模拟协作(zuò)机(jī)器人、构建及运营数字孪生等。

  MGX服务(wù)器规范:快速高效构建百余种服(fú)务器配置

  英伟达发布NVIDIA MGX服务器规范(fàn),为系统制(zhì)造商(shāng)提(tí)供(gōng)模(mó)块化参考架构,满足各种规模的数(shù)据中心(xīn)需求。系统制(zhì)造商可使用它(tā)快速且经济高效地(dì)构建(jiàn)100多种(zhǒng)服务(wù)器配(pèi)置(zhì),以适应广泛的AI、HPC及(jí)NVIDIA Omniverse应用(yòng)。

  MGX支持英(yīng)伟达全系列GPU、CPU、DPU和网络适(shì)配器、各(gè)种x86、完整软件堆栈及Arm处理器,还可集成到云(yún)和(hé)企(qǐ)业数据(jù)中心中。

  华(huá)硕、和硕、QCT、超微(Supermicro)等都将采用(yòng)MGX构建下一代加(jiā)速计算机,可(kě)将开发成本削减多达3/4,并将开(kāi)发时间缩短2/3至(zhì)仅需(xū)6个月

  其中,QCT和超微基于MGX的(de)设计将于(yú)8月面世。超(chāo)微昨(zuó)日公布的ARS-221GL-NR系(xì)统将(jiāng)采用Grace CPU,而QCT的S74G-2U系统将采用Grace Hopper。

  推出(chū)Spectrum-X网络平(píng)台 构建超大规模生成式AI超级计(jì)算机Israel-1

  另外,黄仁勋宣布推出NVIDIA Spectrum-X网络(luò)平台(tái),旨在(zài)提高基于以(yǐ)太网的(de)AI云的(de)性(xìng)能和效率。

  相比(bǐ)传统以太网结构,Spectrum-X可实现(xiàn)1.7倍的整体AI性(xìng)能(néng)和(hé)能效(xiào)提升,并(bìng)具有高度(dù)通用性,可用于各种AI应用。它使(shǐ)用完全基于标准(zhǔn)的以(yǐ)太网,并可(kě)与基(jī)于以太网的堆栈互操作。该平台(tái)支持256个(gè)200Gb/s端口(kǒu),通过(guò)单个(gè)交换(huàn)机(jī)连接,或在两层(céng)leaf-spine拓(tuò)扑中提供16000个(gè)端口(kǒu),以支持AI云(yún)增长和扩展(zhǎn),在保持(chí)性能的(de)同时最(zuì)大限度(dù)减少网络(luò)延迟。

  全球领先云(yún)计算提供商(shāng)正在采用Spectrum-X平(píng)台扩展生成两丈等于多少米式AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在(zài)戴尔、联(lián)想等(děng)系统制造商处提供。

  此外,作(zuò)为Spectrum-X参考设计(jì)的蓝(lán)图(tú)和测试平台,英伟达正构建一台超大规模(mó)生(shēng)成式AI超级计算机(jī)Israel-1。这台AI超(chāo)算价值数亿美元,将采用戴尔PowerEdge XE9680服务器(qì)、英伟达HGX H100超级计算(suàn)平台、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平台(tái)。

  结语

  “40年(nián)来,我(wǒ)们创造了PC、互联网、移动、云,现在是人工智能时代。你会创造什(shén)么?不管是什么,都要像我们一样追(zhuī)赶它。要奔(bēn)跑,不要走。要么为了(le)食(shí)物奔跑,要么作为食(shí)物奔跑(pǎo)。”

  在5月(yuè)27日(rì)的台湾(wān)大(dà)学(xué)发表(biǎo)了毕业典(diǎn)礼演讲上,黄仁勋再(zài)次强调了掌握AI技术的重要性:很多人担心,AI会(huì)抢走自己(jǐ)的工作。但真正会抢(qiǎng)走你饭碗(wǎn)的,是掌握(wò)了AI技(jì)术(shù)的人。

  他表示,从各方面来(lái)看,AI的兴盛是计算机(jī)产业(yè)的再生契机。在下个十年,我(wǒ)们的产(chǎn)业将(jiāng)使用(yòng)新型AI电(diàn)脑,取代价值(zhí)万亿美元的(de)传统电脑。

  而从昨(zuó)日大会上黄仁勋的展示中,人工(gōng)智能(néng)时(shí)代的(de)未来轮廓(kuò)似乎已逐渐浮现。

未经允许不得转载:惠安汇通石材有限公司 两丈等于多少米

评论

5+2=