惠安汇通石材有限公司惠安汇通石材有限公司

嗤笑的意思

嗤笑的意思 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大赢(yíng)家之(zhī)一、英伟(wěi)达背后的那(nà)个(gè)身穿黑色皮(pí)衣的男人又来(lái)了(le)。

  前脚才交出(chū)亮眼业(yè)绩狂(kuáng)拉(lā)股价,英(yīng)伟达CEO黄仁勋后(hòu)脚(jiǎo)就在昨日的COMPUTEX大会(huì)上宣布(bù),“我们已到达生成(chéng)式AI引爆点。从此,全世界的每个角落,都会有计算需(xū)求。”

  如今(jīn)英伟达掌(zhǎng)握(wò)着全球多家科(kē)技公司“算力命脉”,而在这场大(dà)会上,黄仁勋激情(qíng)演讲2个小时(shí),甩(shuǎi)出了多(duō)项重磅新发布(bù),包括算力“杀器”DGX GH200超级计算(suàn)机(jī)、针(zhēn)对游戏的ACE代工服务(wù)、MGX服务器规范(fàn)等(děng)内容。

  算力“杀器”:DGX GH200超级计算机+GH200超级芯片

  先看“集(jí)成了英伟达最先进加速计(jì)算(suàn)和网络技术”的DGX GH200人工(gōng)智能超级(jí)计算机

  这(zhè)款超算专为大(dà)规模(mó)生(shēng)成式AI的负载所设计,由256块GH200超级芯片(piàn)组成,拥有(yǒu)1 exaflop超凡AI性能、144TB内存(是英伟(wěi)达目前DGX A100系统的(de)近500倍)、150英(yīng)里光纤、2000多个风(fēng)扇。

  DGX GH200重达(dá)40000磅(约合18143千克),堪比(bǐ)四只成年大象的(de)体重。

  预计(jì)DGX GH200将于今年年底(dǐ)投入(rù)问世(shì),英伟(wěi)达暂未公(gōng)布(bù)价格,而谷歌云(yún)、Meta与微软将是首批用户

  同时,英(yīng)伟达也正(zhèng)在打造自家基于(yú)DGX GH200的大型AI超(chāo)级计算(suàn)机(jī)NVIDIA Helios,以支(zhī)持(chí)其(qí)研究和开发团队(duì)的工作。其中采用4个DGX GH200系统、1024颗Grace Hopper超级芯片,每个都将与英伟达Quantum-2 InfiniBand网络(luò)连(lián)接,带宽(kuān)高达400Gb/s,将于今年(nián)年底上线(xiàn)。

  值得一提(tí)的是,黄仁勋透(tòu)露,DGX GH200集成的GH200 Grace Hopper超(chāo)级芯片已进入全面(miàn)生产(chǎn)

  “拉踩”CPU:成本、功耗、处理(lǐ)数据量不(bù)如GPU

  在(zài)本次大会(huì)上(shàng),黄仁勋还“拉(lā)踩(cǎi)”了一波CPU。他从功耗、处理数据(jù)量(liàng)等方面,指出使用GPU胜(shèng)过(guò)CPU。

  举例(lì)来说,花费1000万(wàn)美元,可以建设(shè)一个有(yǒu)960颗CPU的数据中心,其(qí)可处理1X LMM(大(dà)语言模(mó)型)数据量,需要11GWh功耗;

  同样成本下(xià),也可以建设一个有48个GPU的数(shù)据中心,其可处理44X LLM数据量,仅需要3.2GWh功耗。

  若(ruò)只想处理1X LMM数(shù)据量,则只需40万美元,便可拥有一个(gè)搭(dā)载2个GPU、功耗仅(jǐn)0.13GWh的数(shù)据(jù)中心。

  “买(mǎi)越多(duō),省越多(The more you buy, the more you save)。”黄仁勋(xūn)再次表示。

  同时,他也列出了数据中心成本公式:数据(jù)中(zhōng)心总持有成本=f[成本(běn)(芯片(piàn)、系统、硬件生(shēng)态系统)、吞(tūn)吐量(GPU、Algo软件(jiàn)、网络、系统(tǒng)软(ruǎn)件、软件生态系(xì)统)、使(shǐ)用率(Algo Lib, 软件(jiàn)生(shēng)态系统)、采(cǎi)购运营、生命周(zhōu)期最佳化、电力]

  ACE代工服务:用AI激活NPC生命

  游戏一直是备受关(guān)注(zhù)的(de)一大AI应用落地领域。英伟达也在大会上宣布,推(tuī)出面(miàn)向游戏的定制AI模型代(dài)工(gōng)服务NVIDIA Avatar Clou嗤笑的意思d Engine(ACE)

  它能赋(fù)予(yǔ)非玩家角(jiǎo)色(NPC)更智(zhì)能且(qiě)不断进化的对话技能,中间件、工具(jù)和游戏开发(fā)者可使用它来(lái)构建和部署(shǔ)定(dìng)制的语音、对话和动画AI模型(xíng)

  其中包括(kuò):英(yīng)伟达NeMo,使用(yòng)专有(yǒu)数据构建、定制和部(bù)署语(yǔ)言模型;英(yīng)伟(wěi)达Riva,用于(yú)自动(dòng)语音识别和文(wén)本转(zhuǎn)语音实现实时语音对话;英伟(wěi)达Omniverse Audio2Face,用于即时创(chuàng)建游戏角色(sè)表情动画,以匹配(pèi)任何(hé)语音轨(guǐ)道。

  开(kāi)发人(rén)员可选择(zé)集成整个NVIDIA ACE for Games解决(jué)方案,也(yě)可仅使(shǐ)用需要的(de)组件。

  新参考工作流程(chéng):帮(bāng)助建设数字(zì)化智能工厂

  黄仁勋(xūn)表示,全(quán)球电子制造商正在使(shǐ)用一种全新(xīn)的综合参考(kǎo)工作(zuò)流程推进工业(yè)数字化工作,该工(gōng)作流程结合了英伟达用(yòng)于生成式AI、3D协作、仿(fǎng)真和自主机器(qì)的技(jì)术,包括:

  英伟达Omniverse,其(qí)连接了顶(dǐng)级(jí)计(jì)算机(jī)辅(fǔ)助设计应用以及生成式AI的API和前沿框(kuāng)架;用于(yú)模拟(nǐ)和测试机(jī)器人的英(yīng)伟(wěi)达Isaac Sim应用程(chéng)序(xù);英伟达Metropolis视觉AI框(kuāng)架,用于自动光学(xué)检测。

  同时(shí),黄仁勋现场展(zhǎn)示了一个完全(quán)数字化的智能工厂的演示。

  目前富士康工(gōng)业互(hù)联网、宜(yí)鼎国(guó)际(jì)、和硕、广(guǎng)达(dá)和纬创正在使用这一参(cān)考工(gōng)作流程,具体用例包(bāo)括电(diàn)路(lù)板质(zhì)保检(jiǎn)测点自动(dòng)化、光学检测自(zì)动化、建(jiàn)设虚拟工厂、模(mó)拟协作(zuò)机器人、构建及运(yùn)营(yíng)数字孪生等。

  MGX服务器规范:快速高效(xiào)构建百余(yú)种(zhǒng)服务(wù)器配(pèi)置

  英伟达发布(bù)NVIDIA MGX服务器规范,为系统制造商(shāng)提供模块化参考(kǎo)架构,满足各种规模(mó)的(de)数据中心需求。系(xì)统制(zhì)造(zào)商可使用(yòng)它快速且经济高效地构建(jiàn)100多种服(fú)务器配置(zhì),以适应广泛的AI、HPC及NVIDIA Omniverse应用。

  MGX支持英伟达全系列GPU、CPU、DPU和(hé)网络(luò)适配器、各种x86、完(wán)整(zhěng)软(ruǎn)件堆栈及Arm处理器,还(hái)可集成到(dào)云和企业数据中心中。

  华硕、和硕、QCT、超微(Supermicro)等都将采用MGX构建下(xià)一代(dài)加速(sù)计算机,可将开发成本(běn)削减多(duō)达3/4,并将开(kāi)发(fā)时间缩短2/3至(zhì)仅(jǐn)需6个月

  其(qí)中,QCT和超微(wēi)基于MGX的设计将于8月面世。超微昨日公布的(de)ARS-221GL-NR系(xì)统(tǒng)将(jiāng)采用Grace CPU,而QCT的(de)S74G-2U系统(tǒng)将采(cǎi)用Grace Hopper。嗤笑的意思p>

  推出Spectrum-X网(wǎng)络平台(tái) 构建(jiàn)超大(dà)规(guī)模生成式AI超级(jí)计(jì)算机Israel-1

  另外,黄仁勋宣布(bù)推出NVIDIA Spectrum-X网络平(píng)台,旨(zhǐ)在提高基于以太网的AI云的(de)性能(néng)和效率。

  相(xiāng)比传统以太网结构,Spectrum-X可(kě)实现1.7倍的整(zhěng)体(tǐ)AI性能和能效(xiào)提升(shēng),并具有高度通用性,可用于各种AI应(yīng)用(yòng)。它使用完全基于(yú)标准的以太(tài)网,并可与基于以太网的堆栈互操作。该(gāi)平台支持256个200Gb/s端口,通(tōng)过单个交换机连(lián)接,或在两层leaf-spine拓(tuò)扑中提供16000个(gè)端口,以支持AI云增长和扩展,在保持性能的同时最(zuì)大限度减少网络延迟。

  全球领先云(yún)计算(suàn)提供商正在采用Spectrum-X平台扩展生成式AI服(fú)务,而(ér)Spectrum-X、Spectrum-4交换(huàn)机、BlueField-3 DPU等已在戴尔、联想(xiǎng)等系统制造商处提供(gōng)。

  此外,作为Spectrum-X参考设计的蓝图和测试平台(tái),英伟达正构建(jiàn)一台(tái)超(chāo)大规(guī)模生成式AI超级计算机Israel-1。这台AI超算价值数(shù)亿美(měi)元(yuán),将采用戴(dài)尔(ěr)PowerEdge XE9680服务(wù)器(qì)、英伟达HGX H100超级计算平台、内置BlueField-3 DPU和Spectrum-4交(jiāo)换机的Spectrum-X平(píng)台(tái)。

  结语(yǔ)

  “40年来,我们创造了PC、互联网(wǎng)、移动、云,现在(zài)是人工智能时代。你会创造什么?不管是什(shén)么,都(dōu)要(yào)像我们一样追赶它。要奔跑,不要走。要么为了食物(wù)奔跑,要么作为食(shí)物奔跑。”

  在5月27日的台湾大学发表了毕业典礼演讲上,黄仁勋再次强调了掌握(wò)AI技术的重要性(xìng):很多人担心,AI会抢走自己的工作。但真正会(huì)抢走你饭碗的,是掌握(wò)了AI技术(shù)的(de)人。

  他(tā)表示,从各方面来(lái)看(kàn),AI的兴盛(shèng)是计算机产业(yè)的(de)再生契机。在下个十年(nián),我(wǒ)们(men)的产(chǎn)业将使用新型AI电脑,取代价值万(wàn)亿美(měi)元(yuán)的传统电(diàn)脑。

  而从(cóng)昨(zuó)日大会(huì)上黄(huáng)仁(rén)勋的展示中(zhōng),人工智能时代的未(wèi)来轮廓似乎已逐渐浮现。

未经允许不得转载:惠安汇通石材有限公司 嗤笑的意思

评论

5+2=