从黄仁勋CES全程高能演讲,看英伟达巨大AI棋局:物理AI、AI PC、通用机器东谈主
作家:赵晓勤
NVIDIA首创东谈主黄仁勋在CES 2025的全程高能演讲,浅看是一场新品发布会,实则是英伟达下了一步巨大的棋,这步棋关乎从云表到末端、从数据中心到平素用户、从杜撰寰宇到物理寰宇的“全地方”AI发展路子,不外这个“全”带了引号,因为英伟达试图在每一个办法王人去突破既有玩法的极限。
就像黄仁勋在会后给与包括至顶科技在内的媒体采访时所说:“英伟达只作念两类事情:要么是别东谈主没在作念的,要么是咱们能作念得专有且更好的。”
是以从这个角度,再回看那场发布会,似乎是另外的基调,是以这篇著述特此梳理黄仁勋此次演讲背后的8个中枢重心。
图:出当今CES 2025舞台上的黄仁勋,此次穿了件闪亮亮的皮衣,他开打趣地对不雅众说谈:“毕竟我在拉斯维加斯”。
重心一:“AI改变了游戏章程,转变变了讨论的本色”,是以用BlackWell从头界说AI讨论的范围。
黄仁勋开篇纪念了英伟达的发展历程。
从1993年NV1运转,英伟达就立志,构建能完成平素讨论机无法完成任务的讨论机,其时英伟达的编程架构被称为UDA(Unified Device Architecture,联合开荒架构),跑在UDA的第一个应用递次,是世嘉的《杜撰战士》。
六年后的1999年,NVIDIA发明了可编程GPU;又过了六年后的2006年,英伟达发明了通用并行讨论架构CUDA(Compute Unified Device Architecture);再过了六年后的2012年,跟着“师生三东谈主组”Alex Krzyzewski、Ilya Suskevor和Jeffery Hinton应用GPU锤真金不怕火AlexNet,并赢得2012年ImageNet挑战赛,畏俱了讨论机视觉界,AI由此干预新阶段。(这几个6年历程,老铁见了王人得直呼666)
黄仁勋认为,AI发展有四个阶段:
1、感知AI(Perception AI),聚集图像、翰墨和声息,场景包括语音识别、推选系统、医学成像;
2、生成式AI(Generative AI),生成图像、文本和声息,场景包括数字营销、内容生成;
3、现阶段的Agenic AI,大致感知、推理、有筹画和行动,场景包括代码助理、客户就业、患者照看;
4、畴昔的物理AI(Physical AI),场景包括自动驾驶汽车、通用机器东谈主。
2018年是一个要道的节点,谷歌发布Transformer模子BERT,透澈改变了AI的口头。这里温馨插入一段解释,之是以说Transformer具有变革性,是因为它引入的注眼光机制,处置了长序列数据处理的穷苦,且允许并行讨论,突破了传统RNN和LSTM的串行死心,它让机器第一次简直学会了“看全局”。
若是说过去的AI是只可一个个字往下读,但会看了后边忘了前面的儿童,而Transformer即是一目十行,心有全篇的众人。这个突破不仅让AI更机灵,处理信息的速率也贼快。而且它犀利的地方是,不光能处理翰墨,连图片、声息这些王人能顶住。是以说,Transformer就像是AI寰宇的“基本法”,透澈改变了AI的发展办法。
黄仁勋现场说:“Transformer驱动的机器学习将从根底上改变每一个应用递次的构建式样、讨论式样、以及超越这些的可能性。”
顺着这句话,黄仁勋举了个“AI鼎新传统图形渲染”的例子。传统色泽跟踪,要对每个像素进行复杂讨论,讨论量巨大,但AI变革了这个经过——英伟达在游戏图形领域完成了两次根人性的鼎新:
第一次鼎新是引入可编程着色器和色泽跟踪技艺,这让显卡大致通过定制化的递次来处理像素,并模拟确实寰宇中的色泽行为,从而生成极具确实感的画面;第二次鼎新是DLSS(AI超分别率技艺,Deep Learning Super Sampling),它的中枢理念是让AI来赞成甚而部分取代传统的像素渲染,通过在英伟达超等讨论机上进行大范围锤真金不怕火,AI系统学会了聚集和预测像素的脸色值,使得GPU上的神经汇集大致“脑补”出未经履行渲染的像素内容。
最新一代DLSS 4的突破,被黄仁勋称之为“遗迹”,它不仅能在空间维度上补全像素,还能在时分维度上责任——通过预测畴昔画面,为每一帧额外生成三帧画面,就好比有3300万像素,而履行只需讨论200万像素,并让AI预测其余的3100万像素,既保证了渲染质地,又升迁了渲染恶果。在现场演示中,DLSS 4 以每秒247帧的速率渲染场景,比不使用AI快8倍以上,同期将蔓延保持在仅34毫秒。
顺着上述知识点,黄仁勋发布了此次的第一款GPU新品——RTX Blackwell系列。
RTX Blackwell 系列领有920亿个晶体管,AI算力最高达4000 TOPS(比上一代高出三倍),好意思光G7内存,带宽可达每秒 1.8 TB(是上一代性能的2倍)。现存的 RTX GPU 也将支援 DLSS 4。
该系列包括四种型号:
RTX 5070——售价549 好意思元,提供 RTX 4090 的性能。
RTX 5070 Ti——售价749 好意思元,提供与 4090 很是的性能,配备 1406 AI TOPS 和 16GB G7 内存。
RTX 5080——售价999 好意思元,配备 1800 AI TOPS 和 16GB G7 内存。
RTX 5090——售价1999 好意思元,配备 3404 AI TOPS 和 32GB G7 内存。
搭载 RTX Blackwell GPU 的条记本电脑,电板寿命延长 40%,性能提高一倍,功耗裁减一半,价钱从1299 好意思元到 2899 好意思元不等。其中,搭载RTX 5090、RTX 5080、RTX 5070 Ti的笔电将于3月上市,搭载RTX 5070笔电将于4月由OEM发售。
重心二:“Scaling Law依然见效,正鼓吹AI讨论需求的指数级增长”,是以用NVLink知足群众数据中心需求。
接着讲到AI发展,黄仁勋认为Scaling Law(范围定律)还充公尾——即数据越多、模子越大、讨论智商越强、模子就越灵验。之是以还充公尾,是因为互联网每年产生的数据量王人在翻倍,畴昔几年东谈主类产生的数据量将特出之前的总数,而且这些数据正变得多模态。
黄仁勋认为,范围定律非但充公尾,而且还发展出三种情景:预锤真金不怕火范围定律(Pre-Training Scaling)、后锤真金不怕火范围定律(Post-Training Scaling)、测试时分范围定律(Test-Time Scaling)。
其中:
「预锤真金不怕火范围定律」应用强化学习和东谈主工反馈等技艺,AI借助东谈主类反馈进行学习升迁,它不错针对特定领域微调,肖似学生凭证忠实携带改进功课,得当处置数学、推理问题。
「后锤真金不怕火范围定律」则肖似于自我进修,AI通过连接自主进修升迁智商,经过中虽消费无数算力,但能产生突破性模子。
「测试时分范围定律」是指AI运行时,不再只是改进参数,而是能动态掉配讨论资源,通过“分步推理”和“深入想考”找出最优处置决策。该定律已被证实极其灵验。
黄仁勋说,“范围定律鼓吹了对英伟达的讨论,很是是Blackwell芯片的巨大需求。”
图:Blackwell全系产物图
话音落下,黄仁勋搬出了一个由72块Blackwell GPU构成的NVLink72巨型“盾牌”模子,还摆了个pose,被网友簸弄“好意思国队长”。
不外黄仁勋手里的“盾牌”,只是NVLink72的减轻模子,简直的NVLink72重达1.5吨,领有60万个零件,很是于20辆汽车的复杂进度,系统里面有个肖似“脊椎”的结构,通过2英里的铜线与5000根电缆把所有的Blackwell联结在沿路。
黄仁勋先容了性能参数。一个NVLink72芯片的AI浮点运算性能是1.4 ExaFLOPS,比寰宇上最大、最快的超等讨论机还要大。其内存带宽达到 1.2 PB/s,很是于群众所有互联网流量的总数。这种超等讨论智商,使得 AI 大致处理更复杂的推理任务,同期权贵裁减老本,为更高效的讨论奠定了基础。
NVLink72的分娩和部署经过十分复杂。它在群众45个工场进行分娩,选定液冷技艺散热,经过严格测试后会被拆解成小部件,运输到群众的数据中心,之后再从头拼装起来——这种特殊的运输式样是因为整机太重太大。
黄仁勋解释了“为什么要建造这块短小精悍”,是因为Scaling Law要求越来越强劲的讨论智商。新一代Blackwell芯片与上一代比较,每瓦性能升迁了4倍,每好意思元性能提高了3倍。这个升迁带来两个要紧影响:
第一,从老本角度看,锤真金不怕火雷同范围的AI模子,老本不错裁减到正本的1/3;或者用疏通老本,不错锤真金不怕火范围大3倍的模子。
第二,从数据中心运营角度看,由于数据中心受限于供电智商,新芯片的能效升迁意味着,在疏通供电条目下,数据中心不错进行4倍于之前的AI运算,这胜仗飘摇为更高的营收智商。
黄仁勋强调,这种升迁相称要紧,因为畴昔险些所有应用王人会使用AI进行文本处理(tokens)。面前大模子的token生成速率为每秒20-30个,与东谈主类阅读速率很是。但在畴昔,GPT-o1/o2/o3、Gemini Pro等新模子大致进行自我对话、想考、反想,因此token的生成速率将大幅提高,而这些处理王人需要在数据中心进行,他将这些数据中心譬如为“AI工场”,而新一代芯片的能效升迁,本色上即是在提高这些“AI工场”的分娩恶果。
重心三:“Agenic AI是企业最要紧的变革之一”,是以英伟达要挟利诱。
黄仁勋形色了一个令东谈主昂然的AI畴昔图景——“Agenic AI将成为企业最要紧的变革之一。”这种变革不仅是技艺的跳动,更是责任式样的根底调遣。
在他的形色中,AI代理不再是毛糙的问答系统,而是一个复杂的智能汇集,它大致聚集用户需求,搜索信息、调用多样器用、并通过多个模子的协同责任,来匡助用户处置问题。
为了匡助企业和团合资伴竣事Agenic AI的畴昔图景,英伟达推出了三个要紧产物:
第一个是NVIDIA NIMS,这是一套打包好的AI微就业,包含CUDA DNN、Cutlass、Tensor RTLM、Triton等CUDA软件,以及一系列模子(涵盖语义聚集、数字东谈主、杜撰内容生成、数字生物等领域,并行将上线“物理AI”模子),浮浅开发者集成到自己软件中,不错在大部分云平台上运行。
第二个是NVIDIA NEMO,这是一个“数字职工”照料系统,负责锤真金不怕火AI智能体稳当企业特定需求、成立行为准则和权限、况且通过反馈束缚改进,就像是给AI代理作念“入职培训”。
第三是一整套AI Blueprints(AI蓝图),以便生态系统伙伴和开发者自主构建AI智能体,而且它绝对开源。黄仁勋先容了其中的一套模子——Llama Nemotron开源模子套件,这是一个企业级说话模子的“全家桶”,是英伟达针对Meta的Llama进行微调而成(黄仁勋解释说,是因为英伟达发现Llama 3.1还是成为一个时势级产物,它被下载65万次,繁衍出了6万个不同版块,是大部分企业研发AI的运转,而且不错它能被很好地微调)。
英伟达的Llama Nemotron包括三种规格:
Nano:极其工致、反馈快、最具老本效益的模子,针对PC和边际开荒所需的低时延模子进行了优化;
Super:在单个GPU上提供超卓蒙胧量的高精度模子;
Ultra:精度最高的模子,专为要求最高性能的数据中心范围应用而联想。
黄仁勋预测,畴昔企业的IT部门将调遣成AI智能体的HR部门,它们不再只是是贵重软件系统,而是要照料一支数字劳能源军队。群众有3000万递次员和10亿知识责任者将受益于这场变革,AI智能体将成为他们的牛逼助手。
这种AI智能体带来的变革,正在影响百行万企,黄仁勋在现场通过一支视频展示了5种AI代理的应用场景:
AI征询助手:在征询领域,AI智能体不错快速处理讲座、期刊、财报等复杂贵寓,生成易于聚集的内容;
天气预告系统:在繁盛预告中,AI智能体将预告精度从25公里升迁到2公里;
软件安全AI:在软件开发经过中,AI智能体不错自动扫描代码谬误并提议开荒建议;
杜撰实验室:在制药征询中,AI智能体不错匡助征询东谈主员快速筛选药物候选物,加快新药研发经过。
英伟达选定了一条专有的阛阓旅途。他们不胜仗面向企业用户,而是与生态系统的团合资伴沿路责任,就像当年扩充CUDA一样。生态系统中的团合资伴有CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases的器用,也有ServiceNow、SAP、西门子的工业平台,也有甲骨文、dataloop的数据平台等。英伟达正在将AI代理浸透到各个行业。
这个计策闪现了英伟达对畴昔AI的真切聚集:AI代理不仅是一个技艺产物,而是企业的“数字职工”,它们需要培训、照料和连接改进,就像照料东谈主类职工一样,这些AI代理可被锤真金不怕火为领域特定的任务众人。
通过这番演讲,黄仁勋展现了一个AI代理与东谈主类协同责任的畴昔。在这个畴昔中,企业将领有一支由东谈主类+AI代理构成的劳能源军队,该军队是鼓吹分娩力升迁的要紧力量,而英伟达正在通过完整的技艺决策和生态系统建设,来匡助企业竣事这个畴昔。
重心四:“将Windows PC调遣为AI超等讨论机”,是以英伟达发布了WSL2。
说结束Agenic AI的愿景之后,如何材干简直落地呢?黄仁勋的谜底是——土产货算力:
“天然云表讨论对AI 来说是圆善的选定,但AI的畴昔不应该仅限于云表,而是应该无处不在,很是是要干预咱们的个东谈主电脑。就像Windows 95鼎新了个东谈主讨论时期一样,畴昔的PC将草创新的讨论范式,让每个用户王人大致充分应用AI的力量来升迁工行恶果和创造力。”
从这个角度来看,黄仁勋先容了畴昔PC的见解:不再只是毛糙地领有3D、声息和视频API,而是要具备多样生成式API的智商(包括3D生成、说话生成、声息生成等),这意味着每台电脑王人将成为一个强劲的AI助手。
英伟达提供了一个处置决策:Windows WSL2(Windows Subsystem for Linux 2),这是一个Window系统内的双操作系统,为开发者提供胜仗拜谒硬件的智商,况且还是针对云原生应用和CUDA进行了优化,这使得包括NVIDIA NIMS、NVIDIA NEMO在内的所有AI器用王人能在Windows PC上运行。
通过WSL2,英伟达不错将其所有AI器用和就业带到个东谈主电脑上,包括多样模子。换句话说,这是一种讨论范式的调遣——每台个东谈主电脑王人将成为一个强劲的AI责任站。
重心五:“咱们要创造一个物理寰宇的AI模子”,是以英伟达发布Cosmos。
黄仁勋接下来的演讲内容,我认为是本场最要紧亦然英伟达接下来最要紧的计策布局,我合计不错聚集为“让AI化形”。
什么原理?若是说GPT等大说话模子让AI掌捏了“说”的智商,那么英伟达但愿创造一个能聚集物理寰宇的AI系统,赋予AI“作念”的智商,这预示着AI行将从杜撰寰宇走向现实寰宇的要紧一步。
接下来咱们就迟缓来讲讲。
黄仁勋最先说,当咱们使用ChatGPT这么的说话模子时,咱们输入一段提醒词,模子会分析这段翰墨中的每个词语(token)之间的干系,然后一个接一个地生成复兴的词语。这个经过看似毛糙,履行上模子里面特等十亿个参数在运作,每个词语王人要和凹凸文中的其他词语建立讨论,讨论它们之间的有关性。
然而,咱们生计的现实寰宇比文本复杂得多,AI需要聚集重力、摩擦力、惯性等物理法例,还要显着空间干系和因果干系。比如,当你把球推出去时,它会如何畅通;当你推倒一个物体时,会发生什么;物体从桌子上掉下去后,并不会祛除——这些在东谈主类看来很毛糙的学问,对AI来说王人是巨大的挑战。
为了达成这个极具挑战性的“让AI聚集物理寰宇”方针,于是英伟达发扬推出Cosmos——一个强劲的、能聚集物理寰宇的、群众基础模子。
Cosmos是如何责任的?就像婴儿通过不雅察、触摸、实验来意识这个物理寰宇,Cosmos通过看无数视频来学习物理寰宇的法例,就像是一个加快学习的婴儿。黄仁勋说,Cosmos还是学习了2000万小时的视频,内容包括:天然时势(水会若何流动)、物理法例(物体会如何碰撞)、东谈主类动作(东谈主是如何步辇儿和抓取物品的)等。这些王人成为它聚集物理寰宇的“教化”。
然而,Cosmos的作用远不啻于此。黄仁勋说,因为有Cosmos,咱们不错因此创造一个物理寰宇的基础模子,基于Autoregressive Model(自总结模子)、Diffusion Model(扩散模子)、Video Tokenizer(将视频内容编码为紧凑的潜在token)、Video Processing and Curation Pipeline(视频处理管谈)。
比如,它不错用来生成锤真金不怕火数据,匡助开发更智能的机器东谈主,被黄仁勋譬如成“机器东谈主的种子”;它能生成多种畴昔的物理场景,匡助AI作念出更好的决策,“就像是一个奇异博士”;它甚而不错为视频生成准确的形色,这些形色又不错用来锤真金不怕火说话模子。
最要紧的是,英伟达选定将Cosmos开源,就像Meta开源Llama一样。黄仁勋默示,但愿Cosmos能为机器东谈主和工业AI领域带来肖似Llama 3.1对企业AI的翻新性影响。
当今要道来了:当Cosmos与英伟达的杜撰现实仿真平台Omniverse结合时,这就像是给AI创造了一个“物理寰宇的实验场”,让它能在这里学习、实验和成长,它就能创造出基于确什物理法例的杜撰寰宇。
这里梳理一下黄仁勋的解释:Omniverse是一个基于物理法例运行的模拟器,而Cosmos则不错聚集为一个物理寰宇的AI生成系统。当这两个系统结合时,这就像是咱们在用大说话模子时,通过RAG(检索增强生成)系统来确保AI生成的内容是基于确实信息一样。在这里,Omniverse的物理模拟确保了Cosmos生成的内容得当现实寰宇的物理法例。
黄仁勋用了一个很好的类比:就像咱们需要让说话模子的输出建立在确实信息的基础上一样,咱们也需要让机器东谈主的行为建立在确什物理法例的基础上,这么的结合创造出了一个“基于物理法例的多元六合生成器”。
在履行应用中,这种结合很是得当机器东谈主和工业应用场景。正因为如斯,黄仁勋提议了一个“三个讨论机系统”见解:
第一个讨论机系统(DGX)是用来锤真金不怕火AI的。这就像是机器东谈主的“学校”,在这里进行基础的AI锤真金不怕火。
第二个讨论机系统(AGX)是部署在履行场景中的,比如安设在自动驾驶汽车里、机器东谈主身上或者畅通场馆中的讨论机。这些是在“前方”责任的讨论机,负责履行的自主操作。
第二个讨论机系统恰是Omniverse+Cosmos系统,它是一个数字孪生平台。这就像是机器东谈主的“杜撰锤真金不怕火场”。在这里,还是锤真金不怕火好的AI不错进行进修、完善,通过合成数据生成和强化学习,来升迁性能。这个系统将前两个系统联结起来,使它们大致协同责任。
为什么需要Cosmos+Omniverse?因为假定你在教一个孩子学物理,弗成能让孩子去作念所有危急的实验,比如从高处跳下来感受重力,或者去碰滚热的物体了解温度。而Omniverse就提供了一个“杜撰实验场”:比如不错无穷尝试多样动作,而无须顾忌损坏确实开荒;或者,快速模拟数千种不同的场景,而无须顾忌时分不够;或者测试多样极点情况,而无须承担履行风险。
这种组合的强劲之处还在于:一方面,就算AI出错,也不会形成履行亏蚀,不错立即重来。另一方面,Cosmos通过不雅察视频学习到的“教化”,不错在Omniverse中得到考证和完善。
黄仁勋很是强调了Omniverse+Cosmos系统在工业领域的要紧性:“群众制造业约莫有50万亿好意思元的范围,包括数以百万计的工场和数十万个仓库,这些设施王人需要向软件界说和自动化办法发展。不管是工场的自动化系统,照旧自动驾驶汽车,王人需要这么的系统,来保证其行为既得当AI的智能决策,又得当现实寰宇的物理法例。”
图:英伟达Omniverse的团合资伴生态系统
也因此,黄仁勋预测:工业分娩正在向数字化、智能化办法发展,数字孪生将成为畴昔每一个工场的标配,它就像工场的“杜撰分身”,大致绝对模拟确实工场的运作,通过Omniverse+Cosmos系统,不错模拟出多种畴昔可能的运营决策,然后让AI选定最优决策,这些决策会成为确实工场的运营携带。
重心六:“三个讨论机系统”表面构筑自动驾驶畴昔,是以英伟达带来了Thor。
接着,黄仁勋谈到了自动驾驶翻新,又秀出一张生态并吞图,展示了英伟达在自动驾驶领域的泛泛并吞,消散Waymo、特斯拉、捷豹路虎、飞驰、丰田,还有比亚迪、逸想、小鹏等浩荡中国车企。
黄仁勋提供了一组数据:群众每年分娩1亿辆汽车,谈路上有10亿辆车,每年行驶里程达到1万亿英里。他预测,“这些车辆畴昔王人将竣事高度自动化或绝对自动化驾驶,这代表自动驾驶很可能成为第一个万亿好意思元级别的机器东谈主产业。”面前,只是是极少运转量产的自动驾驶汽车,就还是为英伟达带来了40亿好意思元收入范围,展望本年将达到50亿好意思元。
针关于此,英伟达此次发布了新一代车载处理器Thor。
图:英伟达Thor
这款芯片的处明智商是上一代Orin的20倍。在安全方面,DRIVE OS取得了ASIL-D认证,这是汽车功能安全的最高模范,这背后凝合了约15000个工程年的戮力,使CUDA发展成为一个功能完备、安全可靠的自动驾驶讨论平台。
重心七:“通用机器东谈主的ChatGPT时刻驾临”,是以英伟达用ISAAC Groot从头界说机器东谈主开发。
谈到机器东谈主变革,黄仁勋说了一句金句:“通用机器东谈主的ChatGPT时刻驾临”,并指出了三种最有远景的机器东谈主类型,这三种机器东谈主的专有之处在于,它们不需要特殊的环境改革,不错胜仗在咱们现存的寰宇中使用:
1、通用型AI或AI代理:因为它们是信息责任者,独一能稳当咱们现存的办公环境和电脑系统,就不错责任。
2、自动驾驶汽车:因为东谈主类还是花了一百多年建设谈路和城市,这些基础设施还是完备。
3、东谈主形机器东谈主:不错胜仗稳当为东谈主类联想的所有环境和器用。
黄仁勋认为,若是这三种机器东谈主技艺取得突破,将创造东谈主类历史上最大的科技产业。
但他也指出了现时靠近的要道挑战,很是是在东谈主形机器东谈主的锤真金不怕火方面,与自动驾驶汽车不同(咱们每天王人在产生无数的驾驶数据),汇集东谈主类动作示范数据黑白常耗时忙绿的。
为了处置这个问题,英伟达提议了一个创新决策——ISAAC Groot平台,这是一个面向东谈主形机器东谈主开发的完整处置决策。
该平台的创新之处在于其专有的数据获取和锤真金不怕火方法:开发者不错使用Apple Vision Pro进行而已操作来拿获数据,通过极少东谈主类示范就能生成大范围锤真金不怕火数据,并应用Omniverse+Cosmos进行领域就地化和3D确实感放大,这是一种AI锤真金不怕火方法的创新。
这个技艺其实也揭示了机器东谈主领域的要害变革:咱们正在从专用机器东谈主向通用机器东谈主过渡,而这个调遣的要道在于如何高效地锤真金不怕火这些机器东谈主,通过AI和杜撰仿真技艺的结合,咱们不错大大加快这个经过。
重心八:“每个用讨论机的东谈主,王人需要AI超等讨论机”,是以英伟达用“DIGITS”开启个东谈主AI超算的新纪元。
算作压轴的重磅产物,黄仁勋先容了公司里面的一个样式“Project DIGITS”,展现了将企业级AI讨论智商带入个东谈主桌面的宏愿。
最先,黄仁勋解释了样式名字的由来。领先样式叫“DIGITS”(Deep Learning GPU Intelligence Training System,深度学习GPU智能锤真金不怕火系统),其后为了与公司其他产物线(如RTX、AGX等)保持一致,简化为DGX。
DGX-1的推出是一个翻新性的蜕变点。在此之前,若是想要使用超等讨论机,你需要建设有利的设施和基础设施,这对大多数机构来说王人是难以竣事的。而DGX-1改变了这一切,它是一台“开箱即用”的AI超等讨论机。黄仁勋还很是提到,2016年他们将第一台DGX-1请托给了OpenAI,其时包括马斯克、Ilya Sutskever在内的团队王人在场。
图:英伟达DGX-1
但当今情况不一样了,AI的应用还是不再局限于征询机构或创业公司。正如黄仁勋在演讲运转时提到的,AI讨论正成为新的讨论式样、新的软件开发式样,每个软件工程师、工程师、创意艺术家,履行上是每个用讨论机的东谈主,王人需要AI超等讨论机。
因此,英伟达但愿能作念出比DGX-1更小的开荒,于是发扬发布“Project DIGITS”:一个微型化的AI超等讨论机。
图:英伟达“Project DIGITS”
该产物基于英伟达的GB110芯片(最小的Grace Blackwell芯片),通过与MediaTek并吞开发CPU,并选定NVLink联结到Blackwell GPU,竣事了前所未有的性能突破。
图:英伟达“Project DIGITS”的里面结构
它的联想理念,是成为一个放在桌面上的云讨论平台,不管你的PC是什么系统王人能联结使用,也不错算作Linux责任站使用,支援ConnectX和GPU Direct等技艺,是一台袖珍版的超等讨论机。展望将在2025年5月上市。
换句话说,英伟达正在将高性能讨论从专科数据中心,带入平素用户的办公桌面,这种微型化、便携化的AI超等讨论机,可能会像个东谈主电脑翻新一样,让更多东谈主使用AI技艺进行创新和开发。