首页 > 电脑硬件 > 电脑硬件
发布日期:2025-03-19 09:24:32

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

黄老惊艳发布最强B300核弹,英伟达B200创历史推理世界新高

   皮衣老黄,带着最强AI芯片GB300闪亮登场“AI超级碗”GTC,燃爆全场!

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   性能方面,和去年发布的GB200相比,推理性能是其1.5倍。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   据悉,GB300将在今年的下半年出货。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   除此之外,老黄在近期的活动中展示了英伟达下一代AI超级芯片,并透露预计将在2026年下半年开始发货,这款芯片的名字也焕然一新,被命名为Vera Rubin。这个名字不仅体现了英伟达对科学探索的致敬,也传递出其在高性能计算领域的雄心壮志。从目前透露的信息来看,这款芯片无疑将成为AI领域的一个重要里程碑,为未来的智能化应用提供更强大的算力支持。不过,我们也必须关注到,在技术快速迭代的同时,如何平衡性能提升与能耗控制,将是整个行业需要共同面对的挑战。期待Vera Rubin真正落地后,能为我们带来更多惊喜和突破。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   其实它的命名规则和Grace Blackwell(GB)类似:Grace是CPU,Blackwell是GPU。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   而Vera Rubin中的Vera是CPU,Rubin是GPU。根据老黄的说法:

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   几乎所有细节都是新的。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   从预览的性能来看,Vera Rubin整体性能更是GB300的3.3倍。更具体一些:

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   Vera:CPU的内存是Grace的4.2倍,内存带宽是Grace的2.4倍。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   Rubin:将配备288GB的HBM4。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   在VeraRubin之后,英伟达计划于2027年下半年推出下一代GPU,并将其命名为RubinUltra,其性能将达到GB300的14倍。

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   一个直观的对比,如下图所示:

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   更多的具体性能对比,是这样的:

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   性能上的提升,也正应了老黄在现场说的那句话:

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   大规模推理是一种极限计算。Inference at-scale is extreme computing.

黄老发布全新B300核弹,英伟达B200成功突破DeepSeek-R1推理世界纪录

   不仅如此,黄仁勋再次展现了他在科技领域的前瞻性布局,连Rubin之后的下一代GPU都已经亮相,这款产品将以费曼(Feynman)的名字命名。这一命名不仅体现了英伟达对科学巨匠理查德·费曼的敬意,也预示着这款GPU将在计算性能和创新技术上达到新的高度。 在我看来,以费曼这样的名字命名新一代GPU,不仅仅是对科学家的纪念,更是英伟达对自己研发实力的一种自信表达。费曼在量子电动力学领域的贡献举世闻名,而英伟达希望通过这个名字传递出这款GPU将在高性能计算和复杂算法处理上的卓越能力。这不仅是对技术的追求,也是对未来应用场景的深刻洞察。黄仁勋又一次用实际行动证明了他“AI计算引擎缔造者”的称号实至名归。未来,这款GPU能否真正如预期般引领行业变革,值得我们拭目以待。

   在本次GTC大会上,老黄多次提到的几个核心关键词——tokens(标记)、推理以及Agentic AI,无疑成为关注焦点。这些词汇不仅体现了技术发展的新趋势,也折射出人工智能领域正在经历的重要变革。从tokens到推理能力的提升,再到赋予机器类似人类自主决策的Agentic AI概念,这一系列布局表明了英伟达对未来计算方向的战略思考。这种对前沿科技的持续探索,不仅是企业竞争力的体现,也为整个行业的创新发展注入了强大动力。 在我看来,老黄所强调的技术方向反映了当前AI行业从单一功能向更复杂应用场景迈进的趋势。特别是Agentic AI,它试图让机器具备主动性和目标导向性,这将极大拓展人工智能的应用边界。同时,这也意味着开发者需要重新定义人机交互的方式,并确保技术发展始终服务于社会需求。总体而言,GTC大会传递的信息让人充满期待,同时也提醒我们,在追求技术创新的同时,必须兼顾伦理与责任。

   但除此之外,还有一个比较有意思的关键词——DeepSeek。

   英伟达官方博客称:

   实现了DeepSeek-R1推理性能世界纪录。

   每位用户每秒能够处理超过250个token;系统可实现每秒超过30000个token的最大吞吐量。

   这项纪录基于B200平台达成,英伟达方面指出,随着Blackwell Ultra等新一代GPU的逐步推出,未来这项纪录有望再次被超越。 在我看来,这一情况充分体现了当前科技领域竞争的激烈程度以及技术迭代的速度之快。从B200到Blackwell Ultra,这不仅是硬件性能的提升,更是整个行业对更高目标不断追求的体现。对于消费者而言,这意味着我们能够享受到更加先进、高效的技术成果;而对于从业者来说,则需要在研发创新上持续投入,以跟上甚至引领这种快速变化的步伐。这也提醒我们,无论是企业还是个人,在面对日新月异的技术浪潮时,都必须保持敏锐的洞察力与灵活的应对能力。

   在演示传统大型语言模型与推理型大型语言模型的区别时,老黄同样以DeepSeek-R1为例进行了说明:

   嗯,微妙,着实有点微妙。

   那么除了一系列新GPU之外,还有什么?我们继续往下看。

   推出两款个人AI超级计算机

   首先,第一款个人AI超级计算机,叫做DGX Spark。

   它就是老黄在今年1月份CES中发布的那个全球最小的个人AI超级计算机Project Digits,这次取了个正式的名字。

   DGX Spark售价3000美元(约21685元),大小和Mac Mini相当。

   这款设备搭载了英伟达GB10芯片,具备每秒1000万亿次的AI运算能力,适用于微调和部署最新的AI模型。

   其中,GB10凭借先进的NVLink-C2C互连技术,实现了CPU与GPU之间的高效协同工作,构建了完整的相干内存模型。这一创新不仅大幅提升了数据处理效率,其带宽更是达到了第五代PCIe的五倍之多,展现了新一代计算架构的强大潜力。 在我看来,这项技术突破标志着计算领域进入了全新的时代。随着AI和高性能计算需求的不断增长,传统的数据传输方式已经难以满足现代应用的需求。NVLink-C2C的引入,不仅显著提升了系统性能,还为未来的异构计算提供了更多可能性。这不仅是硬件技术的一次飞跃,也为开发者和企业带来了更广阔的创新空间。希望未来能看到更多基于此类技术的优秀解决方案,推动整个行业的快速发展。

   值得一提的是,英伟达官网已经开发预定了哦~

   至于第二款个人AI超级电脑,则是DGX Station。

   DGX Station搭载了今日发布的GB300芯片,成为首款配备该芯片的AI计算机。

   其性能如下:

   拥有784GB的相干内存空间

   拥有英伟达的ConnectX-8超级网卡,支持高达800Gb/s的网络速度

   拥有Nvidia的CUDA-X AI平台,可访问NIM微服务和AI Enterprise

   用老黄的话来说就是:

   这就是PC应该有的样子。This is what a PC should look like.

   至于上市赶时间,则是将于今年晚些时候从华硕、BOXX、戴尔、惠普、Lambda和美超微等厂商处推出。

   △搭载GB300的DGX Station主板

   英伟达推出的这两款个人AI超级计算机,显然是为研究人员、数据科学家、AI开发者以及学生量身打造的。在我看来,这一举措不仅体现了英伟达对推动人工智能技术普及的决心,也为更多有志于投身AI领域的年轻人提供了强有力的工具支持。随着人工智能在各行各业的应用越来越广泛,这类设备的推出无疑将进一步降低开发门槛,让更多人能够参与到这场技术革命中来。这不仅是技术上的突破,更是对未来人才培养的一种投资。希望未来能有更多类似的创新产品问世,助力全球AI生态系统的繁荣发展。

   除此之外,在本届GTC大会上,老黄将业务扩展至以太网领域,发布了全球首款专为AI优化的以太网网络平台——Spectrum-X。

   它由英伟达的Spectrum-4以太网交换机和BlueField-3 SuperNIC共同发力,能为AI、机器学习和自然语言处理等提供高性能支持。

   与传统以太网相比,Spectrum-X能够将AI网络性能提升1.6倍,并增强AI云的电力使用效率。

   同时,还有基于硅光技术的Spectrum-XPhotonics和Quantum-XPhotonics网络交换平台,旨在利用硅光技术构建超大规模的数据中心。

   新一代网络交换平台将端口的数据传输速率提升至1.6Tb/s,整体传输能力达到400Tb/s,从而让数百万颗GPU可以实现高效协作与运行。

   还开源了一系列软件

   除了硬件,英伟达这次在软件开源方面也有几个新动作。

   其中最重磅的,当属发布NVIDIA Dyamo,一个用于加速AI模型推理的分布式推理服务库。

   老黄把这套系统称作“AI工厂的操作系统”,其主要目的在于提升推理效率的同时减少测试阶段的算力消耗。

   根据英伟达的介绍,在NVIDIA Blackwell平台上借助Dynamo进行推理优化,可使DeepSeek-R1的吞吐量提高30倍。

   Dynamo的独特优势在于其能够根据实时请求的变化动态调配GPU资源,这种灵活性不仅有效应对了流量高峰,还通过智能地将数据迁移至成本更为低廉的存储设备,实现了推理成本的有效控制与整体效率的显著提升。 在我看来,Dynamo的这一策略展现了云计算领域内一种前瞻性的技术思维。在当前数据量激增、应用场景日益复杂的背景下,这种既能保证性能又能兼顾经济性的解决方案显得尤为珍贵。它不仅为用户带来了更优质的体验,也为行业树立了一个可持续发展的典范。未来,随着更多企业采用类似的技术手段,相信整个行业的运营模式都将迎来更加深远的变革。

   目前Dynamo已全面开源,兼容PyTorch、SGLang、NVIDIATensorRT以及vLLM。在GitHub上获取相关资源后,用户可将推理任务分配至多达1000块NVIDIAGPU芯片进行处理。

   此外,英伟达在近日宣布开源一款全新的AI推理模型——LlamaNemotron,这款模型此前曾在今年1月的CES展会上亮相。

   据介绍,Llama Nemotron基于开源Llama基础模型构建,采用英伟达最新技术和高质量数据集进行剪枝和训练,优化了计算效率和准确性。

   为了直观展示其性能,老黄在大会上将它和Llama 3.3(70B)以及DeepSeek R1 Llama (70B)进行了对比,下图展示了它们在Agentic任务上的平均准确率(横轴)与每秒处理的tokens数量(纵轴):

   可以看出,最新推出的推理模型凭借490亿参数量,在Agentic任务上的表现显著优于其他两个模型,尤其展现出卓越的能力。

   目前Nano和Super模型可在NIM微服务中获取,Ultra模型即将推出。

   与此同时,英伟达在自动驾驶和具身智能方面也有新进展。

   大会刚刚拉开帷幕,老黄便透露英伟达已与通用汽车建立合作伙伴关系:

   通用将在自动驾驶上使用英伟达的AI技术。

   在这之后,英伟达正式推出了面向自动驾驶汽车的全栈综合安全解决方案——NVIDIA Halos。

   这个系统致力于整合NVIDIA领先的汽车硬件与软件平台,同时深度融合前沿AI研究成果,从而为自动驾驶汽车从概念设计到实际落地的全过程提供安全保障。这一创新举措不仅加速了自动驾驶技术的迭代速度,还进一步提升了整个行业的安全标准。 在我看来,这种结合不仅是技术上的突破,更是对未来出行方式的一次深刻重塑。通过将复杂的AI算法与高性能计算硬件无缝对接,该系统为解决自动驾驶领域的核心挑战提供了全新思路。尤其是在面对复杂路况时,如何让机器具备人类驾驶员般的判断力和反应能力,这正是此类技术努力的方向。随着越来越多的企业加入这场变革浪潮,我们有理由相信,在不久的将来,自动驾驶将不再是科幻电影中的场景,而会成为日常生活中触手可及的一部分。

   介绍过程中,老黄多次提到了“安全性”这个词,并公开声称:

   我们是全球首家对每行代码实施安全审查的公司。

   Halos系统在实际应用中聚焦于三个相辅相成的层面为用户带来帮助。这一系统不仅在技术层面实现了创新突破,更在用户体验与服务效率上展现出显著优势。在我看来,Halos系统的核心价值在于它能够精准对接不同用户的需求,通过多层次的服务架构,有效提升了信息处理的智能化水平。尤其是在当前信息化快速发展的背景下,Halos系统的存在无疑为行业树立了新的标杆,其未来潜力值得期待。

   技术层面:包括平台安全、算法安全和生态系统安全;

   开发层面:在当今信息化社会,网络安全已成为全球关注的重大议题。设计阶段的安全防护措施至关重要,这包括从系统开发之初就嵌入安全理念,确保每一行代码都经过严格审查,避免潜在漏洞的产生。部署阶段同样不可忽视,此时需要对系统的安全性进行全面测试与评估,例如模拟攻击场景以检验防御机制的有效性,并及时修补发现的问题。 验证阶段则是对整个安全体系的一次全面体检,通过真实环境下的压力测试来确认各项防护措施是否到位。此外,定期更新软件版本、加强员工安全意识培训也是不可或缺的一部分。这些措施共同构建起一道坚实的防线,保护着个人隐私及企业核心资产免受侵害。 在我看来,随着技术的进步,网络安全形势日益严峻,我们必须始终保持警惕,不断优化和完善现有的安全策略。同时,政府、企业和公众三方需携手合作,形成合力,才能有效应对各种新型网络威胁。只有这样,我们才能真正实现数字世界的长治久安。

   计算层面:从AI模型的开发到实际应用的落地,借助三大核心计算平台实现全流程支持,分别是NVIDIA DGX负责AI训练任务,NVIDIA Omniverse结合NVIDIA Cosmos在NVIDIA OVX平台上运行以支撑复杂模拟场景,以及NVIDIA DRIVE AGX用于最终的产品部署。

   到了大会的最后阶段,老黄宣布英伟达与Google DeepMind和Disney Research正合作开发下一代开源仿真物理模型Newton。

   据英伟达介绍,Newton基于NVIDIA Warp构建,支持与MuJoCo Playground或NVIDIA Isaac Lab等学习框架兼容。

   它主要服务于机器人模拟训练,能够助力研究人员在确保安全的前提下,以更快速度和更低开销来训练、开发、测试以及验证机器人控制算法与原型设计。

   同时,英伟达最新发布的Isaac GR00T N1被称作全球首款开源且完全可定制的人形机器人基础模型,这一突破性进展无疑为机器人技术领域注入了新的活力。在当前人工智能与机器人技术快速发展的背景下,这款基础模型的推出恰逢其时,它不仅能够大幅降低开发者进入人形机器人领域的门槛,还可能推动更多创新应用的诞生。 从我个人角度来看,Isaac GR00T N1的意义不仅仅在于技术层面的革新,更在于它所代表的一种开放合作的态度。通过提供开源工具和模块化设计,英伟达正在鼓励全球范围内的开发者共同参与和完善这个平台,这种做法有助于加速整个行业的进步。同时,完全可定制化的特性也让这款产品具备了极高的灵活性,可以满足不同场景下的需求,无论是工业生产还是日常生活服务,都有望因此受益。 不过,值得注意的是,在享受技术红利的同时,我们也需要关注随之而来的伦理和社会问题。例如,随着人形机器人的普及,隐私保护、就业影响以及社会公平等问题都需要提前做好规划和应对策略。总之,Isaac GR00T N1的发布是一次重要的里程碑事件,我们期待看到它在未来如何进一步促进人形机器人技术的发展,并帮助人类构建更加智能化的生活方式。

   它采用双系统架构,灵感来自人类思考模式,包括快速思考的动作模型(System 1)和慢速思考的决策模型(System 2)。

   在大型展示活动中,GR00TN1展现出强大的通用能力,可以流畅完成抓取物体、搬运物品以及在双臂间传递物件等常见操作,同时也能够应对需要深度推理的复杂任务。

   最后的最后,在老黄的谢幕环节中,他依然成功“唤醒”了一个搭载GR00TN1模型的机器人——Blue(星球大战中的机器人)。

   尽管在过程中有一些不配合的“任性表现”,但好在最终还是给了一些面子(doge)。

   One More Thing

   今年的GTC大会,除了老黄的主题演讲,另一大亮点同样令人期待。

   2025年首次推出的“量子日”活动即将举办,老黄将与D-Wave Quantum和Rigetti Computing等多家量子计算领域的领先企业高管齐聚一堂,共同探讨量子计算的技术现状、未来发展潜力以及前行方向。

   年初时,老黄那句“量子计算还需20年才实用”的言论一出,相关概念股便迅速下跌,引发市场广泛关注。这一现象再次凸显了资本市场对前沿科技的敏感度与波动性。量子计算作为未来技术的重要方向,其发展路径充满挑战,但同时也蕴藏着巨大的潜力。尽管老黄的判断或许会让部分投资者感到失望,但从长远来看,这并不妨碍整个行业的稳步前行。毕竟,任何颠覆性的技术创新都需要时间积累与实践验证。对于企业而言,在追逐热点的同时更需保持理性,注重技术研发的实际进展与市场需求的结合。而对普通投资者来说,则需要具备足够的耐心和辨别能力,避免因短期波动而失去对未来的信心。从目前的情况看,2025年的科技版图正展现出更多元化的可能性,让我们拭目以待。

   因此,众人这次都在关注,老黄是否会再次“语出惊人”,进而引发外界对量子计算产业发展方向的进一步讨论。

   咱们继续坐等答案揭晓~

   老黄演讲回看地址:https://www.youtube.com/watch?v=_waPvOwL9Z8

电脑硬件最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有