GTC2025 小结

在上周举行的第18届年度GTC大会上,英伟达公司不出所料地试图让观众为即将到来的未来感到兴奋——显然,这个未来就是人工智能的快速演进。

英伟达联合创始人兼首席执行官黄仁勋再次以他标志性的主题演讲者身份登场。一如往常,他身着全黑装束,包括一件皮夹克。周二当天,黄仁勋在没有讲稿的情况下,对即将推出的产品进行了持续超过两小时的介绍。

这一切都关乎人工智能

人工智能正迅速渗透到各行各业。企业投入资金和精力,通过应用AI向客户、合作伙伴和股东展示其创新能力。这场AI浪潮的成功依赖于快速、可靠且创新的技术。因此,英伟达的聚焦方向不难理解。鉴于今年1月中国同名AI公司推出的DeepSeek-R1 LLM引发的震撼,黄仁勋迫不及待地展示了英伟达及其日益强大(但昂贵的)图形处理单元、芯片系统和AI产品的全部潜力。

以他惯常的快节奏演讲风格,黄仁勋概述了行业趋势,并重点介绍了英伟达近期及未来即将推出的多项创新。以下是部分关键公告:

  • 用于构建和部署AI模型的新芯片 Blackwell Ultra系列芯片预计将于今年内出货,而以发现暗物质的天文学家维拉·鲁宾命名的下一代GPU——Vera Rubin,计划于明年推出。黄仁勋表示,英伟达后续的芯片架构将命名为物理学家理查德·费曼,并预计于2028年出货。英伟达保持着定期推出“下一代GPU”的节奏,这对超大规模云计算企业而言是好消息。但随着AI应用范围扩展至更多企业,能否跟上英伟达的步伐将是一大挑战。我曾与许多首席信息官交流,他们对何时启动AI项目感到犹豫——因为模型和基础设施的迭代速度前所未有的快。是现在行动以抢占先机,还是等待六个月以获取指数级收益?这确实是个难题。但我的建议是立即行动,因为等待会让企业进一步落后。不过作为前CIO,我理解当下投入可能面临一年后技术过时的风险。 据传闻,GB300 AI服务器将配备高达1400W的TDP,相比Blackwell GB200的1000W TDP有显著提升。通过架构改进,预计FP4性能将比上一代提高约1.4倍。此外,内存容量将从192 GB增加到288 GB,通过12-Hi HBM3E堆叠实现。
  • Nvidia Dynamo 被黄仁勋称为“AI工厂的操作系统”,Dynamo是专为大规模推理模型服务的AI推理软件。这款完全开源的“极其复杂”软件专为推理加速和数据中心级推理设计。“应用并非传统企业IT,而是智能体(agents)。操作系统也不是类似VMware的东西,而是像Dynamo这样的系统。它运行的并非数据中心,而是整个AI工厂。”Dynamo是英伟达“全栈式”AI战略的典范。尽管其他公司也生产优秀的GPU,但英伟达脱颖而出的关键在于对软件等栈层的专注。
  • DGX Spark和DGX Station DGX Spark号称全球最小的AI超级计算机,而黄仁勋称DGX Station为“AI时代的计算机”,它将为桌面端AI开发带来数据中心级性能。两者均基于Blackwell芯片运行。DGX Spark的预订已于3月18日开放,而DGX Station预计将于今年通过英伟达制造合作伙伴(如华硕、BOXX、戴尔、惠普、Lambda和超微)推出。需注意,DGX Spark并非面向游戏玩家,而是AI从业者。通常这类用户会使用价格约10万美元的DGX Station作为桌面设备,而DGX Spark起价3,999美元,为重度AI工作者提供了更实惠的选择。
  • 机器人领域的进展 在即将到来的物理AI浪潮中,黄仁勋宣布与谷歌DeepMind和迪士尼研究院合作。合作伙伴将共同开发“针对精细刚体和软体机器人的物理引擎,用于训练触觉反馈、精细运动技能和执行器控制”。黄仁勋强调,该引擎必须GPU加速,以实现在超实时虚拟环境中快速训练AI模型。“它还需无缝集成到全球机器人学家使用的框架中。”一只名为Blue的《星球大战》风格步行机器人(内置两台英伟达计算机)登台亮相,预演了未来图景。他还透露,英伟达Isaac GROOT N1人形机器人基础模型现已开源。工作场所的机器人(即“协作机器人”)即将登场,将承担人类当前从事的危险或重复性任务。从技术角度看,许多机器人将通过5G连接,为移动运营商利用AI浪潮提供了良机。社会影响值得关注。尽管人们对AI的恐惧多源于其取代人力的潜力,但黄仁勋在演讲中预测:“到本世纪末,全球劳动力缺口将至少达5000万。”这一观点与传统认知相悖。若机器人能承担更多危险或单调工作,我们真的会面临5000万人的缺口吗?难以预测,但机器人确将随时填补缺口。
  • 自动驾驶 黄仁勋宣布与通用汽车合作开发其未来的自动驾驶车队。“自动驾驶的时代已然到来,我们期待与通用汽车在三大领域推进AI——制造领域的AI将革新其生产方式,”他说,“企业级AI将重塑汽车设计与模拟,车内AI则将重新定义驾乘体验。”他还推出了Nvidia Halos,一款从芯片到部署的自动驾驶安全系统。他强调,英伟达是全球首家对其全部代码(700万行)进行安全评估的公司。“我们的芯片、系统、系统软件和算法均通过第三方审查,确保其设计具备多样性、透明度和可解释性。”CES展上自动驾驶创新随处可见。回溯十年前,许多行业观察者预测我们如今已拥有完全自动驾驶汽车,但现实仍寥寥无几。车载AI虽已显著进步且更安全,但全面自动驾驶的门槛远高于预期。不过,我认为我们已近在咫尺。
  • 量子日:有趣但未解关键问题 GTC周四首次举办了量子日,黄仁勋与18家量子公司的高管进行了三场圆桌讨论。活动虽引人入胜,介绍了D-Wave、IonQ和Alice & Bob等公司,但未解答两个核心问题:量子计算的用例是什么?何时才能实现?会上,黄仁勋宣布英伟达计划开设量子研究设施,预计2025年晚些时候开放,并暗示2026年量子日将展示更多用例。与行业同仁交流时,我听到的预测时间跨度从5年到30年不等。我认为更接近5年,因为一旦出现实际用例,将形成“示范效应”,推动发展如AI浪潮般加速。

2025年GTC已成过去,虽然没有“颠覆性”公告,但AI在各领域的稳步推进昭示着其将如互联网般普及。此次大会更侧重让企业消化如何应用AI,而非追逐下一个“大事件”。AI的广度与深度表明其正在普及化,这将推动更广泛采用——这对英伟达有利,也惠及整个AI生态系统的庞大企业群。

原文标题:Nvidia presents AI-centric future at GTC conference[1]

  1. / ↩
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-25,如有侵权请联系 cloudcommunity@tencent 删除自动驾驶企业机器人模型芯片