英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

1,435次阅读
没有评论

梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

整个AI圈最想知道的秘密,被老黄在PPT某页的小字里写出来了?

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

时隔两年,英伟达官宣新一代Blackwell架构为AI带来30倍推理加速定位直指“新工业革命的引擎” 。

老黄PPT中拿了一个1.8万亿参数MoE的GPT系列大模型测试结果来证明。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

眼尖的网友当场就盯上了这行不起眼的小字,截图发出神秘暗号。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

1.8万亿参数、MoE架构,与初代GPT-4的细节传闻一毛一样,32k序列长度也能对得上。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

刚升任研究经理不久的英伟达科学家Jim Fan,甚至直接摊牌了。

表达摩尔定律已经限制不住英伟达了的同时,直接点破了这层窗户纸。‍‍‍‍‍

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

不过个秘密之所以能以这种形式半官方确认,很可能说明对OpenAI来说已经无关紧要了。

很多人相信,最新版gpt-4-turbo经过一轮轮的优化,已经蒸馏到更小规模。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

说回到英伟达GTC大会本身,作为架构更新的大年,老黄的主题演讲亮点颇多:

  • 宣布GPU新核弹B200,超级芯片GB200

  • Blackwell架构新服务器,一个机柜顶一个超算

  • 推出AI推理微服务NIM,要做世界AI的入口

  • 新光刻技术cuLitho进驻台积电,改进产能。
    ……

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

8年时间,AI算力已增长1000倍。

老黄断言“加速计算到达了临界点,通用计算已经过时了”。

我们需要另一种方式来进行计算,这样我们才能够继续扩展,这样我们才能够继续降低计算成本,这样我们才能够继续进行越来越多的计算。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

老黄这次主题演讲题目为《见证AI的变革时刻》,但不得不说,英伟达才是最大的变革本革。

GPU的形态已彻底改变

我们需要更大的GPU,如果不能更大,就把更多GPU组合在一起,变成更大的虚拟GPU。

Blackwell新架构硬件产品线都围绕这一句话展开。

通过芯片,与芯片间的连接技术,一步步构建出大型AI超算集群。

4nm制程达到瓶颈,就把两个芯片合在一起,以10TB每秒的满血带宽互联,组成B200 GPU,总计包含2080亿晶体管。

内存也直接翻倍,高达192GB的HBM3e高速内存。

没错,B100型号被跳过了,直接发布的新架构首个GPU就是B200。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

两个B200 GPU与Grace CPU结合就成为GB200超级芯片,通过900GB/s的超低功耗NVLink芯片间互连技术连接在一起。

两个超级芯片装到主板上,成为一个Blackwell计算节点。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

18个这样的计算节点共有36CPU+72GPU,组成更大的“虚拟GPU”。

它们之间由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum™-X800以太网平台连接,可提供速度高达800Gb/s的网络。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

在NVLink Switch支持下,最终成为“新一代计算单元”GB200 NVL72

一个像这样的“计算单元”机柜,FP8精度的训练算力就高达720PFlops,直逼H100时代一个DGX SuperPod超级计算机集群(1000 PFlops)

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

与相同数量的72个H100相比,GB200 NVL72对于大模型推理性能提升高达30倍成本和能耗降低高达25倍

把GB200 NVL72当做单个GPU使用,具有1.4EFlops的AI推理算力和30TB高速内存。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

再用Quantum InfiniBand交换机连接,配合散热系统组成新一代DGX SuperPod集群。

DGX GB200 SuperPod采用新型高效液冷机架规模架构,标准配置可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。

此外还支持增加额外的机架扩展性能。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

最终成为包含32000 GPU的分布式超算集群。

老黄直言,“英伟达DGX AI超级计算机,就是AI工业革命的工厂”。

将提供无与伦比的规模、可靠性,具有智能管理和全栈弹性,以确保不断的使用。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

在演讲中,老黄还特别提到2016年赠送OpenAI的DGX-1,那也是史上第一次8块GPU连在一起组成一个超级计算机,当时只有0.17 PFlops。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

从此之后便开启了训练最大模型所需算力每6个月翻一倍的增长之路。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

GPU新核弹GB200

过去,在90天内训练一个1.8万亿参数的MoE架构GPT模型,需要8000个Hopper架构GPU,15兆瓦功率。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

如今,同样给90天时间,在Blackwell架构下只需要2000个GPU,以及1/4的能源消耗。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

在标准的1750亿参数GPT-3基准测试中,GB200的性能是H100的7倍,提供的训练算力是H100的4倍。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

Blackwell架构除了芯片本身外,还包含多项重大革新:

  • 第二代Transformer引擎

动态为神经网络中的每个神经元启用FP6和FP4精度支持。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

  • 第五代NVLink高速互联

为每个GPU 提供了1.8TB/s双向吞吐量,确保多达576个GPU之间的无缝高速通信。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

  • Ras Engine(可靠性、可用性和可维护性引擎)

基于AI的预防性维护来运行诊断和预测可靠性问题。

  • Secure AI

先进的加密计算功能,在不影响性能的情况下保护AI模型和客户数据,对于医疗保健和金融服务等隐私敏感行业至关重要。

  • 专用解压缩引擎

支持最新格式,加速数据库查询,以提供数据分析和数据科学的最高性能。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

在这些技术加持下,一个GB200 NVL72就最高支持27万亿参数的模型

假如初代GPT-4真是1.8万亿参数,一台GB200 NVL72就能跑15个GPT-4。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

英伟达要做世界AI的入口

老黄官宣ai.nvidia.com页面,要做世界AI的入口。

任何人都可以通过易于使用的用户界面体验各种AI模型和应用。

同时,企业使用这些服务在自己的平台上创建和部署自定义应用,同时保留对其知识产权的完全所有权和控制权。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

这上面的应用都由英伟达全新推出的AI推理微服务NIM支持,可对来自英伟达及合作伙伴的数十个AI模型进行优化推理。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

此外,英伟达自己的开发套件、软件库和工具包都可以作为NVIDIA CUDA-X™微服务访问,用于检索增强生成 (RAG)、护栏、数据处理、HPC 等。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

比如通过这些微服务,可以轻松构建基于大模型和向量数据库的ChatPDF产品,甚至智能体Agent应用。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密
英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

NIM微服务定价非常直观,“一个GPU一小时一美元”,或年付打五折,一个GPU一年4500美元。

从此,英伟达NIM和CUDA做为中间枢纽,连接了百万开发者与上亿GPU芯片。

什么概念?

老黄晒出AI界“最强朋友圈”,包括亚马逊、迪士尼、三星等大型企业,都已成为英伟达合作伙伴。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

最后总结一下,与往年相比英伟达2024年战略更聚焦AI,而且产品更有针对性。

比如第五代NVLink还特意为MoE架构大模型优化通讯瓶颈。

新的芯片和软件服务,都在不断的强调推理算力,要进一步打开AI应用部署市场。

当然作为算力之王,AI并不是英伟达的全部。

这次大会上,还特别宣布了与苹果在Vision Pro方面的合作,让开发者在工业元宇宙里搞空间计算。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

此前推出的新光刻技术cuLitho软件库也有了新进展,被台积电和新思科技采用,把触手伸向更上游的芯片制造商。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

当然也少不了生物医疗、工业元宇宙、机器人汽车的新成果。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

以及布局下一轮计算变革的前沿领域,英伟达推出云量子计算机模拟微服务,让全球科学家都能充分利用量子计算的力量,将自己的想法变成现。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

One More Thing

去年GTC大会上,老黄与OpenAI首席科学家Ilya Sutskever的炉边对谈,仍为人津津乐道。

当时世界还没完全从ChatGPT的震撼中清醒过来,OpenAI是整个行业绝对的主角。

如今Ilya不知踪影,OpenAI的市场统治力也开始松动。在这个节骨眼上,有资格与老黄对谈的人换成了8位——

Transformer八子,开山论文《Attention is all you need》的八位作者。

他们已经悉数离开谷歌,其中一位加入OpenAI,另外7位投身AI创业,有模型层也有应用层,有toB也有toC。

这八位传奇人物既象征着大模型技术真正的起源,又代表着现在百花齐放的AI产业图景。在这样的格局中,OpenAI不过是其中一位玩家。

而就在两天后,老黄将把他们聚齐,在自己的主场。

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

要论在整个AI界的影响力、号召力,在这一刻,无论是“钢铁侠”马斯克还是“奥特曼”Sam Altman,恐怕都比不过眼前这位“皮衣客”黄仁勋。

……

最后,再来欣赏一段英伟达为Blackwell架构制作的精彩动画短片。

直播回放:
https://www.youtube.com/watch?v=Y2F8yisiS6E

报名中!

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项,欢迎报名评选

评选报名截至2024年3月31日 英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

中国AIGC产业峰会同步火热筹备中,了解更多请戳:Sora时代,我们该如何关注新应用?一切尽在中国AIGC产业峰会

商务合作请联络微信:18600164356 徐峰

活动合作请联络微信:18801103170 王琳玉

点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 3 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...