在刚过去不久的 Microsoft Ignite 2023 大会上◈ღ✿✿,微软一口气扔出了多颗「炸弹」◈ღ✿✿。
毫不夸张地说◈ღ✿✿,这场大会让微软再一次登上了神坛◈ღ✿✿。毕竟在过去几个月间◈ღ✿✿,OpenAI 推出了一系列的更新和计划◈ღ✿✿,重新抓住了全世界的目光◈ღ✿✿。
但如果说生成式 AI◈ღ✿✿,甚至 AI 的未来就集中在了微软和 OpenAI 两家公司上◈ღ✿✿,英伟达的可能是第一个不服的◈ღ✿✿。就在Ignite 大会上◈ღ✿✿,微软 CEO 纳德拉邀请英伟达创始人兼 CEO 黄仁勋上台◈ღ✿✿,并问了一个问题◈ღ✿✿:
老黄表示用你的指尖扰乱我吧2用你的指尖扰乱我吧2◈ღ✿✿,生成式 AI 是过去 40 多年计算历史中最重要的一次范式转换优发国际网官网在线◈ღ✿✿,比 PC◈ღ✿✿、移动设备乃至互联网都要来得更大◈ღ✿✿。以 OpenAI GPT 引发的大模型「爆发」可以视为生成式 AI 的第一波浪潮◈ღ✿✿;第二波则是微软当下正在实践的 Copilot 模式优发国际网官网在线◈ღ✿✿。
而第三波也是最大的一波◈ღ✿✿,将是英伟达的 Omniverse 与生成式 AI 相结合帮助重工业实现数字化◈ღ✿✿,「世界上绝大多数工业都依赖于重工业◈ღ✿✿,」老黄解释◈ღ✿✿。
今年 8 月的图形技术顶会 SIGGRAPH 上◈ღ✿✿,英伟达就大谈特谈生成式 AI 与 Omniverse 的结合◈ღ✿✿,并展示了一个「从 PDF 到工厂」的 demo◈ღ✿✿。简单来讲◈ღ✿✿,英伟达把「建工厂」——一个复杂的工程「搬到」了数字世界◈ღ✿✿,利用生成式 AI 与图形技术将 2D 平面图转为 3D 模型用你的指尖扰乱我吧2◈ღ✿✿,再加入光照◈ღ✿✿、纹理以及大量的信息优发国际网官网在线◈ღ✿✿,最终打造出工厂的「数字孪生」版本◈ღ✿✿。
而另一方面◈ღ✿✿,尽管微软新发布的自研 AI 芯片表现出了不俗的竞争力优发国际随优而动一触即发◈ღ✿✿,再加上 AMD 带来的威胁◈ღ✿✿,让不少人和公司看到了打破英伟达算力霸权的希望◈ღ✿✿。但事实上◈ღ✿✿,英伟达 GPU 依然占据很大的优势◈ღ✿✿,不管是去年发布 H100◈ღ✿✿,还是前几天刚推出的 H200◈ღ✿✿。
微软发布自研 AI 芯片 Maia 100◈ღ✿✿,估计没有人会感到意外◈ღ✿✿。一是早前就有消息透露了这一点◈ღ✿✿,二是地球上最大的几家云计算公司——谷歌◈ღ✿✿、亚马逊都已经推出了自研 AI 芯片◈ღ✿✿。当然◈ღ✿✿,另一个直接因素还出在英伟达身上◈ღ✿✿。
众所周知◈ღ✿✿,英伟达 GPU 在事实上成为了大模型「硬件标准」◈ღ✿✿,H100 成为了所有科技巨头都在囤积的战略资源优发国际网官网在线◈ღ✿✿,即便是远在 2020 年发布的 A100 依然能够引发「哄抢」◈ღ✿✿。但一方面受限于产能◈ღ✿✿,英伟达 GPU 始终供不应求◈ღ✿✿;另一方面用你的指尖扰乱我吧2◈ღ✿✿,英伟达 GPU 巨额的利润与大模型的烧钱战争◈ღ✿✿,也引发了「只有英伟达在赚钱」的广泛讨论◈ღ✿✿。
问题是◈ღ✿✿,科技巨头没能在英伟达之外找到太好的选择◈ღ✿✿,自研 AI 芯片反而可能是更好的选择◈ღ✿✿。但以微软的 Maia 100 为例◈ღ✿✿,自研 AI 芯片能够替代英伟达 GPU 了吗?
按照纳德拉的说法用你的指尖扰乱我吧2◈ღ✿✿,微软的自研 AI 芯片 Maia 100 基于英伟达 H100 同版本的台积电 5nm 工艺打造优发国际网官网在线◈ღ✿✿,晶体管数量达到了惊人的 1050 亿个◈ღ✿✿。从公开数据来看优发国际网官网在线◈ღ✿✿,这颗芯片也是迄今为止最大的 AI 芯片◈ღ✿✿。
如果单从数字来看◈ღ✿✿,Maia 100 的算力完全碾压了谷歌的 TPUv5 以及亚马逊的 Trainium/Inferentia2 芯片◈ღ✿✿,就算与英伟达 H100 相比◈ღ✿✿,差距也不大了◈ღ✿✿。
但需要指出的是◈ღ✿✿,MXInt8◈ღ✿✿、MXFP4 都是最新的数据格式◈ღ✿✿,MXInt8 预期将替代 FP16/BF16◈ღ✿✿,MXFP4 预期将替代 FP8◈ღ✿✿。然而实际上◈ღ✿✿,还没有任何公司基于这些新的数据格式训练过大模型◈ღ✿✿,所以至少在训练环节上◈ღ✿✿,Maia 100 的算力其实并不适合与其他 GPU 或者 AI 芯片进行直接比较◈ღ✿✿。
事实上◈ღ✿✿,微软也明白「一口吃不成胖子」◈ღ✿✿,Maia 100 距离替代英伟达 H100 乃至更新的型号还有很远的距离◈ღ✿✿。据报道◈ღ✿✿,Maia 100 采用直接液体冷却◈ღ✿✿,目前仅为 GitHub Copilot 运行 GPT-3.5用你的指尖扰乱我吧2◈ღ✿✿,明年也只是扩展到为 Azure 云的部分负载提供支持◈ღ✿✿。
而就在几天前重工业◈ღ✿✿,◈ღ✿✿,英伟达刚刚发布了 H200 GPU◈ღ✿✿,仅依靠大幅升级内存带宽和容量◈ღ✿✿,就将大模型的训练和推理性能提升了 60%到 90%◈ღ✿✿。
这可能也是为什么◈ღ✿✿,在发布自研 AI 芯片 Maia 100 的同时◈ღ✿✿,微软在 Ignite 大会依然宣布将与英伟达继续打造下一代 AI 超级计算机和工厂了◈ღ✿✿。
作为绝对的领先者◈ღ✿✿,拥有最深的护城河◈ღ✿✿,英伟达或许并没有太过重视微软自研 AI 芯片这件事优发国际网官网在线◈ღ✿✿。但显然◈ღ✿✿,英伟达更在意还是 Copilot 之后◈ღ✿✿,Omniverse 要如何结合生成式 AI 成为新时代「最大的一波浪潮」◈ღ✿✿。
对于英伟达大力鼓吹的 Omniverse◈ღ✿✿,可能很多人早已淡忘了◈ღ✿✿,但肯定忘不了两年前的「真假黄仁勋」◈ღ✿✿。
2021 年 4 月◈ღ✿✿,英伟达再次举办了一场线上「厨房」发布会◈ღ✿✿,惯例由「黄仁勋」主讲◈ღ✿✿。此后的三个多月◈ღ✿✿,谁也没有发现这场发布会真正的神奇之处◈ღ✿✿,直到英伟达在当年 8 月的 SIGGRAPH 大会上主动揭秘◈ღ✿✿:
那场「厨房」发布会画面中的厨房◈ღ✿✿、皮衣◈ღ✿✿、烤箱……乃至「黄仁勋」本人以及他的动作◈ღ✿✿、表情等等一切都是「假的」◈ღ✿✿,或者更确切地说◈ღ✿✿,是现实的「数字孪生」◈ღ✿✿。
Omniverse 平台也是这个时候开始浮出水面◈ღ✿✿,彼时「元宇宙」概念大热◈ღ✿✿,也有人将其视为英伟达版本的元宇宙◈ღ✿✿。但有一点是 Omniverse 和元宇宙截然不同的◈ღ✿✿,英伟达想要创造一个数字孪生世界◈ღ✿✿,核心目的在于影响现实世界◈ღ✿✿。
就像英伟达去年 GTC 大会提到的◈ღ✿✿,德国铁路已经在 Omniverse 上构建◈ღ✿✿、运营铁路轨道的「数字孪生」优发国际官方网站◈ღ✿✿,◈ღ✿✿,包含了 5700 个站◈ღ✿✿,全长 3 万多公里◈ღ✿✿。而在这个「虚拟铁路」里◈ღ✿✿,德国铁路能进行训练◈ღ✿✿、验证 AI 模型◈ღ✿✿,持续监控铁路◈ღ✿✿、火车的运行情况◈ღ✿✿,制造各种意外状况来发现问题对运营造成的影响◈ღ✿✿。
最直接实际的价值是◈ღ✿✿,基于在 Omniverse 上的测试和验证◈ღ✿✿,能够在不需要造新轨道的同时◈ღ✿✿,增加铁路运载容量和运行效率◈ღ✿✿,降低碳排量◈ღ✿✿。
通过「数字孪生」的测试验证◈ღ✿✿,数字世界的结果能够指导现实世界◈ღ✿✿,这就是黄仁勋对 Omniverse 始终推崇备至的核心原因之一◈ღ✿✿。也是为什么◈ღ✿✿,就算「元宇宙」概念已经被全世界抛弃◈ღ✿✿,英伟达每一届 GTC 和 SIGGRAPH 大会都还在「推销」自己 Omniverse◈ღ✿✿,包括这次在微软 Ignite 大会上也不例外◈ღ✿✿。
两年前英伟达那场以假乱真的发布会上◈ღ✿✿,数字孪生版本的「黄仁勋」实际只出场了 14 秒◈ღ✿✿,但背后却是一系列的复杂工作◈ღ✿✿,需要不小的人力◈ღ✿✿、物力◈ღ✿✿。与之相对的是◈ღ✿✿,今年 SIGGRAPH 大会上展示的「从 PDF 到工厂」demo◈ღ✿✿,实际就大量应用了生成式 AI 进行参与◈ღ✿✿。
基于 Omniverse 平台◈ღ✿✿,通过与各种生成式 AI 的对线D 平面图转成完整的「数字孪生」◈ღ✿✿。放在两年前◈ღ✿✿,我们根本无法想象◈ღ✿✿,但现实是◈ღ✿✿,生成式 AI 已经向全世界证明了自身的实力和潜力◈ღ✿✿。
而从这个角度来看◈ღ✿✿,站在微软 CEO 纳德拉的旁边◈ღ✿✿,老黄说出了「Copilot 很重要◈ღ✿✿,但 Omniverse+生成式 AI 更重要」优发国际网官网在线◈ღ✿✿,就不难理解了◈ღ✿✿。


