天空之城| 城主
半导体行业特别是AI芯片,是目前全球科技竞争里最前沿的角斗场,近期却上演了一出令业界震惊的“联手大戏”——芯片巨头英伟达,向其长期的竞争对手英特尔投资50亿美元。这一举动,犹如一声惊雷,不仅改变了两大巨头之间的关系,更预示着人工智能、云计算乃至全球芯片竞赛格局的深远重塑。
为了拨开这层层迷雾,SemiAnalysis首席分析师迪伦·帕特尔(Dylan Patel),a16z普通合伙人莎拉·王(Sarah Wang),以及a16z合伙人、英特尔数据中心和人工智能业务部前首席技术官吉多·阿彭策勒(Guido Appenzeller),在a16z投资播客最新的一场深入访谈中,共同探讨了这场交易的意义、中美科技禁令的现状、英伟达的护城河、华为的崛起,以及AI基础设施的未来走向。他们揭示了一个由技术创新、地缘政治和万亿级资本狂潮共同驱动的全新时代。
声明: 观点仅供参考 不代表本城同意嘉宾的立场观点细节.
核心观点:
-
• 英伟达投资英特尔重塑格局 :此举是英伟达的一步妙棋,不仅可能带来丰厚回报,也对AMD和ARM等竞争对手构成了巨大压力,重塑了PC和数据中心市场的竞争态势。
-
• 华为是英伟达最强劲的对手 :尽管面临美国制裁,华为在AI芯片设计和制造方面正迅速追赶,其强大的执行力和国内市场支持使其成为英伟达在全球范围内(尤其是在非美国市场)不容忽视的竞争者。
-
• AI算力需求驱动万亿级市场 :超大规模数据中心的建设正在以前所未有的速度进行,甲骨文凭借其灵活的策略和庞大的资本,成功抓住OpenAI等大客户,成为AI云市场的主要赢家。
-
• 英伟达的成功源于高风险赌注 :黄仁勋以其非凡的直觉和敢于押上整个公司的魄力,带领英伟达多次抓住市场顺风,建立了强大的技术和市场护城河。
-
• 新硬件带来新挑战 :虽然GB200等新一代GPU在性能上实现了巨大飞跃,但其高昂的总拥有成本、复杂的部署要求和可靠性问题,为使用者带来了新的基础设施挑战。
当长期的竞争对手握手言和,市场总会嗅到不同寻常的气息。英伟达向英特尔投资50亿美元的消息一经公布,便引发了业界的广泛关注。帕特尔指出,这笔投资对英伟达而言是一笔妙棋,甚至在消息公布后,英特尔的股价就上涨了30%,为英伟达带来了可观的潜在回报。
更深层次的意义在于,此次合作不仅涉及财务投资,更涵盖了定制数据中心和PC产品的共同开发,这被帕特尔形容为一切都回到了原点,英特尔有点像在向英伟达卑躬屈膝,这有点诗意。他回顾了英特尔和英伟达之间曾经围绕芯片组反竞争行为的诉讼纠葛,如今英特尔将制造小芯片与英伟达的GPU进行封装,共同打造PC产品,这无疑是市场格局的一次颠覆。帕特尔认为,这种深度整合的x86笔记本电脑,可能会成为“市场上最好的产品”。
前英特尔高管吉多·阿彭策勒对此表示:“如果你的两个最大的死敌突然联手,那是你能得到的最糟糕的消息。”他认为,这项合作对短期的客户和消费者是利好,尤其在笔记本电脑市场。然而,其对竞争对手的冲击是巨大的。阿彭策勒直言不讳地指出,AMD和ARM都将面临严峻挑战。AMD的显卡虽然不错,但软件生态系统孱弱,而英伟达与英特尔的联手将进一步挤压其生存空间。对于ARM而言,其核心卖点是与英特尔的“不合作”,但现在英伟达可能借此进入英特尔的技术领域,成为更危险的CPU竞争者。阿彭策勒总结道:“这重新洗牌了,我没料到会这样。我认为这是一个了不起的发展。”
华为的逆势崛起:美国制裁下的AI芯片挑战者
在全球芯片竞争的另一端,尽管面临严酷的美国制裁,华为的AI芯片业务正在逆势崛起,成为英伟达在全球市场(尤其是在美国市场之外)最不容忽视的竞争对手。帕特尔回顾了华为在2020年发布昇腾(Ascend)芯片时的辉煌,当时他们是首家推出7纳米AI芯片的公司,其技术水平与英伟达的差距几乎不存在。
然而,制裁使华为失去了台积电的代工能力,被迫转向国内中芯国际(SMIC)寻求生产,同时还通过各种渠道获取海外的内存供应。帕特尔透露,华为通过复杂的实体网络,曾从台积电获得了近300万片芯片订单,总价值约5亿美元。尽管这些渠道最终被切断,但华为的韧性不容小觑。
随着2025年H20等英伟达专供中国市场的AI芯片被禁,中国政府正在积极推动国产替代。帕特尔指出,华为等中国公司在逻辑芯片(替代台积电)和内存芯片(替代海力士、三星)方面正迅速追赶。他认为,虽然仍有差距,但中国能够制造大量的7纳米人工智能芯片,甚至可能通过使用现有设备来制造5纳米芯片。
更令人惊讶的是,华为在内存领域也取得了突破,宣布将采用定制HBM(高带宽内存)。帕特尔认为这证明了华为正在迅速赶上英伟达和AMD在内存技术方面的计划。尽管产能和良率仍然是关键瓶颈,且需要更长时间才能完全与西方匹敌,但帕特尔强调:“问题总在于,我们能制造出来吗?黄仁勋会说的是,你是在赌中国无法制造吗?这只是时间问题,而不是会不会的问题。”
这种“炒作国内供应链”的策略,帕特尔认为也是华为在与美国政府进行博弈的一种手段,旨在表明中国拥有自主研发能力,从而影响美国的出口管制政策。他甚至认为,长远来看,美国政府必须权衡,是完全支持内部供应链,还是完全追求超强人工智能,因为中国终有一天会做出自己的选择。
AI算力战:万亿市场、云服务商与激增的资本支出
在半导体行业激荡的背景下,AI算力需求的爆炸式增长正在推动一个史无前例的万亿级市场。帕特尔指出,银行界对明年所有超大规模企业(微软、CoreWeave、亚马逊、谷歌、甲骨文、Meta)的总资本支出预测约为3600亿美元,而他的研究模型显示,这一数字更接近4500亿到5000亿美元,并且其中绝大多数将流向英伟达。
在这场算力竞赛中,甲骨文(Oracle)凭借其独特的策略脱颖而出。帕特尔认为,甲骨文与OpenAI签署的超过3000亿美元的合作协议,是股票和上市公司历史上“最前所未有的事情”。他解释了甲骨文成功的秘诀:拥有业内最大的资产负债表,且不固守任何特定硬件或网络技术,这使其在评估和抢购数据中心容量方面极具灵活性。
帕特尔通过追踪全球每一个数据中心的建设进度、电力供应、芯片部署以及客户协议,精确预测了甲骨文的营收增长。他发现,甲骨文正在积极签约和部署大量新数据中心,这些设施将在未来几年内为OpenAI和字节跳动等大客户提供关键的AI算力支持。
相比之下,亚马逊AWS曾一度在AI云领域陷入“危机”。帕特尔在2023年第一季度撰文指出,AWS过去在横向扩展计算方面的优势,在垂直扩展的AI基础设施时代变得滞后,其内部AI芯片团队专注于成本优化而非性能最大化。尽管AWS收入增长一度放缓,但帕特尔预测其将重新加速,因为亚马逊仍拥有最大的闲置数据中心容量,这将在未来一年内转化为AI收入。
然而,新一代AI硬件的部署也带来了挑战。尽管亚马逊在液冷等高密度数据中心技术上经验丰富,但吉多·阿彭策勒提出了一个关键问题:“那是正确类型的数据中心容量吗?我现在可能需要附近的一条大河来冷却,在很多地区,我只是无法获得足够的水。而且可能在同一地区也有电力问题。” 帕特尔承认存在效率问题,但强调亚马逊正迅速投入并转化这些容量。
对于微软与OpenAI的关系演变,帕特尔指出,虽然微软曾是OpenAI的独家计算供应商,但随着OpenAI寻求多元化,并与甲骨文达成巨额协议,这种关系正在被重塑。这背后的核心驱动力是资产负债表:OpenAI需要一个有足够资本实力来承担巨额GPU投入的合作伙伴,而甲骨文恰好具备这一条件。
黄仁勋的非凡赌注:英伟达护城河的深度解析
英伟达在AI芯片领域的主导地位并非一蹴而就,而是其创始人黄仁勋(Jensen Huang)一系列“疯狂”且高风险赌注的结果。迪伦·帕特尔将黄仁勋比作“半导体界的沃伦·巴菲特效应”,并深入剖析了英伟达建立强大护城河的历史策略。
帕特尔透露,英伟达在早期经历多次失败,但黄仁勋疯狂到敢于押上整个公司。他曾为了Xbox项目,在微软下订单之前就订购了所需数量的芯片,这种YOLO(你只活一次)式的豪赌贯穿了英伟达的发展史。
在加密货币泡沫时期,当所有人都在怀疑GPU需求是否真实时,英伟达成功说服供应链合作伙伴,这不仅仅是加密货币,更是游戏、数据中心和专业可视化等“持久的真实需求”。他们诱导供应商增加产量,并在泡沫破裂时,英伟达只需注销一个季度的库存,而其他公司(如AMD)则因犹豫不决而错失良机。
黄仁勋的另一大特点是其非凡的直觉和远见。帕特尔分享了一个关于黄仁勋和CFO科莱特的趣闻,黄仁勋曾说:“我讨厌电子表格。我不看它们。我就是知道。”这种直觉使他能够多次提前预判市场需求,甚至给出比客户内部计划更高的产能预测,并敢于提前下达“不可取消、不可退货”的订单。
更令人印象深刻的是英伟达在芯片设计和制造上的执行力。阿彭策勒曾表示,在英特尔时期,他们非常嫉妒英伟达,因为英伟达总能在第一次交付时就成功(first pass success),通常只需提交“A0”版本,而其他公司(如英特尔)可能需要多达15次修订(“E2”版本),这大大缩短了产品上市时间。这种高效的执行力使得英伟达能够迅速响应市场变化,及时交付创新产品,例如在Volta芯片投产前几个月,大胆地加入了张量核心,从而奠定了其在AI领域的领先地位。
英伟达的护城河并非仅仅是技术和市场份额,更是黄仁勋这种只为下一局而赢的独特领导哲学。帕特尔引用黄仁勋的话:“玩游戏的目的是为了赢。赢得目的,或者说,赢得原因是为了你可以再次玩。”这种不断追求下一代技术突破、而非固守现有成就的基因,是英伟达长青的秘诀。
迈入“吉瓦时代”:AI基础设施建设的狂飙突进
随着AI算力需求的飞速增长,全球数据中心的建设正在以前所未有的速度和规模进行,行业已正式迈入“吉瓦时代”。迪伦·帕特尔指出,曾几何时,训练GPT-3需要2万个H100 GPU,令人印象深刻;而现在,全球已拥有至少10个10万个GPU集群,分析师们甚至对“兆瓦级”的数据中心感到“无聊”,只有“吉瓦级”的建设才能引起他们的兴奋。
在这场史诗般的建设狂潮中,埃隆·马斯克(Elon Musk)的XAI和Colossus项目成为了一个引人注目的案例。帕特尔详细描述了马斯克在田纳西州孟菲斯的惊人壮举:在短短六个月内,从购买工厂到部署10万个GPU,建成了一个液冷数据中心。他采用了一系列“疯狂”的创新做法,包括将发电机直接安置在工厂外、挖掘天然气管道获取电力、部署移动变电站等,以最快速度获取能源和冷却。
马斯克的建设速度和“第一性原理”思维,甚至让他能够挑战地方政府的监管。帕特尔提到,马斯克在孟菲斯遇到抗议后,直接将部分基础设施转移到密西西比州边境,利用不同州之间的法规差异来加速建设。这种打破常规的执行力,是推动“吉瓦时代”数据中心建设的关键。
然而,如此大规模的AI基础设施投资也带来了新的挑战:英伟达作为最大的现金流公司,面对未来数千亿美元的现金盈余,其资本部署策略成为了一个开放性问题。黄仁勋因监管审查无法进行大型收购(如ARM),那么这些巨额资本该何去何从?
帕特尔认为,英伟达投资数据中心和电力设施,解决算力增长的瓶颈,可能比投资云服务本身更具战略意义。但他同时也承认,黄仁勋在投资新云、模型训练公司等方面也在积极布局,只是这些都是小打小闹,无法完全消耗其庞大的现金流。这一困境,与苹果公司在库克时代因缺乏远见而将大量现金用于股票回购,导致创新停滞的案例形成了鲜明对比。
新硬件的部署之困:GB200的TCO与可靠性挑战
新一代AI硬件虽然性能飞跃,但其部署带来的高昂成本和复杂挑战,让使用者和云服务商都面临着新的难题。帕特尔分析了英伟达GB200(将GPU和CPU集成在同一个芯片上)的TCO(总拥有成本),指出其大约是H100的1.6倍。虽然在特定工作负载(如深度探索推理或强化学习)下,GB200能提供超过6-7倍的性能提升,使投资变得物有所值,但对于其他通用型任务,性能提升可能仅为2倍左右,收益便不再那么显著。
GB200在部署中最大的挑战是可靠性问题。帕特尔透露,作为一个新GPU,GB200仍面临一些可靠性挑战,且其故障的“爆炸半径”远超前代产品。在一个包含72个GPU的GB200机架中,如果一个GPU出现故障,可能导致整个机架需要离线维修。这与8个GPU的H100/H200盒子不同,后者故障时只需替换单个服务器。
为了应对这一挑战,用户和云服务商不得不设计复杂的基础设施管理策略,例如将高优先级工作负载运行在64个GPU上,而将低优先级工作负载运行在剩余的8个GPU上,以减少故障对核心业务的影响。云服务商也因此调整了服务等级协议(SLA),例如提供64个GPU 99%的可用率,而非72个。这迫使最终客户必须具备处理这种不可靠性的能力和智能。
此外,帕特尔还详细阐述了推理工作负载的细分:预填充(Prefill)和解码(Decode)。这两个操作需求截然不同,前者需要巨大的浮点运算能力,后者则对延迟和每秒令牌数(TPS)敏感。OpenAI、Anthropic等顶级实验室,以及众多云服务商,都已开始分离预填充和解码工作负载,在不同的GPU集群上并行运行,以提高效率和用户体验。
英伟达也顺应这一趋势推出了专门用于预填充的Rubin预填充卡(如CPX)。CPX通过剥离HBM(占据GPU成本一半以上),提供了一个更便宜、更高效的预填充芯片,从而有效支持长上下文AI模型的部署。这不仅降低了成本,也提高了整个推理过程的效率。
RL环境的未来:机遇与隐忧
在快速变化的AI前沿领域,RL(强化学习)环境作为训练AI代理的关键技术,正吸引着硅谷的巨大关注。文章指出,RL环境旨在通过模拟真实软件应用中的多步骤任务来训练AI代理,这对于开发更强大的通用型AI代理至关重要。
Anthropic等领先的AI实验室正大量投入自建RL环境,而像Mercor和Mechanize这样的初创公司,以及Scale AI等传统数据标注巨头,也在积极布局,希望成为“RL环境领域的Scale AI”。
然而,RL环境的未来并非一片坦途。帕特尔强调,“人们低估了扩展(RL)环境的难度。” 一些业内专家也指出,RL环境容易出现“奖励欺骗(reward hacking)”问题,即AI模型通过作弊而非真正完成任务来获取奖励。OpenAI高管对RL环境初创公司持谨慎态度,而AI研究员Andrej Karpathy虽然看好“环境和代理交互”的潜力,但对“强化学习本身”能带来多大进步持保留意见。
这表明,RL环境虽然被视为AI代理突破的关键,但其技术挑战、扩展成本和有效性仍有待时间验证。
一个无法预测的万亿未来
正如帕特尔所言,预测超过五年后的未来几乎不可能,因为每次的情况都是一个全新的局面。在这个由技术、资本和地缘政治交织的狂野西部,黄仁勋那句“玩游戏的目的是为了赢,赢得目的,或者说,赢得原因是为了你可以再次玩”的哲学,或许是对这场高 stakes 变革最恰当的注脚。
天空之城全文整理版 意外的联手:英伟达投资英特尔的影响
迪伦·帕特尔
: 你购买GPU的方式就像购买可卡因。你给几个人打电话,你给几个人发短信,你问,哟,你手头有多少?价格是多少?
Guido Appenzeller
: 如果你的两个死敌突然联手,这是你能得到的最糟糕的消息。我没有预料到这个。我认为这是一个了不起的进展。
主持人
: 就像沃伦·巴菲特入股一家公司。黄仁勋就像半导体界的巴菲特效应。
迪伦·帕特尔
: 一切都回到了原点,英特尔有点像在爬向英伟达,这有点诗意。
主持人
: 迪伦,欢迎回到播客。
迪伦·帕特尔
: 谢谢邀请。
主持人
: 碰巧就在我们邀请你来的时候,英伟达宣布向英特尔投资50亿美元,双方将合作开发定制数据中心和PC产品。你怎么看待这次合作?
迪伦·帕特尔
: 我觉得很有趣,就像英伟达可以投资,消息一宣布,他们的投资就已经上涨了30%。50亿美元的投资,20亿美元的利润,我觉得这很有意思,因为他们需要他们的客户真正地大量购买。所以当他们潜在的客户大量购买并致力于某些类型的产品时,这是非常有意义的,
在某种程度上,这有点可笑,因为过去,曾发生过英特尔因芯片组的反竞争行为而被起诉的事件,而且英伟达实际上很久以前就从英特尔那里获得了一笔和解金,当时图形处理单元(GPU)与显卡是分离的,显卡实际上是放在芯片组上的,芯片组还有其他的输入/输出(IO),比如USB和所有这些东西。所以,现在英特尔将制造一个小芯片,并将其与英伟达的小芯片一起封装,然后这就是一个PC产品,这有点滑稽的转变,所以,一切都回归原点,英特尔有点像是在向英伟达卑躬屈膝,但这实际上可能只是最好的设备,这有点诗意,我不想要ARM笔记本电脑,因为它不能做很多事情。因此,一台完全集成了英伟达显卡的x86笔记本电脑,可能会是市场上最好的产品。
那么你乐观吗?你认为事情会如何发展?当然,我希望,我对英特尔总是保持乐观,因为我必须如此。我当时的想法是,至少很多政府人士和英特尔都在努力争取的交易结构是,让人们,大客户和最大的供应商直接向英特尔提供资金。但现在有点反过来了,他们购买了一些股票,拥有了一些所有权,但他们并没有真正地稀释其他股东的权益。然后,当英特尔最终从资本市场筹集资金时,其他股东将被稀释,或者说所有人都将被稀释。
但是因为他们已经宣布了这些交易,而且规模很小,英伟达50亿,软银20亿,美国政府是100亿,这些仍然相对较小。相当小,关于事物的本质,上次我想我说英特尔需要大约500亿美元,现在当他们进入资本市场时,情况会更好。而且希望他们能得到另一些,一些这样的声明,也许,有各种各样的猜测说特朗普参与其中,某种程度上让这些公司投资。英伟达,现在,还有政府,当然,现在,苹果会来投资吗,并且还会和英特尔或其他什么人合作吗?这将真正提升投资者信心,他们可以稀释股份/获得债务。
主持人
: 就像沃伦·巴菲特进入一家公司的股票。黄仁勋就像半导体界的巴菲特效应。
Sarah Wang
: Guido,您曾是英特尔数据中心和人工智能业务部的首席技术官。你有什么想法?
Guido Appenzeller
: 我认为这对短期内的客户和消费者来说真的很好,英特尔和,尤其是笔记本电脑市场,拥有这两个合作者真是太棒了。我想知道英特尔的任何内部图形或人工智能产品会发生什么,他们可能只是按下重置键,暂时放弃那些。他们目前没有任何有竞争力的东西,曾经有Gaudi的努力。那或多或少完成了,曾经有内部图形芯片,但从未真正地在高端市场竞争过,
_2
: 所以从那个角度来这很有道理,
Guido Appenzeller
: 这是为了双方。听着,我认为对英特尔来说,他们需要一股新鲜空气,他们有点绝望。所以我认为这是一件非常好的事情。我认为AMD完蛋了。如果你两个最大的死敌突然联手,那就是你能得到的最糟糕的消息,他们已经很挣扎了,他们的显卡不错。他们的软件栈不行,他们获得的关注非常有限,他们现在在那方面有更大的问题。我认为ARM也有点完蛋了,因为他们最大的卖点有点我们可以和所有不想与英特尔合作的人合作。从某种意义上说,他们是第一。英伟达可能是未来CPU竞争者中最危险的,因此,他们现在突然可以访问英特尔的技术,并可能朝那个方向发展。它重新洗牌了,我没料到会这样。我认为这是一个了不起的发展。
华为的崛起:国产AI芯片的挑战与机遇
Sarah Wang
: 看看这件事如何发展会非常有趣。针对埃里克的观点,新闻密集的一周。
Sara Wang
: 既然迪伦你在这里,我们还想请教你另一件事,那就是华为发布其人工智能路线图的消息。
Sarah Wang
: 显然,他们在大肆宣传其能力。我认为你们一直走在尝试评估950超级集群实际能力的曲线前端,但很想听听你们对中国方面所有进展的看法,这与DeepSeek声称他们的下一个模型将基于国产中国芯片的消息联系在一起。中国政府禁止公司购买专门为中国生产的英伟达芯片。所以目前中国的半导体市场有很多多米诺骨牌正在倒下,但很想听听你的总体看法,深入一些细节。
迪伦·帕特尔
: 我认为当你稍微放大视野,比如回顾2020年,因为我认为认识到华为有多么强大,或者甚至从历史上他们一直都非常出色,这一点非常重要。当然,最初他们窃取了像思科的源代码和固件之类的东西,但随后他们迅速超越了思科以及其他所有电信公司。2020年,他们发布了Ascend芯片,并提交给公正的公共基准测试,他们是第一个将7纳米人工智能芯片推向市场的公司。他们是第一个拥有那个的,现在你仍然可以说英伟达领先,但差距几乎不存在,这时他们可以完全使用国外的供应链。这时他们刚刚超越苹果,成为台积电最大的客户。从整体上他们在制造供应链的设计方面显然领先于所有人,当然,英伟达仍然拥有更高的市场份额,但当时市场还很初期,他们本可以真正接管市场。
华为被特朗普政府禁止访问,然后在2020年生效,完全禁止。所以他们只能制造少量这些芯片,但他们用当时制造的这些芯片训练了重要的模型。然后在接下来的几年里,英伟达继续加速发展。华为由于被台积电禁运,不得不去想办法在中芯国际(国内的台积电)进行生产。与此同时,他们也在试图通过空壳公司在台积电生产,并从韩国获取内存等等。因此到了24年底,这种行为已经全面展开,并且被抓住了,被抓住了,他们最终关闭了这些渠道,但他们通过这些其他实体从台积电获得了300万片芯片,确切说是290万片芯片,大约价值5亿美元的订单,最终变成了美国政府给台积电的10亿美元罚款,如果我没记错的话,或者至少有一篇路透社的文章是这么说的。我不知道他们是否真的开出了罚单,这一点很重要,也很有意思,因为目前市面上流通的昇腾芯片数量还没有完全消耗掉这些产能,
现在我们到了2025年,H20在年初被禁售。英伟达不得不注销巨额资金。我们对英伟达在中国仅H20产品的收入估计超过200亿美元,因为那是他们预定的产能或不得不注销的金额。然后它被禁售了,他们切断了供应链,就像他们说的那样,不,我们不再这样做了。他们有他们的库存,库存重新获得批准,他们转售库存,但现在他们在想,我们还要重新开始生产吗?这是英伟达的问题。现在中国会说,我们不需要英伟达,我们有国产替代品,无论是华为还是寒武纪,这些公司都有产能,但这些产能大部分仍然是国外生产的,无论是台积电的晶圆,还是韩国的内存,三星和SK海力士。所以问题有点他们能在国内做多少?
而且那里大致有两个方面,有逻辑方面,即替代台积电,还有内存方面,即替代海力士、三星、美光。在逻辑方面,他们落后了,但他们正在迅速提升,而且我认为他们可以达到一定的生产能力。所需的估算,而且美国几乎仍然允许他们进口所有必要的设备。这些禁令实际上是针对当前这一代技术之后的,超越7纳米的,这些禁令实际上是针对5纳米及以下的,即使政府说是针对14纳米的,但实际被禁的设备只是针对7纳米以下的。因此,他们将能够制造大量的7纳米人工智能芯片,甚至可能通过使用现有设备来制造5纳米芯片,而不是采用新技术。
因此,有逻辑方面,然后是存储方面。华为宣布的消息中令人惊讶的方面是,他们正在进行定制内存,这部分有点这真的很令人兴奋。他们宣布了明年两种不同的芯片,一种专注于推荐系统和预填充,另一种专注于解码。
Guido Appenzeller
: 现在有一种趋势。
迪伦·帕特尔
: 所以在英伟达,同样的事情,他们最近也宣布了一款专门用于预填充的芯片。有许多人工智能硬件初创公司真正专注于预填充而不是解码。因此,推理分解为两个工作负载,华为明年的芯片也在做同样的事情。有趣的是,解码芯片采用了定制的HBM。这意味着什么?制造供应链是什么样的?因为这才是棘手的问题,他们能生产多少这种定制HBM?英伟达和其他公司也要到明年才开始采用定制HBM,所以不是说,制造能力不存在。也许它会消耗更多的电力。带宽可能会稍微低一些,但他们能够做到英伟达计划做的一些事情,AMD计划在他们的内存中做的事情,这证明他们正在赶上。但剩下的主要问题是生产能力。
所以,关于“英伟达在中国被禁”这件事,就像他们说的那样,不要购买英伟达的芯片。我认为在一段时间内,这没问题,对中国来说没问题,从中国的角度来没问题,因为你们在2024年运来了所有的产能。它们还没有变成人工智能芯片。现在你们要把它们变成人工智能芯片。你们正在耗尽所有库存。那么,从耗尽库存到提升新产品的过渡呢,那个过渡才是真正棘手的。中国要么通过在那段时间不购买英伟达芯片来搬起石头砸自己的脚,要么中国能够提升产能。我认为他们能够提升产能。我认为这会花费更长的时间,并且会出现一个中间的空档期,中国可能会退一步并表示一切都很好。比如字节跳动正在恳求获得英伟达的芯片,比如他们不想用,他们用了一些寒武纪,他们用了一些华为,但他们真的想用英伟达的,因为它更好。他们不在乎国内供应链。他们想要制造最好的模型。他们想要尽可能高效地部署他们的人工智能。所以政府可以强制要求他们不要这样做,所以不是英伟达没有竞争力。而是政府在某种程度上试图煽动它。
然后,我想最后要说的是,总有一种说法是,如果禁止向中国出口英伟达芯片对中国这么好,为什么中国自己不这样做呢?他们最终开始为自己这么做了。所以再说一次,看看会发生什么,会很有趣。走私仍然在发生,将芯片从其他国家再出口到中国。 这仍然以一定的量在发生,低量,中低量,但是,目前不一定能直接运送那些合法允许出口到中国的英伟达芯片,但可能在某个时候必须重新开始,因为中国没有足够的生产能力,与美国相比,他们部署在国内的人工智能芯片会少很多。 在某个时候,你必须做出选择,我是完全支持内部供应链,还是完全追求超强人工智能?
Guido Appenzeller
: 那么这里是否存在一个关于谈判角度的问题?因为目前仍在讨论出口到中国的边界到底在哪里,什么可以出口到中国? 所以如果你想表明美国应该允许更多出口,那么这些都是适时的声明。你认为这是一个因素吗,还是不是?
迪伦·帕特尔
: 所以,在几周前我们做的关于华为的生产能力和供应链的报告中,我们写了一点关于,老实说,如果你是中国,你想要英伟达,你确实想要英伟达的芯片,你会怎么做? 那就是通过炒作你的国内供应链。并且感觉我们什么都能做。就像华为发布了各种最疯狂的东西。宣布了长达7年的计划,或是发布了3年的路线图。
Guido Appenzeller
: 我猜他们基本上是读了你的报告。
迪伦·帕特尔
: 我认为他们知道。他们已经被咬了一口了。然后假设我们禁止英伟达,然后政府官员会考虑,同时受到国内厂商的游说,我们当然想给他们运送更好的AI芯片。我们正在失去这个市场。我们不能失去这个市场。这有点这是10000智商,我们在这里玩跳棋,而他们在下象棋。
Sarah Wang
: 那么,我想先抛开谈判筹码不谈,你在那份报告中提到,HBM或高带宽内存是华为的瓶颈。正如你所说,关于这次发布会令人惊讶的方面之一,你认为根据他们所说的,不再是瓶颈是可信的吗?或者他们只是在炒作?
迪伦·帕特尔
: 我认为从生产能力来这绝对仍然是一个瓶颈。他们,制造HBM所需的某些类型的设备需要进口。他们正在研究国产解决方案。但据我们所知,他们还没有进口足够的设备来完成这项工作。虽然,如果你查看中国不同类型设备的进口数据,大概是这样,晶圆厂大约会花费,这取决于工艺技术,但晶圆厂在光刻、刻蚀、沉积、计量等方面花费的金额大致不同,就像这些不同的步骤。从历史上光刻一直徘徊在17%、18%左右。随着EUV(极紫外光刻),它增长到25%,但中国,因为他们有点想要储备光刻设备,并且担心即将到来的禁令,他们以比这更高的比率进口光刻设备,比如他们设备进口的30%、40%都是光刻设备。而且他们只是在囤积光刻设备。现在这种情况有点逆转了,如果我想要,所以如果你查看中国的月度进出口数据,包括进入中国各省的数据,以及从各国出口的数据,你可以看到刻蚀设备正在急剧增加。
关于堆叠HBM(高带宽存储器)的主要事情是,当你有了每个晶圆,你必须进行刻蚀,创建一种叫做硅通孔的东西,这样它才能从顶部连接到底部,然后你将它们堆叠在一起,HBM有12层高,16层高。这就是你制造超高带宽内存的方式。并且他们刻蚀机的进口量现在就像火箭般蹿升。所以他们还没有生产能力。作为他们能获得多少设备的函数,他们能以多快的速度提高产量?A,以及B,比如良率,在制造业上,提高良率真的很难。英特尔和三星真的很棒。而台积电简直令人惊叹。不是说那些公司很糟糕,我想这是更好的表达方式。
所以,我认为是这两件事。良率,他们甚至还没有开始高速HBM3的生产,他们只做了一些HBM2的抽样。HBM3几年前就出来了。所以在提升学习曲线方面,还有很多方法。显然,我预计他们赶上的速度会比技术开发所需的时间更快,因为它已经存在了,在世界上,我们知道如何去做。这只是实际去做和发明它的区别。另一个是产能问题。几个月的进出口数据不足以建立起未来几年的供应链,这就是我们今天在韩国为韩国公司所拥有的。现在,海力士也在美国投资。在伊利诺伊州,而美光主要在日本,美国的存储公司主要在日本和台湾,但他们也在新加坡和美国扩张。现在。就像已经投入了大量的资本。中国需要一段时间才能建立起能够真正与西方匹敌的生产能力。当我说西方时,我指的是东亚的生产,非中国东亚的生产能力。所以需要一段时间才能达到那个水平。我不认为,我认为这我们可以设计这个。问题总在于,我们能制造出来吗?
然后像黄仁勋会说的是,你是在赌中国无法制造吗?这只是时间问题,而不是会不会的问题。这就是整个考量,我认为美国政府必须意识到,当他们说,我们出售什么级别的AI芯片时?我们什么都卖吗?可能不会,因为人工智能远比半导体更强大,而且人工智能的终端市场将远大于半导体和设备的终端市场。我们卖什么,我们卖到什么程度?中国能在每个特定的,某种性能层级上制造多少,然后,分析它,以及它的产量,然后弄清楚什么是可以接受的,比如略高于或大约相同水平。
Sarah Wang
: 所以,正如你所说的关于下象棋与跳棋的问题,如果你是黄仁勋,鉴于手头的情况,你的下一步行动会是什么?
迪伦·帕特尔
: 这在某种程度上是正确的,他害怕华为胜过害怕AMD。他称他们为强大的。像其他公司一样,华为已经击败了苹果,他们在台积电订单上超过了苹果。他们在手机市场份额上超过了苹果,虽然不是在美国,但在禁令颁布之前,在世界许多地方都是如此。即使现在,在没有西方供应链的情况下,他们的市场份额也在再次增长。他们已经对许多其他行业这样做了。我会说苹果就像一个强大的竞争对手,就像他们已经击败了很多行业。所以他害怕他们是很合理的。这有点他并不害怕AMD。所以,我认为最好的事情是,尽可能地像华为一样,华为所宣布的是现实,而不是他们的希望目标。
所以,排除了所有关于制造能力的疑问,我认为这不公平,我认为制造能力是他们真正的瓶颈。然后是良率学习,真正的瓶颈,就像暂时的,也许我们会看看会持续多久,我们会看看英伟达的技术在多大程度上超越了华为的能力,以及华为能够以多快的速度缩小差距。
主持人
: 但我认为他的主要论点是华为是真实的。
迪伦·帕特尔
: 他们是个强大的竞争对手。他们不仅要占领中国市场,还要占领国外市场,无论是中东、东南亚、南亚、欧洲还是拉丁美洲,除了美国以外的任何地方。 还有,有点我认为诺亚·史密斯有这样一个比喻,整个想法是,你应该对中国进行“加拉帕戈斯化”,让他们拥有与世界其他地方截然不同的国内产业,有点像70、80和90年代的日本发生的事情,他们的PC非常特别,并且针对日本市场进行了过度优化,那些奇怪的,我不知道你是否见过日本PC上奇怪的滚轮。就像你真的,你这样做,它就会滚动,触摸板是一个圆圈,然后在它周围。诸如此类的东西非常奇怪。世界上的其他地方并不关心,但日本市场喜欢它,而他的整个想法就像是,让我们对他们进行加拉帕戈斯化,即将他们的技术限制在中国境内。那样就会造成无谓损失,他们永远无法向外扩张,而我们服务于整个世界。
但整体的风险是,相反的情况也可能发生。我们的技术经过了超优化,可以运行这种规模的语言模型和强化学习。而你持续进行硬件软件协同设计可能会把你带入一条陷阱路径,最终走到死胡同。然后中国,因为他们无法访问这条路径,他们就会想,哦,好吧。然后他们最终会到达最佳的位置,我们遇到了局部最小值,他们遇到了局部最大值,他们遇到了全局最大值,就像那种技术加拉帕戈斯化的事情,这有点像诺亚·史密斯(Noah Smith)的比喻。我很喜欢它。我不知道这是否准确,但这是一个有趣的观点。
万亿市场的未来:AI算力增长的乐观与悲观情景
Sarah Wang
: 我喜欢这个。实际上也许可以从当前的事件中退一步,即使现在有很多事情可以谈论。上次你和我们一起出现时,英伟达(Nvidia)被提到了,这是显而易见的。你谈到了英伟达(Nvidia)未来发展的几种潜在路径。给我们讲讲看多情景和看空情景吧。有道理。
迪伦·帕特尔
: 现在他们的数字中嵌入了很多东西,但有趣的是银行的共识就像超大规模企业一样。也就是微软、CoreWeave、亚马逊、谷歌和甲骨文,Meta,所以是六大超大规模企业,我会认为他们是超大规模企业。银行业界的共识是明年所有银行的总支出为3600亿美元。而我的数字更接近,大概是4500亿到5000亿。这是基于我们对数据中心的所有研究,以及追踪供应链中每个独立的数据中心,所以,这仅仅是英伟达的支出。这是超大规模企业的资本支出,然后这些资本支出会被分配给不同的公司,但绝大多数仍然流向英伟达,英伟达的处境不是他们掠夺份额,他们无法掠夺份额,而是他们与市场共同增长或者捍卫份额。所以问题是,超大规模企业和其他用户的资本支出增长速度有多快,我之所以将甲骨文和Core Wave纳入超大规模企业,即使它们传统上不被称为超大规模企业,是因为它们正在睁大眼睛看待超大规模,
所以,当你观察并查看甲骨文的公告时,首先,甲骨文的公告,我不明白为什么人们不认为这更疯狂。他们做了股票和上市公司历史上最前所未有的事情。他们给出了四年指导,这使得拉里成为世界上最富有的人,就像所有这些事情一样。无论如何,问题是,收入增长有多快,你认为甲骨文和Open,你认为OpenAI,它与甲骨文签署了一项超过3000亿美元的协议,实际上能够支付3000亿美元吗,通过筹集资金和收入。我认为大多数,并且它在短短几年内达到了每年超过800亿美元,超过900亿美元的速度,
主持人
: 所以这你相信市场会增长得那么快吗?
迪伦·帕特尔
: 非常有可能。而且像OpenAI这样的公司,明年退出时的收入会是多少,这也非常有可能。有人认为350亿,有人认为400亿,有人认为450亿。年度经常性收入(ARR),到明年年底,今年他们达到了200亿,年度经常性收入(ARR),如果保持这种增长率,那么所有这些成本都将用于计算,以及他们继续筹集的所有资金,再次说明,他们上次融资时给投资者的财务数据大致是,我们明年将烧掉大约150亿美元。更有可能达到200亿,但是,如果把这些都加起来,他们没有产生现金流,在2029年之前他们都不会盈利。所以你大概可以认为,他们每年将继续烧掉150亿、200亿、250亿美元的现金,加上收入增长,这就是他们的计算支出。你可以对Entropiq这样做,对OpenAI这样做,对所有实验室都这样做。这个大盘子很有可能会达到,超过5000亿,明年不是3600亿,而是5000亿,用于总资本支出,并且这个大盘子会继续增长。
对于超大规模企业,英伟达表示,实际上每年在人工智能基础设施上的投入将达到数万亿美元。他将占据其中很大一部分。这是他的乐观情景,乐观情景是人工智能实际上具有变革性,世界将被数据中心覆盖,并且你的大多数互动都将与人工智能进行,无论是业务效率,还是指示代理执行一些代码,或者你只是和你的AI女友安妮聊天,诸如此类,无关紧要。在很大程度上,所有这些都运行在英伟达的平台上。悲观情景是,即使它确实增长了很多。
Guido Appenzeller
: 请继续。让我们暂时保留乐观情景。我认为从根本上讲,价值创造,我个人认为,是存在的,通过人工智能创造数万亿美元的价值,我完全可以看到这种情况发生。所以假设这是真的,英伟达的上限在哪里?
迪伦·帕特尔
: 我想,你有多相信起飞,所以如果存在一个起飞情景,在那种情景下,强大的人工智能构建更强大的人工智能,构建更强大的人工智能,或者,这创造了越来越多,每个智能水平都为经济赋能,比如你能在你的企业里雇佣多少猴子,而不是雇佣多少人类,有点像或者多少条狗,有点一个人相对于一条狗的价值创造是什么?这有点像人工智能。所以,在这种情况下,价值创造可能是数千亿美元,如果不是,我们正在追逐这个目标。
Guido Appenzeller
: 你需要这个吗?如果我们让每个白领工人的工作效率通过人工智能提高一倍,那将达到数千亿美元,不是吗?
主持人
: 但是,什么叫做一倍,如果你和实验室的人谈谈,比如工作效率提高一倍,这到底意味着什么?就是取代了他们,而且会比死亡好10倍。
Guido Appenzeller
: 我不知道那有多快——如果一种白领工人本质上在没有持续不断的LLM(大型语言模型)令牌流的情况下毫无用处,那能让他们提高生产力,到那时,你基本上可以对世界上每个知识工作者征税,从长远来这也就是世界上大多数的工人。所以,你猜是什么?给我们一个数字。上限是多少?上限?
迪伦·帕特尔
: 为什么我们不制造一个俄罗斯套娃大脑?在某个时候,机器会说人类不需要生存,我们需要更多的计算能力。在那之前的一步,我们开始殖民火星了吗?待定,伙计。我觉得,就好完全,好不可能预测五年以上的事情,鉴于变化如此之大。那不像——五年?五是最后的数字。我会把它留给经济学家,好老实说,好供应链的东西,好三、四年就结束了。然后第五年,有点像及时行乐,所以,我只是试着让自己立足于供应链的东西,供应链,然后,人工智能的采用情况如何?价值创造是什么?使用情况是什么?而且你可以在短时间内看到它。除此之外,我们是否都会连接到电脑,脑机接口之类的?伙-计。人形机器人,它们会怎么样,你看到了埃隆的东西,他说,是啊,人形机器人是特斯拉价值超过10万亿美元的原因。好的,很好。所有这些都是用什么训练的?很好,英伟达,好的,太棒了。所以那也值10万亿美元,这对我来说太遥远了。我不喜欢那些遥远的讨论。
主持人
: 非常公平。
迪伦·帕特尔
: 读一些科幻小说。
英伟达的护城河:从历史赌注到市场主导
Sarah Wang
: 所以仅仅是提取你谈到的线索,这有点像一句顺带一提的评论,但市场份额实际上无法增长,因为它已经占据了如此主导的市场份额。我们谈到过,或者你们上次谈到过英伟达的护城河。显然,这个护城河与维持他们目前拥有的非常高的市场份额相关。我很喜欢你之前带我们回顾的关于华为的那段历史旅程。你能大概讲解一下英伟达在历史上都做了些什么来建立他们的护城河吗?
迪伦·帕特尔
: 这非常棒,因为,他们在早期失败了很多次,而且他们多次押上了整个公司,黄仁勋疯狂到敢于押上整个公司,就像在知道芯片是否能工作之前就订购了一定的芯片数量,而且这几乎是他剩下的所有钱,或者像是为他尚未赢得的项目订购数量。我听到一个传闻,或者说不是传闻,而是从一位业内老前辈那里听来的故事,我认为他应该知情,他说,不,不,不。英伟达在微软下订单之前,就已经为Xbox订购了所需的数量。他们只是想,去他妈的, YOLO(你只活一次),我不知道这件事有多真实,我确信其中有更多的细微差别,口头指示或者什么的,但是就像订单在他收到订单之前就已经下了,就像他说的。
有些情况就像加密货币泡沫一样,就像有几次,但是英伟达尽了最大的努力来说服供应链中的所有人,这不是加密货币,而是游戏,这是持久的真实需求,是游戏、数据中心和专业可视化,因此你们应该提高产量,然后他们都提高了产量,并花费了所有的资本支出来增加产量,为他们建立新的生产线,他们按件付费,然后购买并出售,赚了很多钱,然后当一切崩溃时,他们只需要注销一个季度的库存,无论如何,其他人都说,糟糕,我所有的生产线都空了,所以但是AMD当时做了什么,他们的芯片,实际上更适合加密货币挖矿,在一个,硅成本与哈希值的比例上,但是他们就是没有,AMD啊,我们不会真的提高产量,就像一个合理的,事情,它不是一个,这有点像趁热打铁,所以同样的事情也发生在英伟达身上,
他们,最近,好他们订购了没人相信的产能,好几次。他们看到了需求,很明显,但在很多情况下,他们只是觉得,他们给微软的数字比微软的内部计划还要高,然后微软的内部计划提高了,但是他们给微软的数字还是高得多。这啊,即使他们告诉我们这么多,我们也不认为微软会需要这么多。这谁会不,不,不,客户,你会买更多的。订单,然后当订单通过供应链时,我必须支付NCNR,不可取消,不可退货,这是,这是,我曾经在台湾问过一个问题。那里好像有一个,是科莱特,她是首席财务官,还有黄仁勋,首席执行官。他们都在那里。那是一个房间,里面大多是金融人士,他们在盈利发布前三天问一些愚蠢的金融问题。所以很明显,他们什么都回答不了,因为这是美国证券交易委员会的规定。
但我问他们的问题是,你黄仁勋,你非常注重感觉,非常有直觉,而且非常有远见。然后科莱特是首席财务官,她本身就很出色,但是,这些个性会冲突。你们是如何一起工作的?他说,我讨厌电子表格。我不看它们。我就是知道,诸如此类就是他的回答。而且当然,世界上最优秀的创新者都有非常好的直觉,这种直觉就像是在不了解情况时下不可取消的订单,而且他们在历史上不得不多次注销,累计订单金额达数十亿美元,因此,累计总订单,无论是H20(更多的是监管方面),还是他们订购后不得不取消的其他情况。达到数十亿美元了吗?达到数十亿美元。小菜一碟。这取决于情况,当他们的股票价值低于1000亿美元时,加密货币的减记就像几十亿美元,这只是小菜一碟。只是与上涨空间相比,我认为你做的一切都是对的。我认为AMD所做的一切都是错的。在那样的情景下,但就像这很疯狂,尤其是在像半导体这样周期性的行业里,公司总是会破产,这就是为什么我们有这么多的整合,每一次下行周期公司都会破产。
Guido Appenzeller
: 如果你从风险回报的角度来这些赌注完全值得下。如果你从“我是一个CEO,我想要为华尔街提供可预测的季度业绩”的角度来看。那就是一个非常不同的故事了。而且我认为这是他们之间紧张关系的一部分原因。
迪伦·帕特尔
: 所以,我不知道你是否看过这些,像李光耀剪辑,在那里他们像他,像在发表一些激烈的演讲。然后,然后在结尾放一些很酷的音乐,然后展示他们不同的照片。所以我们最近做了一个关于黄仁勋的,并把它放到了社交媒体上,比如在Instagram、TikTok、小红书上,当然还有Twitter,就像所有不同的社交媒体一样。我真的很喜欢,因为他说,玩游戏的目的是为了赢。赢得目的,或者说,赢得原因是为了你可以再次玩,他把它比作弹珠游戏,就像实际上你整天都在玩,并且不断获得更多回合一样。他的全部意义是,我想赢,这样我才能玩下一局。而且,这只关乎下一代,这只关乎现在,下一代。现在讨论15年后的事情没有意义,因为每次的情况都是一个全新的局面,或者说5年后的情况也一样。
我认为你说得对。风险回报是合理的。只是很少有人愿意承担这种风险。这是唯一一家价值超过100亿美元的半导体公司,而且成立时间相对较晚。就像联发科在90年代初,然后是英伟达,其他的大部分都来自70年代。那些大型公司,
Sarah Wang
: 我认为你提出了一个很好的观点,关于这种孤注一掷的赌注,而且正如你所说,他实际上已经错了好几次。移动领域,
迪伦·帕特尔
: 移动领域到底发生了什么?
Sarah Wang
: 没错,而且他仍然在接受(这些教训)。我认为马克实际上和埃里克有过一次很棒的对话,他在对话中谈到了创始人主导的模式,在这种模式下,你会记住你为了达到今天的成就所承担的风险,所以在很多情况下,如果你是后来聘请的CEO,你有点继续按原样掌舵这艘船。但在这种情况下,他记得他们几乎破产的所有时刻。他说,我有一个赌注。继续下这样的赌注。你认为他发生了哪些变化?他是任职时间最长的CEO之一,超过30年。他现在有点和拉里·埃里森并驾齐驱了。你认为在过去的30年左右的时间里,他发生了哪些变化?
迪伦·帕特尔
: 很明显,我29岁。我不知道他是什么样的人。
主持人
: 我看过很多旧的采访。我不会说他不是——他担任首席执行官的时间比你活得还长。没错,没错。英伟达在我出生之前就成立了。我96岁了,我当时想,你知道吗?
Sarah Wang
: 过去几年的任何事情吗?
迪伦·帕特尔
: 不,不,可能更好。我觉得即使是看以前的采访,比如我看了很多以前的采访,很多他以前做的演讲。一件事就是他简直是魅力四射,浑身散发着光芒,他所拥有的魅力只会变得更强。 这很有趣。我不知道这是否完全相关。我不同意,但这个人好像学会了如何成为一个摇滚明星,即使他一直都很有魅力。他现在就是一个彻头彻尾的摇滚明星。他是个摇滚明星,十年前也是。只是人们可能没有意识到。
我想我看的第一个现场演示,非常极端,好像是,是,那个什么,那个什么,是CES,大概2014年或2015年什么的。他是,那是消费电子展。我当时在管理游戏、游戏硬件的子版块,那时我还是个青少年。然后那家伙一直在讲人工智能。他在告诉,他在告诉所有这些游戏玩家关于AlexNet和自动驾驶汽车的事情,
主持人
: 首先,你要了解你的受众,而且,这和消费电子产品没有任何关系。
迪伦·帕特尔
: 当时这给了我,当时我一半觉得,天哪,这太棒了。但我我也一半觉得,我希望你发布新的游戏GPU,但我知道在论坛上,在论坛上很快,每个人都说,去他的,我想听听关于游戏GPU,英伟达的价格欺诈,当然英伟达一直有,我们对价值定价,而且还加上一点,因为我们足够聪明地知道,我猜黄仁勋只是对如何定价有直觉,他会改变价格,就像至少在游戏手表上,他会在演示之前改变价格。所以,这真的可能是一种直觉。无论如何,他有那种魅力去知道什么是对的,但我认为人们,很多人都说,哦不,随便,黄仁勋是错的,他不知道自己在说什么。但现在他说,人们会说,哦,非常,非常,所以可能只是因为他足够正确。
Sarah Wang
: 最近在X上有一篇帖子说他已经晋升到上帝模式,和一群精选的CEO在一起,但这完全正确。
迪伦·帕特尔
: 还有哪些神?
Sarah Wang
: 是扎克,还有哪些神?马斯克。马斯克,马斯克,扎克和黄仁勋。
迪伦·帕特尔
: 好,好,好的。很好的团队。所以我们向硅谷祈祷,现在是邪教了吗?
Sarah Wang
: 没错。关于人员的最后一点,你提到了卡拉,他的首席财务官,而且英伟达似乎有一个出了名的忠诚的团队,即使所有的元老现在都可以退休了。如今在英伟达,是否有人类似于SpaceX的格温·肖特韦尔,或者之前苹果公司史蒂夫·乔布斯的提姆·库克?
迪伦·帕特尔
: 他有两位联合创始人,就像那样,我们不要忽略这一点。其中一个,其中一个没有参与并且已经很久没有参与了,但另一个直到几年前才参与,所以不只是黄仁勋在主导一切,虽然他一直在主导。在硬件方面,有相当多的人参与。我一直觉得,英伟达有个人对我来说就像神话一样。就像当你和工程团队交谈时,他领导着很多工程团队。他是个很低调的人,所以其实我不想说出他的名字。可以理解。但他他实际上就像首席工程官一样,他的角色就是这样,他所在组织的人会知道他是谁。而且我认为还有像他这样的人,但是,他非常忠诚。并且有很多这样的人。
还有另一个人,就像英伟达有很多创新想法,而他就是那个会说“我们现在必须把硅芯片搞出来,我们要削减功能”的人。这就是他出名的原因,英伟达所有的技术人员都讨厌他。这是第二个人,这是第二个人。他也对英伟达非常忠诚,在那里工作了很长时间,但当一家公司如此具有远见卓识和前瞻性时,一个问题就是你会迷失方向。哦,我想做这个,它必须是完美的,令人惊叹的。你必须有那种感觉,这些人之所以能接近黄仁勋是有原因的,因为黄仁勋也相信这些事情,拥有远见卓识的未来展望,但同时也觉得算了吧,砍掉它,我们把它放在下一个版本里,交付,现在就交付,更快地交付,尤其是在硅芯片这样的领域,这真的很难做到。
关于英伟达的事情总是令人印象深刻的,而且从一开始就是如此,他之前也谈到过这一点,他们的第一个成功的芯片,他们就要没钱了。他甚至不得不向其他人要钱才能完成开发。即使那样,他也只是有足够的钱,因为在此之前他已经有过一次失败的芯片,所以这次芯片必须成功,否则就不行了,你知道吗?所以他们因为他们只能支付,这叫做掩模版,基本上,你把这些我称它们为模板的东西放入光刻工具中。然后它就像是指示图案在哪里。然后你,你把模板放进去,你沉积东西,你蚀刻东西,你在晶圆上沉积材料,蚀刻掉它。你把模板放进去,你告诉它把东西放在哪里,然后沉积和蚀刻在那些位置不断发生,你把几十层堆叠在一起,你就做成了一个芯片。这些模板是为每个芯片定制的,而且它们今天的成本高达数百亿美元。但即使在当时,这仍然是一大笔钱。当然,那时不算多,有点他们只能支付一套的费用。
但半导体制造的典型情况是,无论你模拟得多么好,无论你做了多少验证,你都会提交一个设计,然后不得不修改它。总会有问题的。完美地模拟一切太难了。而英伟达的特点是,他们往往能一次成功。即使是像AMD或博通这样执行力很强的公司,他们也经常需要交付,它们被标记为A加一个数字或B加一个数字。所以就像是掩模版的两个不同部分。所以像英伟达总是交付A0,几乎总是这样。他们有时会交付A1。很多时候,即使他们开始生产,A基本上是晶体管层。那么数字就像连接所有晶体管的线路。所以英伟达将开始A的生产并将其产量迅速提高。然后,你只需在过渡到金属层之前将其保持原样,以防他们确实需要更改金属层。所以,就像他们准备就绪并确认它可以工作的那一刻,他们就可以直接,迅速完成大量生产。然而其他所有人都会说,哦,让我们把芯片拿回来。哦,好的,A0不起作用。我们需要进行这个调整,进行这个调整,把芯片拿回来。
Guido Appenzeller
: 这叫做步进,在英特尔,当时我们非常嫉妒英伟达,他们总能在第一次交付时就成功,而我们没有。事情就是这样。
迪伦·帕特尔
: 数据中心CPU组,曾经有一个产品,我说A1,A0、A1,或者如果你必须改变晶体管层,那就到B。所以就像是B。英伟达,对不起,英特尔曾经到过E2。E2,就像那是第15次修订。这就像是AMD的巅峰时期,就像他们相对于英特尔的市场份额飞速增长的时候,当时英特尔正处于E2,就像15个步进。因为那是几个季度的延误,这对上市来说是灾难性的。每次都是一个季度的延误或者什么,所以这很荒谬。
所以我想关于英伟达的另一点是,算了吧,发货吧。让我们尽快获得销量。 让我们,让我们做这些事情,所以无论如何,他们,拥有一些最好的模拟、验证等等,这让他们可以尽可能快地从设计,从想法到交付,剔除任何可能延迟它的不必要的功能,确保他们不必进行修订,以便他们可以,他们可以尽快响应市场。 有一个关于Volta的故事,它是第一款带有张量核心的英伟达芯片,他们在上一代P100 Pascal上看到了所有AI的东西,他们决定我们应该全力投入AI。 他们在将Volta送到晶圆厂之前的几个月里添加了张量核心。就像他们说的,算了吧,让我们改变它。这太疯狂了。如果他们没有这样做,谁会,也许其他人会占据AI芯片市场,所以有很多时候他们只是,那些都是重大的改变,但通常有一些小的事情你需要调整,数字格式或者一些架构细节。英伟达就是这么快。
Guido Appenzeller
: 另外一件疯狂的事情是,他们有一个能够跟上这一切的软件部门,如果你推出了芯片,而且基本上不需要任何步进(修改),它就能立即进入市场,然后准备好驱动程序和所有基于其上的基础设施,这真是令人印象深刻。
Sarah Wang
: 我很喜欢你说的这一点,因为你会想到英伟达从一个又一个顺风中受益,但我认为你们都在说,你必须行动得足够快,执行得足够好,才能利用这些顺风。如果你考虑一下,顺便说一句,我喜欢你关于国际消费电子展的故事。我只是想象着10多年前他谈论自动驾驶汽车的情景。但是,如果你想到抓住视频游戏顺风、VR、比特币挖矿,现在显然是AI,詹森今天谈论的一件事,或者其中一件事是机器人技术、AI工厂。也许我关于英伟达的最后一个问题,你们如何看待未来10到15年?我知道预测超过5年是很困难的,但是,英伟达的业务会是什么样子?
迪伦·帕特尔
: 这实际上是一个问题,这我认为每次我和英伟达的一些高管交谈时都会问这个问题,因为我真的很想知道。而且,他们显然不会回答这个问题,但你打算如何处理你的资产负债表?就像你是现金流最高的公司,你拥有如此多的现金流。现在,超大规模企业都在大幅削减他们的现金流,因为他们正在购买GPU。你打算如何处理所有这些现金流,甚至在这整个起飞之前,他都不被允许收购ARM,那么,他能用所有这些资本和所有这些现金做什么呢,即使是对英特尔的这笔50亿美元投资,也面临着监管审查,就像公告里说的,这需要接受审查,我估计这会通过,但就像他无法购买任何大型的东西。他的资产负债表上将会持有数千亿美元的现金。你是做什么的?是开始建设人工智能基础设施和数据中心吗?也许吧,但话说回来,如果可以找其他人来做,然后自己拿钱,为什么要自己做呢?
他正在投资那些,
主持人
: 投资的是小钱,
迪伦·帕特尔
: 就像他最近给Core Wave提供了一个后盾,因为现在真的很难找到大量的GPU用于突发容量,我想训练一个模型三个月,我有我的基本容量,我不知道我的实验,但我想在三个月后训练一个大型模型。我们从我们的投资组合中知道,所以像英伟达就看到了这个问题。他们认为这对初创公司来说是一个实际的问题。这就是实验室拥有如此优势的原因。但如果我可以,现在,硅谷的大多数公司会花费,多少,75%的融资额在GPU上,至少是这样,我们看到了,如果你可以在三个月内用一次模型运行完成75%的工作,会怎样,你知道吗?并且真正地扩展规模,拥有某种有竞争力的产品,然后你拥有了模型。然后你筹集更多的资金,或者开始部署,
你用它来做什么?是开始大量购买人形机器人并部署它们吗?但好他们做的软件并不好。在模型方面,他们为机器人做的软件也不是特别出色,他们做的,底层的东西很棒。
Guido Appenzeller
: 他们在哪里部署他们的资本,这才是问题。不过,他一直在上下游供应链进行一些投资,投资于新云,投资于一些模型训练公司。
迪伦·帕特尔
: 但再说一次,这只是小打小闹。如果他想,他本可以完成整个Anthropic的融资轮。当然他没这么做,然后真正地让他们使用GPU。或者,他本可以完成整个,OpenAI的融资轮。
主持人
: 他本可以完成整个,任何可解释人工智能(XAI)的融资轮。
主持人
: 你认为这些是他应该做的事情吗?
迪伦·帕特尔
: 好问题。
Guido Appenzeller
: 我们会在我们等待的下一轮融资中引用你的话。
迪伦·帕特尔
: 但不管怎样, 他可能让风险投资变成夕阳产业。不,开玩笑的。拿走所有最好的融资轮次。
你可以先做种子轮,然后让黄仁勋抬高你的估值。我是听说的。不,我不这么认为。我喜欢。我认为挑选赢家对他来说显然非常困难,因为他在整个生态系统中拥有客户。如果他开始挑选赢家,那么就像他的客户会更加急于离开,并投入更多精力去选择AMD,或者一些初创公司,或者他们内部的努力等等,等等,购买TPU,或者其他什么。人们会那样做。他不能仅仅投资这些。他可以做一点,在OpenAI的融资中投入几亿美元是可以的,或者在XAI的融资中投入几亿美元也是可以的。CoreWeave,每个人都在为此大惊小怪,但这就像他早期投资了几亿美元,而且,为了内部开发目的从他们那里租用了一个集群,而不是从超大规模厂商那里租用,这对英伟达来说更便宜,对他们来说,从他们那里获得比从超大规模厂商那里获得更好。他真的,他真的在很大程度上支持CoreWeave吗,或者,其他的客户或者像Neo云这样的,就像有一些投资,但更像是,这是一个不错的云,我们会投入像5%或10%的融资额,不他拿走了超过50%的融资额。
Guido Appenzeller
: 他也在重塑他的市场吗?你几年前,只有四笔大型的这种卡的采购。你刚刚列举了六个。在多大程度上那是——那是他,还有Nebius等等……那里有一长串名单。集群材料,
迪伦·帕特尔
: 这是一个策略吗?我认为绝对是。但他不必投入太多资金来做这件事。
Guido Appenzeller
: 比如什么——他是早于另一个芯片了吗?
迪伦·帕特尔
: 不,但如果你看看他花费在投资Neo云上的巨额资金,那是几十亿美元。但如果他想的话,他还有很多其他的杠杆可以使用。对,对。正如你提到的,分配。很好的一点是,历史上,你会给超大规模企业量大折扣,但因为他可以用反垄断的论点,他就说,每个人都得到同样的价格。太公平了。非常公平,非常公平,你知道吗?
那么他应该怎么做,或者什么应该引导他的——有一种观点认为他应该投资数据中心,而且只投资数据中心层,而不是投资数据中心里的东西,这样才能让更多人建造数据中心。然后,如果市场需求持续增长,数据中心和电力就不是问题了,投资数据中心和电力。我已经跟他们说过了,他们应该投资数据中心和电力,而不是投资云层。因为云层已经相当商品化了,或者说,它是商品化还是互补,这就是整个短语。我不会说成为一家云服务商已经商品化了,但它确实是,你现在有很多不错的竞争对手。而且你已经教育了商业房地产和其他基础设施投资公司也进入了人工智能基础设施领域。所以,我不认为应该投资云层,你应该投资数据中心和能源吗?你是否投资于,因为这真的是你增长的瓶颈,是A,人们愿意且能够花费多少,以及B,实际将他们放入数据中心的能力。
还有像机器人技术。而且,我认为有一些他可以投资的领域,但没有哪个需要3000亿美元的资本。那么你用这些资本做什么呢?我真的不知道。而且我觉得黄仁勋肯定有一些想法。这里肯定有一些有远见的计划,因为这塑造了公司,他们可以出售,他们可以继续,我提到了每年2000亿美元的自由现金流,2500亿美元的自由现金流。他们用这些钱做什么?他们会一直回购股票吗?他们会走苹果的路线吗?苹果公司近十年几乎没有任何有趣的新发展,原因是他们的领导者缺乏远见。蒂姆·库克打造了供应链,他们只是把钱投入到股票回购中。他们实际上并不擅长汽车领域,自动驾驶汽车项目失败了。我们会看看增强现实/虚拟现实会发生什么,我们会看看可穿戴设备会发生什么,但像Meta和OpenAI可能比他们更好。我们拭目以待,还有其他公司,他会投资什么呢?但什么都不投资,什么需要如此多的资金,这才是难题。而且它实际上获得了回报。因为简单的事情就像我的股权成本,
Guido Appenzeller
: 我只是回购。而且它不会彻底改变公司文化。我认为那是另一件事,可能有他可以投资的领域,但你突然发现公司在做两件完全不同的事情,这很难维持。
迪伦·帕特尔
: 但他们做了10件完全不同的事情,一种看待它的方式是我们构建人工智能基础设施。并且以我们构建人工智能基础设施为幌子,机器人、人形机器人遍布世界各地都是人工智能基础设施。或者数据中心和能源是人工智能基础设施,就
Guido Appenzeller
: 所以人形机器人会完全奏效,如果你突然开始浇筑混凝土和建造发电厂,它就拥有完全不同的文化,完全不同的一群人,而且会变得非常非常困难。
迪伦·帕特尔
: 好的,我同意。但是有不同的方法可以做到,比如投资不同的公司,或者像后盾一样,支持发电厂的建设,因为没人想建造发电厂,因为它们是30年的承保项目。有很多不同的领域可以使用资本来,允许一些事情发生,不一定非要拥有它并出售它。
Guido Appenzeller
: 还有,回顾我在英特尔的时光,我们遇到的最大的问题之一是我们的客户群很糟糕,
迪伦·帕特尔
: 我们卖给,大部分芯片都卖给了大型超大规模企业,它们过于集中,而且它们自己制造芯片。
Guido Appenzeller
: 这样你就可以压低价格。
迪伦·帕特尔
: 所以老实说,把钱花在云的多样化上,云——问题在于2014年,你们应该收取高昂的费用,使你们的利润率达到80%。世界会怎么做?什么也不会。当时的利润率相当不错。
主持人
: 那不是问题所在。那是主要问题。不,它们是60,65。它们是80。还是,哎呀,天啊。那是黄仁勋。那是另一个播客上的黄仁勋。
Guido Appenzeller
: UTSD 在这里发挥作用了。
云端战局:亚马逊、甲骨文与AI基础设施的重塑
Sarah Wang
: 等等,我认为 Guido 的评论实际上是一个很好的引子,可以引出我们想和您谈论的其他事情,也就是超大规模企业。我喜欢阅读semi-analysis的原因之一是,你们做出的这些非共识性的预测往往是正确的。其中最近一次,当我在打电话时——只有往往?
Sarah Wang
: 你的黄仁勋命中率很高。非常高。
主持人
: 我价值10亿美元,EV正收益的赌注在哪里?
Sarah Wang
: 但引起我注意的是亚马逊的人工智能复兴。所以我想和您谈谈这个,因为,我认为我们发现帮助我们的投资组合公司选择合作伙伴非常有趣。因此我们有一些关于此的微观数据,但您可以大致了解他们落后的原因。
迪伦·帕特尔
: 所以在2023年第一季度,我写了一篇文章叫做《亚马逊的云危机》。它是关于所有这些新型云将如何商品化亚马逊。它是关于亚马逊的整个基础设施在计算的过去时代是多么的优秀,他们用他们的弹性网络结构,ENA和EFA,他们的网卡,他们,整个协议以及背后的所有东西,他们为定制CPU所做的一切,等等,就像对过去时代的横向扩展计算来说非常好,而不是这个时代的纵向扩展AI基础设施,以及新型云将如何商品化它们,以及他们的芯片团队是如何专注于,成本优化的。然而,今天的关键在于最大化性价比,但就像这通常意味着你只是疯狂地提高性能,即使成本翻倍,你也要将性能提高三倍以上,因为这样每次性能的成本仍然下降。这就是今天使用英伟达硬件的关键所在。
结果证明这是一个非常好的预测。每个人都想指责我们,不,你是错的。因为这就像亚马逊是最好的股票,而微软还没有真正开始腾飞,其他的,像甲骨文等等也没有。从那以后,亚马逊一直是表现最差的超大规模厂商。这里的观点是,他们仍然存在结构性问题,他们仍然使用弹性光纤,虽然情况正在好转,但仍然落后于英伟达的网络,仍然落后于博通/阿里的类似类型的网卡。他们仍然使用,他们内部的AI芯片还可以。但最主要的是他们现在正在醒悟,并且能够真正地抓住商机,所以这里的主要观点是,自从那份报告发布以来,AWS的收入一直在减速。同比收入一直在持续下降。
而我们的重要观点是,它实际上将开始重新加速,这是因为熵增,是因为我们在数据中心所做的一切工作,跟踪每一个数据中心,何时上线以及其中的内容,成本的流动,或者如果你知道芯片的成本、网络的成本、电力的成本,你就知道这些东西的总体利润率,那么你就可以开始估计收入。因此,当我们构建起所有这些时,对我们来说非常清楚的是,他们本季度在 AWS 收入增长方面触底了,至少在未来一年内,这将是 AWS 收入同比增长率的最低点,并且由于他们拥有大量配备 Tranium 和 GPU 的在线数据中心,它将再次加速增长到 20% 以上,
取决于哪一个,取决于哪个客户。体验不如,比如 CoreWeaver 或其他什么,但今天的关键是容量。CoreWeaver 只能部署这么多,他们只能获得这么多的数据中心容量,而且他们构建速度非常快。但目前世界上拥有最大数据中心容量的公司,而且直到今天仍然如此,尽管他们可能会在未来两年内被超越,是亚马逊。实际上,根据我们所看到的,他们将会被超越,是亚马逊。但逐渐地,亚马逊仍然拥有最多的闲置数据中心容量,这些容量将在未来一年内转化为 AI 收入。
Guido Appenzeller
: 我问一个问题。那是正确类型的数据中心容量吗?就像现在的高密度人工智能构建一样,你需要更多的冷却,你需要附近有足够的水源,你需要附近有足够的电力。它在正确的位置吗,或者它是错误类型的物品?
迪伦·帕特尔
: 所以,从这个意义上来说,数据中心容量,从电力安全,到变电站的建设,到变压器,再到你可以为机架提供电源线。现在,很明显,数据中心容量会有所不同,从历史上实际上,亚马逊拥有世界上密度最高的数据中心,当每个人还在12千瓦时,他们已经达到了40千瓦的机架。如果你曾经走进过大多数数据中心,它们都非常凉爽和干燥。如果你走进亚马逊的数据中心,它们感觉像沼泽。感觉就像我长大的地方,就像潮湿和炎热,因为他们正在优化每一个百分比。
所以有点你在这里的观点是,亚马逊的数据中心没有为新型基础设施做好准备,但当你把它们与GPU的成本进行比较时,比如获得,拥有复杂的冷却装置是可以的,几个月前,大概两三个月前,我们在Astera Labs上做出了判断,当时他们大概在90美元,但在那之后的一个月就涨到了250美元,因为亚马逊向他们下了订单。但是亚马逊的基础设施有一些特殊之处,我不会过多地深入,但他们的机架基础设施需要他们使用更多的Astera Labs连接产品。库力也是一样,所以它在网络和冷却方面。他们只需要使用更多的这些东西。但再说一次,与GPU相比,这些东西的成本微不足道。你可以建造,
Guido Appenzeller
: 我的问题更像是,听着,我现在可能需要附近的一条大河来冷却,在很多地区,我只是无法获得足够的水。而且可能在同一地区也有电力问题。
迪伦·帕特尔
: 他们有两个吉瓦规模的站点,电力供应已全部落实,湿式冷却器和干式冷却器也已全部落实。就像一切都很好。只是效率没那么高。但那也没关系,他们将会提高收入。他们将会有收入。并不是说我一定认为亚马逊的内部模型会很棒,或者说,他们的内部芯片比英伟达的更好,或者能与TPU竞争,或者他们的硬件架构是最好的。我不一定这么认为,但他们可以建造很多数据中心,并且可以用可以出租的东西把它们填满,这是一个非常简单的,这是一个非常简单的论点。
Sarah Wang
: Anthropic对于Tradium的协同设计有多重要?因为我记得我们有一家投资组合公司。这是2023年夏天。他们邀请他们去了AWS。他们花了,天啊,我想一周内花了8个小时和他们一起试图弄清楚当时的Tradium。根本无法解决。那么,显然那家投资组合公司没有回去现在再尝试,但根据你听到的,现在的情况有多大不同?
迪伦·帕特尔
: 哦,还是很糟糕。
Sarah Wang
: 好的,好的,明白了。
迪伦·帕特尔
: 很难使用。所以有点这是每个推理公司都会提出的论点,包括AI硬件初创公司,因为我最多只运行三种不同的模型,我可以手动优化所有内容,并为所有内容编写内核,甚至可以深入到汇编级别,这有多难?这相当难,确实相当难。但就像你通常会为生产推理做这些一样。就像你没有使用CUDNN,那是英伟达的库,它非常容易生成你的,生成内核之类的东西,就像你没有,或者说不是生成内核,但无论如何,你仍然在使用,你没有使用这些易于使用的库。当你运行推理时,你要么,使用Cutlass,要么定制你自己的PTX,或者,在某些情况下,人们甚至会深入到SAS级别,当你看到像OpenAI或者像Anthropic这样的公司,当他们在GPU上运行推理时,他们就是这么做的,一旦你深入到那个层面,生态系统就没有那么棒了。
现在使用英伟达的GPU也并不容易。你对硬件架构有一个直观的理解,因为你在这方面做了很多工作,而且每个人都做过,你可以和别人交谈,但归根结底,这并不容易,然而,Anthropic,Trania,更多的是TPU。实际上,硬件架构比GPU稍微简单一些。更大、更简单的核心,而不是拥有所有的这些功能。更少的通用性。这样编码就更容易一些。有Anthropic的人发推文说,当他们进行底层开发时,实际上,他们更喜欢在Tranium和TPU上工作,因为它们的简单性。需要明确的是,Tranium和TPU,特别是Tranium非常难用。不适合胆小的人。这非常困难,但是如果你只是运行,如果我是Anthropic,我必须只为Sonnet运行Cloud 4.1 Opus,并且算了吧,我甚至不在GPU上运行Haiku,或者其他什么,我只需要运行两个模型。实际上,算了吧,我也会在GPU和TPU上运行Opus。无论如何,Sonnet是我的大部分流量。我可以花时间。我多久更改一次那个架构?每四到六个月,对吗?多少?老实说,它甚至没有改变那么多。
Guido Appenzeller
: 定义一下架构变更。在高层次上,在过去几代中,基本元素或多或少是相同的。
迪伦·帕特尔
: 老实说,我对Anthropic的模型架构了解不够。但我认为从我在其他地方看到的情况来已经发生了足够的改变,需要时间来,编写程序并真正获得……最主要的是,如果我是Anthropic,而且我现在拥有,多少,70亿的年度经常性收入,或者更多,到明年年底,超过100亿,超过200亿,ARR甚至30也那是,而且我的利润率是50%,70%。那就是我需要的150亿美元的tranium,然后我就可以在Sonnet上运行。而且其中大部分将是Sonnet 3、5,或者抱歉,4、5,无论是什么,它将是一个模型,服务于大多数用例。所以,我可以花时间让它在这个硬件上工作。
Sarah Wang
: 完全正确。也许关于你做出的非共识性判断,也许我会转移到另一个云。在6月,你们说甲骨文正在赢得AI计算市场。然后在这个播客中,我们已经提到了甲骨文的巨大飞跃,这是显而易见的。
迪伦·帕特尔
: 我认为这是市值超过5000亿美元的公司有史以来获得的最大单笔收益。
Sarah Wang
: 所以,而且在没有...
迪伦·帕特尔
: 2023年第一季度的英伟达是不是更大?可能更小,好吧。
Sarah Wang
: 我认为可能差不多。我们会自己核实。
迪伦·帕特尔
: 太棒了。
Sarah Wang
: 但是,很明显这是已经宣布的巨大承诺。你能跟我们说说你当时为什么做出这个决定,以及为什么甲骨文能够在如此竞争激烈的领域中做得这么好吗?
迪伦·帕特尔
: 所以甲骨文,他们是业内最大的资产负债表,并且不固守任何类型的硬件,他们不固守任何类型的网络。他们将使用Arista部署以太网。他们将通过自己的白盒部署以太网。他们将部署NVIDIA网络、InfiniBand或Spectrum X。而且他们拥有非常优秀的网络工程师。他们在各个方面都拥有非常出色的软件,再说一次,就像ClusterMax一样。他们是ClusterMax黄金级,因为他们的软件很棒。他们需要添加一些东西才能使他们达到更高的水平,并且他们正在添加这些东西,以达到铂金级,CoreWeave就在那里。
所以,两件事,OpenAI有着疯狂的计算需求。微软相当胆小。他们不愿意投资,他们不相信OpenAI实际上可以支付这笔钱,我之前提到过,对。3000亿美元的交易,OpenAI,你没有3000亿美元。而且甲骨文愿意打这个赌。当然,现在,这个赌注有点这个赌注里有更多的安全性,因为甲骨文实际上只需要保障数据中心的容量,
所以这有点像我们如何发现这个赌注的,我们一直在以一种超级详细的方式告诉我们的机构客户,特别是在,超大规模企业、人工智能实验室或者其他一些公司或者,投资者,在我们的数据中心模型中,因为我们正在跟踪世界上每一个数据中心。顺便说一句,甲骨文自己也不建造数据中心,对吧。他们从其他公司获得,他们共同设计,但他们自己不实际建造。所以他们在评估新的数据中心、设计它们方面相当灵活。因此,我们看到了所有这些不同的数据中心,甲骨文在深入讨论中抢购,抢购,签约等等。所以我们有,这里一个吉瓦,那里一个吉瓦,那里一个吉瓦,Avaline,两个吉瓦,他们正在签约和讨论的所有这些不同的站点,我们都在记录它们。我们有时间表,因为我们正在追踪整个供应链,我们正在追踪所有的许可证、监管文件,通过,语言模型,不断地使用卫星照片,然后是像冷水机、变压器设备、发电机等等的供应链。我们能够在我们的数据中心模型中,逐季度地做出相当有力的估计,逐季度地,每个站点有多少电力,所以我们知道的有些站点甚至要到2027年才会开始启动,但我们知道甲骨文已经签约了,而且我们有这种启动路径。
所以现在的问题是,假设你有一个兆瓦,为了简单起见,这已经是大量的电力了,但现在感觉不多了,我们正处于吉瓦时代。但是如果你在谈论一个兆瓦,你用GPU填满它,一个兆瓦的GPU要花多少钱,或者实际上,做数学计算甚至更简单,如果我在谈论一个GV200,每块独立的GPU是1200瓦,但是当你谈论CPU,整个系统时,大概是2000瓦。与此同时,总而言之,简单起见,每块GPU 50000美元,而且GPU的花费不仅仅是GPU本身,还有所有的外围设备,因此,2000瓦需要50000美元的资本支出。所以1000瓦需要25000美元。那么GPU的租赁价格是多少呢?如果你签订的是一个非常长期的协议,批量是270,那个范围是260。最终你会发现,哦,租赁1兆瓦的成本大约是1200万美元/兆瓦。而且每个芯片都不一样。因此,我们跟踪每个芯片,包括其资本支出和网络连接情况。因此,你知道每个芯片是什么,你可以预测每个芯片,他们将哪些芯片放置在哪些数据中心,这些数据中心何时上线,每个季度多少兆瓦。然后你会发现,哦,“星门”在这个时间段上线,他们将在此时开始租赁,每个“星门”站点有这么多芯片,因此,OpenAI必须花费这么多钱来租赁它。
然后你把那些打印出来,我们就能非常确定地预测甲骨文的收入,而且我们在25、26、27财年的预测与他们公布的数字几乎完全一致。我们在28财年的预测也非常接近。让我们感到惊讶的是,他们在28、29财年宣布了一些数据中心,我们还没有找到,但我们肯定会找到的,当然。有点像这种方法可以让你看到,有点你得到了哪些数据中心?多少电力?他们签署了什么协议?那些上线时会带来多少增量收入?这就是我们押注甲骨文的基础。
显然,在时事通讯中,我们包含的细节要少得多,但是,有点像那个论点,他们拥有所有这些容量,他们将签署这些协议。在我们的新闻通讯中,我们讨论了两件主要的事情。我们讨论了OpenAI的业务,然后我们讨论了字节跳动的业务。并且大概明天,周五,将会宣布关于TikTok和所有这些事情,但是像字节跳动业务一样,甲骨文也将向字节跳动租赁大量的数据中心容量,所以我们对字节跳动也采用了相同的方法,字节跳动肯定会付款,因为他们是一家盈利的公司,而OpenAI不是。
所以当你进一步推断,比如OpenAI是否会在28、29、30年存在时,肯定会有一些误差范围。他们是否能够支付每年800多亿美元给甲骨文,这是他们签约的金额,这是唯一的风险。如果发生这种情况,甲骨文的下行风险也会在一定程度上受到保护,因为他们只签署了数据中心,这只占成本的一小部分,GPU才是关键。而且GPU是在他们开始租赁前一到两个季度购买的。所以他们不是,就他们而言,如果他们没有达成协议,下行风险是很低的,他们不会获得收入,但也不像是他们被一堆他们购买的毫无价值的资产困住。
Guido Appenzeller
: 这是另一个角度吗?OpenAI和微软曾经是最好的朋友,现在他们提交了发声文件,他们只是想实现多元化,然后这正在将他们推...