OpenAI高管坦言:GPU短缺仍是最大瓶颈
OpenAI高管们不断强调,公司对算力资源的需求远未满足,尤其是GPU数量严重不足。CEO萨姆·阿尔特曼(Sam Altman)已推动公司加速扩张,计划在年底前将可用GPU数量提升至超过100万张。相比之下,埃隆·马斯克的xAI团队已部署超过20万张GPU的“科洛苏斯”(Colossus)超级集群用于训练Grok4模型。阿尔特曼在X平台发文调侃:“为团队感到骄傲,但接下来得想办法把算力再提升100倍了。”而马斯克随后回应,称xAI未来五年目标是拥有相当于5000万张英伟达H100芯片的算力。 这场算力竞赛背后,是AI研发的核心逻辑:GPU已成为AI研究的“硬通货”。OpenAI副总裁乔纳森·科恩(Jonathan Cohen)直言,GPU就像科研领域的“货币”。就连马克·扎克伯格的妻子普里西拉·陈(Priscilla Chan)也表示,她所参与的陈-扎克伯格倡议组织(Chan Zuckerberg Initiative)正用GPU作为吸引顶尖人才的工具。 OpenAI首席产品官凯文·韦尔(Kevin Weil)在一次访谈中进一步解释:算力的增加直接带来AI应用的爆发。他将这一过程比作互联网带宽的提升——过去视频传输不可行,如今因网络能力提升,视频已成日常。他强调:“我们拥有的GPU越多,人们使用的AI就越多。” 为应对持续的算力饥渴,OpenAI联合甲骨文与软银启动了耗资5000亿美元的“星门计划”(Stargate)。该计划于今年1月在白宫发布,旨在推动美国实现通用人工智能(AGI)。OpenAI首席财务官萨拉·弗里尔(Sarah Friar)表示,公司目前最大的挑战就是“始终处于算力不足的状态”,因此才必须推进如此大规模的基础设施建设。 在产品层面,更多GPU意味着更低延迟、更快的文本生成速度,也使高级功能可向更广泛用户开放,或支持更多实验性项目。然而,内部需求同样无限:韦尔坦言,研究团队对GPU的渴求“几乎无穷无尽”,这也是OpenAI不断扩建算力体系的根本原因。