马斯克人工智能公司xAI计划打造超级计算机,面临电力挑战
科技巨头埃隆·马斯克旗下的新兴人工智能企业xAI,近期宣布了一项雄心勃勃的计划——在美国田纳西州孟菲斯市构建全球规模最大的超级计算机。然而,这一宏伟蓝图正遭遇电力供应的巨大瓶颈。
据悉,自2024年6月项目启动以来,xAI已向孟菲斯相关机构提交了多达14份建筑许可申请,旨在建造一系列配套设施,预计总投资额高达4.059亿美元(折合人民币约29亿元)。这些申请涵盖了电气、机械、管道等多个工程领域,其中包括一项耗资3000万美元的计算机设备安装工程,以及一项造价390万美元的防撞围栏建设项目。
马斯克曾公开表示,他期望将孟菲斯超级计算机Colossus的规模扩大十倍,以容纳多达100万个GPU。然而,xAI在电力需求方面遇到了严峻挑战。根据提交的文件显示,孟菲斯当地电网无法满足这一庞大计算集群的电力需求,除非xAI能够自行建设发电设施。
为了应对电力缺口,xAI已向孟菲斯照明、天然气和水处理公司(MLGW)申请了300兆瓦的电网电力,并成功获得了一半的供电许可。同时,xAI还计划在项目现场安装天然气涡轮机进行发电,并已启用卡特彼勒子公司Solar Turbines提供的总发电能力为250兆瓦的燃气发电机作为补充。
尽管如此,xAI在许可申请中坦言:“若无额外现场发电,我们将难以满足客户需求。”这一困境也引起了田纳西河谷管理局(TVA)的关注。作为田纳西州及周边地区的主要电力供应商,TVA表示计划在未来几年内投资160亿美元,以满足包括xAI在内所带来的历史性负荷增长。然而,TVA发言人强调,任何超过100兆瓦的新负荷均需经过董事会审查批准,以确保电力系统可靠性不受影响。
加州大学河滨分校电气与计算机工程副教授任绍磊分析指出,尽管xAI具备自主现场发电能力,可能足以支持20万个英伟达H100 GPU的运行,但进一步扩大算力将面临重重挑战。他预计,运行100万个GPU所需电力可能超过1千兆瓦,是当前xAI在孟菲斯可获得电力的四倍之多。任绍磊还提到,虽然采用超额预订策略可能在一定程度上缓解电力紧张问题,但这无疑将增加运营风险。