在人工智能领域,一场激烈的竞争正在悄然上演。近日,马斯克旗下的AI项目Grok-3横空出世,迅速在AI性能排行榜上崭露头角,以1402的高分夺得榜首,其强大的实力引起了业界的广泛关注。
据了解,Grok-3在多个分类测试中均表现出色。在数学测试(AIME’24)中,它获得了96分的高分,超越了DeepSeek-R1和GPT-4o等强劲对手。在科学测试(GPQA)中,Grok-3更是展现出研究生级的知识问答能力,遥遥领先。而在编程测试(LCB)中,其生成复杂代码的效率也远超Claude 3.5和Gemini 2.0等模型。
在马斯克的一次直播中,他亲自展示了Grok-3的强大功能。无论是生成3D动画、求解开普勒定律,还是制作游戏,Grok-3都能轻松应对。更令人惊叹的是,马斯克在演示过程中还能实时检查运算结果,并自行修正逻辑错误,而其他大模型在执行这些任务时往往显得力不从心。
不仅如此,马斯克还在Grok-3的基础上推出了智能体深度探索DeepSearch。虽然名字与DeepSeek相似,但DeepSearch的实力同样不容小觑。它结合了深度思考和全网搜索的能力,比传统搜索引擎更加高效。
马斯克团队的豪言壮语也引发了热议。他们表示,未来实习生可能面临失业风险,因为DeepSearch能够胜任实习生所能做的所有工作,甚至还能完成实习生无法胜任的任务。那么,作为AI行业的后来者,马斯克究竟是如何逆袭美国大厂,登顶全球第一的呢?
答案或许并不复杂——砸钱。为了训练Grok-3,马斯克不惜斥巨资建立了一座AI数据中心,并投入了大量H100芯片。在算法不变的情况下,算力几乎等同于性能。因此,在20万张GPU的加持下,Grok-3的性能自然非同凡响。
然而,马斯克的成功同样离不开人才的支持,尤其是中国人才的贡献。在Grok-3的发布现场,马斯克身边坐着两位华人面孔,分别是多伦多大学科学系助理教授Jimmy Ba和来自中国杭州的AI数学家吴宇怀。事实上,马斯克的AI公司初始成员中有五位华人,他们在公司的发展中发挥了重要作用。
例如,张国栋本科就读于浙江大学信息工程专业,连续三年专业排名第一,并多次获得国家奖学金和全国大学生数学建模竞赛一等奖。他对人工智能充满兴趣,并投身于计算机视觉领域的研究。另一位联合创始人杨格则本硕就读于哈佛大学数学系,曾是微软的高级研究员。还有戴子航,他本科就读于清华大学工商管理学,硕博就读于卡内基梅隆大学计算机科学学院,曾在网易、百度、谷歌等知名企业实习和工作。
尽管Grok-3在性能上取得了显著优势,但它真的已经赢了吗?或许并非如此。与其他大模型相比,Grok-3的综合性能只是略胜一筹,提升有限。而且,对于中国的普通用户和企业来说,Grok-3的高昂价格也是一个不小的门槛。相比之下,中国的DeepSeek则显得更加亲民和实用。
DeepSeek不仅开源且价格实惠,还广泛应用于教育、医疗、金融等多个领域。企业可以定制工具,普通用户也能低成本调用API。这种将AI融入生活的做法得到了广泛认可。而Grok-3则主要服务于X平台用户,提供聊天机器人、智能搜索和创意生成等服务,并采用付费模式。这在一定程度上限制了其大规模普及的可能性。
DeepSeek在技术创新方面也不遗余力。近日,其创始人梁文峰提交了一篇新的技术论文,介绍了一种名为NSA的技术。该技术能够在技术推理的同时降低训练成本,而且不牺牲性能甚至还能提升性能。在基于64K上下文长度训练时,正向传播加速9倍,反向传播加速6倍。这一成果无疑为DeepSeek的发展注入了新的动力。
Grok-3和DeepSeek分别代表了高性能闭源和普惠开源两种不同的竞争格局。前者凭借强大的算力和资本支持占据上风,但高昂的成本和门槛限制了其普及范围;后者则凭借低成本、开源生态和真实数据处理能力在各个领域发光发热。中美在大模型赛道的对决才刚刚开始,谁将笑到最后尚未可知。