在人工智能领域,一场前所未有的竞赛正在激烈上演。就在近日,备受瞩目的“地球上最聪明的人工智能”——Grok 3,终于由特斯拉创始人马斯克携手xAI团队正式发布。
这场发布会,一如既往地秉承了马斯克的风格,虽然预告十二点准时开始,但最终还是让等待的观众多等了近二十分钟。然而,当发布会正式拉开帷幕,近一个小时的直播内容瞬间点燃了整个AI界。
马斯克携xAI天团,全方位展示了Grok 3的强大实力。据官方数据,Grok 3在多项测试中均超越了谷歌、OpenAI和DeepSeek等明星公司的招牌模型,引发了业内外的广泛关注。
国内外关于Grok 3的报道铺天盖地,“首个突破1400分(模型在Imarena.ai竞技场的得分)的模型”、“首个十万卡集群训练出来的模型”等头衔让人眼前一亮。在知危编辑部看来,Grok 3虽不至于“炸裂”,但至少从直播内容来看,它再次延续了AI领域“大力出奇迹”的神话。
目前,Grok 3仅对部分X的Premium+会员开放。马斯克在发布会上,将Grok与GPT的模型迭代速度进行了对比,针对性十足。他强调,Grok 3实际上是一个模型家族,包括非推理模型和推理模型两种。
在非推理模型方面,Grok 3和Grok 3 mini在AIME’24美国数学竞赛、GPQA(研究生水平科学知识问答能力的基准测试)和代码三项测试中,成绩远超其他模型。而mini版本则可以通过牺牲一定程度的准确性,来换取更快的回答速度。在Chatbot Arena的盲测中,Grok 3的早期版本“巧克力”更是以史无前例的1400分登顶,整体风格控制、编码、数学和创意写作等多个方面均获第一。
在推理模型方面,Grok 3 Reasoning Beta和Grok 3 mini Reasoning同样表现出色。尽管在测试中,如果不算上加时赛(即给模型更多思考时间),Grok 3的推理模型与其他模型的差距并不明显,但一旦加上时长,其优势便立即显现。这似乎说明,Grok 3的推理能力可以随着时间线性增长,具有巨大的成长空间。
现场演示中,马斯克团队展示了Grok 3推理模型在2025年AIME数学竞赛上的测试结果,并直接让Grok 3生成3D动画代码和结合俄罗斯方块与宝石迷阵的新游戏。这不仅让人联想到马斯克此前实锤的xAI将成立AI游戏工作室的消息,更预示着Grok 3在游戏制作方面的巨大潜力。
马斯克还透露,Grok 3在未来的两到三年内,可能参与到特斯拉的生产和火箭发射过程中。同时,基于Grok 3构建的Deepsearch智能搜索引擎也正式发布,为用户提供了更加智能、高效的搜索体验。