近日,科技界迎来了一场震撼发布,埃隆·马斯克与他的新公司xAI携手推出了最新的旗舰人工智能模型——Grok-3系列,以及全新的聊天机器人Grok。这场发布会吸引了全球数百万观众的瞩目,xAI虽作为AI竞赛中的后来者,却凭借其强大的技术实力和马斯克的个人魅力,迅速成为焦点。
在发布会上,xAI团队展示了Grok-3的卓越性能,从马斯克引以为傲的数据集群到直接的评测数据对比,无一不彰显着其“地表最强AI”的称号。xAI强调,Grok-3在推理、数学、代码等多个领域均取得了显著突破,甚至在AIME和GPQA等基准测试中超越了其他顶尖模型。
马斯克的竞争观念在Grok-3的发布中得到了充分体现。他追求极致的创新速度,用巨大的算力(20万张GPU,远超DeepSeek-V3百倍)和精简的团队(xAI最初仅12人)来打造这一“不下牌桌”的AI强者。xAI团队在直播中将Grok-2戏称为“玩具”,以突出Grok-3的强大。
Grok-3系列包括推理模型和mini模型,其中推理模型Grok-3 Reasoning和Grok-3 mini Reasoning在多项测试中表现出色。例如,在AIME 2025最新的数学基准测试中,Grok-3 Reasoning超越了o3-mini high的最佳版本。在大模型竞技场LMSYS上,Grok-3的早期版本也位列第一,成为首个评分突破1400分的模型。
xAI现场演示了Grok-3的推理和创意编程能力,如生成3D动画代码和涉及推理能力的升级版俄罗斯方块小游戏。这些核心能力升级也被融入到了新的Grok应用中,以Agent形式集成了DeepSearch、Think和Big Brain三种模式,为用户提供编程、数学等高阶能力。
马斯克还透露,后续将推出语音交互、多模态交互等新功能,并成立AI游戏社区。然而,Grok-3并不会立即向所有用户开放,而是首先针对X的Premium+订阅用户解锁。同时,xAI还推出了会员服务“SuperGrok”,价格为每月30美元或每年300美元。
尽管Grok-3取得了显著成就,但作为后发者,xAI仍面临诸多挑战。在商业模式上,xAI通过免费和开放API降低模型使用门槛,但目前在服务企业方面尚不具备完备的能力。同时,在C端市场,Grok与X的集成度还有待提高,特别是尚未上线的语音、视频等功能。
在外部竞争方面,中国模型公司如DeepSeek等的冲击,以及OpenAI和Anthropic等强劲对手的快速发展,都给xAI带来了不小的压力。然而,马斯克一贯的“竞争观”和“大力出奇迹”的策略,或许能让xAI在这场AI竞赛中继续创造奇迹。