在科技界的聚光灯下,一场关于人工智能巅峰对决的戏码正式拉开帷幕。据行业权威媒体透露,埃隆·马斯克旗下的xAI公司最新发布的Grok 3模型,在X平台上吸引了超过200万观众的目光,成为业界焦点。
Grok 3以其惊人的计算能力和卓越表现震撼业界。相较于上一代模型,Grok 3的计算量提升了10倍,使用了庞大的20万张GPU卡集群进行训练。整个训练过程分为两个阶段:第一阶段历时122天,使用了10万张GPU进行同步全面训练;第二阶段则在92天内扩展到20万张GPU卡,再次进行训练和推理。这一壮举不仅彰显了xAI的技术实力,也预示着人工智能领域的新里程碑。
在数学能力测试(AIME24)中,Grok 3以52分的成绩超越了DeepSeek-V3的39分以及OpenAI的o3-mini等模型。在科学知识评估(GPQA)和编程能力测试(LCB Oct-Feb)等方面,Grok 3同样表现出色。在最新的AIME 2025性能测试中,Grok 3 Reasoning Beta版本在推理和计算时间复合评分上获得了93分的高分,其精简版本Grok-3 mini也达到了90分,远超DeepSeek-R1和Gemini-2 Flash Thinking等其他模型。
马斯克在直播中亲自展示了Grok 3的强大功能,包括解决复杂的物理问题和创作融合《宝石迷阵》与《俄罗斯方块》元素的游戏。尽管Grok 3的推理模型仍处于测试版,并仍在训练中,但其展现出的潜力已足以令业界震撼。
然而,并非所有人都对Grok 3持完全乐观态度。有分析指出,在“推理+测试时间计算”这一测试中,尽管Grok 3使用了20万张GPU卡,但其数学性能相较于o3-mini-high模型和DeepSeek R1模型并未展现出显著优势。马斯克也承认,Grok 3的语音模式仍存在一定的不稳定性。
尽管如此,xAI公司仍信心满满。马斯克表示,Grok 3模型拥有强大的AI推理能力,在测试中表现优于市面上任何已知产品。从今天开始,X平台的Premium Plus订阅用户将率先获得Grok 3的访问权限,而独立应用程序则需要订阅Super Grok服务,具体售价尚未公布。
这场直播的同时,OpenAI方面也传来了新动向。为抵御马斯克的收购要约,OpenAI正考虑赋予其非营利性董事会特殊投票权,以确保其对重组后的公司保持控制权,并能够否决包括微软和软银等现有投资者以及董事会的决策。这一举措被外界视为OpenAI对马斯克敌意收购的防御措施。
回溯历史,马斯克与OpenAI的渊源颇深。他曾是OpenAI的联合创始人之一,但因理念不合于2018年离开公司。随着ChatGPT的火爆,马斯克创立了xAI公司,旨在与OpenAI展开竞争。过去一年多时间里,xAI团队发布了多个版本的Grok模型,并不断推动技术进步。
如今,马斯克终于迎来了证明自己的时刻。他坦言,Grok 3将成为AI领域的真正颠覆者。xAI公司基于合成数据进行训练,能够通过反复检查数据来反思所犯的错误,从而实现逻辑一致性。这一特点使得Grok 3在解决问题时更加准确和高效。
然而,这场AI领域的巅峰对决远未结束。随着DeepSeek等开源模型的崛起,无论是国外的OpenAI和xAI,还是国内的百度、腾讯等科技大厂,都面临着新的挑战和机遇。开源与闭源、应用与解决方案之间的较量正愈演愈烈。
在这场没有硝烟的战争中,每一位参与者都在努力寻找自己的定位和优势。而最终谁将问鼎AI领域的巅峰,还需时间来揭晓。