马斯克Grok 3智商遭质疑,连9.11和9.9大小都分不清?

   时间:2025-02-19 15:47 来源:天脉网作者:柳晴雪

近期,科技界巨头埃隆·马斯克携其xAI团队,在一场备受瞩目的直播活动中,正式揭晓了备受期待的Grok 3。此前,马斯克通过一系列精心策划的预热,成功将公众对Grok 3的关注度推向巅峰。

在发布会上,马斯克信心满满地宣布,Grok 3在数学、科学与编程领域的基准测试中,表现超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算中。他甚至大胆预测,未来三年内,Grok 3有望实现诺贝尔奖级别的科学突破。

然而,Grok 3的实际测试表现却与马斯克的豪言壮语大相径庭。发布会后,多家媒体对Grok 3的最新Beta版进行了测试,并提出了一个经典难题:“9.11与9.9哪个大?”令人惊讶的是,被誉为“最聪明”的Grok 3竟然无法正确回答这个问题,这一尴尬表现迅速在网络上引发嘲讽,被网友戏称为“天才不屑回答简单问题”。

不仅如此,在xAI发布会直播期间,当Grok 3被用于分析游戏《流放之路 2》的职业与升华效果时,也给出了大量错误答案,而马斯克本人在直播中并未发现这些明显的错误。这一连串的失误,无疑给Grok 3的发布会蒙上了一层阴影。

尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中的表现看似遥遥领先,但实际上,它与DeepSeek R1和GPT4.0的差距仅为1%到2%。这一细微的差距,无疑揭示了随着模型规模的扩大,性能提升的边际效应已经愈发明显。

为了证明Grok 3的强大,马斯克在发布会上透露,该模型使用了超过20万张H100芯片,总训练小时数更是达到了惊人的两亿小时。然而,与之形成鲜明对比的是,DeepSeek V3仅使用了2000张H800芯片,训练时间也仅为两个月,但其性能却与Grok 3不相上下。这一对比,无疑给马斯克和xAI团队带来了不小的压力。

面对外界的质疑和嘲讽,马斯克在社交媒体上迅速作出回应。他表示,当前的Grok 3仍处于测试阶段,完整版将在未来几个月内推出,并诚邀用户反馈使用过程中遇到的问题。这一表态,似乎是在为Grok 3的未来表现留下了一丝悬念。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报