在万众瞩目中,马斯克麾下的xAI公司正式揭晓了其最新力作——Grok 3大型语言模型。这一盛况通过视频直播形式呈现,吸引了超过百万观众的在线围观,连马斯克本人也亲临直播间助阵。
据马斯克亲自介绍,Grok 3在极短时间内实现了功能的飞跃式提升,相较于其前代Grok 2,其能力已跃升一个数量级。Grok 3及其精简版Grok 3 mini在多项性能指标上均表现出色,甚至超越了Gemini、DeepSeek和ChatGPT等业界佼佼者。
xAI的工程师团队透露,尽管Grok系列起步较晚,但其在MMLU(一种评估语言模型多任务语言理解能力的基准测试)上的得分正以惊人的速度逼近ChatGPT。Grok 3的训练量是Grok 2的十倍之多,且已在xAI内部稳定运行了两周时间。
xAI还推出了名为Deepsearch的Grok 3智能搜索引擎。这款工具被工程师们誉为xAI的首款广泛代理工具,它不仅能够帮助专业人士编写代码,还能为普通人解答日常生活中的各种疑问。
马斯克在现场亲自演示了Grok 3的搜索能力。例如,当询问“下一次星舰发射的时间”时,Grok 3会像DeepSeek一样展示其处理过程,包括浏览的网页、思考路径,以及信息的可信度验证,最终以列表形式给出预测结果。
Deepsearch在深度思考过程中还会展示不同的子任务,这种功能相较于现有的搜索引擎更为强大,能够节省大量时间,这得益于其对搜索引擎算法和逻辑的重构。
关于用户何时能体验到这款“地球上最聪明的人工智能”,马斯克表示将首先向预定用户开放。由于模型仍在持续优化中,苹果应用商店的Grok版本可能会稍显滞后,而网页版将保持最新状态。据透露,Grok 3的语音模式有望在一周后推出。
在直播的尾声,马斯克和xAI工程师回答了网友们的提问。当被问及是否考虑开源时,马斯克给出了肯定的答复,并表示每次发布新版本时都会开源上一个版本,Grok 3将在几个月后开源。对于“Grok 3是男性还是女性”这一有趣问题,马斯克笑称性别是模型自我定义的,并幽默地提醒网友“不要爱上Grok”。
马斯克还分享了开发Grok 3过程中的最大挑战,即模型的训练和100%逻辑推理过程,其复杂程度堪比预测宇宙的发展态势。
如果Grok 3的推理能力真如其宣传般强大,那么它或将引领AI领域从“生成答案”向“逻辑推导”的新阶段迈进。
xAI公司成立于2023年7月,此前已成功推出Grok-1、Grok-1.5、Grok-1.5 Vision和Grok-2等大模型产品。其中,Grok-1是迄今为止参数量最大的开源大语言模型;Grok-1.5在推理能力和上下文长度上有所改进;Grok-1.5 Vision则是首个多模态智能模型;而Grok-2在Chatbot Arena榜单上排名第18位。
然而,当前的大模型行业竞争异常激烈。在Grok 3发布的同一天,OpenAI的首席执行官奥特曼在社交媒体上透露,GPT-4.5的测试体验远超预期,似乎预示着GPT-4.5的发布已为期不远。谷歌也在近期发布了一系列新模型,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及旗舰大模型Gemini 2.0 Pro的实验版本。面对这些强劲的竞争对手,Grok 3能否占据市场主导地位仍需时间检验。