在AI领域的一场激烈角逐中,谷歌的新版Gemini模型(Exp 1114)以惊人的表现脱颖而出,成功登顶竞技场总榜,这一消息迅速在科技圈内引起了轰动。经过6000多名网友的匿名投票,Gemini不仅在数学成绩上与学霸级模型o1并驾齐驱,更是在其他五个单项中拔得头筹,展现出了全面而强大的实力。
Gemini(Exp 1114)的卓越成绩一经公布,谷歌CEO皮猜便亲自为其站台,这一举动无疑为Gemini的火爆热度再添一把火。竞技场官方也迅速发布喜讯,祝贺谷歌达到了这一非凡的里程碑。此前,关于谷歌AI发展遭遇瓶颈的言论不绝于耳,而Gemini的横空出世无疑是对这些质疑的有力回击。
目前,新模型已在谷歌AI Studio上线供用户体验,官方后续还计划提供API接口,以便更多开发者能够利用这一强大工具。Gemini的强势崛起,让不少网友猜测它是否就是传说中的Gemini 2。从竞技场Imsys的排名来看,Gemini(Exp 1114)的分数直线飙升40分以上,成功挤下了此前一直霸榜的OpenAI模型,包括o1-preview和GPT-4o等。
在单项比拼中,Gemini(Exp 1114)同样表现出色,一举夺得了复杂提示、数学、创意写作、指令遵循、长查询处理以及多轮对话六个单项的第一名。尤其在数学能力上,Gemini竟能与OpenAI的o1模型平分秋色。要知道,o1模型据称无需专门训练就能拿下数学奥赛金牌,甚至在博士级别的科学问答中超越人类专家。然而,在写代码这一重要功能上,Gemini虽然相比谷歌上一版本有所进步,但仍未能进入前三名。
在风格控制这一新推出的功能测试中,Gemini-Exp-1114也未能进入前三名,甚至不及自家的Gemini-1.5-pro。不过,Gemini-Exp-1114在视觉能力上却拿下了第一名,超越了GPT-4o。这一成绩让不少网友感到意外和惊喜,同时也引发了关于Gemini是否真的是Gemini 2的热烈讨论。一些网友通过实测发现,Gemini-Exp-1114虽然拥有32k上下文窗口,但在某些方面似乎还不如旧版Gemini 1.5。谷歌AI Studio负责人对此表示,将尽快更新以改善用户体验。
尽管Gemini-Exp-1114在某些方面仍存在不足和争议,但其整体表现无疑已经让谷歌在AI领域重新夺回了领先地位。不少网友已经迫不及待地在谷歌AI Studio上体验了这一新模型,并分享了自己的使用反馈。从反馈中可以看出,Gemini-Exp-1114在思维链和数学能力上表现突出,但在某些物理问题和数字比大小等简单任务上却出现了失误。甚至有网友在询问Gemini-Exp-1114的名字时,得到了“Claude”的回答,引发了一阵欢笑。