DeepSeek-R1再创佳绩,全球风格控制类大模型登顶!

   时间:2025-01-29 08:34 来源:天脉网作者:沈如风

近期,国内AI大模型领域传来振奋人心的消息,DeepSeek-R1在国际大模型排名Arena上取得了显著进展。自1月24日发布以来,这款深度求索推理大模型在短时间内便迅速攀升至全类别大模型排名的第三位。

在Arena的全类别大模型排名中,DeepSeek-R1以其卓越的性能脱颖而出。这一成就不仅展示了DeepSeek团队在AI技术研发上的深厚实力,也标志着国内AI大模型在全球舞台上的竞争力日益增强。DeepSeek-R1在风格控制类模型(StyleCtrl)分类中更是与OpenAI的o1模型并列第一,其Arena得分高达1357分,略高于o1的1352分。

在Arena的排名中,还出现了一个令人意外的现象。小红书这一社交平台在全球大模型排名中的位置,竟然超过了Twitter、Discord、Blog、GitHub、Paper、Dataset等众多常用链接。这一排名结果或许反映了小红书在内容生成和互动方面的独特优势,也引发了人们对社交平台在AI时代角色的新思考。

在全球大模型的激烈竞争中,DeepSeek系列模型无疑成为了国内AI领域的佼佼者。除了DeepSeek-R1之外,DeepSeek-V3也成功跻身全球大模型排名前十名。这两款模型的出色表现,不仅为DeepSeek团队赢得了广泛的赞誉,也为国内AI技术的发展注入了新的活力。

关于Chatbot Arena(前身为LMSYS)的排名机制,其采用了一种盲测的方式。用户可以向两个匿名的AI聊天机器人提问,并选择他们认为最好的回答。这一过程将持续进行,直到确定优胜者。为了确保排名的公平性,如果AI的身份在盲测过程中被揭露,那么该用户的投票将被视为无效。Chatbot Arena还推出了上传图片并与AI互动的新功能,以及使用文本生成图像模型(如DALL-E 3、Flux、Ideogram)来创建图像的功能。用户还可以通过RepoChat标签与Github仓库进行互动聊天,进一步拓宽了AI的应用场景。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报