Mistral新品CodeStral 2501登顶,代码模型上下文窗口跃升至256k

   时间:2025-01-14 14:09 来源:天脉网作者:沈瑾瑜

近期,备受瞩目的“欧洲版OpenAI”——Mistral公司,再度推出了其代码模型CodeStral的最新版本,该版本在Copilot竞技场中与DeepSeek V2.5和Claude 3.5并驾齐驱,共同摘得桂冠。

此次更新的CodeStral不仅在性能上实现了飞跃,其上下文窗口长度更是达到了前所未有的256k,是之前版本的8倍之多。这一改进无疑将为用户带来更加流畅和高效的代码编写体验。

据Mistral官方介绍,新版CodeStral(2501)采用了更为高效的架构和分词器,使得生成速度相较于前一代提升了约2倍。在多个基准测试中,2501版本均取得了业界领先的成绩,特别是在代码补全(FIM)能力上表现尤为出色。

Mistral的合作伙伴Continue.dev的联合创始人Ty Dunn表示,CodeStral 2501的推出标志着FIM领域取得了重大进展。这一评价无疑是对CodeStral团队辛勤付出的高度认可。

在Copilot竞技场中,CodeStral 2501与Deepseek V2.5以及Claude 3.5 Sonnet并列榜首。相较于上一版本(2405),新版得分提高了12分,达到了新的高度。而Llama 3.1、Gemini 1.5 Pro和GPT-4o等模型则紧随其后。

Copilot竞技场由卡内基梅隆大学和UC伯克利的研究人员与LMArena合作推出,旨在通过用户出题并让系统随机选择两个模型匿名输出的方式,来评估代码模型的性能。这一平台为代码模型的比较和选择提供了有力的工具。

Mistral官方还晒出了CodeStral 2501在Humaneval等传统测试中的成绩单。在多个指标上,CodeStral 2501均取得了业界领先的成绩。特别是在Python语言和SQL数据库的测试中,CodeStral 2501在多个测试指标上都位列第一,展现了其强大的代码生成和补全能力。

除了Python,CodeStral 2501还支持80多种其他编程语言,并在C++、JS等多种常用语言中取得了SOTA成绩。在C#语言上,CodeStral 2501的得分也超过了半数。然而,在Java上,CodeStral 2501的成绩相较于前一代略有下降,这或许是其未来需要改进的方向之一。

在FIM表现方面,CodeStral 2501同样表现出色。其平均成绩以及Python、Java和JS三个单项相较于前一代均有显著提升,且优于OpenAI FIM API等其他模型。这一成绩无疑进一步巩固了CodeStral在FIM领域的领先地位。

目前,用户可以通过Mistral的合作伙伴Continue,在VSCode或Jetbrains系列IDE中使用CodeStral 2501。同时,对于动手能力强的用户,也可以通过API自行部署该模型,价格为每百万输入/输出token 0.3/0.9美元或欧元。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报