近日,科技界传来一则令人瞩目的消息,百度最新推出的文心大模型X1在多个公开数据集上的表现超越了升级后的DeepSeek-V3-0324,特别是在数学、代码生成以及知识推理方面展现出了卓越的能力。
在数学能力的测试中,文心X1在GSM8K数据集上取得了95.6的高分,而DeepSeek-V3-0324的得分则为93.6。这一成绩充分展示了文心X1在数学问题解决方面的深厚功底。在代码生成方面,文心X1同样表现出色,在Humaneval数据集上的得分达到了90.9,高于DeepSeek-V3-0324的86.6分。在知识推理的测试中,文心X1也以88.6的分数领先于DeepSeek-V3-0324的85.1分。
DeepSeek官方不久前宣布了其V3模型的小版本升级,针对推理、前端开发、中文写作以及中文搜索等多个方面进行了能力优化。然而,百度文心大模型X1的发布无疑给这一领域带来了新的挑战和机遇。
文心大模型X1由百度的慢思考技术发展而来,具备更强的理解、规划、反思以及进化能力。作为能力更全面的深度思考模型,文心X1在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算以及工具调用等多个方面均表现出色。其准确、创意和文采兼备的特点,使其在众多应用场景中都能发挥出色的作用。
据可靠消息透露,文心大模型X1即将上线千帆大模型平台,为用户提供更加便捷和高效的API调用服务。值得注意的是,其API调用价格仅为DeepSeek-R1调用价格的50%,这无疑将进一步提升文心X1的市场竞争力。