近期,百度宣布了一项重大决策,计划在未来数月内推出其文心大模型的最新版本——4.5系列,并定于6月30日正式向公众开放源代码。这一消息引发了业界的广泛关注。
百度此次决定开源文心大模型,背后有着深刻的行业背景。近年来,DeepSeek作为一股新兴力量迅速崛起,给百度等AI巨头带来了不小的挑战。DeepSeek的旗舰产品——DeepSeek V3,凭借其高达6710亿参数的规模、创新的MoE架构,以及每秒60个Token的处理速度,在知识类任务、数学竞赛等多个领域展现出了卓越的性能。DeepSeek还通过强化学习、知识蒸馏等先进技术,不断提升模型的效能。
更为重要的是,DeepSeek选择了开源之路,将其模型和技术论文全面公开。这一举措极大地激发了开发者的创新热情,使得基于DeepSeek技术的各种新应用、新服务如雨后春笋般涌现。相比之下,那些仍然坚持闭源的大模型显得愈发捉襟见肘,难以跟上开源社区快速发展的步伐。
有趣的是,百度此次开源决策与其创始人李彦宏此前的言论形成了鲜明对比。在2024年4月的Create 2024百度AI开发者大会上,李彦宏曾表示:“在大模型场景下,开源实际上是最昂贵的选择。因此,开源模型往往会逐渐落后。”然而,面对DeepSeek的强劲势头和开源生态的蓬勃发展,百度不得不调整策略,选择开源其最新的文心大模型。这一转变无疑是对当前AI行业发展趋势的一种深刻反思和积极应对。