OpenAI首席执行官萨姆·奥尔特曼近日在社交媒体上征求公众意见,关于公司即将推出的开源项目方向,引发了业界的广泛关注。奥尔特曼提出了两个备选方案:一个是虽小巧但仍需GPU支持的o3-mini级模型,另一个则是专为手机设计、经过高度优化的模型。
这一举动或许预示着OpenAI将再次迈出开源大模型的重要一步,自2019年GPT-2开源以来,这是该公司在开源领域的又一重大动作。
实际上,早在1月底的Reddit“问我任何事”活动中,奥尔特曼就透露了OpenAI内部正在讨论是否公开更多AI模型技术及其工作原理。他反思了OpenAI过去的开源立场,承认可能“站在了历史的错误一边”,并表示公司需要调整开源策略。不过,他也承认,公司内部对此并非意见一致。
回顾OpenAI的历史,自2015年成立以来,公司曾承诺在符合公众利益的前提下公布模型的研究和数据。然而,面对日益激烈的竞争压力以及对信息泄露可能带来的安全风险的担忧,OpenAI逐渐转向了专有模型的开发。
但近期,AI科技行业的格局发生了显著变化,促使OpenAI重新审视其开源策略。尤其是DeepSeek的崛起,以其低成本和开源模式迅速赢得了市场青睐。DeepSeek的大模型DeepSeek-R1仅用两个月时间完成训练,成本仅为550万美元,相比之下,OpenAI等竞争对手的同类项目成本要高得多。
自ChatGPT在2022年底推出以来,为了保持竞争力,许多AI公司选择不公开过多技术细节。然而,随着DeepSeek等开源技术的兴起,越来越多的开发者和客户开始转向更具性价比的开源解决方案。这无疑给OpenAI等专有模型开发者带来了不小的压力,也促使他们重新考虑开源策略的重要性。