近期,全球AI领域迎来了一位新星——Deepseek,它的出现如同一股强劲的旋风,迅速席卷了整个行业。在国内市场稳居榜首的同时,Deepseek还成功超越了谷歌的Gemini,跃居全球第二大受欢迎的AI聊天机器人。
这一卓越成就不仅吸引了广大公众的眼球,也引发了包括特斯拉CEO马斯克在内的科技巨头的关注。在WELT经济峰会上发布的采访视频中,马斯克高度赞扬了中国工程师的才智与进取心,并指出Deepseek正是中国人才辈出的产物之一。然而,尽管对中国工程师表示了赞赏,马斯克仍认为Deepseek并未达到AI领域的革命性突破,他坚信自己旗下的xAI公司以及其他AI企业即将推出更为先进的模型。
不仅仅是马斯克,谷歌DeepMind的首席执行官、2024年诺贝尔化学奖得主德米斯·哈萨比斯也对Deepseek发表了看法。哈萨比斯承认,Deepseek的AI模型是他见过的中国最佳作品之一,但他同时指出,从技术层面来看,Deepseek并未带来突破性的科学进展,而是利用了现有的人工智能技术,外界的炒作或许有些夸大。他还透露,谷歌新发布的Gemini 2.0 Flash模型在效率上超过了Deepseek。
Deepseek的崛起并非一帆风顺,它也面临着来自各方的质疑。回想起两年前ChatGPT横空出世时,同样遭遇了不少类似的批评声音。meta首席人工智能科学家杨立昆就曾认为ChatGPT并没有特别的创新之处。然而,事实证明,ChatGPT的出现为人工智能产业带来了革命性的变化,推动了整个行业向生成式AI的转型。
Deepseek同样以极低的成本脱颖而出,其背后的支持者是国内对冲基金巨头幻方量化。自2023年5月成立以来,Deepseek在不到两年的时间里取得了显著的成就。2024年5月,Deepseek发布了开源的第二代MoE大模型DeepSeek-V2,该模型在性能上与GPT-4 Turbo不相上下,但价格仅为GPT-4的百分之一,因此被市场誉为“价格屠夫”和“AI界的拼多多”。
2025年1月,Deepseek推出的R1模型在数学、代码、自然语言推理等任务上表现出色,与OpenAI的o1-1217模型基本持平,并在美国数学邀请赛、MATH-500以及软件开发领域测试集SWE-Bench Verified上取得了微弱优势。令人惊叹的是,这一切成就都是在不到600万美元的投入下实现的。Deepseek的“四两拨千斤”模式打破了人们对大模型行业“大力出奇迹”的传统认知,有望为整个大模型产业的落地提供新的动力。