中国AI新星DeepSeek,能否撼动OpenAI的硅谷地位?

   时间:2025-01-26 10:33 来源:天脉网作者:苏婉清

中国AI新星深度求索(DeepSeek)近期在国际舞台大放异彩,其在人工智能领域的创新成就引发了欧美科技界的广泛关注与热议。

1月24日,美国知名财经频道CNBC发表文章指出,DeepSeek推出的AI模型对美国在AI领域的领导地位构成了潜在威胁。同日,华尔街顶级风险投资公司A16Z的创始人马克·安德森在社交媒体上盛赞DeepSeek R1为其所见的最令人震撼的突破之一,并强调其开源特性是对全球的馈赠。英伟达的高级科学家Jim Fan也对DeepSeek给予了高度评价。

不仅如此,据媒体报道,meta(原Facebook)的内部员工在匿名职场社区上透露,DeepSeek的一系列动作已让meta的生成式AI团队感到恐慌,工程师们正急于分析DeepSeek,以期复制其技术精髓。此前,OpenAI前政策主管、Anthropic联合创始人杰克·克拉克也曾表示,DeepSeek汇聚了一批神秘莫测的天才,并认为中国制造的大模型将成为一股不可忽视的力量,与无人机、电动汽车等领域的发展相媲美。众多国外科技博客也纷纷对DeepSeek进行了详尽报道。

那么,这家让欧美科技创投界大佬及媒体赞不绝口的中国大模型公司,究竟有何过人之处?

总部位于杭州的DeepSeek近日发布的推理模型R1,在性能上已逼近OpenAI的GPT-4正式版,但其推理成本却仅为后者的几十分之一。据《纽约时报》报道,DeepSeek以极低的成本(600万美元)和少量的芯片(2000块)实现了与OpenAI等巨头相当的性能,这一成就挑战了“只有科技巨头才能研发尖端AI”的行业固有观念。

DeepSeek的这一创新不仅降低了高性能模型研发的成本,更提升了用户体验。R1功能强大且免费使用,同时DeepSeek还将代码向开发者开源。网友们对此反响热烈,纷纷表示DeepSeek不仅能力强大还完全免费,大大节省了成本。有人甚至表示,通过DeepSeek的模型写代码,效果比GPT更好。

记者亲身体验发现,只需登录DeepSeek的官方网站或手机APP,即可通过“深度思考”功能感受DeepSeek R1的强大能力。当记者询问DeepSeek关于其R1模型发布与英伟达股价下跌的关系时,DeepSeek从多个维度进行了逻辑严密的分析,包括用户为何会产生这种关联联想、英伟达的股价受哪些因素影响以及R1模型可能影响其股价的原因等,最终给出了精炼的阐述和结论。

在测试过程中,R1不仅能以动画形式解释量子力学、轻松应对脑筋急转弯,还能以缜密的逻辑回答诸如电车难题等各种复杂问题。据了解,DeepSeek R1摒弃了业内常用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等。这种方法不仅提高了训练效率,还显著减少了对昂贵计算资源的依赖。与OpenAI的GPT-4相比,DeepSeek模型的百万token输入成本从15美元大幅降至0.55美元,输出成本也从60美元降低到2美元。

由于DeepSeek通过技术创新减轻了对算力的过度依赖,甚至有市场观察者将芯片巨头英伟达股价周五的下跌归因于DeepSeek R1模型的发布。还有人认为,DeepSeek正是在美国对华芯片出口限制的背景下激发出的创新成果。

业内人士指出,DeepSeek的崛起标志着中国AI产业正从“跟随创新”向“范式创新”转变,全球AI竞争已步入技术多极化的新时代。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报