近期,在瑞士达沃斯召开的世界经济论坛上,微软CEO萨提亚·纳德拉对中国的一项AI技术——DeepSeek,表达了极高的评价。他特别赞扬了DeepSeek的新模型,在高效开发开源模型及推理计算方面所展现出的卓越性能,并指出这些技术进展具有重大意义。
据悉,DeepSeek-R1在大模型竞技榜上的表现尤为亮眼,与2024年11月发布的ChatGPT-4o并驾齐驱,跻身前三。而其开源且成本仅为ChatGPT-4o二十分之一的特性,更是引起了业界的广泛关注。此前,Facebook母公司meta已成立专项研究小组,旨在深入剖析DeepSeek的工作原理,以期提升其旗下大模型Llama的性能。
DeepSeek-R1推理大模型于1月20日正式亮相。据官方介绍,该模型在后训练阶段大规模运用了强化学习技术,即便在标注数据稀缺的情况下,也极大地提升了模型的推理能力。在数学计算、代码编写以及自然语言推理等多个领域,DeepSeek-R1的性能与OpenAI的o1正式版难分伯仲。
DeepSeek应用在发布后迅速走红,不仅在中国苹果应用商店免费下载排行榜上登顶,还成功超越了ChatGPT,在美国市场的下载榜上占据榜首位置。这一表现充分彰显了DeepSeek强大的市场吸引力和广泛的用户基础。