蛇年新春,人工智能领域传来新动态:中国本土企业DeepSeek正迅速崛起,成为国际舞台上一颗耀眼的新星。
DeepSeek公司宣布,其人工智能模型相较于美国同行,展现出显著的成本效益优势。这一突破使得DeepSeek的应用程序在全球范围内,特别是在51个国家中,赢得了广泛认可与喜爱。而这一切的背后,离不开华为Ascend 910C芯片的助力。
据悉,DeepSeek的大语言模型DeepSeek R1在训练阶段采用了英伟达的H100 GPU。然而,在推理——即生成人工智能响应的关键环节——DeepSeek则巧妙地转向了华为的Ascend 910C芯片。这一策略不仅大幅降低了成本,还有效减少了对美国技术的依赖,实现了成本与自主性的双重优化。
成本效益方面,DeepSeek展现出了强大的竞争力。DeepSeek R1的预训练费用仅为557.6万美元,使用2048块英伟达H800 GPU集群运行55天即可完成。而在API调用成本上,DeepSeek R1更是以每百万输入tokens仅0.55美元的价格,远低于OpenAI-o1模型的15美元。DeepSeek R1还支持本地部署,能够在消费级硬件上运行精简版本,从而完全避免了高昂的云费用。
人工智能研究员Dorialexander指出,Ascend 910C芯片在推理方面的表现尤为出色,尽管它并不适用于训练阶段。训练人工智能模型需要强大的计算能力,而英伟达GPU在此方面占据优势。然而,推理过程对功率的需求较低,这使得华为的Ascend 910C芯片成为了一个可行的替代方案。这种策略在保持高性能的同时,实现了成本的显著降低。
尽管Ascend 910C芯片在推理方面表现出色,但它也存在局限性,即缺乏训练大规模人工智能模型所需的能力。因此,中国的人工智能公司仍需要依赖英伟达进行模型开发。为了克服这一挑战,华为正在积极研发Ascend 920C芯片,旨在与英伟达的顶级人工智能芯片Blackwell B200一较高下。如果研发成功,这将为中国企业提供一个强大的国产选择,进一步推动中国人工智能产业的发展。
DeepSeek R1的开源性质和低成本策略,使其在发布后迅速获得了广泛关注。其开源代码和训练方法为开发者提供了极大的灵活性和创新空间,有助于推动AI技术的普及与发展。DeepSeek的崛起,不仅展现了中国在人工智能领域的雄心壮志,还预示着整个行业即将迎来新的变革。
DeepSeek的成功案例,无疑为中国人工智能产业注入了新的活力。随着华为等本土企业在硬件方面的不断进步,以及DeepSeek等创新企业的崛起,中国有望在全球人工智能领域占据更加重要的位置。中美科技巨头之间的较量,将推动人工智能技术的不断创新与发展,为全球用户带来更多惊喜与可能。
喜欢本文的读者,不妨点赞、收藏,分享给更多的朋友。SevenTech,与您一同见证科技的每一次飞跃!