近日,国内AI新兴企业DeepSeek遭遇服务中断风波,其官方网站及API接口于1月27日显示不可用状态,此前一天也曾短暂出现故障。DeepSeek方面回应称,这一系列宕机事件是由于新模型发布后用户访问量急剧增加所致。
自2024年末DeepSeek发布其新一代大语言模型DeepSeek-V3并宣布开源以来,该公司迅速在AI领域崭露头角。DeepSeek-V3在多项基准测试中表现优异,不仅超越了主流开源模型,还与顶级闭源模型不相上下。尤为引人注目的是,该模型以极低的训练成本赢得了“AI界拼多多”的称号。
DeepSeek的背后是杭州深度求索人工智能基础技术研究有限公司,该公司由量化投资巨头幻方量化于2023年创立。随着DeepSeek-V3的发布,其关键开发者之一罗福莉也受到了广泛关注。这位95后的年轻女性,因在计算机语言学领域的杰出贡献,被誉为AI界的“天才少女”。罗福莉本科毕业于北京师范大学计算机专业,后在北京大学获得计算语言学硕士学位,曾在阿里达摩院从事人工智能研究,参与开发了多语言预训练模型VECO。
据知情人士透露,在DeepSeek-V3发布前夕,小米创始人雷军已向罗福莉伸出橄榄枝,开出千万元年薪邀请其加入小米,领导AI大模型团队。这一举动无疑进一步提升了DeepSeek及其团队的知名度。
随着DeepSeek的声名鹊起,其应用也迅速走红。DeepSeek不仅在国内市场受到追捧,还成功登顶苹果中国和美国应用商店免费APP下载排行榜,超越了ChatGPT等竞争对手。DeepSeek-R1 API服务的定价也相对亲民,每百万输入tokens仅需1元(缓存命中)至4元(缓存未命中),每百万输出tokens则为16元。
在国际大模型排名榜Chatbot Arena上,DeepSeek-R1也取得了不俗的成绩,基准测试排名已升至全类别大模型第三位,与OpenAI的ChatGPT-4o最新版并列。尽管如此,DeepSeek-R1的预训练费用仅为557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。
随着业务的迅速扩张,DeepSeek也在积极招聘新人才。据招聘网站信息显示,其北京子公司目前正放出52个岗位,涵盖深度学习研究员、核心系统研发工程师、资深UI设计师等多个职位。其中,核心系统研发工程师(校招)的薪资范围最高可达9万元,大部分岗位的起薪也在2万元以上。该公司还招聘实习生,AGI大模型实习生的日薪最高可达1000元。