AI新星闪耀!DeepSeek爆火背后:雷军千万招揽95后“天才少女”

   时间:2024-12-30 14:03 来源:天脉网作者:冯璃月

近期,国产AI大模型DeepSeek在全球范围内引起了广泛关注,尤其是其最新发布的DeepSeek-V3版本,更是成为了业界的焦点。这一热潮还意外地带火了一位年轻的AI开发者——95后“天才少女”罗福莉。

据悉,罗福莉在DeepSeek的研发过程中扮演了重要角色,特别是DeepSeek-V2的研发,她是这款模型的关键开发者之一。随着DeepSeek的声名鹊起,罗福莉的才华和贡献也被更多人知晓。

DeepSeek-V3的发布,标志着DeepSeek在AI大模型领域取得了重大突破。这款新模型在多项基准测试中表现优异,甚至与世界顶尖的闭源模型不相上下。而更令人惊叹的是,其训练成本极低,因此被业界称为“AI界的拼多多”。

据DeepSeek发布的技术报告显示,DeepSeek-V3的参数量高达671B,激活参数为37B,使用的预训练token量为14.8万亿。在评测中,它超越了阿里的Qwen2.5-72B和metadeLlama-3.1-405B等其他开源模型。而其训练成本仅为GPT-4o的二十分之一,售价也仅为GPT-4o的十分之一,性价比极高。

DeepSeek的创始人背景同样引人注目。这家初创公司由国内知名量化资管巨头幻方量化于2023年7月创立,专注于开发先进的大语言模型和相关技术。幻方量化的背景为DeepSeek提供了强大的技术支持和资金保障。

罗福莉的学术背景和职业经历同样令人瞩目。她本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。在学术领域,她曾在人工智能顶级国际会议ACL上发表过多篇论文,展现了深厚的学术功底。毕业后,她先后进入阿里达摩院和幻方量化从事AI相关研究,最终加入DeepSeek,参与了DeepSeek-V2的研发。

罗福莉的才华和DeepSeek的成就吸引了众多企业的关注。其中,小米创始人雷军更是开出了千万元年薪,力邀罗福莉加入小米,领导其AI大模型团队。这一举动不仅体现了小米对AI技术的重视,也显示了雷军对罗福莉个人能力的认可。

事实上,小米在AI领域早已有所布局。自2016年组建AI团队以来,小米经过多次扩展,相关领域人员规模已达3000多人。2023年4月,小米正式组建了AI实验室大模型团队,并计划不断挖掘AI相关的用户场景,发挥自身技术优势。今年11月,小米还成立了专门的AI平台部,由小米的元老级技术大牛张铎负责。

小米还在积极搭建GPU万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划由雷军亲自领导,显示了小米在AI领域的决心和投入。据小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元。未来五年,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报