在全球AI芯片竞赛日益激烈的背景下,一款名为DeepSeek的国产大模型横空出世,正悄然改变技术演进的内在逻辑。凭借其迅猛的发展势头,DeepSeek已迅速突破3000万日活跃用户大关,成为业界瞩目的焦点。如何理性审视当前的AI热潮?如何准确评估DeepSeek技术的潜在价值?这些问题成为业界亟待探讨的课题。
近期,一场围绕“DeepSeek如何重塑AI格局?AGI门槛正逐渐消失?”的沙龙活动成功举办。本次活动由新网银行携手西南财经大学管理科学与工程学院联合呈现。活动中,新网银行副行长李秀生、西南财经大学管理科学与工程学院计算金融系主任王俊教授、新网银行风控科学部负责人卫浩,共同揭开了DeepSeek技术背后的神秘面纱,并探讨了其在银行业的应用前景。
面对OpenAI与微软合作引发的“生态垄断”争议,以及英伟达遭遇美国史上最严格的AI芯片出口管制,DeepSeek的开源策略如同一股清流,为企业提供了以较低成本采用先进大模型的新途径,有效提升了多场景智能助手的能力。在软件领域,开源与闭源模式各有千秋,李秀生以Linux和安卓为例,指出开源模式推动了操作系统领域的发展,而苹果作为闭源模式的代表,则在高端手机应用市场中占据领先地位。
“我个人更倾向于开源模式,因为它能汇聚全球智慧,共同推动技术创新。未来,开源与闭源或将并行发展,但开源的潜力巨大。”李秀生表示。
王俊则认为,开源与闭源是相互竞争、相互融合的关系。开源技术能吸引大量开发者参与,促进技术迭代,但盈利模式和商业模式尚不确定;而闭源则注重构建自身护城河,投入巨大,商业模式独特但多样性不足。两者各有长短,实践中可能会相互借鉴、融合,并在特定领域形成竞争。
从市场角度看,DeepSeek作为开源、低成本且高效的大模型,对头部科技公司构成了不小挑战。王俊指出,DeepSeek的定价策略迫使OpenAI等闭源大模型公司重新审视商业模式和技术优化方向,同时促使英伟达等芯片公司思考AI基建的投资逻辑和发展模式调整。
然而,通用人工智能大模型在解决数字化风控问题时面临挑战。卫浩表示,尽管大模型具备广泛能力,但在风控领域表现不尽如人意,原因在于其训练主要依赖公开互联网数据和代码,缺乏针对风控领域的专门数据训练。
DeepSeek的低成本和高效率为中小银行提供了逆袭的机会。据浙商证券研报,DeepSeek-V3的训练成本远低于传统大模型,且本地化部署成本不足百万元。目前,多家金融机构正积极部署DeepSeek,新网银行自2024年5月起,已在系统研发场景中应用DeepSeek大模型,构建了研发知识问答助手和代码续写助手,显著提升了研发效率。
李秀生认为,DeepSeek的出现带来了两大理念变革:一是打破了“大力出奇迹”的执念,通过优化算法和模型,在较低算力下实现高效性能;二是加剧了开源与闭源之争,降低了技术门槛,使更多机构能够应用大模型,对银行业等金融机构产生了深远影响。
在银行业数字化风控领域,DeepSeek等大模型技术展现出广泛应用前景。卫浩表示,DeepSeek能增强语义理解和文本处理能力,提高从非结构化数据中获取信息的能力,同时提升客户评估准确性,助力更好决策。DeepSeek的R1版本通过思维链训练模式,提高了意图和语义理解能力,在处理长上下文和复杂意图时表现出色。
面对大模型时代的来临,银行需要从战略层面思考如何构建适配自己的智能技术应用能力。李秀生指出,银行需从算力、数据、算法及应用等多方面综合考虑,重塑经营管理和流程。新网银行已在客服领域应用大模型,并正在营销、贷后管理等领域探索大模型的应用。
王俊预测,在制造业、气候风险预测、计算机、教育、媒体娱乐等领域,大模型相关智能应用都将有明显提升。高校也在致力于培养AI+专业领域的复合型人才,通过优化课程设置、增加实训项目和实验课程,以及加强产学研合作,以满足业界需求。
对于银行从业者而言,人工智能技术的进步既带来了挑战,也提供了新的机遇。李秀生勉励从业者保持冷静、不断学习,紧跟时代变化。卫浩强调,动手实践是掌握人工智能的关键,风控人员需要具备深厚的技术功底和广泛的知识面。王俊表示,高校正通过优化课程设置和加强产学研合作,培养符合业界需求的复合型人才。