近日,京东技术总监翟周伟在公开场合深入探讨了电商大模型及搜索应用实践,为电商领域的AI技术发展带来了新的视角与启示。这份详尽的实践报告,共计33页,全面覆盖了电商行业的最新发展、大模型应用所面临的挑战及其解决方案,以及在搜索场景中的具体应用实例。
首先,翟周伟介绍了电商行业的整体发展状况。他指出,过去十年间,实物商品的网上零售额实现了高速增长,电商模式也从传统的货架电商逐步发展为与内容电商并存的多元化格局。技术的不断创新,不仅降低了商品流通的成本,还显著提升了零售效率。在用户消费决策链中,包括购前、购中、购后的各个环节,搜索始终扮演着至关重要的角色。电商搜索的目标,是基于用户的实际需求,精准分发商品,以实现GMV(商品交易总额)和UCVR(用户点击到实际购买转化率)的最大化。
技术演进方面,翟周伟指出,从文本检索到机器学习,再到深度学习和大模型阶段,电商搜索技术经历了多次变革。从最初的规则引擎应用,到基于深度神经网络(DNN)的精准理解,再到如今的多模态交互和AGI导购助手,每一步都旨在追求更低成本、更高效率和更优的用户体验。
然而,大模型在电商场景下的应用并非一帆风顺。翟周伟坦言,尽管大模型具备逻辑推理、多语言理解等显著优势,但在电商领域仍面临诸多挑战,如商品知识的专业性不足、个性化推荐的难度、时效性的局限、高昂的成本以及安全性风险等。为此,京东构建了文本大模型底座和多模态大模型底座,通过DataPipeline提升数据质量,进行持续预训练和通用及领域对齐学习,同时从被动和主动两个方面保障安全性,并建立了一套完善的评估体系。
在电商搜索场景下的应用实践中,京东充分利用了大模型的强大能力。例如,通过大模型优化搜索交互,提升效率,如智能纠错、搜索建议等功能。同时,利用电商知识增强的大模型,结合搜索交互日志,不断优化目标,通过多指令学习迭代改进。在电商意图理解方面,京东通过指令学习,利用搜索用户反馈和RAG技术,显著提升了商品召回的相关性和多样性。大模型还被广泛应用于文案创意生成,如商品标题、文案、卖点的自动生成,大幅降低了商品素材的成本。
在电商搜索相关性的改进方面,京东采用了多种主流模型,如孪生网络和交互式匹配。同时,结合prompt工程应用、数据增强蒸馏或增强预训练以及相关性对齐方案,进一步提升了用户需求与商品之间的匹配精度。