在近期举办的百度世界大会上,一场关于“有价值AI应用”的深度探讨吸引了业界的广泛关注。百度集团创始人李彦宏在会上透露,百度将此次大会的主题定为“应用来了”,这标志着百度对当前大模型和生成式人工智能时代的深入洞察与判断。
会上,李彦宏分享了百度文心大模型的显著成就:日均调用量已超过15亿次。他强调,如果这一数字能在一年内增长10倍,那么这无疑证明了市场对AI大模型的强烈需求。实际上,文心大模型的调用量在短短半年内就接近了10倍的增长。
李彦宏在会上提出了几个关于AI发展的共识。首先,他指出,检索增强(RAG)已成为行业的普遍共识,对于消除AI模型的“幻觉”现象至关重要。在过去24个月里,大模型的最大变化就是基本解决了“幻觉”问题。其次,李彦宏认为,智能体将成为AI应用的主流形态,成为AI原生时代内容、信息和服务的新载体。他将智能体与PC时代的网站和移动时代的自媒体进行了类比,但强调智能体更加人性化、智能化。李彦宏列举了智能体的四个主要应用方向:公司类(如销售客服)、角色类(如数字人直播)、工具类(如行业报告智能生成)和行业类。
李彦宏在发言中多次强调了技术的商业价值。他提到,iRAG的商业价值在于无幻觉、超真实、零成本、即时获取。李彦宏还发布了0代码开发工具“秒哒”,认为它实现了生产力的无限扩张,称这是一个仅凭想法就能创造收益的时代。
在产业落地方面,李彦宏指出,大模型为行业带来的价值增量主要体现在降本和增效上。百度智能云千帆大模型平台已经精调了3.3万个模型,开发了77万个企业应用,吸引了超过一半的央国企用户。百度文库和网盘在最近的架构调整中实现了生态打通,为用户提供了更加便捷的知识管理和内容创作体验。
百度副总裁、百度文库兼百度网盘负责人王颖表示,以往文库和网盘的用户面临着不同格式素材无法在同一平台上编辑操作、公域和私域知识无法协同等痛点。为此,百度文库上线了“自由画布”功能,这一功能成为打通文库和网盘内容的桥梁。用户可以通过点选、对话、框选等方式自由选择和组合文库和网盘上的内容,并通过背后的MoE(混合专家模型)架构和多模态模型生成跨模态内容,适应多种内容生态。
王颖认为,文库和网盘的收费模式本质上是与用户分润,通过为用户创造价值、帮助他们赚钱来提高用户的留存率和付费率。AI能力拓展了产品功能的边界,组合出更多产品,给用户带来更多权益,从而提高了付费转化率。
在提到图像与RAG技术结合时,李彦宏指出,多模态模型目前尚未大规模应用,主要原因是“幻觉”问题尚未解决。百度在Sora出现时,没有盲目跟进,而是着手解决多模态的“幻觉”问题。会上,百度发布了iRAG技术,这是一项基于检索增强的文生图技术,可以去除生成图像的“机器味”。
百度CTO王海峰介绍了iRAG的技术链路,包括需求分析、实体增强、检索选择和图像生成等阶段。通过局部和整体注意力计算,iRAG能够在保持实体特征不变的情况下实现图像的高泛化和高精确生成。
百度还推出了小度AI眼镜,这款眼镜自重仅45g,搭载了1600万像素超广角镜头和AI防抖算法,以及四麦阵列和开放式防漏音扬声器设计,续航能力也超过了行业标杆水平。基于文心大模型和DuerOS AI原生操作系统,小度AI眼镜能够实现第一视角拍摄、边走边问、识物百科、视听翻译、智能备忘等功能,计划在2025年上半年上市。
会上,百度还宣布了“秒哒”这一0代码应用开发平台,计划在2025年第一季度上线。秒哒的特色在于应用开发过程由多个多智能体协作完成,从代码编写到文案创作、资料查询、配图生成到质量检测,每个环节都由擅长该领域的智能体完成,大大提高了开发效率和质量。