近日,AI领域的最新进展引发了广泛关注。自2023年底斯坦福大学发布了一款名为“小镇模拟游戏”的AI实验项目以来,AI Agent的概念逐渐进入公众视野。这款游戏中,25个AI角色能够自主交谈、建立关系,展现了惊人的社交能力,让人们对具有自主意识和决策能力的AI助手充满期待。
然而,一年后,当微软、Google等科技巨头纷纷布局AI Agent市场,并推出各类相关产品时,人们发现这些所谓的“Agent”产品大多只具备基本的自然语言理解能力,远未达到真正的AI Agent标准。
在硬件领域,类似的现象也在上演。智能戒指品牌Oura推出的最新款Oura Ring 4虽然加入了AI功能,但其成功主要归功于健康追踪这一基础功能,而非AI技术本身。相比之下,主打AI的硬件产品如AI Pin、Rabbit R1等却遭遇了市场冷遇。
那么,什么才是真正的AI Agent?美国VC Madrona合伙人Jon Turow指出,目前市场上存在多种不同概念的Agent产品,但真正符合AI Agent标准的并不多。
2024年,AI Agent市场热闹非凡。海外市场方面,OpenAI、Anthropic、微软、谷歌等科技巨头纷纷公布相关进展,将AI Agent视为未来发展的关键。例如,Anthropic推出的“Computer Use”系统能够像人一样操作计算机,而微软则计划在Dynamics 365业务应用平台上部署10款AI Agent。
国内市场也不甘落后,百度、阿里、腾讯等大厂纷纷入局。百度文心智能体平台、腾讯元器等产品开始面向企业用户提供智能体创建平台,并在AI智能助手界面中添加AI Agent入口。
然而,尽管市场热闹,但真正能够依赖的AI Agent却寥寥无几。用户普遍反映,目前市面上的AI Agent大多存在“不靠谱”和“鸡肋”的问题,难以确保始终提供准确、符合上下文的响应。
从技术角度来看,AI Agent的突破取决于多项技术的进步。首先是LLM(大型语言模型)的发展,OpenAI和谷歌DeepMind等研究机构正在探索如何让AI模型具备更强的推理能力。其次是记忆机制的进步,融合Agent能力的RAG(检索增强型生成)技术能够显著提升AI Agent的个性化记忆能力。
Tool use(工具使用)和Planning skills(规划能力)的进步也是AI Agent发展的关键。例如,Anthropic的“Computer Use”系统通过构建API将自然语言提示转化为各种电脑操作指令,而谷歌的“编程助手”Jules则能够分析复杂的代码库并准备详细的拉取请求。
资本市场方面,AI Agent也备受青睐。2024年,国内AI领域发生了多起融资案例,其中AI Agent项目受到投资人的高度关注。YC合伙人、资深投资人Jared指出,垂直领域AI Agent作为一种新兴B2B软件,有望成为市值超过3000亿美元的科技巨头。
目前,虽然尚未出现真正的“全能助手”级AI Agent,但在多个垂直领域已经出现了专业级的Agent产品。例如,Cursor在编程领域表现出色,能够自动生成代码文件并准备好运行环境;而Outset则将AI Agent应用于问卷调查和分析领域,可以替代传统的人工调查和分析工作。
展望未来,AI Agent有望在更多垂直领域实现商业化突破。随着技术的不断进步和市场的逐渐成熟,AI Agent将成为AI 2.0时代的重要推手。