在近期的一次技术探索中,墨问团队深入调研了知识库领域,旨在通过AI技术提升用户创作内容的检索体验。作为一款创作工具,墨问见证了用户知识库的日益丰富,但同时也面临着内容检索的难题。传统的关键词检索方式不仅效率低下,还容易因遗忘关键词而导致信息查找失败。因此,墨问团队决定引入AI技术,以实现对知识库内容的智能化问答。
对于知识库产品的交互设计,墨问团队有着清晰的认识,但技术实现却成为了一大挑战。回答的准确性是衡量知识库产品好坏的关键,而这一点在不同AI知识库产品中差异显著。墨问团队深知,底层的模型和工程能力直接决定了产品的下限。然而,作为一家创业团队,墨问尚未具备从零开发全新知识库基础设施的实力。
在综合考虑后,墨问团队决定采用云上的成熟能力。云计算的普及让墨问团队能够更专注于产品本身,而无需在底层技术上投入过多精力。在对比了市面上多个知识库解决方案后,墨问团队最终选择了火山引擎的知识库能力。火山引擎不仅提供了丰富的AI特性,还凭借其强大的技术实力赢得了墨问团队的信任。
火山引擎的知识库具有多个显著优势。首先,它支持的最大单文档上限高达350M,远超其他同类产品,如腾讯云知识引擎的200M和阿里云的百炼知识库的100M。这一优势对于墨问团队来说尤为重要,因为用户越来越倾向于上传大体积的PDF文件。其次,火山引擎的知识库支持对文档内的图片进行问答,只需在创建知识库时开启OCR能力,模型就能自动分析图片中的信息。火山引擎的知识库还具有低延迟的特点,即使在百亿数据规模下,检索延迟也能保持在毫秒级。
接入火山引擎知识库的过程非常简单。用户只需登录火山引擎,在火山方舟中选择“知识库”菜单,按照官方提供的指引,四步即可完成知识库的创建。在创建过程中,用户可以对知识库进行一系列配置,如选择向量模型、向量维度、切片方式等。值得注意的是,创建知识库并开始上传文档后,系统就会开始计费。但墨问团队通过参与火山的裂变活动,获得了不少优惠券,可以用于测试阶段。
为了验证火山引擎知识库的实际效果,墨问团队上传了不同类型的文档进行测试。这些文档包括阿里巴巴的财报、人生建议、播客速记稿以及读书笔记等。在测试中,墨问团队发现火山引擎知识库能够准确理解文档内容,并快速回答用户的问题。例如,在一张关于“习得性快乐”的图片中,即使用户忘记了具体词汇,只是模糊地询问与快乐相关的观点,火山引擎知识库也能准确找到相关信息。
火山引擎知识库还支持复杂文档的理解。在测试中,墨问团队上传了阿里巴巴的财报,并询问了淘宝和天猫的最新营收数据。火山引擎知识库不仅找到了最新数据,还结合文档上下文信息,准确定位了淘宝和天猫属于淘天集团。这一表现充分展示了火山引擎知识库在复杂文档理解方面的强大能力。
对于想要将火山引擎知识库接入自己产品的用户来说,API调用也非常简单。火山引擎提供了完整的API调用指南,涵盖了文档管理、切片管理、知识库管理等相关能力。墨问团队的研发人员表示,这些API调用方式与其他云计算能力的调用方式一模一样,非常易于上手。
经过一周的测试和使用,墨问团队对火山引擎知识库的能力表示高度认可。他们认为,基于火山引擎的知识库能力,构建一款AI知识库应用或功能已经绰绰有余。墨问团队只需专注于应用的交互设计和场景打磨,而无需担心技术实现的难度。随着AI技术的不断发展和云计算的普及,越来越多的团队开始将AI应用作为自己的发展方向。墨问团队的这次尝试无疑为其他团队提供了宝贵的经验和启示。