近日,RTE2024第十届实时互联网大会在北京盛大启幕,此次盛会由声网携手RTE开发者社区共同主办,主题定为“AI爱”,涵盖了AI、出海、社交泛娱乐、IoT、VoiceAI、空间计算等超过20个行业及技术分论坛。此次大会汇聚了众多行业领袖和技术精英,共同探讨了实时互联网与人工智能融合的未来趋势。
在大会主论坛上,声网创始人兼CEO赵斌发表了主题演讲,分享了他对实时互动行业十年发展的深刻洞察以及对生成式AI时代下的未来趋势判断。赵斌指出,生成式AI正在推动IT行业发生深刻变革,这种变革体现在终端、软件、云和人机界面四个层面。他预测,PC和Phone将进化为AIPC和AIPhone,所有软件都将通过大模型重新实现,发展为AINativeSoftware,云也将进化为具备大模型训练和推理能力的AINativeCloud,而人机界面的主流交互方式也将转变为自然语言对话界面(LUI)。
赵斌还在现场宣布,声网将推出RTE+AI能力全景图,从实时AI基础设施、RTE+AI生态能力、声网AIAgent、实时多模态对话式AI解决方案、RTE+AI应用场景五个维度,全面展示RTE与AI结合的技术能力和应用方案。他强调,生成式AI与RTE的结合将带来场景创新,成为下一个十年的主题。
声网的兄弟公司Agora作为语音API合作者,出现在OpenAI发布的RealtimeAPI公开测试版中,赵斌在会上透露,声网与MiniMax正在合作打磨中国第一个RealtimeAPI,并展示了基于MiniMaxRealtimeAPI打造的人工智能体,实现了人与智能体的实时语音对话,展现了生成式AI与RTE结合的实际应用潜力。
LeptonAI创始人兼CEO贾扬清则从AI基础设施的视角出发,分享了他对AI应用、云和GPU算力云技术的独到见解。他认为,当前是最容易建设AI应用的时代,应用本身的开发范式也在发生变化,未来的应用开发将从“以流程为中心”转化为“以模型为中心”。贾扬清还指出,AI是云的第三次浪潮,AI云将具备算力成为智能基础、需要大量计算与大规模异构集群以及少量但高质量通讯等特征。
声网首席科学家、CTO钟声则聚焦在实时AI基础设施的探讨上。他提到,分布式端边云结合的AI系统将成为现代基础设施的基本形态,这一系统能够有效解决高昂计算成本、数据隐私保护以及延时等问题,提供更低延时、更高网络抖动容忍度和优秀的抗噪声能力。钟声还在现场演示了一个由STT、LLM、TTS、RTC四个模块组成的端边结合实时对话AI智能体,展示了实时AI对话能力的实际应用。
在圆桌讨论环节,LeptonAI创始人兼CEO贾扬清、MiniMax合伙人魏伟、面壁智能联合创始人及CTO曾国洋、HuggingFace工程师王铁震、Agora联合创始人TonyWang五位嘉宾共同探讨了AI基础设施到AI商业化落地的机会与挑战。嘉宾们一致认为,开源架构的应用将越来越普遍,未来需要关注开源模型的基础设施和数据闭环,同时,多模态模型的出现将拓展生成式人工智能的边界,加速产业变革。