近日,钉钉宣布推出了一项全新的视频会议功能,该功能能够智能识别并定位会议室中的发言人,极大地提升了参会人员的沉浸感和专注度。这项创新技术背后依托的是阿里巴巴的通义听悟技术,现已成功集成至钉钉会议室Rooms软件中,并与多种生态会议硬件实现了兼容。
在混合会议场景下,线下会议室往往有多人同时就座,而线上参会者只能看到一个小窗口的画面,这使得他们很难判断是谁在发言,从而影响会议体验。此外,当会议内容繁多、时间较长时,会议组织者也会面临难以根据不同发言人整理会议纪要的挑战。钉钉会议的这项升级功能则能有效解决这些问题,它能在复杂的会议场景中智能区分和定位发言人,无论是实时字幕、双语翻译,还是会议智能纪要功能,都能准确识别不同的发言人,使参会者能更加聚焦于内容的讨论,同时会后纪要的整理也变得更为轻松。据天脉网了解,这一功能的实现得益于通义实验室语音团队研发的CAM++模型,该模型通过大规模数据训练优化了说话人识别和连续语音数据聚类算法,提高了识别准确率,并结合语义理解技术来识别说话人的转换,从而实现了对会议室中不同发言人的实时准确区分和定位。
目前,钉钉会议的发言人区分功能已经与亿联网络、看到科技、MAXHUB等多家会议硬件厂商完成了适配,共同打造了AI时代软硬一体的会议解决方案,为用户带来了更加高效的会议体验。公开资料显示,钉钉会议已经广泛应用于新能源、制造、零售、金融、物流、互联网等多个行业,为包括宁德时代、云南白药、安踏集团、顾家家居、申通快递、人民日报、一汽集团、民生证券、微博等众多行业的领军企业提供了优质的服务。