抖音首次揭秘算法原理,旨在消弭公众误解
近日,抖音在其安全与信任中心网站上正式试运营,并首次向公众、创作者及社会各界公开了其算法推荐系统的核心原理。此举被视为抖音对近年来因热点事件处理引发的广泛争议的正面回应。
抖音总裁韩尚佑在中国网络媒体论坛上曾指出,许多人对推荐算法存在误解,认为算法是通过为内容和用户打标签来进行匹配的。然而,他解释说,抖音的推荐系统实际上已很少依赖标签,而是运用一系列复杂的神经网络计算,直接预测每个用户对每个内容的可能行为,并挑选出最有可能被用户喜欢的内容进行推荐。
抖音安全与信任中心网站详细阐述了这一机制:当用户打开应用时,算法会为候选视频打分,并将分数最高的视频呈现给用户。用户的互动行为,如观看完成度、点赞等,都是对视频兴趣的反馈,这些反馈会进一步影响内容的推荐优先级。
抖音算法的核心在于通过预测用户行为概率及不同行为的价值权重来确定推荐内容的优先级。尽管推荐算法并非新事物,但它带来的争议却从未停止,如导致标题党、低质内容泛滥以及信息茧房等问题。然而,算法也极大地提升了信息分发效率,促进了信息的流动。
为了破解这些争议,抖音和今日头条今年开始逐步释放算法和平台治理的相关信息,试图通过提高透明度来建立信任。抖音的推荐算法包含召回、过滤、排序等环节,重点学习用户行为,运用多种技术模型如协同过滤和Wide&Deep模型来优化推荐结果。
协同过滤通过用户行为的协同,快速筛选出用户可能感兴趣的内容。而Wide&Deep模型则结合了模型的“记忆能力”和“泛化能力”,解决了推荐结果头部效应显著的问题。然而,由于算法无法理解内容语义,可能导致不良内容的传播,因此平台治理体系对其进行严格的约束和规范。
针对公众普遍担忧的算法推荐博眼球内容以提升用户留存率的问题,抖音算法工程师刘畅在开放日上表示,抖音更关注用户的长期价值,而非短期数据。算法在计算推荐内容时,会综合考虑完播、评论、点赞、长期消费、分享等多种目标,力求推荐更符合用户长期利益的内容。
同时,为打破信息茧房,抖音算法在多目标建模体系下设置了专门的探索维度,通过多样性打散、多兴趣召回、扶持小众兴趣等方法,控制相似内容出现的频次,帮助用户探索更多新兴趣。用户的主动行为,如随机探索、社交关系拓展、搜索推荐联动等,也会影响推荐系统,使推荐更加个性化和多样化。
尽管抖音对算法原理的解释强调了其数学计算的本质,但公众对算法的误解往往源于社会热点事件及其引发的情绪反应。多位抖音用户表示,他们更关心的是平台对热点事件处理的透明度。例如,在吴柳芳事件中,公众质疑平台算法故意推荐擦边内容,而事实上,其流量的增长是在事件成为社会热点后,用户主动搜索所致。
为此,抖音集团副总裁李亮开始在微博上积极回应算法相关问题,并对多个热点事件进行解释,以增加与公众的沟通。然而,要想彻底打破算法争议,抖音还需在热点事件处置的透明度上做出更多努力,以赢得公众的信任。