算法型内容推送会导致信息茧房吗？
——基于媒介多样性和信源信任的一项实证分析

2020-11-28 03:13喻国明方可人

山东社会科学 2020年11期

喻国明方可人

(北京师范大学新闻传播学院，北京 100875)

信息茧房(Information Cocoons)是美国学者凯斯·桑斯坦(Cass R.Sunstein)在《信息乌托邦——众人如何生产知识》中提出的概念，即用户在海量信息中只选择感兴趣和悦已的主题，从而构成一套“个人日报”式的信息系统，进而排斥或无视其他观点与内容。(1)[美]凯斯·桑斯坦：《信息乌托邦——众人如何生产知识》，毕竞悦译，法律出版社2008年版。长此以往，这将阻碍个体信息的全面发展，阻断观点的自由交流，形成所谓“回声室”(Echo Chamber)效应，并导致群体极化(Group Polarization)，威胁社会民主的基石。(2)Sunstein, C.The Law of Group Polarization.Journal of Political Philosophy.2002,10(2)，pp.175-195.信息茧房被视为数字时代高度个性化信息服务不可避免的“副作用”。随着算法推荐成为信息分发的重要途径与方式，有一种说法甚嚣尘上，即算法加剧了信息茧房的产生与泛化。《人民日报》曾经三评算法推荐，指出算法自动过滤“不感兴趣”“不认同”的异质信息，久而久之，信息接收渠道变窄，资讯获取渠道单一。(3)乙智：《 “尖叫效应”与“信息茧房” 》，人民网2018年5月2日和3日。http://m.people.cn/n4/2018/0502/c25-10910831.html.如今，算法几乎根植于所有主流移动应用中，社交媒体推荐趣味相投的朋友，音乐APP自动播放喜爱的音乐，电商网站提示着昨晚电影中的“明星同款”，用户似乎在毫无觉察中已被包裹进个体与机器共筑的温柔却严丝合缝的茧房。然而，需要注意的是，桑斯坦所说的信息茧房更像是半预言式的隐喻，他并未作更深入的研究和系统性论述。因此，尽管学界对信息茧房的危害有一定程度的共识，但是信息茧房的存在条件是什么，算法是否必然导致信息茧房，目前尚没有实证研究作为佐证，从而使得信息茧房问题至今没有一个清晰准确的研究框架，这极大影响了对“信息茧房”的观测与认知，也不利于客观审视算法与“茧房”的关系。基于上述种种疑问，本文拟对算法是否导致信息茧房进行实证探索。

一、“信息茧房”的含义以及几个研究假设

由于缺少直接观测信息茧房的量表，所以需对信息茧房的公认特征进行剖析。回顾既有研究，通常认为，陷入“信息茧房”的用户会呈现如下状态：

(一)信息接收渠道的收窄和固化。互联网尤其是移动互联网的发展，为公众提供了高度自由的媒介环境，使得个体在媒介使用上享有空前的自治(4)Hasebrink U，Domeyer H.Media Repertoires as Patterns of Behavior and as Meaningful Practices:A Multimethod Approach to Media Use in Converging Media Environments.Journal of Audience&Reception Studies,2012,9(01),pp.757-783.。用户根据特定场景的特定需求，可自由选择媒介，并组成个体独有的媒介生态系统。

当前，信息供给端的基本格局是，传统媒介、社交型媒介、算法型媒介等不同模式的传播渠道并存。不同媒介的信息分发各有侧重，满足着用户不同维度的信息需求。例如人工的传统媒介强调社会共性信息解决，通常扮演了“压舱石”的角色。而社交媒介则成为各类偶发性信息与意见交换的重要场所。因此，媒介使用的多样性意味着用户有机会接触到不同的信息与观点，为了解和评估事实提供了多维度的参照。而政治传播的研究也证实，媒介多样性会提升用户的政治素养(5)Kim, Dam Hee，Kwak, Nojin.Media Diversity Policies for the Public: Empirical Evidence Examining Exposure Diversity and Democratic Citizenship.Journal of Broadcasting & Electronic Media,2017，61(4),pp.687-702.并消除党派偏见(6)Dubois,Elizabeth，Blank,Grant.The echo chamber is overstated: the moderating effect of political interest and diverse media.2018,21(5),pp.729-745.。有调查结论则反映，2019年，仅有2%的美国人是靠单一渠道获取资讯，大多数用户会倾向于采用多种媒介来获取新闻内容(7)Kleis Nielsen,R, Nic Newman，N., Fletcher, R., Kalogeropoulos, A.Reuters Digital News Report.Oxford: Reuters Institute for the Study of Journalism,2019.。

但是，对算法持负面态度者坚持认为，算法型媒介通过刺激多巴胺分泌致使用户成瘾，并“收割”用户有限的空闲时间。(8)《被算法量产的“沉迷” 》，果壳网2018年4月17日、2020年1月12日。https://36kr.com/p/5129661.更有甚者将算法分发的信息比作合法的“毒品”(9)Sukhodolov, Alexander P.,Bychkova, Anna M.etc.Journalism Featuring Artificial Intelligence.Theoretical and Practical Issues of Journalism,2019.8(4)，pp.647-667.。这种对时空的侵占降低了用户与其它类型媒介接触的可能，导致信息渠道变窄，使媒介多样性受到影响。

基于此，本文提出假设：H1.算法型媒介的使用频率负向影响媒介多样性。

(二)对特定信息偏听偏信。在信息茧房中，“每个人的世界图景都只是他们所希望看到的，而不是世界本来应该拥有的样子”。基本上人们提到信息茧房时，都会涉及到信息偏食导致的视野局限，以及由此对观念、态度与决定等的影响。(10)彭兰：《导致信息茧房的多重因素及“破茧”路径》，《国际新闻界》2020年第1期。

霍夫兰很早就在个体差异论中指出，由于个体在需求、信念、价值观、态度上的认知结构存在差异，相同的大众传播内容在受众之间会产生不同的效果，受众倾向于接触与原有态度较为一致的信息，而尽量回避那些与己见不合的信息，即所谓信息的选择性注意和理解。而认知均衡理论认为，网络带来了信息大爆炸，面对复杂纷乱的信息，人们容易感到无所适从，为缓解心理焦虑，往往根据个人喜好或既有经验进行筛选和过滤，以保持认知的平衡。技术忧虑者担心算法推荐加剧了上述心理认知，用户将信息选择的权力交给算法，算法根据用户惯习投其所好，形成所谓“过滤气泡”(filter bubble)”。

如果“过滤”仅涉及个人的娱乐爱好，倒也无关大局。但算法忧虑者关注的重点在于，算法的“价值无涉”可能导致舆论治理的危机，尤其使得传统媒介“压舱石”的功能失灵。如今我们处于后真相时代，信息的传播速度太快，往往使得话语在前、事实在后，情绪在前、真相在后。算法的优势在于分发的效率，但如果将把关审核权力从人工让渡于技术，那么信息的真实性就有可能难以得到保障。倘若用户不加分辨地相信推送而来的内容，无形中会助长谣言的泛滥。若用户长期受算法分发的信息的裹挟和影响，将会形成对某类认知与观点的长期追崇，从而降低对其它媒体尤其是主流媒体声音的信任感，影响其价值判断进而影响其行为选择。

但另一些观点则认为，用户对于不同信源的信任程度并不一致，用户未必就相信自己日常接触的媒体。例如，一项跨国研究证明，在所有媒介类型中，用户对社交媒体的信任程度是最低的。(11)Dutton, W., Reisdorf, B., Dubois, E.,Blank, G.Search and Politics: The Uses and Impacts of Search in Britain, France, Germany, Italy, Poland, Spain, and the United States.New York: Social Science Electronic Publishing,2017.在面对重要的社会议题时，用户还是更依赖主流媒体和人际传播。(12)Elizabeth Dubois.The strategic opinion leader: Personal influence and political networks in a hybrid media system.Oxford: University of Oxford,2015.因此，有必要考察算法媒介是否真地对其他信源尤其是传统媒介的信任造成了影响。

基于以上分析本文提出如下假设：H2.算法型媒介的使用频率会正向影响算法型信源的信任。H3.算法型媒介的使用频率会负向影响非算法型信源的信任。H3a.算法型媒介的使用频率会负向影响传统媒介的信任。

二、不同类型用户媒介使用情况调查的样本来源与操作方案

(一)样本来源

本研究样本全部来自于研究组专项课题“2019年全民媒介接触与使用暨媒介价值观调查”数据。项目主要采用问卷调查法，意图调查不同类型的用户在使用媒介上的差异及其原因。参照国家统计局标准对全国实际人口情况划分抽样比例，参考CNNIC最新的第43次《中国互联网络发展状况统计报告》对样本的人口统计学特征作了配额设计，制定从一线城市到五线城市的社区入户分层抽样方案，访问涉及北京、上海、重庆、合肥、昆明、周口、长治等45个城市，共回收有效样本4631份。

从大样本中提取使用典型算法类资讯APP——今日头条的用户作为最终研究样本(注：对象在问卷题项“您在过去一周内打开过哪些APP”中勾选了“今日头条”选项)，研究样本数为926份。

在本研究中，选择性别、年龄、婚姻状况、教育程度、收入水平以及所在城市6个指标作为控制变量。样本中使用今日头条的用户基本情况如表1所示。

(二)操作方案

在媒介多样性的测量上，本研究要求用户自评过去一周内打开的资讯(含资讯功能)媒体种类，题目形式为“您在过去一周内打开过以下哪些媒介或APP？(多选题)”。选项中，除了今日头条外，还包含报纸、电视、广播等传统媒体，同时包含微信、QQ、微博、百度贴吧、腾讯新闻、搜狐新闻、趣头条等市面上的主流移动应用，涵盖了各种内容分发类型，共20个选项。单个用户每打开一个媒体，其媒介多样性分值“+1”，累积最高得分20分。研究样本的媒介多样性得分范围从2到17，即有的用户每周仅打开过两个资讯媒体,而最多的则每周会打开17个。其中，19.87%的用户每周会打开5个资讯媒体，18.79%的用户每周会打开4个资讯媒体，样本平均值为5.71。

在媒介内容信任程度的测量上，本研究要求用户对不同信源信任程度进行自评。题目形式为“您对下列媒介中的内容信任程度如何？”。答复采取李克特五分量表，即“完全不相信”、“不相信”、“不确定”、“相信”、“完全相信”，并依次按1-5分进行赋值。信源类型包括传统纸媒、传统电子媒体、微博、微信朋友圈/公众号、社区论坛(百度贴吧、豆瓣等)、算法型新闻APP(今日头条等)。从样本的均值来看，用户对传统媒体的信任程度依然高于网络媒体。

在算法型媒介使用频率上，本研究选择今日头条的使用频率。题目形式为“请您对过去一周内使用过的APP使用频率进行打分”，同样采用李克特五分量表，即从“很少使用”到“频繁使用”，不使用该类APP则置为空值并排除。相关描述性统计如表2所示。

表2 因变量与关键自变量的描述性统计

三、调查数据的回归分析和复合校验

研究采用多元层次回归分析，首先对因变量作正态分布检验，采用K-S检验，各变量峰度的绝对值小于10且偏度的绝对值小于3，因此样本基本符合正态分布，各因变量可纳入回归分析环节。

(一)控制变量对因变量的影响

将所有控制变量纳入第一层回归，其结果如表3所示。在媒介多样性上，年龄、婚姻状况对媒介多样性产生具有负向影响，即大龄用户或已婚用户，其媒介多样性的水平较低。大龄用户可能受既有媒介惯习影响，而已婚用户则可能在“养家糊口”上有更多任务，阅读资讯的时间更少；而教育程度与收入水平则对媒介多样性具有正影响；性别、城市等级对媒介多样性则无显著影响。

表3 各控制变量对媒介多样性和信源信任程度的影响

在信源信任程度上，女性对社区论坛和算法型新闻APP的信任程度更高；用户年龄越小，对微博的信任程度越高；收入水平则对传统纸媒和传统电子媒体的信任程度影响显著。其他控制变量对信源信任影响均不显著，这使得该部分的调整R2值较低。

(二)关键自变量对因变量的影响

将今日头条的使用频率纳入第二层回归，结果发现，其使用频率并未对各控制变量的显著性造成太大影响，并对个体媒介多样性的影响不显著。这证明假设H1不成立，用户频繁使用算法型媒介并不会降低用户的媒介总体接触数量。可见媒体型分发模式和关系型分发模式在算法面前并未失效，三者共同匹配了用户多层次、宽领域的资讯使用需求。而在信源信任程度上，今日头条使用频率对算法型新闻APP信任程度产生显著影响，R2值有所提升，这证明假设H2成立。但其使用频率并未对其它类型信源信任程度造成负影响，假设H3并不成立，用户并未对非算法型信源存在态度偏见。

实际上，今日头条的使用频率还提升了传统电子媒体和社区论坛的信任程度，因此H3a不成立。随着媒介的深度融合，有相当多的传统媒体以PGC(Professional Generated Content)内容提供者的身份入驻新闻聚合平台，在涉及重要社会内容的报道与处理上引导公众价值。尽管没有了过去的渠道垄断优势，但通过算法推荐，传统媒体可以更精准地匹配用户，并凭借新闻专业主义赢得公众尊重。有研究亦指出，在谷歌新闻算法推荐最多的内容中，有69%是来自于5家专业新闻机构，谷歌新闻的议程设置更像是对传统媒体的复制而非颠覆。(13)Efrat Nechushtai,Seth C.Lewis.What kind of news gatekeepers do we want machines to be? Filter bubbles, fragmentation, and the normative dimensions of algorithmic recommendations.Computers in Human Behavior,2019(90)，pp.298-307.

而百度贴吧、豆瓣等社区论坛则是用户话题深挖的端口。以信息流为主的算法型媒介侧重于话题的密集触达，通常信息面广但深度不足。当前算法技术也无法有效判断同类型资讯对于用户是否重复或互为补充。因此，用户通过算法获得信息要点后，社区论坛则满足了用户寻找“新闻背后的新闻”的需求，以获取更详尽的信息文本。由此可见，人们追求高质量的内容是亘古不变的真理。

(三)复核校验

考虑到不同APP所采用的算法类型和推送系统都不一致，为确保结论的稳定性，本研究从原始大样本中提取腾讯新闻APP的用户(n=719)作复合校验，腾讯新闻在图文、视频、音频、话题、问答等内容模块均涉及算法推送。结果显示，腾讯新闻使用频率同样不影响媒介的多样性，且在信源信任程度上其使用频率对传统纸媒(β=0.072*)和传统电子媒体(β=0.096**)的信任均有正向影响。

表4 今日头条使用频率纳入回归后的影响结果

四、研究结论：算法不是导致“信息茧房”而是为个体提供了多元理性的信息世界

综上，假设的论证结果如表5所示。

表5 各假设结论

上述研究表明，算法的技术忧思被人为地夸大了，算法不但没有导致“信息茧房”，反而在主流价值观的引导上发挥了积极作用，并为个体提供了更多元和理性的信息世界。与所有新技术一样，算法推荐并不是一成不变的，以今日头条为例,从2012年9月第1版开发运行以来,已经经过四次大的调整和修改。算法型信息分发在不断迭代中提升着 “有边界的调适”，并增强了其社会的适应度与合法性。(14)喻国明、杜楠楠：《智能型算法分发的价值迭代：“边界调适”与合法性的提升——以“今日头条”的四次升级迭代为例》，《新闻记者》2019年第11期。在人工智能主导信息分发的时代，所谓把关的权力并没有轻易让渡给智能算法，而是通过开放算法原理、加强人工审核、优化推荐系统、引入专业内容生产团队，为算法持续注入了人本与理性的价值。

而从商业利益的考量来看,“聪明”的算法平台都不会希望自己的用户兴趣窄化，就像没有一个商场的经理会希望顾客每一次来到商场都只关注同一类别的商品一样。事实上，商场经理都希望顾客关注尽可能多的产品品类，以扩大其消费能力。因此,从算法的商业利益初衷来看,算法不可能真正压缩信息空间，相反,它还会在更新迭代中逐步挖掘出个体尚未被开掘的信息消费潜能。(15)喻国明、陈艳明、普文越：《智能算法与公共性:问题的误读与解题的关键》，《中国编辑》2020年第5期。实际上，信息分发所依赖的算法已具有越来越多元的发展趋势，不同的算法型信息分发平台很少会使用同一种算法，采用多种算法的信息分发平台所具有的社会构造，从信息流动来说，总体上能够有效地避免“茧房效应”的发生。

本研究结论还对算法模型的进一步优化提供了参考。研究发现，年龄、婚姻状况、教育程度、收入水平对媒介多样性具有影响。早在2002年，有学者就指出了教育程度对“数字鸿沟”有巨大影响(16)祝建华：《数码沟指数之操作定义和初步检验》，汕头大学出版社2002年版，第203-211页。，而十几年过去了，在如今网络基础设置完善、高自由度的媒介环境中，信息的“鸿沟”依然存在。较之于教育良好的“精英分子”，普罗大众更容易盲从和不思考，一旦沉浸在同质化的信息环境中，就更难以基于理性焦虑和质疑精神而实现自主“破茧”。因此，针对老年人、已婚人士、教育程度与收入较低者，需要依据其用户画像，在个性化推荐中作额外的适配处理，包括导流更多来源的信息，并增加异质性内容的分发权重。此外，值得关注的是，低收入群体对传统媒体尤其是传统纸媒的信任较低,技术公司应该凭借算法对个体分析的优势，重视弱势群体的信息需求，强化价值引领。传统媒体在媒介融合过程中，也需要适应算法时代传播逻辑与话语方式的变化，对社会底层予以更多的人文关怀。

必须意识到，在已经到来的5G时代，实时生成的数据、实时分析、实时调整的算法，将成为整个信息系统运行的神经和命脉，这也是无法绕开的基本要素。今天我们跟算法之间所出现的一系列问题或争议,实际上还是人与人之间的问题，是掌握了现有技术传播生产力的人们，跟过去既有的掌握制度传播生产力的人们之间，在一个特定的发展阶段上的一种矛盾与对冲，也可以说是一种博弈[注]喻国明：《传播学科的迭代：对数据与算法的纳入与包容》，《新闻与传播评论》2019年第5期。。应该讲，算法推进了传媒领域中传统的寡头权力逐步让位于技术逻辑主导的用户权力的过程[注]喻国明、韩婷：《算法型信息分发：技术原理、机制创新与未来发展》，《新闻与传播研究》2018年第4期。。在传统的新闻生产中，传播的主导权掌握在新闻媒体手中，媒体控制着传播渠道与传播内容，受众在很大程度上只能作为新闻文本的“解码”者而存在。算法则将媒体的传播主动权部分分流到了受众手中，使用户自身在一定程度上成为自己的议程设置者，从而打破了媒体对传播主导权的垄断。同时，由于不同用户的需求与个性是各不相同的，经由算法推送的新闻经过用户的分享，使得多种声音同时存在，颠覆了少数人的话语霸权。概言之，算法实际上释放了用户的自主意识，提升了公众参与表达的能力[注]喻国明、杨莹莹、闫巧妹：《算法即权力:算法范式在新闻传播中的权力革命》，《编辑之友》2018年第5期。。总之，算法本身并无“原罪”可言，人文理性与技术理性相互交融，将为算法提供更可信任的发展路径。

算法型内容推送会导致信息茧房吗？——基于媒介多样性和信源信任的一项实证分析