一、文献回顾与核心概念
1.民意基础设施
民意(public opinion),又称舆论,基本上指大多数人共同持有的态度或信念[11]。如前文所述,赫布斯特提出用民意基础设施模型来描绘不同历史时期的民意定义、测量与传播方式。赫布斯特举例,哈贝马斯所描述的18世纪欧洲沙龙公共领域,其民意基础设施模型可以描述为:①在含义方面,民意是精英和公众对感兴趣的话题的批判性交谈;②在测量方面,通过倾听和参与对话来辨别民意;③在媒体方面,民意通过媒体和公众成员间的人际交往传播。而民意调查模型则可以描述为:①民意是个体意见的聚合;②民意通过问卷调查来测量;③民意通过大众媒体传播[10]。
如今,社交媒体成为新兴的民意基础设施,其定义、测量和传播民意的方式也发生了显著变化。在《社交媒体作为民意:记者如何使用社交媒体代表民意》一文中,香农·麦格雷戈(Shannon McGregor)详细阐释了两种代表民意方式的异同:通过调查来推测的民意是私下的(private)、个体的(individual)、有代表性的(representative)、可测量的(measurable);而通过社交媒体来推测的民意则是公开的(public)、有关的(relational)、分层级的(hierarchical)、可测量的[6]。
学者指出,尽管民调人士批评社交媒体的样本缺乏代表性,且存在数据污染问题(如社交机器人的使用),然而社交媒体扩展了民意的含义,尤其纳入了社交维度。社交媒体分析的优势在于:①数据生成未受到干预;②能够对民意进行动态追踪甚至实时回应;③强调互动、参与和对话,而不是单个个体意见的聚合[12]。
以往对民意调查的主要批评就是,个体并不是原子化的、相互隔绝的,而是在社会互动中形成意见。民意调查也没有考虑到社会分层级的本质,如精英在意见形成过程中所扮演的作用[13-14]。从这个意义上讲,社交媒体作为民意基础设施,似乎更加符合经典的民主参与观念。
那么,在中国语境下,我们如何理解和描绘热搜所代表的民意基础设施呢?热搜是如何定义和测量民意的,更偏向于“分散个体的意见聚合”,还是“公众间的连接、讨论与交流”?其生成的结果又是如何被大众媒体二次传播的?笔者认为,微博热搜不仅具有社交媒体的共性特征,还具有不同于推特等西方平台的独特性和差异性;此外,民意基础设施模型也有助于我们洞察热搜因时而变的趋势,这正是研究问题1要探讨的内容。
2.算法的合法性建构
过去30年间,人类日益将文化工作——“对人、地、物及思想所进行的排序、分类和等级划分”——委托给计算过程。人类不再是文化的独家生产者(producers)、仲裁者(arbiters)、策展者(curators)或阐释者(interpreters),这一转变极大地改变了长期以来文化范畴得以被实践、经验与理解的方式,催生了算法文化[8]。在这样的背景下,新闻业开始关注以数据化形态出现的集体注意力(如推特热点话题、转评赞的数量),越来越多地报道那些据称引发了广泛公众关注的议题,公众反映(public response)成为新的新闻价值要素[15]。有学者提出数据化时代公众形塑(public formation)研究的四个切入点,其中,第一个切入点是研究数据基础设置(如数据库结构、数据分析、服务器)和新闻媒体的互动,如量化逻辑(quantifying logics)如何被纳入新闻媒体的新闻分发基础设置之中。
在中国语境下,微博热搜作为一种量化逻辑的产物,日益成为占据主导地位的舆论载体,其背后的热点算法也被视为可信的“权威原则”和“知识逻辑”。特德·斯特瑞佛斯(Ted Striphas)指出,在当今世界,算法日益成为“权威原则”,被委派驱除无序状态(anarchy)的任务[8]。在这个意义上,算法承担了“重组社会”的任务:“使用一系列分析工具在庞大杂乱的语料库中发现统计关联,只有通过这种关联才能将迥然不同的、分散的人联合起来。”
与此同时,热点算法也被视为一种合法的知识逻辑,这种知识逻辑“建立在有关什么是知识,以及如何确定最相关组成部分的特定假设上”[9]。塔利顿·吉莱斯皮(Tarleton Gillespie)以词条“#occupywallstreet”(占领华尔街)未登上推特热点话题为例,展现了这种知识逻辑所具有的不证自明(self-affirming)的特点[16]。根据吉莱斯皮的分析,该词条未上榜的原因可能有:
(1)它正遭到刻意审查;
(2)它实际上没有人们以为的那样流行;
(3)它非常流行但一贯如此,不是突然剧增;
(4)它既流行也在剧增,但不是以算法设计所能测量的方式;
(5)它既流行也在剧增,但还赶不上一些把它挤出榜单的流行文化现象;
(6)它既流行也重要,但不如通过战略博弈挤进榜单的流行文化那么流行;
(7)它没能成为热搜就是因为没有成为热点,因而无法享受热点所提供的放大效应。
尽管学术界、媒体人士、普通用户时常质疑热搜的真实性和有效性,但不可否认的是,热搜背后的热点算法在民意监测和政治话语中承担了日益重要的分量。就像在美国,尽管选民、政党、新闻业对民调结果有诸多质疑,仍然密切关注民调数字一样。赫布斯特指出,表达和测量民意的量化技巧之所以引人注目,是因为这种技巧具有客观性与貌似确定性的性质,“数字化的数据资料往往传播出权威性”。而算法的权力不仅体现在它所发挥的具体功能,还体现在算法这一概念本身所具有的“计算客观性”[17]和“机械中立性”[9]的光环。
迈克·阿纳尼(Mike Ananny)指出,“算法被看作是与社会、技术相关的一种话语和知识文化,这涉及在算法结构中,信息如何生产出来、如何浮现在我们面前,以及我们如何来理解这些信息,这些信息是如何被看作是合法的,又是如何被赋予公共意义的[18]。”马特·卡尔森(Matt Carlson)继而强调,与现存的知识结构相比,算法也会利用正当化的修辞,来合法化它们的知识结构[19]。他建议,未来研究应关注算法判断的合法性话语(discursive legitimization)是如何建构的。
国内有关算法合法性话语的研究主要聚焦于个性化资讯推荐平台,发现官方媒体对算法持批判性态度[20-21],然而对于集体化热点算法则缺少关注。为了弥补不足,本研究试图探究集体化热点算法的合法性话语建构过程,尤其是大众媒体在其中所扮演的角色。对这一问题的探索有助于补充、拓展乃至修正已有的研究结论。