1.2 社交网络竞争性信息传播分析
社交网络上信息竞争传播模式对人们的生产生活方式产生了重要影响,潜移默化地改变了人们的社交活动习惯,在带来巨大商业价值的同时,也推动了人类社会的文明进步。因此,对社交网络信息进行竞争传播分析引起了中外学者的广泛关注。研究人员努力去捕获传播数据、理解竞争行为和预测传播趋势,这些工作能够使我们从信息竞争博弈的角度对社交网络的结构属性、群体特征及竞相传播遵循的规律有进一步的认识。相关研究成果在市场营销、商品推荐、社会舆情监控与引导等诸多领域[12~13]都有着广泛的应用前景。
为了顺应社交网络迅速发展的潮流,理解竞争性信息传播的内部规律,开发和利用社交网络应用,实现为人们服务的目的,国家重点基础研究发展计划(973计划)中设立了“社交网络分析与网络信息传播的基础理论”[14~16]和“社交网络信息传播分析与挖掘”[17~19]两个项目,作为基础理论内容对其进行系统性研究,并于2018年8月13日通过了结题验收。2018年4月成立的计算传播学研究委员会(CCRA),着眼于社交网络上大规模信息传播数据和人类强大的计算处理能力,开展跨学科交叉和国际化合作的信息传播研究工作。同时,近几年来国际顶级学术会议(如SIGKDD、CIKM、ICDM等)也展示了诸多关于竞争性信息传播的重要研究成果。本书通过对这些研究成果的有序回顾、系统分析和归纳总结,发现既有基于实证研究的成果,又有基于理论建模的成果。总体来说,在竞争性信息传播方向上有五类不同的主要研究方法和数学模型,分别是经典信息扩散模型、数据驱动传播模型、社会博弈模型、基于传染病的模型和基于社会物理系统的模型。
1.2.1 经典信息扩散模型
信息扩散类模型研究以一定的方式随时间在社会系统的各种个体间进行竞争性信息传播的过程,整个扩散过程往往表现出特定的规律,大致呈一条S形曲线。这类模型都是动态的,社交网络上的每个节点都将根据自身邻居节点的选择来选择是否接纳其传播的信息,进而显式地模拟社会个体行为随时间的演化。通过邻居节点间的相互作用,节点的状态会发生变化,从而使信息在整个网络中扩散。考察收敛时网络的最终状态,并模拟为相互独立的随机变量集合。这种传播方式就是典型的批量生产的拷贝传播媒介,是最简单的操作,所有人都会。例如,在网上找到一篇文章,复制、粘贴并发出去,对方收到后,就完成了一次传播。这种传播的显著特点是信息量大、传播速度快、扩散范围广。考虑到信息属性的问题,传播过程中存在竞争,比如谣言传播、企业公关危机管理、商品促销推广等,不同类型信息之间都有明确的抵制关系,这也是竞争性信息扩散研究的焦点。这类研究中的典型模型有创新扩散模型、巴斯扩散模型、线性阈值模型、独立级联模型和马尔可夫随机场图模型等[20],如表1.2所示。
表1.2 经典信息扩散模型的特点比较
竞争性信息扩散传播网络是由相互间存在邻接关联关系的用户及信息竞争传播触发关系构成的有向网络,它以用户为节点、以触发关系为有向边构成传播系统,竞争性信息在系统中进行蔓延和传播。若用xi(t)表示网络节点所处的状态,用τi(t)表示竞争性信息对外的权威性影响值,用ξi(t)表示系统外力作用值,用tij表示信息扩散过程中的时间步,用Mij表示两类竞争性信息(i,j)之间的内容关联强度影响值,用β表示信息传播波动系数,用θi表示i节点的传播阈值,用Oi表示节点i的出度值,则竞争性信息扩散满足如下关系式:
式中,f(Oi)为多信息的影响力分布函数,它表示为
式中,a和b为常数。
竞争性信息扩散传播模型考虑了网络中不同类型信息在传播过程中存在的竞争。竞争扩散传播过程中存在明显的级联现象,因此会形成连锁效应,此时级联节点会发挥桥梁的作用。信息级联具有连锁性和脆弱性的双重特点,信息要么迅速扩散传播,要么迅速消亡终结。因此,在信息传播初始阶段的传播行为非常重要,如果信息在早期传播的几轮演化后存活下来,那么它将迅速扩散至几乎整个网络系统。信息级联传播过程示意图如图1.2所示,图中深色表示已获知信息的节点,白色表示未获知信息的节点,节点p为级联节点。
图1.2 信息级联传播过程示意图
1.2.2 数据驱动传播模型
数据驱动传播模型通过采集用户特征、个体行为和外部影响等数据,对数据进行分析和提炼,形成竞争传播规则,在数据的支撑下或指导下进行科学决策,进而驱动竞争性信息在社交网络上的传播与扩散。典型模型有分支过程模型、数据驱动级联模型、基于信息亲和性的模型和基于信息扩散升降模式的模型、外部影响模型、权威节点影响力模型等[21],如表1.3所示。
假设社交网络是一个全封闭的网络,信息在网络中产生,而且仅在该网络中传播,期间网络节点数量不变。以社交网络的用户为节点、以用户间的相互关系为边来构建一个无向图,即社交网络系统图。在此基础上定义信息竞争传播系统S={n,t,X(t),Gt(V,E,W)},其中n表示系统中的节点总数,t={0,1,2,…}表示演化时间步,X(t)=[x1(t),x2(t),…,xn(t)]表示t时刻系统中的信息认可度值,Gt(V,E,W)表示t时刻系统的网络拓扑图,V表示网络节点集合,E表示边的集合(即网络节点之间竞争性信息可能到达的传播通路),W=[wij]表示边的权值矩阵或影响力矩阵(一个节点对与之有连接的各个节点的影响力权值)。
表1.3 数据驱动传播模型的特点比较
若t时刻系统中节点i和j的信息认可度分别为xi(t)和xj(t),则两节点间的认知距离可表示为
节点间的连接权重即影响力权值可表示为
式中,d是一个很小的正数,其作用是避免xi(t)-xj(t)等于零时分母出现异常情况。两个节点间的认知距离越接近,相互间的影响力就越大。
若系统上网络节点i与所有邻居节点之间的连边权值之和为1,即,则相邻节点在t+1时刻边上的影响力权值为
式中,为节点i在t时刻自己对自己的影响力权重。经归一化处理后,在t+1时刻,。
经过一个时间步的演化,节点i在t+1时刻的信息认可度xi(t+1)可表示为
将式(1.6)所示的演化规则推广至整个网络,则系统S在t+1时刻的信息认可度为
式中,X(t)表示t时刻系统的信息认可度向量,X(t+1)表示经过一个时间步演化后在t+1时刻系统的信息认可度向量,W(t+1)表示t+1时刻系统的影响力权值矩阵。
随着社交网络上竞争性信息传播的实证数据的获取越来越容易,根据实证数据分析总结和提取的信息传播扩散规律越来越贴近实际。由此提出的多种数据驱动的竞争性信息传播模型能够用实证数据来逐一检验其有效性,形成了数据-模型不断整合的研究范式。
1.2.3 社会博弈模型
社会博弈模型基于演化博弈的思想,研究竞争性信息社交网络中用户分享行为的合作与竞争机制。社会博弈模型认为社交网络上的用户通过信息分享、信息交互的方式来联系彼此,这种交互方式反映了用户的社会联系,满足人们的社交需求。在博弈设置中,个体只关注其短期的效用和长期的声誉,基于这两个关注点建立个体行为策略更新和社交关系更新的共同演化机制。社会博弈模型有局部相互作用博弈模型、网络演化博弈模型、社交演化博弈模型、进化博弈模型等[22],如表1.4所示。
表1.4 社会博弈模型的特点比较
演化博弈可以表示为一个带属性的三元组G=(V,E,I;U,R)。其中V={i|1≤i≤n}表示个体集合,它是博弈的主体;E={eij|i∈V,j∈V,1≤i≤n,1≤j≤n}是互动关系集合;I是交互集合,表示个体间的交互依赖关系;U为个体的效用函数集合;R为个体的声誉函数集合。个体i的效用是指在每回合博弈中i从对手获得的收益之和,它指导个体与其他个体进行策略博弈,通过模仿其他成功个体的策略来不断改善自身的效用。个体i的声誉是其他个体对合作者行为策略历史的印象,它是个体的长期关注点,可以指导个体更新其社会关系,并通过与高声誉个体建立社交关系并断开与低声誉个体的社交关系来改善自身所处的社交环境。在t时刻,个体i的声誉Ri(t)可以表示为
式中,ΔRi(t)是时刻t的声誉增加值,σ是声誉的记忆衰减率。
在博弈设置中,个体有两种交互策略{C,D}。策略C表示合作行为,使用该策略需要付出一定的成本,但是能够使其他个体及自己获得收益;策略D表示非合作行为,使用该策略不需要付出任何成本,只是单纯地获得收益。运用囚徒困境、鹰鸽博弈和公共品博弈等建模,每轮博弈对决完成后,个体i会根据计算结果更新自己的策略。个体i依据概率w学习博弈对手个体j的博弈策略,相应的概率表达式为
式中,si,sj分别为节点i,j的策略集;ui,uj分别为节点i,j在此轮博弈中获得的收益;β为模仿噪声,即个体模仿其他个体的意愿程度,β→0时表示趋向于随机模拟,β→∞时表示趋向于确定性模拟。竞争博弈的结果体现为不同类型的竞争性信息覆盖网络节点的多寡。
1.2.4 基于传染病的模型
基于传染病的模型是信息传播领域公认的比较成熟的模型,它将社会系统人群分成易感者、感染者和治愈者三类,信息从感染者传到易感者,易感者收到信息并成功转发后,自身转变为治愈者,完成个体状态的转换,直至系统达到一种稳定态。传统模型有SI、SIS、SIR,这些模型均无法反映易感者转化为感染者之前有一个潜伏期的事实,为此将潜伏状态引入SIR模型,产生了SEIR等模型[23],如表1.5所示。
假如在社交网络上某用户发布一条信息后,信息会依社交关系传播给它的关注者,此时关注者有两种选择:若信息引起关注者共鸣,则接收并转发;否则弃之不理。因此,网络节点被划分为四类:未知者I(未接收到信息的节点)、潜伏者E(接收但不转发信息的节点)、传播者S(接收并转发信息的节点)、免疫者R(接收过但对信息不感兴趣的节点)。节点间的状态转换规则如下。
(1)未知者I与潜伏者E接触后以概率p1转化成潜伏者。
(2)未知者I与传播者S接触后以概率p2转化成潜伏者。
(3)潜伏者E以概率α转化成传播者。
(4)传播者S以概率β转化成免疫者。
表1.5 基于传染病的模型的特点比较
SEIR模型的状态转移概率图如图1.3所示。
图1.3 SEIR模型的状态转移概率图
根据网络节点状态转换规则,可得到竞争性信息传播模型为
由式(1.10)可知,若该社交网络传播模型中的节点数量为一常量,则可假定I(t)+E(t)+S(t)+R(t)≡N,其中I(t),E(t),S(t),R(t)分别指t时刻各类节点数占传播网络节点总数N的比例。
在后续发展过程中,传染病模型针对不同的应用场景衍生出了许多变体,比如研究新产品在社交网络中扩散的Bass-SIR模型、基于情感交流的HIT-SCIR模型及具有两个时滞和垂直转移的SEIRS模型等。
1.2.5 基于物理系统的模型
基于物理系统的模型借用社会物理学方法分析社交网络中用户个体的属性和网络结构特征,根据社会粒子寻求社会普适有序理论,认为信息传播具有社会普朗克现象和量子化特性,个体社会行为揭示信息在社交网络空间中会不断复制、感染、扩散传播,通过建模和实证分析来预测信息传播的趋势。信息在竞争传播过程中服从最少支付原理和主流疲劳原理,信息扩散服从熵值守恒原理,社会个体在与外界环境交换信息的过程中汲取负熵。竞争性信息的存在使得传播具有不确定性,其实质取决于两类能量博弈:一类是人类社会约束能量,即由社会法律管制和道德约束形成的系统外部束缚能量的总和;另一类是社会个体自发式寻求突破约束的内力总和。两者作用的结果就成为对社会温度计量的映射。典型模型包括人类动力学信息传播模型、社交影响力动力学信息传播模型、引力势能信息传播模型、lotka-volterra模型等[24],如表1.6所示。
表1.6 基于物理系统的模型的特点比较
运用社会物理学引力势能理论,研究社交网络中竞争性信息在用户之间的扩散过程,利用费马最短时间启示研究个体、群体不同行为的选择取向,优化信息传播层级多维介质折射率。把社交网络当作一个完整的引力势能场,网络上的用户就是质点,选取无穷远处的边缘节点为势能零点。
用无向图G′=(V,E)表示网络,其中V={i|1≤i≤n}为节点,E为节点连边,ki为节点i的度。若节点质量为mi=(m1,m2,…,mn),信息粒子质量为mj,信息位移为xj,则根据引力势能理论,质量为mj的信息粒子受到引力的作用,它使xi处的信息粒子产生位移r=|xi-xj|,在xi处受到的引力势能大小与距离r成反比。于是,引力势能函数Φ(t)可以表示为
根据社交网络中用户的不同行为方式,定义了四种传播方式:①浏览方式,阅读量记为n1。②评论方式,评论量记为n2,网络的时效性衰减系数记为λi。③生产方式,以传播者身份发布信息,复制传播数量记为n3。④传递方式,朋友圈对信息进行分享,这种人际传播数量记为n4。结合用户行为和引力势能理论,经推导得到竞争传播动力学微分方程组如下:
式中,t0为初始信息发布时间,v0为初始信息价值,α,β,γ,δ∈[0,1],信息竞争传播过程中满足α+β+γ+δ=1,表示网络空间环境变化对用户竞争传播行为的影响因子。
以上各类研究从不同的角度对信息传播过程进行了剖析,可以帮助社会大众认识社交网络的用户关系结构、个体属性特征、信息竞争方式和扩散动力来源等规律,具有极大的潜在商业价值与社会价值。