3.3 实验结果与分析
3.3.1 数值模拟
在社交网络系统中,由式(3.22)可知,未传播任何信息的S状态节点要转化为传播信息的IA或IB状态节点与两个因素有关:一是传播率λ1,λ2,体现了人们主动传播信息的意愿大小;二是网络拓扑结构,即S状态节点的直接邻居中存在IA或IB状态节点的数量,体现了可能接收到信息的路径多寡。为了观察这两个因素对节点状态转化的影响,根据式(3.20)给出的转移概率矩阵P,考虑某个S状态节点同时存在na个IA状态、nb个IB状态的邻居节点,以λ1为横轴、以λ2为纵轴,以S状态节点成功接收到某一类型信息导致状态转移的概率为竖轴,绘制了S状态节点转移概率随λ1,λ2,na,nb的变化关系图,其中na,nb分别取(1,1),(5,5),(10,2),(2,10),(0,5),(5,0),结果如图3.4所示。
由图3.4(a)和(b)可见,λ1,λ2的增加使得转移概率以线性方式增长,而na,nb的增加则使得转移概率以指数上升方式快速增长。λ1>λ2时,节点向IA状态转移,反之向IB状态转移。由图3.4(c)~(d)容易看出,邻居节点数量的增加可大大提高转移概率的权重,在na=10,nb=2的情形下,S状态节点向IA状态转移的概率很快达到1,这说明在信息传播率一定的情况下,只要邻居节点中处于信息传播状态的节点足够多,该节点的状态转移就可视为必然事件。当节点只接触到某种信息即λ1=0或λ2=0时,模型退化为传统的SIR模型,节点转化为相接触的节点状态,如图3.4(e)~(f)所示。
当系统中相邻节点处于不同信息传播状态时,一对邻居节点分别处理IA状态和IB状态,此时必将引起信息竞争,双方都希望用自身获取的信息去覆盖对方节点,驱赶对方的原有信息。这种竞争力度的大小与信息置换率θ1,θ2和网络结构有关,在考虑邻居接点na,nb的情形下,na,nb分别取(1,1),(5,5),(10,2),(2,10),(0,5),(5,0),以θ1为横轴、以θ2为纵轴、以p23与p32之差的绝对值为竖轴,绘制了竞争转移概率变化趋势图,如图3.5所示。
图3.4 S状态节点转移概率随λ1,λ2,na,nb的变化关系图
由图3.5(a)~(b)可见,节点在信息竞争中向对方状态转移的概率随θ1,θ2的增加呈线性增长,随na,nb的增加呈指数快速增长。从图3.5(c)~(d)可以看出,网络结构对节点间的竞争关系影响重大,在na=10,nb=2时,竞争使节点转移到IA状态的概率远高于转移到IB状态的概率,这说明在社交网络上意见领袖扮演了十分重要的角色,他们话语权高且粉丝众多,一言一行、一举一动均会受到一大批追随者的热捧,导致大多数民众都从意见领袖处得到新闻消息。要想这些普通民众的态度和行为发生预期的改变,就需要利用意见领袖对信息进行权威诠释、阐述观点,为普通大众指引方向并引导舆论。当网络中的某种信息占绝对优势时,信息竞争行为消失,即θ1=0或θ2=0,传播节点将快速向某种状态单方向转化,整个网络舆论迅速统一,如图3.5(e)~(f)所示。
图3.5 竞争转移概率变化趋势图
传播节点在受信息竞争影响的同时,也受节点本身信息遗弃率δ1,δ2的影响。此处仅讨论IA状态节点的情况,IB状态节点的情况类似。一个IA状态节点受竞争的影响可能转化为IB状态,也可能受遗忘效应的影响转化为R状态。对于IA状态节点,以θ1为横轴、以δ1为纵轴、以节点发生状态转移的概率为竖轴,绘制了如图3.6所示的节点状态转移变化关系。IB状态节点具有类似的变化关系。
图3.6 节点状态转移变化关系
由图3.6可见,一个传播节点从IA状态转化为R状态的概率与遗弃率δ1呈线性关系变化,转化为IB状态的概率与置换率θ1呈指数关系变化,主要原因仍然是受到网络结构的影响。当δ1,θ1都较小时,节点保持原有状态,不进行转化;当δ1较大时,传播节点以遗弃率为概率从传播状态转化为R状态,一旦转化为R状态,就不再参与信息竞争;当θ1较大时,因为竞争关系传播节点从IA状态转化为IB状态。
3.3.2 实证对比与结果分析
1.社交网络结构
真实的社交网络节点规模庞大、网络结构复杂、用户行为多样,属于大规模复杂网络。网络结构特征重点研究不同网络拓扑结构对信息传播模式的影响,典型的网络结构有WS网络、BA网络、随机聚团网络、层次结构网络、社区结构网络等。最新的研究成果表明,社交网络是由链结构、圈结构、星结构和团结构四种简单网络复合而成的,构成关系如图3.7所示。
2.实验目的
通过模拟实验生成竞争性信息传播仿真结果数据,收集真实社交网络上发生的热点事件的信息传播统计数据,对两组数据进行预处理并归一化到同一尺度,然后进行比对分析,考察二者之间的拟合程度、偏差范围,以检验模型的有效性和准确性。
3.实验思想
现阶段无法依据真实社交网络拓扑结构来构建实验网络,只能根据社交网络的主要特征(忽略次要因素)生成一个小规模的规则网络去近似社交网络,在近似网络上开展研究和试验工作,最后将试验结果与真实社交网络上的统计数据进行对比分析,检验研究过程和研究结果是否正确。
图3.7 社交网络构成关系
4.实验步骤
(1)分别从百度指数(互联网搜索统计分析平台)和新榜数据平台(移动端全平台内容数据服务商)提取不同类别事件的社交网络信息传播数据。
(2)运用模型竞争传播算法模拟信息传播过程,得到模拟实验结果数据。
(3)将两组数据归一化到同一坐标系尺度,然后作图,定性分析二者之间的拟合情况。
(4)根据定性和定量分析的结果,对模型做出综合评价。
5.可行性分析
社交网络结构虽然复杂,但只要有足够的实时处理能力和运算能力,仍然可以抓取和统计网络中的真实传播数据。选取网络中不同类别的热点事件可视为从总体中随机抽取样本,每个样本值(即每个事件传播数据)又是数以百万计用户的行为共同作用的结果,每位用户是否传播信息受其自身的随机因素综合影响。由此可知,样本值必然服从大数定律和中心极限定理,具有统计规律性和代表性。因此,把模型仿真结果数据与网络真实统计数据进行比对,分析二者之间的近似程度和误差范围,即可衡量模型是否与客观传播规律相符,进而检验模型是否正确和有效。
根据2018年真实发生的“××偷逃税”和“宝马男砍人反被杀”热点事件,收集相应的社交媒体传播数据,开展实证对比实验,与模型仿真结果数据进行比对。真实热点事件信息传播统计数据来源于两个不同类型的权威平台,分别是新榜数据和百度指数。新榜数据平台专门为社交媒体从业人员、科研工作者、咨询公司等提供传播数据监测采集和统计分析服务。百度指数平台关注网民日常的搜索行为和词条数据,以此为基础向客户提供数据分享服务。
“××偷逃税”事件,2018年6月,××签署“阴阳合同”,作为公众人物,却不依法纳税。9月29日以文章“××消失的100多天”引爆社交网络舆论,随后登上了微博、百度贴吧等社交媒体榜首,一时间成了许多网友关注的焦点。10月3日税务部门公布该案件事实,并开出高达8亿余元的罚单。至此,对该热点事件的各种讨论和猜疑尘埃落定。
新榜平台对该事件进行信息监测的统计结果显示,网络上传播的信息可分为两类:一是“××消失的100多天”文章及其衍生文章,视为A信息;二是税务部门公布案件事实和处罚决定,视为B信息。这两类信息的每日阅读量如表3.1和图3.8所示。
在模型中,取A信息的传播率λ1=0.05、遗弃率δ1=0,B信息的传播率λ2=0.3、遗弃率δ2=0.5,开展实证对比实验。将模拟传播结果数据及表3.1中的真实监测统计数据统一归一化处理,绘制了“××偷逃税”事件信息传播数据对比图,如图3.9所示。实验参数设置是依据事件特征和真实社会中的效应取定的,λ1远低于λ2,因为A信息为民间消息,可信度不高,而B信息属于官方消息,大众愿意采信并积极传播。遗弃率取值为δ1=0,δ2=0.5,因为A信息是有关一线明星的消息,能够吸引大众眼球并引发持续关注,而B信息属于事件的最终结果,一旦公布就意味着事件的终结。
表3.1 “××偷逃税”事件信息阅读量
注:数据摘自http://data.newrank.cn
图3.8 “××偷逃税”事件信息传播过程图
从图3.9可以看出,模型仿真数据与真实统计数据变化趋势基本相符,初期A信息在网络中的一定范围内传播扩散,随后由于B信息的发布使得A信息的传播逆转,逐渐缩小覆盖范围。与此同时,B信息快速扩散,因为该信息是由意见领袖(官方部门)发布的,所以传播速度快、范围广。在最后,该事件失去新鲜感和大众讨论的价值逐渐被民众所遗弃。从整个信息的传播过程来看,模型有效地模拟了该事件的真实传播过程,相似度高,B信息及时有效地抑制了A信息的进一步扩散和传播。真实数据中B信息的传播数据出现两次峰值即Q1,Q2点,与仿真结果数据差异较大,原因是在真实社交网络中,网民规模巨大且属于开放式系统,导致Q1点的传播峰值极高;而模型的实验网络规模较小且是封闭的,不可能产生这种奇点。Q2点峰值的出现是由于官方部门对该事件的后续处理并发布相关信息造成的,可视为第三种类型信息竞争的结果。
图3.9 “××偷逃税”事件信息传播数据对比图
为了避免单一数据来源随机性的影响,再从百度指数平台提取“宝马男砍人反被杀”事件在传播过程中的搜索指数数据进行分析。2018年8月,××市发生一起砍人反被杀案件,宝马车上的男子持长刀奔袭砍向骑自行车的男子,但不慎刀具跌落到地,随即被骑自行车的男子捡起,反而将这名宝马车上的男子杀害。砍人者是正当防卫还是涉嫌故意伤害罪,随即引起社会广泛关注和讨论,登上百度平台等社交媒体的热搜榜首。经过相关部分的缜密侦办,最终定性骑自行车的男子为正当防卫而无罪释放。
百度指数平台对该事件进行信息传播监测的统计结果显示,信息可以分为两类:一是事件本身是否属于正当防卫的讨论为A信息;二是公权力机关最后定性为正当防卫为B信息。这两类信息的每日阅读量和信息传播过程图分别如表3.2和图3.10所示。
表3.2 “宝马男砍人反被杀”事件信息阅读量
注:数据摘自http://index.baidu.com
图3.10 “宝马男砍人反被杀”事件信息传播过程图
在模型仿真实验中,设定参数A信息的传播率为λ1=0.2、遗弃率为δ1=0,B信息的传播率为λ2=0.3、遗弃率为δ2=0.5,信息发布时间为ta=0、tb=0,传播率和遗弃率的取值依据与“××偷逃税”事件实验的类似。进行对比实验,将演化结果数据和表3.2的统计数据做标准化和归一化处理,在同一坐标系下绘制成信息传播数据对比分析图,如图3.11所示。
图3.11 “宝马男砍人反被杀”事件信息传播数据对比分析图
从图3.11可以看出,模型仿真数据与真实统计数据的变化趋势吻合程度高,拟合性能好,较为准确地刻画了竞争性信息传播的过程。初期A信息在网络中大范围内传播扩散,几乎引发全民讨论,随后由于B信息的发布,即司法机关对案件的定性结果和通报,导致A信息的传播趋势逆转,民众讨论和议论热情下降,统一了社交网络舆论。最后该事件作为司法经典案例定格在人们心中,受网络中其他新闻热点事件的冲击而逐渐被人们遗弃,信息传播过程结束。
根据以上两个取自不同平台、不同事件的统计数据,以及与仿真实验数据对比分析的结果,发现在整个信息传播过程中,模型较为准确地模拟了真实事件的传播过程,体现了网络中两种不同类型信息之间的竞争关系。实验中无论A信息扩散的范围大小如何,B信息都能及时有效地抑制A信息的进一步扩散和传播。