社交网络竞争性信息传播与用户行为分析
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 社交网络用户行为分析

1.3.1 社交网络群体行为分析

群体是介于组织与个人之间的集合体。组织与个体由一定的社会关系结合并在共同活动中相互作用,形成人们社会生活的具体单位。社交网络群体行为分析是实现发现群体、认知群体及引导群体等应用的基础。对于群体行为分析,有两种倾向:一种是个人参与群体行为的心理状态;另一种是作为非典型互动形式展开分析。这两种研究倾向对应的群体行为理论框架分别为社会认同理论和符号互动理论。众多学者对于群体行为的认识都离不开这两个理论框架,因此这两个理论框架构成了充分解释群体行为的基础。

群体行为一般具有三个特征:其一,由个人心理上引起的正常行为,不受外界控制产生;其二,行为受社会关系和社会规范的影响;其三,群体具有共同目标。所以,由此认为群体行为是超过一定数量、具有共同目标的个体相互作用的结果,且具有自发性和自组织性。通过社交网络,人们可以摆脱地理或组织约束,促进各行各业相互联系,进行信息、思想和情感的交流,形成不同类别的群体组织。社交网络群体行为与现实群体行为相比,无论是在参与主体、行动的场域、组织方式方面,还是在群体对个体的影响等方面,都表现出诸多不同。在社交网络环境下,群体极化效应更加凸显,群体具有自组织性、随机性和复杂性,个体依存关系表现出的稳定性较弱,但是关系连接范围变得更广。用户加入社交群体后,社会规范、社会标准对社交群体行为变得相对不重要。在社交网络群体中,群体成员更多地根据群体关系和规范做出行为决策,聚集形成群体行为。在社交群体环境中,群体同样具有与现实社区网络中一样的强弱关系。但是,网络中的群体关系更为多元、自由散漫且缺乏稳定性。综上,相比于现实群体行为,社交网络群体行为具有以下两个特性:一是群体中个体的行为受群体关系和规范的约束力小;二是群体行为在社交群体环境中的表现多样、形成速度快且影响范围广泛。

1.3.2 社交网络用户兴趣行为分析

用户兴趣是个性化推荐的核心要素,在社交网络、电商等领域中,用户兴趣挖掘都具有十分重要的作用。在不同的场景下,用户兴趣的获取方式各不相同,获取效果也具有很大的差异。随着存储和计算能力的提升,保存海量行为日志并对其进行数据挖掘的方法得到了越来越广泛的应用。

用户兴趣分析是个性化商品推荐系统的前提条件和重要步骤。常用的用户兴趣获取方式有两种:一是显式用户兴趣获取,这种方式要求用户参与调查问卷形式的互动,比如选择感兴趣的商品类别或对商品写评语和评分等,显式用户兴趣获取依赖于用户的主动性,获取的用户兴趣往往具有偏差;二是隐式用户兴趣获取,电商网站通常定义不同类型的交互动作,在用户购物时电商网站会默默记录用户的操作行为日志,通过对用户行为日志建模获取用户兴趣。显式用户兴趣获取方式需要用户参加与购物不相关的操作,为了提升用户的参与度,商家通常使用返利等方式诱导用户提交相关信息,因此获得的用户兴趣可能不具有很高的客观性,但是对于新用户或历史数据较少的用户来说,问卷调查是解决推荐冷启动问题的一个方法。显式用户兴趣在实际场景中被广泛应用,常见的协同过滤推荐算法就是充分发挥显式兴趣信息的作用来解决具体问题的。算法依据用户对商品的评分来区别用户之间的差异,从而发现用户兴趣,给具有相似兴趣的用户推荐类似的商品,算法对评分这种显式兴趣信息建模,实现了较准确的用户兴趣挖掘。

1.3.3 社交网络异常用户分析

社交网络中的异常用户研究检测领域目前提出了四类检测方法:一是基于行为特征的检测方法,二是基于内容的检测方法,三是基于图的检测方法,四是无监督学习的检测方法。社交网络异常用户检测方法的分类如表1.7所示[25]

表1.7 社交网络异常用户检测方法的分类

检测方法的分类并没有很明确的标准,有的检测方法可能运用了两种或两种以上的检测方法。例如,基于行为特征的检测方法在将用户的行为特征抽象化后,可以使用无监督学习算法(如聚类算法)进行分类,因此在设计检测方法时可以考虑结合多种检测方法,以达到更好的分类结果。

1.3.4 社交网络用户影响力行为分析

社会网络是人与人之间的关系网络,其用户节点影响力的影响因素与节点自身的属性特点具有很大的关系。如果节点本身的社会网络较大,强关系链接越多,并且联系越频繁,联系的对象节点的传播能力越强,那么发布的信息就越有可能被更多节点接收到。其次,社交网络中存在着一定的权重倾向问题,一些用户节点由于官方认证等原因,会处于影响力的强势地位,而另一些用户节点则会处于比较弱势的地位。权重较高的用户节点对于信息的流向传播一般处于领导地位,而且这些用户节点对于热点话题的形成、传播具有较大的引导作用。表1.8所示为社交网络用户节点影响力的影响因素。

表1.8 社交网络用户节点影响力的影响因素

现实中,由于不断增长的社交网络信息传播模式,用户节点影响力的构成是相对复杂的。就微博社交网络而言,比较重要的因素包括用户节点的粉丝数量、粉丝的影响力、微博用户自身影响力的质量、微博用户自身的活跃度等。

1.3.5 社交网络用户链路预测行为分析

社交网络用户链路预测技术通过对已知社交网络结构的分析,推断出未知的连边关系,这也是网络科学研究中的核心问题。由于现代社交网络对用户隐私的重视,难以获取节点属性,所以只需要考虑网络结构,而无须考虑节点属性的基于节点相似性的链路预测模型现在更受欢迎。然而,这些现有的节点相似性链路预测方法通常只考虑2跳的共同邻居,相对于较为繁杂的社交网络来说,并不能准确地刻画出两点之间的相似性。研究发现,3跳共同邻居在计算节点相似性时也十分重要。理论上考虑更长的链接会得到更准确的预测结果,但计算复杂度也会随之增加,且随着长度的增加链接对相似度的贡献减弱。同时,由于社交网络存在集群效应,即网络中可能产生某些大度节点,该节点的传递能力较弱,因此提出了基于2跳共同邻居和3跳共同邻居的综合性相似性链路预测方法,同时加入惩罚因子,使得3跳共同邻居对相似度的贡献弱于2跳共同邻居。由于社交网络中大度节点的传递能力较弱,因此也加上了对大度节点的惩罚。该方法能更好地反映现实生活中的社交网络情况,使得预测结果更为精确,同时在增强准确性的同时,有效降低了计算复杂度,因此更加适用于大规模的社交网络。