上QQ阅读APP看书,第一时间看更新
2.2.1 CN相似度
通用邻居(Common Neighbors,CN)相似度观察两个样本之间共有的邻居数量来决定它们是否相似,其表达式为
N(x)表示x样本的邻居集,在一个社交网络的好友推荐场景中,CN相似度也是用户x与用户y之间共同好友的数量,而在短视频推荐场景中,CN相似度可以认为是用户x与用户y都喜欢的短视频数量。
CN相似度的代码非常简单,仅需计算两个集合的交集长度,代码如下:
CN相似度的值是[0,∞],所以无法单从某两个样本的CN相似度指标的值来判断它们是否相似,而必须对样本间的两两CN相似度比较后才能判断。当然也可对所有的CN相似度做归一化处理。