耦合社会信任信息的矩阵分解协同过滤模型

蒋伟; 秦志光

doi:10.3969/j.issn.1001-0548.2019.03.018

耦合社会信任信息的矩阵分解协同过滤模型

doi: 10.3969/j.issn.1001-0548.2019.03.018

蒋伟,
秦志光

电子科技大学信息与软件工程学院成都 610054

详细信息

作者简介:
蒋伟(1976-), 男, 博士生, 主要从事数据挖掘、机器学习等方面的研究.E-mail:wayne_jiang@sina.com

中图分类号: TP311

A Matrix Factorization Collaborative Filtering Model with Trust Information

School of Information and Software Engineering, University of Electronic Science and Technology of China Chengdu 610054

摘要: 在过去的十年中，协同过滤（CF）推荐系统已经取得了巨大的成功。然而，用户-物品矩阵的稀疏性和冷启动问题仍然是一个挑战。在线社交网络的出现，为推荐系统提供了大量社交网络信任信息，从而为解决这一问题提供了契机。该文基于矩阵分解协同过滤方法，提出了一种集成用户信任信息的模型。该方法利用用户信任信息对用户隐因子进行修正，采用自编码器来提取用户和物品隐特征向量的初始化特征，并针对社交网络中的信任关系提出了信任群组的检测算法。大规模的真实数据集上进行的广泛的实验表明，该模型与相关算法对比，不但能有效缓解冷启动，而且取得了更好的推荐性能。
- 协同过滤 /
- 矩阵分解 /
- 推荐系统 /
- 辅助信息 /
- 社会网络 /
- 信任感知
Abstract: Collaborative filtering (CF) recommender system has been a most successful recommendation model in the past decade. However, the sparseness of user-item matrix and cold-tart problem still remain the challenges. The emergence of online social networking provides a great deal of social trust information for recommender systems, thus providing an opportunity to solve these problems. In this paper, based on matrix factorization collaborative filtering method, a model of integrating user trust information is proposed. This method uses trust information of users to amend the user latent factors and employs an auto-encoder to extract the initialization features of user and item latent feature vectors. And then a trust group detection algorithm is proposed for the trust relationship in the social network. Extensive experiments on real data sets show that the proposed model can not only effectively alleviate cold start, but also achieve better recommendation performance than the compared algorithms.
- collaborative filtering /
- matrix factorization /
- recommender system /
- side information /
- social network /
- trust-aware

图 1 SoRec模型

下载: 全尺寸图片幻灯片

图 2 社会网络示例

下载: 全尺寸图片幻灯片

图 3 初始化的影响

下载: 全尺寸图片幻灯片

图 4 维数的影响

下载: 全尺寸图片幻灯片

图 5 clique大小的影响

下载: 全尺寸图片幻灯片

表 1 Flixster数据集统计数据

统计项	数值
用户数	1 049 455
物品数	4 923 59
评分数	8 238 597
信任关系数	26 771 123

下载: 导出CSV

表 2 综合比较

指标	Tidal-Trust	Mole-Trust	BMF	STE	Social-MF	GWNMF	Our Model
RMSE	0.834 5	0.825 2	0.815 3	0.802 3	0.797 7	0.796 1	0.788 1
Coverage/%	75.54	76.39	86.33	89.43	89.93	92.13	94.78
F-Measure	0.773 4	0.779 4	0.830 5	0.845 8	0.847 9	0.856 7	0.873 3

下载: 导出CSV

[1]	SARWAR B, KARYPIS G, KONSTAN J, et al. Item-based collaborative filtering recommendation algorithms[C]//Proceedings of the International Conference on World Wide Web. New York: ACM Press, 2001: 285-295.
[2]	MA Hao, YANG Hai-xuan, LYU M R, et al. Sorec: Social recommendation using probabilistic matrix factorization[C]//Proceedings of the ACM Conference on Information and Knowledge Management. California: ACM Press, 2008: 265-275.
[3]	YANG Bo, LEI Yu, LIU Da-yong, et al. Social collaborative filtering by trust[C]//Proceedings of the 23rd International Joint Conference on Artificial Intelligence. Beijing: AAAI Press, 2013: 2747-2753.
[4]	YANG Bo, LEI Yu, LIU Da-Yong, et al. Social collaborative filtering by trust[J]. IEEE Transactions. on Pattern Analysis and Machine Intelligence, 2017, 39(8):1633-1647. doi: 10.1109/TPAMI.2016.2605085
[5]	MA Hao, KING I, LYU M R. Learning to recommend with social trust ensemble[C]//Proceedings of the International ACM SIGIR Conference on Research and Development in Information Retrieval. Boston: ACM Press, 2009: 19-23.
[6]	JAMALI M, ESTER M. A matrix factorization technique with trust propagation for recommendation in social networks[C]//Proceedings of the ACM Conference on Recommender Systems. Barcelona: ACM Press, 2010: 26-30.
[7]	MA Hao, ZHOU Deng-yong, LIU Chao, et al. Recommender systems with social regularization[C]//ACM International Conference on Web Search and Data Mining. Hong Kong, China: ACM Press, 2011: 287-296.
[8]	LI Hui, WU Ding-ming, Tang Wen-bin, et al. Overlapping community regularization for rating prediction in social recommender systems[C]//Proceedings of the 9th ACM Conference on Recommender Systems. Vienna: ACM Press, 2015: 27-34.
[9]	TANG Ji-liang, WANG Su-hang, HU Xia, et al. Recommendation with social dimensions[C]//Proceedings of the 30th AAAI Conference on Artificial Intelligence. Honolulu: AAAI Press, 2016: 251-257.
[10]	SEDHAIN S, MENON A K, SANNER S, et al. Low-Rank linear cold-start recommendation from social data[C]//Proceedings of the 31th AAAI Conference on Artificial Intelligence. San Francisco: AAAI Press, 2017: 1502-1508.
[11]	HIDASI B, TIKK D. Initializing matrix factorization methods on implicit feedback databases[J]. Journal of Universal Computer Science, 2013, 19(12):1834-1853.
[12]	REZAEI M, BOOSTANI R, REZAEI M. An efficient initialization method for nonnegative matrix factorization[J]. Journal of Applied Sciences, 2011, 11(2):354-359. doi: 10.3923/jas.2011.354.359
[13]	RIFAI S, VINCENT P, MULLER X, et al. Contractive auto-encoders: Explicit invariance during feature extraction[C]//Proceedings of the International Conference on Machine Learning. Washington: IMLS, 2011: 833-840.
[14]	FORTUNATO S. Community detection in graphs[J]. Physics Reports, 2009, 486(3):75-174. http://d.old.wanfangdata.com.cn/OAPaper/oai_arXiv.org_0911.5239
[15]	ZHOU Zhen, WANG Wei, WANG Liang. Community detection based on an improved modularity[M]. Berlin:Springer Berlin Heidelberg, 2012:638-645.
[16]	BLONDEL V D, GUILAUME J L, LAMBIOTTE R, et al. Fast unfolding of communities in large networks[J]. Journal of Statistical Mechanics, 2008(10):155-168. doi: 10.1088-1742-5468-2008-10-P10008/
[17]	ZHANG He, YANG Zhi-rong, OJA E. Improving cluster analysis by co-initializations[J]. Pattern Recognition Letters, 2014, 45(11):71-77. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=bab3058171f4fd8160a166726f573e8f
[18]	MASSA P, AVESANI P. Trust metrics in recommender systems[M]. London:Springer London, 2009:259-285.
[19]	MASSA P, AVESANI P. Trust-aware recommender systems[C]//Proceedings of the ACM Conference on Recommender Systems. Minneapolis: ACM Press, 2007: 17-24.
[20]	KANNAN R, ISHTEVA M, PARK H. Bounded matrix factorization for recommender system[J]. Knowledge & Information Systems, 2014, 39(3):491-511.
[21]	GU Quan-quan, ZHOU Jie, DING C. Collaborative filtering: Weighted nonnegative matrix factorization incorporating user and item graphs[C]//Proceedings of the SIAM International Conference on Data Mining. Ohio: SIAM Press, 2010: 199-210.

[1]	王永, 王淞立, 邓江洲. 基于生成对抗网络的评分可信推荐模型 . 电子科技大学学报, 2024, 53(2): 1-8. doi: 10.12178/1001-0548.2023116
[2]	夏欣, 马闯, 张海峰. 基于改进的度折扣方法研究社交网络影响力最大化问题 . 电子科技大学学报, 2021, 50(3): 450-458. doi: 10.12178/1001-0548.2020338
[3]	王永, 冉珣, 尹恩民, 王利. 满足差分隐私保护的矩阵分解推荐算法 . 电子科技大学学报, 2021, 50(3): 405-413. doi: 10.12178/1001-0548.2020359
[4]	郭强, 岳强, 李仁德, 刘建国. 基于四阶奇异值分解的推荐算法研究 . 电子科技大学学报, 2019, 48(4): 586-594. doi: 10.3969/j.issn.1001-0548.2019.04.017
[5]	陈玲姣, 蔡世民, 张千明, 周涛, 张翼成. 基于信任关系的资源分配推荐算法改进研究 . 电子科技大学学报, 2019, 48(3): 449-455. doi: 10.3969/j.issn.1001-0548.2019.03.022
[6]	ALI Waqar, 邵杰, KHAN Abdullah Aman, TUMRANI Saifullah. 上下文感知推荐系统：挑战和机遇 . 电子科技大学学报, 2019, 48(5): 655-673. doi: 10.3969/j.issn.1001-0548.2019.05.002
[7]	张海霞, 吕振, 张传亭, 袁东风. 一种引入加权异构信息的改进协同过滤推荐算法 . 电子科技大学学报, 2018, 47(1): 112-116, 152. doi: 10.3969/j.issn.1001-0548.2018.01.017
[8]	姚敦红, 李石君, 胡亚慧. 三维有偏权值张量分解在授课推荐上的应用研究 . 电子科技大学学报, 2017, 46(5): 747-754. doi: 10.3969/j.issn.1001-0548.2017.05.018
[9]	余刚, 王知衍, 邵璐, 胡舒悦, 蔡毅. 基于奇异值分解的个性化评论推荐 . 电子科技大学学报, 2015, 44(4): 605-610. doi: 10.3969/j.issn.1001-0548.2015.04.022
[10]	张乐君, 邓鑫, 国林, 张健沛, 杨静, 李泓波. 基于关联度分析的WSN节点信任模型研究 . 电子科技大学学报, 2015, 44(1): 106-111. doi: 10.3969/j.issn.1001-0548.2015.01.018
[11]	刘瑶, 王瑞锦, 刘峤, 秦志光. 动态社会网络的社团结构检测与分析 . 电子科技大学学报, 2014, 43(5): 724-729. doi: 10.3969/j.issn.1001-0548.2014.05.016
[12]	阚佳倩, 谢家荣, 张海峰. 社会强化效应及连边权重对网络信息传播的影响分析 . 电子科技大学学报, 2014, 43(1): 21-25. doi: 10.3969/j.issn.1001-0548.2014.01.003
[13]	刘贵松, 解修蕊, 黄海波, 屈鸿. 基于最短路径信任关系的推荐项目计算方法 . 电子科技大学学报, 2014, 43(2): 162-166. doi: 10.3969/j.issn.1001-0548.2014.02.001
[14]	闫强, 吴联仁, 郑兰. 微博社区中用户行为特征及其机理研究 . 电子科技大学学报, 2013, 42(3): 328-333. doi: 10.3969/j.issn.1001-0548.2013.03.002
[15]	张亮, 柏林森, 周涛. 基于跨电商行为的交叉推荐算法 . 电子科技大学学报, 2013, 42(1): 154-160. doi: 10.3969/j.issn.1001-0548.2013.01.031
[16]	朱郁筱, 吕琳媛. 推荐系统评价指标综述 . 电子科技大学学报, 2012, 41(2): 163-175. doi: 10.3969/j.issn.1001-0548.2012.02.001
[17]	刘旭, 许宗泽. 应用Khatri-Rao积分解的DS-CDMA盲多用户检测 . 电子科技大学学报, 2011, 40(1): 20-25. doi: 10.3969/j.issn.1001-0548.2011.01.004
[18]	张靖, 何发镁, 邱云. 个性化推荐系统描述文件攻击检测方法 . 电子科技大学学报, 2011, 40(2): 250-254. doi: 10.3969/j.issn.1001-0548.2011.02.019
[19]	刁新军, 黄廷祝, 曾翎, 冉瑞生. 五对角矩阵的分解及其逆元素的快速算法 . 电子科技大学学报, 2005, 34(6): 850-853.
[20]	张选芳. Internet网络安全的信息过滤模型分析 . 电子科技大学学报, 2004, 33(3): 270-272.

点击查看大图

图(5) / 表(2)

计量

文章访问数: 4680
HTML全文浏览量: 1301
PDF下载量: 105
被引次数: 0

全文HTML

虽然协同过滤推荐系统已经在学术界广泛应用，并在Amazon和Ebay等公司得到应用，但大多数技术都有一些固有的弱点。众所周知的一个问题是冷启动和数据稀疏性。商用推荐系统可用评分的密度一般小于1%^[1]，传统的推荐算法不能提供很好的推荐性能，尤其是纯粹挖掘用户物品评分矩阵的协同过滤推荐，无法处理只对少量物品进行评分的用户。

现实生活中，由于稳定而持久的社会关系约束，人们更愿意与朋友分享个人意见，而且更信任朋友的建议，因此在购买产品或消费服务(如电影、音乐、书籍、事物等)之前，常常向社交网络中的朋友寻求建议，并且其爱好很容易受朋友的影响。因此，近年来社会网络的快速发展，为提高推荐性能、解决用户端稀疏性及冷启动问题提供了契机。在社会网络中，用户可以创建并分享内容、标注内容、评分评论、加入社区、与朋友联接，用户成了这些社会网络的核心。有了社会网络，可以在不侵犯隐私的情况下轻易取得其中的朋友信任关系，并可以把社会网络中的兴趣网络(Twitter)或熟人关系网(例如Facebook、LinkedIn等)作为用户偏好的来源。例如，由于社交兴趣，用户可能阅读某一特定主题的新闻；由于社会信任，用户可能喜欢她好友在Facebook上推荐的电影。

3. 用自编码器初始化

在大部分的矩阵分解中，用户和物品的隐特征因子都是用随机值进行初始化的。这些算法收敛到局部最优将依赖于初始点。由于相似的用户(例如对物品评分值相似的用户)具有相似的用户特征向量，因此，如果特征向量的初始值更准确地描述了用户之间或物品之间的相似性，则将可以训练出更优化的模型^[11]。因此，本文通过从原始评价矩阵中提取特征来获得初始值，并采用自动编码器来学习用户和项目的隐特征的初始值(${\mathit{\boldsymbol{P}}}$和${\mathit{\boldsymbol{Q}}}$)。因为矩阵分解是非凸优化问题，所以不能保证可以得到最优隐特征矩阵${\mathit{\boldsymbol{P}}}$和${\mathit{\boldsymbol{Q}}}$^[12]，而且根据${\mathit{\boldsymbol{P}}}$和${\mathit{\boldsymbol{Q}}}$的不同初值，会收敛到不同的局部最优解，但如果初始值设置适当，结果可以接近最优。

压缩自动编码器CAE(contractive autoencoder)^[13]是生成特征表示的一种有效方法。CAE对小的扰动具有鲁棒性，所以使用CAE作为预训练算法以得到用户和物品隐特征值的初始值。

4. 信任群组的检测

目前，群组检测算法大多基于网络节点之间的可达性来识别。信任群组nt-clique(n trust clique)检测算法基于n-clique^[14]，在社交网络中使用用户之间的信任关系来检测群组，且该算法可以检测重叠的群组。首先重新定义文献[14]中的n-clique概念，然后再定义社会信任网络nt-clique，最后详细论述nt-clique群组检测算法。

4.1. 信任群组的定义

1) n-clique的定义

给定一个网络$G$，n-clique是一个最大子图，其中每对节点之间的最大距离不超过$n$，这里的距离是在原始网络中定义的，即：

${\rm{dist}}({v_i},{v_j}) \leqslant n$ $\forall {v_i},{v_j} \in G$

2) 质量函数的定义

由质量函数来定义划分好坏，得分高的划分就是好的划分。然而，一个划分是否优于另一个划分，取决于信任群组的具体定义和所采用的质量函数。对于图的任何划分$P$，质量函数定义为：

$$Q(P) = \mathop \sum \limits_{{C_i} \in P} q({C_i})$$

式中，${C_i}$是划分$P$的第$i$个聚类；$q({C_i})$是划分中聚类${C_i}$的质量函数。这里，划分的质量是由各个聚类质量的和来定义，所以质量函数$Q$是加性的。聚类的质量函数$q({C_i})$定义为：

$$q({C_i}) = \frac{1}{{|P|}}\frac{{\sum\limits_{u,v \in {C_i}} {{T_{u,v}}} }}{{\sum\limits_{u \in {C_i},{\rm{ }}v \notin {C_i}} {{T_{u,v}}} }}$$

式中，$\left| P \right|$是划分$P$中聚类的个数。$Q(P)$的最大值意味着同一个聚类中的用户之间的信任度要大于此聚类中的用户与其他聚类中用户之间的信任度。同一个聚类中的用户的偏好更接近，而不同聚类中用户之间偏好差异更大。

3) nt-clique定义

一个nt-clique是一个信任网络${G_T}$的子图，其中每一对顶点之间的最大距离不大于$n$。${G_T}$中的聚类应该保证全局质量函数$Q(P)$取得最大值。

4.2. 信任群组检测算法

这是一个NP问题，因此，使用最优化方法来近似。该算法以文献[15]为基础，并结合了贪婪算法^[16]和模拟退火算法。贪婪算法总是在每个步骤中做出最好的选择，但这并不能保证算法达到全局最优解，所以再结合模拟退火算法来实现全局优化的概率化过程。通过将这两种方法结合起来，希望得到一种快速、概率的全局最优信任群组检测算法。

nt-clique算法的步骤如下：

1) 检测算法总共运行$l$轮迭代，在每一轮迭代中产生划分$P$。最开始划分$P$被初始化为用户集合$U$，也就是每一个用户都构成一个单独的聚类，把它标记为${C_i}$(clique群)，其中$i = 1,2, \cdots ,{n_c}$，${n_c}$是类的数量。$J$是${C_i}$连接的顶点的标号集合。首先令$i = 1$。

2) 假设合并类${C_i}$和顶点${v_j} \in J$，计算相应质量函数的变化量$\Delta Q$。当$j$扫描完${C_i}$的所有邻接顶点，找到类${C_t}$具有最大的质量函数变化量$\Delta {Q_{{\rm{max}}}}$。

3) 如果$\Delta {Q_{{\rm{max}}}} > 0$，接受它并且置${C_j} = t$。否则以一定概率接受它(类似模拟退火，这里把接受概率设置成$0.4$)。

4) 如果$i + 1 < {n_c}$，则$i = i + 1$并且回到步骤2)；否则回到步骤5)。

5) 如果迭代次数为$l$，则运行了$l$轮得到了$l$个不同的划分结果。最后选择具有最大质量函数值的划分作为最终的结果。如果迭代次数小于$l$，作如下操作：当$i$遍历完所有的信任群组后，得到一个新的划分$P$，然后用相同的标记来合并群组；重置标记并更新信任群组的数量${n_c}$(通常${n_c}$逐渐减小)；迭代数量增加$1$；回到步骤2)。

6. 结束语

本文首先分析了基于社会信任信息的协同过滤研究现状，并重点论述了矩阵分解算法中集成社会信任信息的方法。然后，提出了集成社会信任关系的矩阵分解协同过滤算法。在该算法中，采用了压缩自动编码器来提取用户和物品的初始化隐特征向量，并且提出一个在信任网络中检测信任群组的算法。在实际数据集上的实验表明，本文的模型取得了比其他相关模型更好的覆盖率和推荐精度，从而验证了本文模型确实能够有效地缓解冷启动、提高准确性。

参考文献 (21)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

耦合社会信任信息的矩阵分解协同过滤模型

doi: 10.3969/j.issn.1001-0548.2019.03.018

作者简介:
蒋伟(1976-), 男, 博士生, 主要从事数据挖掘、机器学习等方面的研究.E-mail:wayne_jiang@sina.com

A Matrix Factorization Collaborative Filtering Model with Trust Information

计量

耦合社会信任信息的矩阵分解协同过滤模型

doi: 10.3969/j.issn.1001-0548.2019.03.018

电子科技大学信息与软件工程学院成都 610054

作者简介:
蒋伟(1976-), 男, 博士生, 主要从事数据挖掘、机器学习等方面的研究.E-mail:wayne_jiang@sina.com

English Abstract