三维有偏权值张量分解在授课推荐上的应用研究

姚敦红; 李石君; 胡亚慧

doi:10.3969/j.issn.1001-0548.2017.05.018

三维有偏权值张量分解在授课推荐上的应用研究

doi: 10.3969/j.issn.1001-0548.2017.05.018

1.
怀化学院计算机科学与工程学院湖南怀化 418000
2.
武汉大学计算机学院武汉 430072
3.
空军预警学院四系武汉 430010

基金项目:

国家自然科学基金 61272109

湖南省教育厅科学研究项目 15C1086

详细信息

作者简介:
姚敦红(1972-), 男, 副教授, 主要从事数据挖掘、机器学习方面的研究

中图分类号: TP391

A Three-Dimensional Partial Weight Tensor Model for Teaching Recommendation

1.
College of Computer Science & Engineering, Huaihua University Huaihua Hunan 418000
2.
School of Computer, Wuhan University Wuhan 430072
3.
The Fourth Department of Air Force Early Warning Academy Wuhan 430010

摘要: 为解决现今学校授课安排无推荐依据这一实际问题，首先给出了一系列形式化方法用于规约教师的专业基础、课程难度及教学评价；定义了一种加权函数计算出每组专业基础、课程难度和教学评价的综合有偏权值；构建了一种基于“教师-课程-评价-权值”四元关系的三维有偏权值张量模型，张量元素使用综合有偏权值。在此基础上，设计了一种基于Tucker分解的算法，对张量进行高阶奇异值分解（HOSVD）得到降维后的近似张量，按课程分类实现了Top_N授课推荐。实验结果表明，当迭代阈值达到一个合理值时，该方法能实现精准授课推荐，可作为一种新的智能化授课推荐方法应用于各类学校。
- 数据规约 /
- 授课推荐 /
- 张量分解 /
- 三维有偏权值张量
Abstract: To address the problem that the teaching arrangements are not on the basis of recommendation in current school, a series of formalized methods are used to specify teachers' specialty foundation, course difficulty, and teaching evaluation first. Then, a kind of weighted function is defined to calculate the comprehensive partial weight for each group of teachers' professional foundation, course difficulty, and teaching evaluation. Next, the three-dimensional tensor model with partial weight is built on the 4-tuples relation of teacher-courseevaluation-weight and the comprehensive weight is endowed to the tensor elements. Finally, on the basis of above, a new kind of decomposition algorithm based on Tucker Decomposition is designed to obtain the approximate tensor of dimensionality reduction with the higher-order singular value decomposition (HOSVD), achieving the Top-N recommendation of teaching arrangements. Experiment results show that our proposed method can realize precise teaching arrangements recommendations when the iterative threshold value reaches a reasonable value, which can be used as a new intelligent recommendation method applied to the teaching arrangements in all kinds of schools.
- data reduction /
- teaching recommendation /
- tensor decomposition /
- three-dimensional partial weighted tensor

图 1 事实星座模式结构图

下载: 全尺寸图片幻灯片

图 2 稀疏有偏权值张量X非零元素分布图

下载: 全尺寸图片幻灯片

图 3 不同比例训练集在不同ε下的MAE对比图

下载: 全尺寸图片幻灯片

图 4 不同比例训练集在不同N下的P@N对比图

下载: 全尺寸图片幻灯片

表 1 教师信息维表(非全日制)

Teacher ID	Dc	Dw	Ptc	Rm(1)	Sf(1)	Rm(2)	Sf(2)	Pbd
CS001	0.3	0.4	0.4	0.7	0.1	1.0	0.3	0.453 5
CS002	0.3	0.4	0.2	1.0	0.4	1.0	0.4	0.700 5
CS003	0.3	0.4	0.2	1.0	0.1	1.0	0.4	0.550 5
CS004	0.3	1.0	0.2	0.7	0.1	0.7	0.3	0.588 5
CS005	0.4	1.0	0.3	1.0	0.4	1.0	0.4	0.980 5

下载: 导出CSV

表 2 Pbd变化情况

Teacher ID	Pbd (r=0.5, Dw=0.2)	Pbd (r=0.7, Dw=0.4)	ΔPbd	Rate/%
CS001	0.376 3	0.453 5	0.077 2	20.52
CS002	0.654 0	0.700 5	0.046 5	7.11
CS003	0.504 0	0.550 5	0.046 5	9.23
CS004	0.548 5	0.588 5	0.04	7.29
CS005	0.994 0	0.980 5	-0.013 5	-1.36

下载: 导出CSV

表 3 w值对课程难度的影响

Course ID	$ \bar{T} $	$ \bar{S} $	Qr (w=0.4)	Cdc (w=0.4)	Qr (w=0.6)	Cdc (w=0.6)	ΔCdc
60188	0.89	0.63	0.73	0.79	0.79	0.89	0.10
60254	0.81	0.65	0.71	0.75	0.74	0.81	0.06
60262	0.90	0.69	0.78	0.87	0.82	0.95	0.08
60309	0.70	0.55	0.61	0.55	0.64	0.61	0.05
60318	0.80	0.58	0.67	0.66	0.71	0.75	0.09

下载: 导出CSV

表 4 学生评分

Teacher ID	Course ID	Numbers	Student-Score	Eva
CS008	60 058	93	90.97	0.66
CS007	60 064	22	93.50	0.87
CS035	60 095	289	93.40	0.86
CS021	60 185	458	91.41	0.70
CS003	60 188	679	93.14	0.84

下载: 导出CSV

表 5 实验数据集(E)

Teacher ID	Pbd	Course ID	Cdc	Eva	$ {{w}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $
CS001	0.453 5	60 308	0.57	0.81	0.690 7
CS002	0.700 5	60 384	0.54	0.83	0.746 1
CS003	0.650 5	60 337	0.11	0.87	0.674 1
CS003	0.650 5	60 339	0.55	0.85	0.7501
CS004	0.550 5	60 337	0.11	0.85	0.642 1
CS004	0.550 5	60 339	0.75	0.88	0.788 1

下载: 导出CSV

表 6 不同r、Dw值下的Top_5推荐对比(Course ID=60 264)

E₁		E₂
Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $	Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $
CS022	0.657 0	CS011	0.646 0
CS009	0.644 4	CS009	0.634 1
CS012	0.637 9	CS022	0.629 1
CS011	0.637 9	CS012	0.614 0
CS035	0.634 3	CS035	0.606 4

下载: 导出CSV

表 7 不同w值下的Top_5推荐对比(Course ID=60 264)

E₃		E₄
Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $	Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $
CS012	0.465 1	CS012	0.542 0
CS022	0.459 3	CS022	0.536 2
CS035	0.456 6	CS035	0.533 5
CS004	0.453 9	CS004	0.530 7
CS011	0.448 2	CS011	0.525 1

下载: 导出CSV

表 8 不同偏重系数下的Top_5推荐对比(Course ID=60 264)

E₁		E₅		E
Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $	Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $	Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $
CS022	0.657 0	CS012	0.538 9	CS012	0.736 0
CS009	0.644 4	CS022	0.533 1	CS004	0.717 5
CS012	0.637 9	CS035	0.530 4	CS015	0.709 2
CS011	0.637 9	CS004	0.527 6	CS035	0.705 7
CS035	0.634 3	CS011	0.522 0	CS022	0.693 9

下载: 导出CSV

表 9 任意比重系数下的Top_5推荐对比(Course ID=60 264)

E₆		E₇		E₈
Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $	Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $	Teacher ID	$ {{\hat{w}}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $
CS012	0.588 2	CS022	0.639 1	CS004	0.672 9
CS004	0.587 3	CS012	0.634 9	CS012	0.666 1
CS035	0.582 8	CS035	0.625 0	CS035	0.664 7
CS022	0.578 3	CS004	0.610 9	CS022	0.656 6
CS011	0.566 1	CS011	0.603 5	CS015	0.639 5

下载: 导出CSV

[1]	GOLDBERG D, NICHOLS D, OKI B M, et al. Using collaborative filtering to weave an information tapestry[J]. Communications of the ACM, 1992, 35(12):61-70. doi: 10.1145/138859.138867
[2]	李聪, 梁昌勇, 马丽.基于领域最近邻的协同过滤推荐算法[J].计算机研究与发展, 2008, 45(9):1532-1538. http://youxian.cnki.com.cn/yxdetail.aspx?filename=JSGG20170627004&dbname=CAPJ2015 LI Cong, LIANG Chang-yong, MA Li. A collaborative filtering recommendation algorithm based on domain nearest neighbor[J]. Journal of Computer Research and Development, 2008, 45(9):1532-1538. http://youxian.cnki.com.cn/yxdetail.aspx?filename=JSGG20170627004&dbname=CAPJ2015
[3]	于江德, 李学钰, 樊孝忠, 等.最大熵模型的事件分类[J].电子科技大学学报, 2010, 39(4):612-616. http://www.cnki.com.cn/Article/CJFDTOTAL-DKDX201004031.htm YU Jiang-de, LI Xue-yu, FAN Xiao-zhong, et al. Event classification based on maximum entropy model[J]. Journal of University of Electronic Science and Technology of China, 2010, 39(4):612-616. http://www.cnki.com.cn/Article/CJFDTOTAL-DKDX201004031.htm
[4]	叶茂, 陈勇.基于分布模型的层次聚类算法[J].电子科技大学学报, 2004, 33(2):171-174. http://youxian.cnki.com.cn/yxdetail.aspx?filename=JSYJ20170614035&dbname=CAPJ2015 YE Mao, CHENG Yong. Hierarchical clustering algorithm based on distribution model[J]. Journal of University of Electronic Science and Technology of China, 2004, 33(2):171-174. http://youxian.cnki.com.cn/yxdetail.aspx?filename=JSYJ20170614035&dbname=CAPJ2015
[5]	廖志芳, 李玲, 刘丽敏, 等.三部图张量分解标签推荐算法[J].计算机学报, 2012, 35(12):2625-2632. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJX201212017.htm LIAO Zhi-fang, LI Ling, LIU Li-min, et al. A tripartite decomposition of tensor for social tagging[J]. Chinese Journal of Computers, 2012, 35(12):2625-2632. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJX201212017.htm
[6]	邹本友, 李翠平, 谭力文, 等.基于用户信任和张量分解的社会网络推荐[J].软件学报, 2014, 25(12):2852-2864. http://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201412010.htm ZOU Ben-you, LI Cui-ping, TAN Li-wen, et al. Social recommendations based on user trust and tensor factorization[J]. Journal of Software, 2014, 25(12):2852-2864. http://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201412010.htm
[7]	廖志芳, 王超群, 李小庆, 等.张量分解的标签推荐及新用户标签推荐算法[J].小型微型计算机系统, 2013, 34(11):2472-2476. doi: 10.3969/j.issn.1000-1220.2013.11.011 LIAO Zhi-fang, WANG Chao-qun, LI Xiao-qing, et al. Tag recommendation and new user tag recommendation algorithms based on tensor decomposition[J]. Journal of Chinese Computer Systems, 2013, 34(11):2472-2476. doi: 10.3969/j.issn.1000-1220.2013.11.011
[8]	孙玲芳, 冯遵倡.基于特征加权张量分解的标签推荐算法研究[J].江苏科技大学学报:自然科学版, 2015, 29(6):574-579. http://www.cnki.com.cn/Article/CJFDTOTAL-HDCB201506012.htm SUN Ling-fang, FENG Zun-chang. Tag recommendation algorithm based on feature weighting and tensor decomposition[J]. Journal of Jiangsu University of Science and Technology (Natural Science Edition), 2015, 29(6):574-579. http://www.cnki.com.cn/Article/CJFDTOTAL-HDCB201506012.htm
[9]	孙玲芳, 李烁朋.基于K-means聚类与张量分解的社会化标签推荐系统研究[J].江苏科技大学学报:自然科学版, 2012, 26(6):597-601. http://www.cnki.com.cn/Article/CJFDTOTAL-HDCB201206017.htm SUN Ling-fang, LI Shuo-peng. Social tagging recommendation system based on K-means cluster and tensor decomposition[J]. Journal of Jiangsu University of Science and Technology (Natural Science Edition), 2012, 26(6):597-601. http://www.cnki.com.cn/Article/CJFDTOTAL-HDCB201206017.htm
[10]	张昌利, 龚建国, 闫茂德.基于复杂网络的社会化标签语义相似度分析[J].电子科技大学学报, 2012, 41(5):642-648. http://www.cnki.com.cn/Article/CJFDTOTAL-DKDX201205002.htm ZHANG Chang-li, GONG Jian-guo, YAN Mao-de. Complex network based semantic similarity measure for social tagging systems[J]. Journal of University of Electronic Science and Technology of China, 2012, 41(5):642-648. http://www.cnki.com.cn/Article/CJFDTOTAL-DKDX201205002.htm
[11]	SYMEONIDIS P, NANOPOULOS A, MANOLOPOULOS Y. A unified framework for providing recommendations in social tagging systems based on ternary semantic analysis[J]. IEEE Transactions on Knowledge & Data Engineering, 2010, 22(2):179-192. http://dl.acm.org/citation.cfm?id=1687049
[12]	SYMEONIDIS P, NANOPOULOS A, MANOLOPOULOS Y. Tag recommendations based on tensor dimensionality reduction[C]//Proceedings of the 2008 ACM Conference on Recommender Systems. New York:ACM, 2008:43-50. http://dl.acm.org/citation.cfm?id=1454017
[13]	ADOMAVICIUS G, TUZHILIN A. Toward the next generation of recommender systems:a survey of the state-of-the-art and possible extensions[J]. IEEE Transactions on Knowledge & Data Engineering, 2005, 17(6):734-749. http://ieeexplore.ieee.org/document/1423975/
[14]	BADER B W, KOLDA T G. Tensor decompositions and applications[J]. Siam Review, 2009, 51(3):455-500. doi: 10.1137/07070111X
[15]	TUCKER L R. Some mathematical notes on three-mode factor analysis[J]. Psychometrika, 1966, 31(3):279-311. doi: 10.1007/BF02289464
[16]	余刚, 王知衍, 邵璐, 等.基于奇异值分解的个性化评论推荐[J].电子科技大学学报, 2015, 44(4):605-610. http://www.cnki.com.cn/Article/CJFDTOTAL-DKDX201504022.htm YU Gang, WANG Zhi-yan, SHAO Lu, et al. Singular value decomposition-based personalized review recommendation[J]. Journal of University of Electronic Science and Technology of China, 2015, 44(4):605-610. http://www.cnki.com.cn/Article/CJFDTOTAL-DKDX201504022.htm
[17]	朱郁筱, 吕琳媛.推荐系统评价指标综述[J].电子科技大学学报, 2012, 41(2):163-175. http://youxian.cnki.com.cn/yxdetail.aspx?filename=RJXB20171009007&dbname=CAPJ2015 ZHU Yu-xiao, LÜ Lin-yuan. Evaluation metrics for recommender systems[J]. Journal of University of Electronic Science and Technology of China, 2012, 41(2):163-175. http://youxian.cnki.com.cn/yxdetail.aspx?filename=RJXB20171009007&dbname=CAPJ2015
[18]	BREESE J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering[C]//Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence. Madison, USA:ACM, 1998:43-52.
[19]	WANG L, MENG X, ZHANG Y, et al. New approaches to mood-based hybrid collaborative filtering[C]//The Workshop on Context-Aware Movie Recommendation. Barcelona:ACM, 2010:28-33.

[1]	王永, 冉珣, 尹恩民, 王利. 满足差分隐私保护的矩阵分解推荐算法 . 电子科技大学学报, 2021, 50(3): 405-413. doi: 10.12178/1001-0548.2020359
[2]	吴琳拥, 毛谨, 白渭雄. 基于奇异值分解的雷达微小目标检测方法 . 电子科技大学学报, 2019, 48(3): 326-330. doi: 10.3969/j.issn.1001-0548.2019.03.002
[3]	张双狮, 雷朝军, 刘迎辉, 牛新建, 魏彦玉. 瞬态电磁场三维时域有限差分模拟研究 . 电子科技大学学报, 2019, 48(1): 13-21. doi: 10.3969/j.issn.1001-0548.2019.01.003
[4]	郭强, 岳强, 李仁德, 刘建国. 基于四阶奇异值分解的推荐算法研究 . 电子科技大学学报, 2019, 48(4): 586-594. doi: 10.3969/j.issn.1001-0548.2019.04.017
[5]	程东升, 谭旭, 许志良, 陈宝文, 张运生. 结合四维超混沌系统和位分解的图像加密算法研究 . 电子科技大学学报, 2018, 47(6): 906-912. doi: 10.3969/j.issn.1001-0548.2018.06.017
[6]	骆忠强, 朱立东. 基于广义协方差张量分解的欠定盲辨识算法 . 电子科技大学学报, 2016, 45(6): 893-897. doi: 10.3969/j.issn.1001-0548.2016.06.003
[7]	余刚, 王知衍, 邵璐, 胡舒悦, 蔡毅. 基于奇异值分解的个性化评论推荐 . 电子科技大学学报, 2015, 44(4): 605-610. doi: 10.3969/j.issn.1001-0548.2015.04.022
[8]	周俊, 彭凯, 刘大刚. 基于高层数据模型库的三维粒子模拟程序研究 . 电子科技大学学报, 2014, 43(4): 530-536. doi: 10.3969/j.issn.1001-0548.2014.04.010
[9]	郭兴明, 袁志会, 丁晓蓉. 经验模式分解及关联维数在心音信号分类识别中的应用 . 电子科技大学学报, 2013, 42(6): 955-960. doi: 10.3969/j.issn.1001-0548.2013.06.028
[10]	李楠, 程锦房, 钱富. 加权信号张量子空间拟合算法 . 电子科技大学学报, 2013, 42(4): 546-548,591. doi: 10.3969/j.issn.1001-0548.2013.04.003
[11]	胡权, 黄桃, 杨中海, 李斌, 李建清. 电子光学系统的三维有限元局部对称计算 . 电子科技大学学报, 2012, 41(3): 408-411. doi: 10.3969/j.issn.1001-0548.2012.03.017
[12]	雷刚, 蒲亦菲, 张卫华, 周激流. 张量典型相关分析及其在人脸识别中的应用 . 电子科技大学学报, 2012, 41(3): 435-440. doi: 10.3969/j.issn.1001-0548.2012.03.022
[13]	吴志红, 刘日晨, 甘霖. 基于三维校正的SHGC物体三维结构提取方法 . 电子科技大学学报, 2011, 40(3): 446-450. doi: 10.3969/j.issn.1001-0548.2011.03.023
[14]	刘昶, 周激流, 何坤, 张健. 正交非负CP分解的图像表示和识别 . 电子科技大学学报, 2011, 40(6): 905-910. doi: 10.3969/j.issn.1001-0548.2011.06.019
[15]	赵学智, 叶邦彦. 单向收缩QR算法在奇异值分解中的收敛特性 . 电子科技大学学报, 2010, 39(5): 762-768. doi: 10.3969/j.issn.1001-0548.2010.05.024
[16]	房春兰, 陈雷霆, 张宇. 肝脏CT图像三维分割研究 . 电子科技大学学报, 2009, 38(2): 278-281. doi: 10.3969/j.issn.1001-0548.2009.02.29
[17]	蒋秀凤, 蒲晓蓉, 章毅. 基于MPEG-4的三维人脸动画 . 电子科技大学学报, 2007, 36(3): 569-572.
[18]	余文革, 钟先信, 巫正中, 李晓毅. 三维层叠微带天线的FDTD模拟 . 电子科技大学学报, 2004, 33(3): 266-269.
[19]	杜平安. 内燃机活塞三维热分析 . 电子科技大学学报, 1999, 28(2): 141-143.
[20]	周先敏, 陈隽永, 王光泰. 多分辨数据融合中信号的分解与重构 . 电子科技大学学报, 1998, 27(3): 231-235.

点击查看大图

图(4) / 表(9)

计量

文章访问数: 3664
HTML全文浏览量: 1165
PDF下载量: 95
被引次数: 0

全文HTML

推荐系统是对用户历史行为数据进行分析、预测并主动为用户给出相关推荐的系统。自文献[1]推出第一个推荐系统以来，涌现出了大量的推荐系统，特别是在电子商务、社交网络、搜索引擎等方面，如亚马逊基于兴趣的广告推荐、NEC研究院的CiteSeer搜索引擎、IBM的Websphere电商平台、阿里云推荐、京东推广、百度推广、博客挖掘、社交推荐等。这些推荐应用的实现一般是根据用户行为数据建立起的“用户-项目”二元关系挖掘分析而得。随着社会化标签的出现，又出现了“用户-产品-标签”的三元关系，使个性化推荐更趋向精准。

目前，推荐系统常用的技术有基于欧氏距离、Pearson相关系数、余弦相似性和Tanomi等最近邻启发式协同过滤推荐算法^[2]；有基于上下文感知模型、潜在因子模型、贝叶斯模型、信任感知模型、聚类模型、最大熵模型^[3]等协同过滤推荐算法；有以决策树、神经网络、向量、TF-IDF、自适应过滤、阈值设定等基于内容的推荐算法；还有其他如关联规则推荐、效用推荐、知识推理等算法，以及使用标签的图、标签的FolkRank、层叠、加权、变换、标签层次聚类^[4]和张量分解的组合推荐算法等。

应用张量分解算法进行个性化推荐，在近年来也有了一些研究，文献[5-7]采用了融合某种关系或附加某种标签信息的张量分解推荐算法。文献[8-10]也有采用加权张量模型，即通过提取标注关键特征，再得出一个权值作为张量元素。

在现有研究中，还未曾涉及学校授课推荐。一直以来，学校授课安排没有一种好的推荐依据，很多是随教师意愿而为，或是强加给教师，这些方式未能使教学达到最优效果，难以提高教学质量。所以，在学校多年大量的教学数据中进行分析挖掘，找到一种实现精准授课推荐的方法，具有一定的现实意义和实用价值。

本文借鉴文献[11]的四元元组张量分解算法，优化文献[12]中提出的张量稀疏问题，设计一种基于Tucker张量分解的算法。并利用历史教学数据集进行授课推荐实验，验证该方法在授课推荐上的准确性。

1. 基本概念

借鉴文献[13]对推荐系统的定义，可将授课推荐系统(teaching recommendation system)定义为：设有教师集合teacher={t₁, t₂, …, t_n}、课程集合course={c₁, c₂, …, c_n}和评价集合evaluation={e₁, e₂, …, e_n}，推荐系统目标就是使得衡量教师t、课程c与评价e之间的相关性效用函数f(t, c, e)最大，即$ \forall $t∈teacher，f(t)=max{f(t, c, e)}。

张量是高维数组的总称^[14]，一维张量是向量，二维张量是矩阵，三维或以上的张量为高阶张量^[6]。张量分解即HOSVD，是对高维数据进行特征提取，或是一种低秩逼近。常见的张量分解模型有：CP模型、Tucker模型^[15]。Tucker模型将N维张量分解成N个维度上的低秩特征矩阵与一个核心张量的乘积，其本质是一种高阶主成分分析。如三维张量X的Tucker分解为：

$$ \begin{matrix} X\approx \hat{X}=C{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}}= \\ \mathop {\mathop \sum \limits^P }\limits_{p = 1} {\mkern 1mu} \mathop {\mathop \sum \limits^Q }\limits_{q = 1} {\mkern 1mu} \mathop {\mathop \sum \limits^R }\limits_{r = 1} {\mkern 1mu} {c_{pqr}}{v_p}^\circ {v_q}^\circ {v_r} \ \end{matrix} $$

(1)

式中，$ {{\mathit{\boldsymbol{V}}}^{(i)}}\in {{\mathbb{R}}^{I\times P}} $，$ {{\mathit{\boldsymbol{V}}}^{(j)}}\in {{\mathbb{R}}^{J\times Q}} $，$ {{\mathit{\boldsymbol{V}}}^{(k)}}\in {{\mathbb{R}}^{J\times Q}} $代表3个维度主成分且相互正交的低秩特征矩阵；C∈ ${{\mathbb{R}}^{P\times Q\times R}} $是核心张量；运算符$ o $表示向量的外积^[16]。

如果P，Q，R对应小于I，J，K，则又称C为张量X的压缩张量(规模远远小于原张量的相似张量)，这在大数据集稀疏张量的应用上效果非常显著。由式(1) 可知，当$ {{\mathit{\boldsymbol{V}}}^{(i)}} $、$ {{\mathit{\boldsymbol{V}}}^{(j)}} $和$ {{\mathit{\boldsymbol{V}}}^{(k)}} $确定后，核心张量C就可近似由原张量X与各维特征矩阵的转置运算得到：

$$ C=X{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}^{^{\rm{T}}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}^{^{\rm{T}}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}}^{^{\rm{T}}} $$

(2)

三维张量通过Tucker分解后得到的相似张量，可采用最小化函数$ \mathop {\min }\limits_{\hat X} {\mkern 1mu} \left\| {\left. {X - \hat X} \right\|} \right. $计算其相似程度。为便于计算，对最小化函数平方得到：

$$ \begin{matrix} {{\left\| \left. X-C{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}} \right\| \right.}^{2}}= \\ {{\left\| \left. X \right\| \right.}^{2}}-2\left\langle X, C{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}} \right\rangle + \\ {{\left\| \left. C{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}} \right\| \right.}^{2}}= \\ {{\left\| \left. X \right\| \right.}^{2}}-2\left\langle X{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}}, C \right\rangle +{{\left\| \left. C \right\| \right.}^{2}}= \\ {{\left\| \left. X \right\| \right.}^{2}}-2\left\langle C, C \right\rangle +{{\left\| \left. C \right\| \right.}^{2}}={{\left\| \left. X \right\| \right.}^{2}}-{{\left\| \left. C \right\| \right.}^{2}}= \\ {{\left\| \left. X \right\| \right.}^{2}}-{{\left\| \left. X{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}^{^{\rm{T}}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}^{^{\rm{T}}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}}^{^{\rm{T}}} \right\| \right.}^{2}} \ \end{matrix} $$

(3)

根据式(3) 可知，求$ \mathop {\min }\limits_{\hat X} {\mkern 1mu} \left\| {\left. {X - \hat X} \right\|} \right. $的最优解可转化为$ {{\left\| \left. X{{\times }_{i}}{{\mathit{\boldsymbol{V}}}^{(i)}}^{^{\rm{T}}}{{\times }_{j}}{{\mathit{\boldsymbol{V}}}^{(j)}}^{^{\rm{T}}}{{\times }_{k}}{{\mathit{\boldsymbol{V}}}^{(k)}}^{^{\rm{T}}} \right\| \right.}^{2}} $最大化问题的最优解，于是分别对$ {{\mathit{\boldsymbol{V}}}^{(i)}}^{^{\rm{T}}} $，$ {{\mathit{\boldsymbol{V}}}^{(j)}}^{^{\rm{T}}} $和$ {{\mathit{\boldsymbol{V}}}^{(k)}}^{^{\rm{T}}} $做奇异值分解降维处理后，再组合可得到规模比原张量小得多的相似张量$ \hat{X} $，这有利于加快推荐的速度、提高推荐的精度。

3. 模型及算法设计

3.1. 三维有偏仅值张量模型

为构建三维有偏权值张量模型，数据集按“教师(T)-课程(C)-评分(E)-权值(W)”四元关系$ ({{t}_{i}}, {{c}_{j}}, {{e}_{k}}, {{w}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}}) $构成维度分别为T、C、E的三维张量 $X\in {{R}^{{{I}_{t}}\times {{I}_{c}}\times {{I}_{e}}}} $，其元素对应下标是$ ({{t}_{i}}, {{c}_{j}}, {{e}_{k}}) $，通过对应的元素值计算得到综合有偏权值：

$$ {{w}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}}=\left\{ \begin{align} &{{\rho }_{1}}\text{Pb}{{\text{d}}_{i}}+{{\rho }_{2}}\text{Cd}{{c}_{j}}+{{\rho }_{3}}\text{Ev}{{\text{a}}_{k}}\text{ Ev}{{\text{a}}_{k}}\ne 0\text{ }\sum\limits_{m=1}^{3}{{{\rho }_{m}}}=1 \\ &0\ \ \ \ \ \ \!\!\!\!\text{Εva}{_{k}}=0 \ \end{align} \right. $$

(11)

式(11) 表示如果存在某专业基础度为Pbd_i的教师(t_i)讲授难度系数为Cdc_j的课程(c_j)且获得了评分(e_k)Eva_k，则张量对应下标(t_i, c_j, e_k)的元素值取加权计算得到$ {{w}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $，否则对应元素取0。其中$ {{\rho }_{1}} $，$ {{\rho }_{2}} $和$ {{\rho }_{3}} $分别为专业基础度、课程难度和教学评价的比重系数，可根据授课推荐偏重面不同而设置不同值，得到不同偏重性的推荐结果。这体现出授课推荐综合考虑教师专业基础与课程难度及评分值因素，是一种综合性的和有偏向性的权值。

在实际应用中，课程集与教师集均是大数集，但每位教师所教授的课程仅占课程集中几个元素。这样势必会造成三维有偏权值张量X中绝大部分元素为0，即构建的张量X是非常稀疏的。

3.2. 算法设计

首先按前面的定义，将原始数据集中的数据进行规约、变换和计算，得出Pbd、Cdc与Eva；然后按式(11) 计算出综合有偏权值$ {{w}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $，以“教师-课程-评分-权值”方式构建加权四元元组；再以教师、课程和评分作为维度，以综合有偏权值$ {{w}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $作为元素值，建立一个稀疏的三维有偏权值张量模型；最后，基于Tucker张量分解方法，采用交替最小二乘法获得降维后的近似张量，根据近似张量元素值的大小，按课程分类产生Top-N推荐列表，算法伪代码如下：

输入：迭代收敛阈值ε和最大迭代次数max-iteration;

输出：核心张量C和特征矩阵$ {{\mathit{\boldsymbol{V}}}^{(1)}} $，$ {{\mathit{\boldsymbol{V}}}^{(2)}} $和$ {{\mathit{\boldsymbol{V}}}^{(3)}} $，以及按课程分类的不同Top_N的推荐结果列表;

Begin

数据预处理，按式(11) 计算$ {{w}_{{{t}_{i}}, {{c}_{j}}, {{e}_{k}}}} $;

按教师(T)-课程(C)-评分(E)-权值(W)构建三维有偏权值张量X;

初始化$ {{\mathit{\boldsymbol{V}}}^{(1)}} $，$ {{\mathit{\boldsymbol{V}}}^{(2)}} $和$ {{\mathit{\boldsymbol{V}}}^{(3)}} $;

初始化$ {{C}_{0}}=X{{\times }_{1}}{{\mathit{\boldsymbol{V}}}^{(1)}}^{^{\rm{T}}}{{\times }_{2}}{{\mathit{\boldsymbol{V}}}^{(2)}}^{^{\rm{T}}}{{\times }_{3}}{{\mathit{\boldsymbol{V}}}^{(3)}}^{^{\rm{T}}} $;

for(t=0; t < max-iteration; t++) {

for each n∈[1, 2, 3] {

$ \hat{X}=X $;

for each $ m\in [1, n-1]\text{ }\And \And \text{ }m\ne n $

$ \hat{X}=\hat{X}{{\times }_{m}}\mathit{\boldsymbol{V}}{{_{t+1}^{(m)}}^{^{\rm{T}}}} $;

for each $ m\in [n, 3] $

$ \hat{X}=\hat{X}{{\times }_{m}}\mathit{\boldsymbol{V}}{{_{t}^{(m)}}^{^{\rm{T}}}} $;

$ \left( \mathit{\boldsymbol{V}}_{t+1}^{(n)}, \sum\limits_{t+1}^{(n)}{\mathit{\boldsymbol{W}}_{t+1}^{(n)}} \right)=\text{SVD}(uf(\hat{X}, n), R) $;} //采用SVD分解，$ \mathit{\boldsymbol{W}}_{t+1}^{(n)} $是$ \mathit{\boldsymbol{V}}_{t+1}^{(n)} $正交矩阵，$ \sum\limits_{t+1}^{(n)}{=} $diag(σ₁, σ₂, …, σ_t+1)

$ {{C}_{t+1}}=X{{\times }_{1}}\mathit{\boldsymbol{V}}{{_{t+1}^{(1)}}^{^{\rm{T}}}}{{\times }_{2}}\mathit{\boldsymbol{V}}{{_{t+1}^{(2)}}^{^{\rm{T}}}}{{\times }_{3}}\mathit{\boldsymbol{V}}{{_{t+1}^{(3)}}^{^{\rm{T}}}} $;

if $ ||{{C}_{t+1}}|{{|}^{2}}-||{{C}_{t}}|{{|}^{2}}<\varepsilon $ exit;}

返回核心张量C和特征矩阵$ {{\mathit{\boldsymbol{V}}}^{(1)}} $，$ {{\mathit{\boldsymbol{V}}}^{(2)}} $和$ {{\mathit{\boldsymbol{V}}}^{(3)}} $，组合成近似张量$ \hat{X} $；

根据近似张量$ \hat{X} $按课程分类进行Top-N授课推荐;

End

算法时间复杂度由每次迭代计算核心张量$ {{C}_{t+1}} $的复杂度$ O\left( {\mathop {\mathop \sum \limits^3 }\limits_{i = 1,i \ne n} {\mkern 1mu} \left( {{I_n}{R_n}\mathop {\mathop \prod \limits^{n - 1} }\limits_{j = 1} {\mkern 1mu} {R_j}\mathop {\mathop \prod \limits^3 }\limits_{j = n + 1} {\mkern 1mu} {I_j}} \right)} \right) $、对$ \hat{X} $进行SVD计算的复杂度$ O\left( {{I_n}\mathop {\mathop \prod \limits^3 }\limits_{j = 1,j \ne n} {\mkern 1mu} {R_j}R_n^2} \right) $和求近似张量$ \hat{X} $的模乘运算复杂度(与求核心张量相同)构成。在算法中，因为有偏权值张量X维度大小$ {{I}_{n}} $远大于分解因子维度$ {{R}_{n}} $，故该算法的复杂度可以简化为$ O\left( \prod\limits_{i=1}^{3}{{{I}_{n}}} \right) $。

5. 结束语

从授课安排无较好的推荐依据的实际问题出发，通过归约教师专业基础、课程难度及教学评价，定义具有偏重性的加权方法，构建基于“教师-课程-评价-权值”四元关系之上的三维有偏权值张量模型，使用基于Tucker的分解算法，成功地实现了精准授课推荐，解决了一直以来授课安排无推荐依据的现状，为实现智能化精准授课推荐找到了一种新方法。如何更好地结合教师年龄、职称、专业方向等特征，更进一步精确地和多样化地实现个性化授课推荐，将是下一步研究的重点。

参考文献 (19)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

三维有偏权值张量分解在授课推荐上的应用研究

doi: 10.3969/j.issn.1001-0548.2017.05.018

作者简介:
姚敦红(1972-), 男, 副教授, 主要从事数据挖掘、机器学习方面的研究

A Three-Dimensional Partial Weight Tensor Model for Teaching Recommendation

计量

三维有偏权值张量分解在授课推荐上的应用研究

doi: 10.3969/j.issn.1001-0548.2017.05.018

1. 怀化学院计算机科学与工程学院湖南怀化 418000

2. 武汉大学计算机学院武汉 430072

3. 空军预警学院四系武汉 430010

作者简介:
姚敦红(1972-), 男, 副教授, 主要从事数据挖掘、机器学习方面的研究

English Abstract

A Three-Dimensional Partial Weight Tensor Model for Teaching Recommendation

1. College of Computer Science & Engineering, Huaihua University Huaihua Hunan 418000

2. School of Computer, Wuhan University Wuhan 430072

3. The Fourth Department of Air Force Early Warning Academy Wuhan 430010

全文HTML

3.1. 三维有偏仅值张量模型

3.2. 算法设计

4.1. 实验数据集

4.2. 实验及结果分析

目录

期刊在线

编辑办公

友情链接

留言板

三维有偏权值张量分解在授课推荐上的应用研究

doi: 10.3969/j.issn.1001-0548.2017.05.018

作者简介: 姚敦红(1972-), 男, 副教授, 主要从事数据挖掘、机器学习方面的研究

A Three-Dimensional Partial Weight Tensor Model for Teaching Recommendation

计量

出版历程

三维有偏权值张量分解在授课推荐上的应用研究

doi: 10.3969/j.issn.1001-0548.2017.05.018

1. 怀化学院计算机科学与工程学院 湖南 怀化 418000 2. 武汉大学计算机学院 武汉 430072 3. 空军预警学院四系 武汉 430010

作者简介: 姚敦红(1972-), 男, 副教授, 主要从事数据挖掘、机器学习方面的研究

English Abstract

A Three-Dimensional Partial Weight Tensor Model for Teaching Recommendation

1. College of Computer Science & Engineering, Huaihua University Huaihua Hunan 418000 2. School of Computer, Wuhan University Wuhan 430072 3. The Fourth Department of Air Force Early Warning Academy Wuhan 430010

全文HTML

3.1. 三维有偏仅值张量模型

3.2. 算法设计

4.1. 实验数据集

4.2. 实验及结果分析

目录

期刊在线

编辑办公

友情链接

作者简介:
姚敦红(1972-), 男, 副教授, 主要从事数据挖掘、机器学习方面的研究

1. 怀化学院计算机科学与工程学院湖南怀化 418000

2. 武汉大学计算机学院武汉 430072

3. 空军预警学院四系武汉 430010

作者简介:
姚敦红(1972-), 男, 副教授, 主要从事数据挖掘、机器学习方面的研究

1. College of Computer Science & Engineering, Huaihua University Huaihua Hunan 418000

2. School of Computer, Wuhan University Wuhan 430072

3. The Fourth Department of Air Force Early Warning Academy Wuhan 430010