基于LDA的复杂网络整体研究态势主题分析

赵紫娟; 李小珂; 郭强; 杨凯; 刘建国

doi:10.3969/j.issn.1001-0548.2019.06.019

基于LDA的复杂网络整体研究态势主题分析

doi: 10.3969/j.issn.1001-0548.2019.06.019

1.
上海理工大学复杂系统科学研究中心上海杨浦区 200093
2.
上海财经大学会计学院上海杨浦区 200433

基金项目:

国家自然科学基金 61773248

国家自然科学基金 71771152

详细信息

作者简介:
赵紫娟(1995-), 女, 主要从事文本分析方面的研究

通讯作者: 刘建国, E-mail:liujg004@ustc.edu.cn

中图分类号: TP393;N949

Evolution Properties of Complex Networks in Terms of the LDA

1.
Research Center of Complex Systems Science, University of Shanghai for Science and Technology Yangpu Shanghai 200093
2.
School of Accounting, Shanghai University of Finance and Economics Yangpu Shanghai 200433

摘要: 复杂网络的研究发展非常迅速，已经对自动控制、统计物理、计算机及管理等学科产生了深刻的影响。然而，国内的主题发展态势一直缺乏系统、直观的分析。本文以2017年第十三届全国复杂网络大会的会议摘要文本为研究对象，从会议摘要主题分析的角度研究了国内复杂网络科研领域的整体发展态势。研究过程中首先对摘要文本进行预处理，通过建立自定义词典和停用词库对文本进行jieba分词，得到一个文档-词矩阵。然后用LDA主题模型对摘要主题进行挖掘，通过SVD分解确定主题数目，并基于摘要间的JS距离进行凝聚层次聚类，基于机构间的JS距离用Blondel算法对机构进行社团划分，最终得到10类会议主题和4类科研社团。实证结果不仅能分析出复杂网络宏观上的研究趋势与不同研究方向的热门程度；也能基于聚出的4类科研社团，为新进入复杂网络的研究者寻找对应研究方向的文献提供参考机构。
- 复杂网络 /
- 社团结构 /
- 研究态势 /
- 文本分析
Abstract: The research of complex networks has been developing rapidly, which has had a profound impact on such disciplines as automatic control, statistical physics, computers, and management. However, there has been a lack of systematic and intuitive analysis of the development of topics in China. Taking the abstracts of the 13th National Complex Network Conference in 2017 as research object, we investigate the topic trend of the domestic complex network researches. Firstly, the text information of the abstracts are preprocessed and segmented by adding a custom dictionary and a stop word dictionary to obtain a document-word matrix. Then the LDA model is used to mine topics of the abstracts and SVD decomposition is applied to obtain the number of topics. As a result, ten topics of the conference are found through agglomerative hierarchical clustering according to the JS distance among the abstracts and four research communities involved in the conference are identified through community detection according to the JS distance among institutions. This work not only makes insight on the research trends and the popularity of different research directions in complex networks, but also provides reference institutions for new researchers to find corresponding research directions based on the results.
- complex networks /
- community structure /
- evolution properties /
- text mining

图 1 数据分析流程图

下载: 全尺寸图片幻灯片

图 2 LDA的图模型

下载: 全尺寸图片幻灯片

图 3 预处理流程图

下载: 全尺寸图片幻灯片

图 4 最后10步聚类结果

下载: 全尺寸图片幻灯片

图 5 主题树状图

下载: 全尺寸图片幻灯片

图 6 机构聚类结果图

下载: 全尺寸图片幻灯片

表 1 摘要-关键词矩阵对应的奇异值个数

矩阵总能量信息比/%	80	85	90	95
奇异值个数	79	92	108	126

下载: 导出CSV

表 2 机构-关键词矩阵对应的奇异值个数

矩阵总能量信息比/%	80	85	90	95
奇异值个数	27	31	38	46

下载: 导出CSV

表 3 基于摘要的Top4个主题

Topic 1th	数值	Topic 2nd	数值	Topic 3rd	数值	Topic 4th	数值
网络结构	0.640 5	智能电网	0.406 9	大数据	0.324 2	排名聚合	0.227 9
位置	0.093 7	智能体系统	0.057 9	物联网	0.256 1	教师	0.186 4
距离	0.070 3	一致性	0.056 9	云计算	0.142 1	学生	0.178 3
基准	0.070 3	控制	0.028 9	高性能	0.128 1	评价	0.064 1
晶格网络	0.023 5	指标	0.028 5	网络	0.038 1	排序算法	0.028 5
图分割	0.021 5	拓扑	0.028 2	随机效应	0.034 1	观察	0.021 4
人口数据	0.011 9	神经回路	0.015 2	数学家	0.024 1	有序	0.021 4
社区属性	0.011 8	离散时间	0.014 9	机遇	0.024 0	传播速率	0.021 4
觅食行为	0.011 8	监督	0.014 3	预期收益	0.014 1	大学	0.014 3
逻辑	0.011 5	优越性	0.014 1	网络科学	0.013 2	教务网	0.013 2

下载: 导出CSV

表 4 基于机构的Top4个主题

Topic 1th	数值	Topic 2nd	数值	Topic 3rd	数值	Topic 4th	数值
网络建模	0.462 7	链路预测	0.393 4	同步性	0.276 1	网络节点	0.148 8
网络结构	0.159 6	联系	0.170 1	耦合矩阵	0.176 1	社区检测	0.040 7
动态	0.159 6	网络结构	0.165 4	内部	0.171 2	局部	0.032 6
吸引力	0.039 7	复杂网络	0.090 7	集体	0.065 5	纳什均衡	0.032 6
记忆	0.039 6	性能	0.071 4	股票市场	0.032 4	顶点	0.024 8
策略	0.033 2	游戏	0.051 4	信任	0.030 9	度	0.024 8
流行阈值	0.033 1	社区检测	0.042 0	评级	0.025 4	局部搜索	0.024 5
相互竞争	0.026 5	空模型	0.028 0	演化机制	0.024 0	聚类现象	0.024 5
免疫策略	0.026 4	信息	0.023 4	市场	0.020 3	测度函数	0.024 3
负相关	0.026 0	聚类现象	0.018 2	外部	0.020 1	游戏	0.016 3

下载: 导出CSV

表 5 摘要主题分布表

排序	摘要数	主题	组成成分
1	106	网络动力学	集群行为、社交网络、博弈、传播等
2	31	网络应用	链路预测、推荐算法、命名游戏等
3	4	网络控制	结构可控性、渗流阈值等

下载: 导出CSV

表 6 机构研究内容表

编号	机构数	主题	研究内容
1	14	网络应用	排名算法、链路预测、推荐算法、命名游戏等
2	10	网络控制	分布式控制、结构可控理论、渗流阈值等
3	23	网络动力学	社交网络、网络同步性、博弈、传播等
4	14	网络分析	链接分析、网络安全、电路分析等

下载: 导出CSV

[1]	NEWMAN M E J. The structure and function of complex networks[J]. SIAM Review, 2003, 45(2):167-256. doi: 10.1137/S003614450342480
[2]	LIU J G, LEI H, XUE P, et al. Stability of similarity measurements for bipartite networks[J]. Scientific Reports, 2016, 6:18653. doi: 10.1038/srep18653
[3]	LIU J G, LIN J H, GUO Q, et al. Locating influential nodes via dynamics-sensitive centrality[J]. Scientific Reports, 2016, 6(3):032812. http://d.old.wanfangdata.com.cn/Conference/9553029
[4]	YANG K, GUO Q, LI S N, et al. Evolution properties of the community members for dynamic networks[J]. Physics Letters A, 2017, 381(11):970-975. doi: 10.1016/j.physleta.2017.01.030
[5]	BARABÁSI A L, ALBERT R. Emergence of scaling in random networks[J]. Science, 1999, 286(5439):509-512. doi: 10.1126/science.286.5439.509
[6]	DEERWESTER S, DUMAS S T, FURNAS G W, et al. Indexing by Latent semantic analysis[J]. Journal of the American Society for Information Science, 1990, 41(6):391-407. doi: 10.1002/(SICI)1097-4571(199009)41:6<391::AID-ASI1>3.0.CO;2-9
[7]	HOFMANN T. Probabilistic latent semantic analysis[C]//The 15th Conference on Uncertainty in Artificial Intelligence.[S.l.]: Morgan Kaufmann Publishers Inc, 1999: 289-296.
[8]	BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 601-608. http://d.old.wanfangdata.com.cn/Periodical/jsjyy201306024
[9]	关鹏, 王曰芬.科技情报分析中LDA主题模型最优主题数确定方法研究[J].现代图书情报技术, 2016, 32(9):42-50. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=xdtsqbjs201609005 GUAN Peng, WANG Yue-fen. Identifying optimal topic numbers from Sci-Tech information with LDA model[J]. New Technology of Library and Information Service, 2016, 32(9):42-50. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=xdtsqbjs201609005
[10]	TEH Y, JORDAN M, BEAl M, et al. Hierarchical Dirichlet processes[J]. Journal of the American Statistical Association, 2007, 101(476):1566-1581. http://d.old.wanfangdata.com.cn/Periodical/sjcjycl201702023
[11]	吴志祥, 王昊, 王雪颖, 等.基于奇异值分解的专利术语层次关系解析研究[J].情报学报, 2017, 36(5):473-483. doi: 10.3772/j.issn.1000-0135.2017.05.005 WU Zhi-xiang, WANG Hao, WANG Xue-ying, et al. Study on Chinese patent terms hierarchy parse based on singular value decomposition[J]. Journal of the China Society for Scientific and Technical Information, 2017, 36(5):473-483. doi: 10.3772/j.issn.1000-0135.2017.05.005
[12]	曹娟, 张勇东, 李锦涛, 等.一种基于密度的自适应最优LDA模型选择方法[J].计算机学报, 2008, 31(10):1780-1787. doi: 10.3321/j.issn:0254-4164.2008.10.012 CAO Juan, ZHANG Yong-dong, LI Jin-tao, et al. A method of adaptively selecting best LDA model based on density[J]. Chinese Journal of Computers, 2008, 31(10):1780-1787. doi: 10.3321/j.issn:0254-4164.2008.10.012
[13]	张俊博, 李健, 张宏宇.潜在语义分析中主题数的确定方法[J].信息技术, 2016(7):96-100. http://d.old.wanfangdata.com.cn/Periodical/xxjs201607025 ZHANG Jun-bo, LI Jian, ZHANG Hong-yu. Determination method of the number of topics in latent semantic analysis[J]. Information Technology, 2016(7):96-100. http://d.old.wanfangdata.com.cn/Periodical/xxjs201607025
[14]	MAJTEY A P, LAMBERTI P W, PRATO D P. Jensen-Shannon divergence as a measure of distinguishability between mixed quantum states[J]. Physical Review A, 2005, 72(5):762-776. http://d.old.wanfangdata.com.cn/OAPaper/oai_arXiv.org_quant-ph%2f0508138
[15]	JOHNSON S C. Hierarchical clustering schemes[J]. Psychometrika, 1967, 32(3):241-254. doi: 10.1007/BF02289588
[16]	DUNN J C. A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters[J]. Journal of Cybernetics, 1973, 3(3):32-57. doi: 10.1080/01969727308546046
[17]	NEWMAN M E J, GIRVAN M. Finding and evaluating community structure in networks[J]. Physical Review E, 2004, 69(2):026113. doi: 10.1103/PhysRevE.69.026113
[18]	BLONDEL V D, GUILLAUME J L, LAMBIOTTE R, et al. Fast unfolding of communities in large networks[J]. Journal of Statistical Mechanics, 2008(10):155-168. doi: 10.1088-1742-5468-2008-10-P10008/
[19]	GRIFFITHS T L, STEYVERS M. Finding scientific topics[J]. Proc Natl Acad Sci USA, 2004, 101(sup 1):5228-5235. http://d.old.wanfangdata.com.cn/NSTLQK/NSTL_QKJJ0212842727/
[20]	汪小帆, 李翔, 陈关荣.网络科学导论[M].北京:高等教育出版社, 2012. WANG Xiao-fan, LI Xiang, CHEN Guan-rong. Network science:An introduction[M]. Beijing:Higher Education Press, 2012.

[1]	王辰曦, 张智成, 袁晨, 蔡世民. 基于高考录取成绩的院校竞争网络实证研究 . 电子科技大学学报, 2022, 51(3): 473-480. doi: 10.12178/1001-0548.2021207
[2]	邢玲, 邓凯凯, 吴红海, 谢萍. 复杂网络视角下跨社交网络用户身份识别研究综述 . 电子科技大学学报, 2020, 49(6): 905-917. doi: 10.12178/1001-0548.2019182
[3]	张帆, 郭强, 刘建国. 基于二阶信息的复杂系统弹性度量研究 . 电子科技大学学报, 2019, 48(3): 456-461. doi: 10.3969/j.issn.1001-0548.2019.03.023
[4]	孙晓璇, 吴晔, 冯鑫, 肖井华. 高铁-普铁的实证双层网络结构与鲁棒性分析 . 电子科技大学学报, 2019, 48(2): 315-320. doi: 10.3969/j.issn.1001-0548.2019.02.024
[5]	朱为华, 刘凯, 闫小勇, 汪明, 吴金闪. 识别流网络关键节点的虚拟外界投入产出分析法 . 电子科技大学学报, 2018, 47(2): 292-297. doi: 10.3969/j.issn.1001-0548.2018.02.021
[6]	吴宗柠, 樊瑛. 复杂网络视角下国际贸易研究综述 . 电子科技大学学报, 2018, 47(3): 469-480. doi: 10.3969/j.issn.1001-0548.2018.03.023
[7]	杨凯, 郭强, 刘晓露, 刘建国. 基于多重特征向量的有向网络社团结构划分算法 . 电子科技大学学报, 2016, 45(6): 1014-1019, 1032. doi: 10.3969/j.issn.1001-0548.2016.06.024
[8]	程灿, 郭强, 刘建国. 网络路由传输策略的研究进展 . 电子科技大学学报, 2015, 44(1): 2-11. doi: 10.3969/j.issn.1001-0548.2015.01.001
[9]	苟智坚, 范明钰, 王光卫. 复杂网络中无信任边界限制的连续观点演化研究 . 电子科技大学学报, 2015, 44(5): 749-756. doi: 10.3969/j.issn.1001-0548.2015.05.019
[10]	张恺, 马忠军, 李科赞. 朋友关系网络的实证统计研究 . 电子科技大学学报, 2014, 43(3): 336-341. doi: 10.3969/j.issn.1001-0548.2014.03.003
[11]	周涛, 张子柯, 陈关荣, 汪小帆, 史定华, 狄增如, 樊瑛, 方锦清, 韩筱璞, 刘建国, 刘润然, 刘宗华, 陆君安, 吕金虎, 吕琳媛, 荣智海, 汪秉宏, 许小可, 章忠志. 复杂网络研究的机遇与挑战 . 电子科技大学学报, 2014, 43(1): 1-5. doi: 10.3969/j.issn.1001-0548.2014.01.001
[12]	唐雪飞, 杨陈皓, 牛新征. 复杂网络链路危险度预测模型研究 . 电子科技大学学报, 2013, 42(3): 442-447. doi: 10.3969/j.issn.1001-0548.2013.03.024
[13]	王伟, 杨慧, 龚凯, 唐明, 都永海. 复杂网络上的局域免疫研究 . 电子科技大学学报, 2013, 42(6): 817-830.
[14]	张昌利, 龚建国, 闫茂德. 基于复杂网络的社会化标签语义相似度分析 . 电子科技大学学报, 2012, 41(5): 642-648. doi: 10.3969/j.issn.1001-0548.2012.05.001
[15]	陈娟, 陆君安. 复杂网络中尺度研究揭开网络同步化过程 . 电子科技大学学报, 2012, 41(1): 8-16. doi: 10.3969/j.issn.1001-0548.2012.01.002
[16]	张聪, 沈惠璋. 网络自然密度社团结构模块度函数 . 电子科技大学学报, 2012, 41(2): 185-191. doi: 10.3969/j.issn.1001-0548.2012.02.003
[17]	朱大勇, 张新丽, 李树全. 利用局部拓扑信息发现模糊社团结构 . 电子科技大学学报, 2011, 40(1): 73-79. doi: 10.3969/j.issn.1001-0548.2011.01.014
[18]	谢福鼎, 张大为, 黄丹, 张永, 孙岩. 寻找复杂网络社团的稠密集算法 . 电子科技大学学报, 2011, 40(4): 483-490. doi: 10.3969/j.issn.1001-0548.2011.04.001
[19]	史定华. 无标度网络：基础理论和应用研究 . 电子科技大学学报, 2010, 39(5): 644-650. doi: 10.3969/j.issn.1001-0548.2010.05.001
[20]	汪小帆, 刘亚冰. 复杂网络中的社团结构算法综述 . 电子科技大学学报, 2009, 38(5): 537-543. doi: 10.3969/j.issn.1001-0548.2009.05.007

点击查看大图

图(6) / 表(6)

计量

文章访问数: 4297
HTML全文浏览量: 1266
PDF下载量: 83
被引次数: 0

全文HTML

复杂网络是一门交叉性学科，近年来得到了大量来自不同领域学者的关注，在各个分支领域都有了丰硕的研究成果^[1-5]。从宏观层面上，分析复杂网络的研究热点和研究趋势对于不同学科发展有着重要的意义。每年举行一届最具权威性的复杂网络大会，设置了复杂系统与复杂网络各个方面的讨论主题，吸引了来自国内外研究复杂网络学者的热情参与与投稿，包含了各个领域和方向的研究成果。如2017年全国复杂网络大会就有来自全国61个科研机构，投稿153篇论文摘要。研究分析这些最具前沿的科研成果，可以从一定程度上反映复杂网络目前的研究热点与方向。本文借助于收集到的复杂网络大会摘要的数据，利用文本分析的工具进行复杂网络研究态势的分析。

目前研究者提出了较多的文本分析的方法，最早的经典主题模型方法是文献[6]在1990年提出的潜在语义分析(latent semantic analysis, LSA)方法。该方法使用词-文档矩阵，然后对该矩阵通过奇异值分解进行降维得到文本的主题，虽然解决了一词多义的问题，但是计算非常耗时，并且LSA得到的不是一个概率模型，缺乏统计基础，结果难以直观地解释。文献[7]提出了概率潜在语义分析(probabilistic latent semantic analysis, PLSA)，该方法基于统计学的理论，来分别估计文档-主题分布和主题-词分布，不过PLSA存在过拟合问题，对于新数据的适应能力不够。文献[8]在2003年提出隐含狄利克雷分布(latent Dirichlet allocation, LDA)，将PLSA贝叶斯化，即相比于PLSA固定的主题分布和词分布，LDA使用Dirichlet分布作为主题和词的先验分布，然后用吉布斯抽样求解后验分布，从而得到给定文档的主题分布。由于LDA有很好的适应性，在实际应用中LDA被应用到个性化推荐、广告预测等方面，是一种应用广泛的主题模型，因此本文选用LDA提取主题。

在主题模型中，首先需要确定主题数，大量实证研究证实LDA主题提取效果与文档主题数目K值有很大的关系，主题提取的结果对K值十分敏感^[9]。文献[8]提出用困惑度(perplexity)定主题数目，但是这种方法会使主题数过大，产生主题冗余。文献[9]提出引入主题方差来决定主题数，用主题方差困惑度作为评定指标，其中困惑度为分子，主题方差为分母，然而这种方法对于主题之间差距不大的文本并不适用。文献[10]提出层次狄利克雷法(hierarchical Dirichlet processes, HDP)，是一种非参数贝叶斯模型，可以自主学习最优主题数目，其参数数目随样本数的增加而自适应，因而不需要提前决定主题数，不过HDP算法复杂度高，在文本分析中效率并不高。奇异值分解(singular value decomposition, SVD)可以将文档从高维空间映射到低维的潜在语义空间^[11]，用保留的奇异值个数作为主题数，使得保留的矩阵能量信息不低于80%。本文在确定主题数K时，用SVD与困惑度方法做了对比，用困惑度确定K时一般需要从10~200取值，选取困惑度最小的K，需要训练至少20个主题模型，效率很低，并且通常产生的主题数偏大，因而本文选择用奇异值分解的方法确定主题数，这样选取的主题数不会过于冗余并且效率高。

本文选用LDA主题模型对会议摘要进行主题挖掘，利用SVD分解确定主题数目，以JS作为距离度量指标，对摘要进行层次聚类，用Blondel算法对机构进行社团划分，最后为每一类贴上标签。本文通过文本分析得出复杂网络宏观上的研究内容与不同研究方向的热门程度，并且通过对61个机构社团划分，得到这些机构所对应的研究方向。

3. 结束语

本文基于2017年第十三届全国复杂网络大会的摘要数据，利用LDA模型提取摘要主题，通过SVD分解来确定主题个数，比困惑度方法更具有效率，且不会产生太大的冗余，得到了摘要的文档-主题矩阵，利用JS算法计算摘要间的距离，进一步基于摘要的JS距离进行凝聚层次聚类，得到主题树状图，分析复杂网络的研究态势。通过数据分析得出10类主题，分别为：网络动力学、网络结构、网络控制、网络应用、网络优化、网络分析、经济网络、网络同步性、人工智能和社区划分，其中网络动力学和网络应用为热门研究方向。另一方面，将机构作为研究主体，同样地，利用机构的文档-主题矩阵，使用JS算法计算机构间的距离，然后用Blondel算法对机构进行社团结构划分，得到机构的聚类结果。本文将参与会议的机构划分为4个社团，每个社团的研究方向分别为：网络应用、网络控制、网络动力学和网络分析。

本文通过对复杂网络会议文本进行研究，挖掘出复杂网络当前的研究趋势，可以帮助复杂网络的研究人员了解复杂网络学科最新的热门领域，拓展他们的科研方向，同时为复杂网络新的研究者提供宏观层面的认识，方便他们选择感兴趣的方向。还能基于机构聚类结果，为新的研究者提供依据机构寻找科研文献的参考建议。此外，本文也存在一些不足，如：自定义词典以及聚类后的主题归纳都受主观因素的影响，人工归纳标签的好坏还没有找到合适的评价指标；分析数据为参与会议的机构所投摘要，不能全面地代表各个机构所有的研究方向。本文还有进一步可扩展的工作：文本主题数的确定和聚类方法的选取都可以尝试更多的方法，也可以结合主题发现结果和机构聚类结果做科研合作单位的推荐。

参考文献 (20)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于LDA的复杂网络整体研究态势主题分析

doi: 10.3969/j.issn.1001-0548.2019.06.019

作者简介:
赵紫娟(1995-), 女, 主要从事文本分析方面的研究

通讯作者: 刘建国, E-mail:liujg004@ustc.edu.cn

Evolution Properties of Complex Networks in Terms of the LDA

计量

基于LDA的复杂网络整体研究态势主题分析

doi: 10.3969/j.issn.1001-0548.2019.06.019

1. 上海理工大学复杂系统科学研究中心上海杨浦区 200093

2. 上海财经大学会计学院上海杨浦区 200433

作者简介:
赵紫娟(1995-), 女, 主要从事文本分析方面的研究

通讯作者: 刘建国, E-mail:liujg004@ustc.edu.cn

English Abstract

Evolution Properties of Complex Networks in Terms of the LDA

1. Research Center of Complex Systems Science, University of Shanghai for Science and Technology Yangpu Shanghai 200093

2. School of Accounting, Shanghai University of Finance and Economics Yangpu Shanghai 200433

全文HTML

1.1. LDA主题模型

1.2. SVD分解

1.3. 聚类分析

2.1. 文本预处理

2.2. 摘要主题挖掘与分析

2.3. 摘要聚类分析

目录

期刊在线

编辑办公

友情链接

留言板

基于LDA的复杂网络整体研究态势主题分析

doi: 10.3969/j.issn.1001-0548.2019.06.019

作者简介: 赵紫娟(1995-), 女, 主要从事文本分析方面的研究

通讯作者: 刘建国, E-mail:liujg004@ustc.edu.cn

Evolution Properties of Complex Networks in Terms of the LDA

计量

出版历程

基于LDA的复杂网络整体研究态势主题分析

doi: 10.3969/j.issn.1001-0548.2019.06.019

1. 上海理工大学复杂系统科学研究中心 上海 杨浦区 200093 2. 上海财经大学会计学院 上海 杨浦区 200433

作者简介: 赵紫娟(1995-), 女, 主要从事文本分析方面的研究

通讯作者: 刘建国, E-mail:liujg004@ustc.edu.cn

English Abstract

Evolution Properties of Complex Networks in Terms of the LDA

1. Research Center of Complex Systems Science, University of Shanghai for Science and Technology Yangpu Shanghai 200093 2. School of Accounting, Shanghai University of Finance and Economics Yangpu Shanghai 200433

全文HTML

1.1. LDA主题模型

1.2. SVD分解

1.3. 聚类分析

2.1. 文本预处理

2.2. 摘要主题挖掘与分析

2.3. 摘要聚类分析

目录

期刊在线

编辑办公

友情链接

作者简介:
赵紫娟(1995-), 女, 主要从事文本分析方面的研究

1. 上海理工大学复杂系统科学研究中心上海杨浦区 200093

2. 上海财经大学会计学院上海杨浦区 200433

作者简介:
赵紫娟(1995-), 女, 主要从事文本分析方面的研究

1. Research Center of Complex Systems Science, University of Shanghai for Science and Technology Yangpu Shanghai 200093

2. School of Accounting, Shanghai University of Finance and Economics Yangpu Shanghai 200433