基于近邻传播的限定簇数聚类方法研究

李海林; 魏苗

doi:10.3969/j.issn.1001-0548.2018.05.015

基于近邻传播的限定簇数聚类方法研究

doi: 10.3969/j.issn.1001-0548.2018.05.015

李海林^1,2,
魏苗¹

1.
华侨大学工商管理学院福建泉州 362021
2.
华侨大学现代应用统计与大数据研究中心福建厦门 361021

基金项目:

国家自然科学基金 71771094

国家自然科学基金 61300139

福建省社会科学规划基金 FJ2017B065

详细信息

作者简介:
李海林(1982-), 男, 博士, 副教授, 主要从事数据挖掘与决策支持方面的研究

中图分类号: TP301

Research on Clustering Method with Specified Cluster Number Based on Affinity Propagation

LI Hai-lin^1,2,
WEI Miao¹

1.
School of Business Administration, Huaqiao University Quanzhou Fujian 362021
2.
Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021

摘要: 针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷，提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合，利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集，结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验，实验结果分析表明，与近邻传播聚类算法和传统限定类簇数目的聚类算法相比，新聚类算法具有更好的聚类效果。
- 近邻传播 /
- 聚类算法 /
- 类簇数目 /
- 数据挖掘 /
- K均值聚类
Abstract: Due to disadvantage of the affinity propagation algorithm of which the number of clusters can not be pre-specified, an improved method including three phases is proposed in this paper. The proposed method uses affinity propagation algorithm to obtain the representation center points of the dataset. Then K-means is applied to the clustering of the center points and produces the initial training set. Moreover, the modified K nearest neighbor algorithm is applied to the procedure of clustering analysis. Artificial data and UCI datasets are used in experiment to compare the new algorithm with other clustering menthes. The results demonstrate that the new clustering algorithm is outperforms the affinity propagation algorithm and traditional clustering algorithms.
- affinity propagation /
- clustering algorithm /
- clusters number /
- data mining /
- K-means clustering

图 1 算法流程图

下载: 全尺寸图片幻灯片

图 2 AP-RNC算法与K-means算法在Test1的聚类结果

下载: 全尺寸图片幻灯片

图 3 AP-RNC算法与K-means算法在Test2的聚类结果

下载: 全尺寸图片幻灯片

图 4 AP-RNC算法与K-means算法在Test3的聚类结果

下载: 全尺寸图片幻灯片

表 1 数据集信息

数据集	样本数	属性数	样本分类数
Iris	150	4	3
Wine	178	13	3
soybean	47	35	4
Zoo	101	16	7
leuk72_3k	72	39	3
Wine Quality	1 600	12	6
contrace	1 473	10	3
waveform	5 000	31	3
page-block	5 473	11	5

下载: 导出CSV

表 2 传统算法与AP-RNC算法的聚类结果比较

数据集	RI				FM
数据集	AP-RNC	K-means	fuzzy	clara	AP-RNC	K-means	fuzzy	clara
Iris	0.892	0.88	0.891	0.886	0.841	0.821	0.841	0.829
Wine	0.725	0.685	0.717	0.73	0.592	0.586	0.581	0.581
Soybean	0.843	0.763	0.774	0.85	0.686	0.557	0.673	0.696
leuk72_3k	0.964	0.707	0.766	0.898	0.945	0.616	0.729	0.845
Zoo	0.925	0.851	0.794	0.845	0.844	0.638	0.536	0.625
Wine Quality	0.558	0.587	0.596	0.581	0.318	0.268	0.258	0.271
Contraceptive	0.586	0.558	0.561	0.559	0.372	0.366	0.364	0.364
Waveform	0.667	0.667	0.535	0.666	0.509	0.504	0.529	0.502
page-block	0.764	0.608	0.352	0.395	0.841	0.739	0.464	0.522
均值	0.770	0.701	0.665	0.712	0.661	0.566	0.553	0.582
胜出率/%	66.67	0	11.11	22.22	77.78	0	11.11	11.11

下载: 导出CSV

表 3 基于AP的聚类方法结果比较

数据集	RI				FM
数据集	AP-RNC	AP_Kmeans	AP	SAP	AP-RNC	AP_Kmeans	AP	SAP
iris	0.892	0.892	0.886	0.868	0.841	0.841	0.832	0.788
wine	0.725	0.663	0.720	0.717	0.592	0.539	0.586	0.581
soybean	0.843	0.852	0.850	0.500	0.686	0.657	0.695	0.409
leuk72_3k	0.964	0.964	0.898	0.875	0.945	0.945	0.845	0.793
zoo	0.925	0.869	0.885	0.855	0.844	0.710	0.737	0.680
Wine Quality	0.554	0.583	0.629	0.626	0.332	0.271	0.130	0.149
Contraceptive	0.556	0.610	0.649	0.634	0.372	0.237	0.234	0.146
Waveform	0.668	0.676	0.675	0.682	0.509	0.185	0.185	0.240
page-block	0.734	0.473	0.756	0.225	0.841	0.611	0.879	0.217
均值	0.762	0.729	0.772	0.665	0.662	0.555	0.569	0.598
胜出率/%	44.5	11.11	33.33	11.11	77.78	11.11	22.22	0

下载: 导出CSV

[1]	XU Rui, DONALD W. Survey of clustering algorithms[J]. IEEE Transactions on Neural Networks, 2005, 16(3):645-678. doi: 10.1109/TNN.2005.845141
[2]	陈黎飞, 姜青山, 王声瑞.基于层次划分的最佳聚类数确定方法[J].软件学报, 2008, 9(1):62-72. http://d.old.wanfangdata.com.cn/Periodical/rjxb200801007 CHEN Li-fei, JIANG Qing-shan, WANG Sheng-rui. A hierarchical method for determining the number of clusters[J]. Journal of Software, 2008, 9(1):62-72. http://d.old.wanfangdata.com.cn/Periodical/rjxb200801007
[3]	GAN Guo-jun, MICHAEL K. Subspace clustering using affinity propagation[J]. Pattern Recognition, 2015, 48(4):1455-1464. doi: 10.1016/j.patcog.2014.11.003
[4]	相洁, 赵冬琴.改进谱聚类算法在MCI患者检测中的应用研究[J].通信学报, 2015, 36(4):27-34. doi: 10.3969/j.issn.1001-2400.2015.04.005 XIANG Jie, ZHAO Dong-qin. Improved spectral clustering algorithm and its application in MCI detection[J]. Journal on Communications, 2015, 36(4):27-34. doi: 10.3969/j.issn.1001-2400.2015.04.005
[5]	SAGHABOZORGI S, SHIRKHORSHIDI A S, WAH T Y. Time-series clustering-a decade review[J]. Information Systems, 2015, 53(C):16-38. http://d.old.wanfangdata.com.cn/NSTLQK/NSTL_QKJJ0235390025/
[6]	孙吉贵, 刘杰, 赵连宇.聚类算法研究[J].软件学报, 2008, 19(1):48-61. http://d.old.wanfangdata.com.cn/Periodical/rjxb200801006 SUN Ji-gui, LIU Jie, ZHAO Lian-yu. Clustering algorithms research[J]. Journal of Software, 19(1):48-61. http://d.old.wanfangdata.com.cn/Periodical/rjxb200801006
[7]	周涛, 陆惠玲.数据挖掘中聚类算法研究进展[J].计算机工程与应用, 2012, 48(12):100-111. doi: 10.3778/j.issn.1002-8331.2012.12.021 ZHOU Tao, LU Hui-lin. Clustering algorithm research advances on data mining[J]. Computer Engineering and Applications, 2012, 48(12):100-111. doi: 10.3778/j.issn.1002-8331.2012.12.021
[8]	BREND F J, DELBERT D. Clustering by passing messages between data points[J]. Science, 2007, 315(5814):972-976. doi: 10.1126/science.1136800
[9]	李海林, 万校基, 林春培.基于关键词重要性和近邻传播聚类的主题分析研究[J].情报学报, 2018, 37(5):533-542. doi: 10.3772/j.issn.1000-0135.2018.05.011 LI Hai-lin, WAN Xiao-ji, LIN Chun-pei. Theme analysis based on keyword importance and affinity propagation clustering[J]. Journal of the China Society for Scientific and Technical Information, 2018, 37(5):533-542. doi: 10.3772/j.issn.1000-0135.2018.05.011
[10]	ARZENO N M, VIKALO H. Semi-supervised affinity propagation with soft instance-level constraints[J]. IEEE Transactions on Pattern Analysis and Machine Itelligence, 2015, 37(5):1041-1052. doi: 10.1109/TPAMI.2014.2359454
[11]	HANG Wen-long, CHUANG Fu-lai, WANG Shi-tong. Transfer affinity propagation-based clustering[J]. Information Sciences, 2016, 34(8):337-356. http://d.old.wanfangdata.com.cn/Periodical/dzkxxk201608035
[12]	李海林, 魏苗.自适应属性加权近邻传播聚类算法[J].电子科技大学学报, 2018, 47(2):247-255. doi: 10.3969/j.issn.1001-0548.2018.02.014 LI Hai-lin, WEI Miao. Affinity propagation clustering algorithm based on adaptive feature weight[J]. Journal of University of Electronic Science and Technology of China, 2018, 47(2):247-255. doi: 10.3969/j.issn.1001-0548.2018.02.014
[13]	张震, 汪斌强, 伊鹏, 等.一种分层组合的半监督近邻传播聚类算法[J].电子与信息学报, 2013, 35(3):645-651. http://d.old.wanfangdata.com.cn/Periodical/dzkxxk201303023 ZHANG Zhen, WANG Bing-qiang, YI Peng, et al. Semi-supervised affinity propagation clustering algorithm based on stratified combination[J]. Journal Of Electronics & Information Technology, 2013, 35(3):645-651. http://d.old.wanfangdata.com.cn/Periodical/dzkxxk201303023
[14]	ZHANG Tao, WU Ren-biao. Affinity propagation clustering of measurements for multiple extended target tracking[J]. Sensors, 2015, 15(9):22646-22659. doi: 10.3390/s150922646
[15]	ZHAO Xiu-li, XU Wei-xiang. An extended affinity propagation clustering method based on different data density types[J]. Computational Intelligence and Neuroscience, 2015, 1:1-12. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=Doaj000004239842
[16]	FUJITA A, TAKAHASHI D Y, PATRIOTA A G. A non-parametric method to estimate the number of clusters[J]. Computational Statistics & Data Analysis, 2014, 73(2):27-39. http://d.old.wanfangdata.com.cn/OAPaper/oai_arXiv.org_astro-ph%2f0110587
[17]	周世兵, 徐振源, 唐旭清.一种基于近邻传播算法的最佳聚类数确定方法[J].控制与决策, 2011, 26(8):1147-1152. http://d.old.wanfangdata.com.cn/Periodical/kzyjc201108006 ZHOU Shi-bing, XUN Zhen-yuan, TANG Xu-qing. Method for determining optimal number of cluster based on affinity propagation clustering[J]. Control and Decision, 26(8):1147-1152. http://d.old.wanfangdata.com.cn/Periodical/kzyjc201108006
[18]	王开军, 张军英, 李丹, 等.自适应仿射传播聚类[J].自动化学报, 2007, 33(12):1242-1246. http://d.old.wanfangdata.com.cn/Periodical/zdhxb200712002 WANG Kai-Jun, ZHANG Jun-ying, LI Dan, et al. Adaptive affinity propagation clustering[J]. Acta Automatica Sinica, 2007, 33(12):1242-1246. http://d.old.wanfangdata.com.cn/Periodical/zdhxb200712002
[19]	RAND W M. Objective criteria for the evaluation of clustering methods[J]. Publications of the American Statistical Association, 1971, 66(336):846-850. doi: 10.1080/01621459.1971.10482356
[20]	FOWLKES E B, MALLOWS C L. A method for comparing two hierarchical clusterings[J]. Publications of the American Statistical Association, 1983, 78(383):553-569. doi: 10.1080/01621459.1983.10478008

[1]	李海林, 张丽萍. 时间序列数据挖掘中的聚类研究综述 . 电子科技大学学报, 2022, 51(3): 416-424. doi: 10.12178/1001-0548.2022055
[2]	郑文, 赵偲, 李泽堃, 武啸泽, 胡涛. 基于Web数据挖掘的COVID-19流行病学特征分析 . 电子科技大学学报, 2020, 49(3): 408-414. doi: 10.12178/1001-0548.2020079
[3]	万武南, 陈俊. 双重掩码的模幂算法聚类相关功耗分析攻击 . 电子科技大学学报, 2018, 47(4): 588-594. doi: 10.3969/j.issn.1001-0548.2018.04.018
[4]	李海林, 魏苗. 自适应属性加权近邻传播聚类算法 . 电子科技大学学报, 2018, 47(2): 247-255. doi: 10.3969/j.issn.1001-0548.2018.02.014
[5]	李海林, 万校基. 基于簇中心群的时间序列数据分类方法 . 电子科技大学学报, 2017, 46(3): 625-630. doi: 10.3969/j.issn.1001-0548.2017.03.024
[6]	吴嘉轩, 代钰, 张斌, 杨雷. 基于拓扑匹配的组件服务副本放置算法 . 电子科技大学学报, 2015, 44(6): 905-910. doi: 10.3969/j.issn.1001-0548.2015.06.019
[7]	李学明, 杨阳, 秦东霞, 周尚波. 基于频繁闭项集的新关联分类算法ACCF . 电子科技大学学报, 2012, 41(1): 104-109. doi: 10.3969/j.issn.1001-0548.2012.01.020
[8]	龙文, 马坤, 辛阳, 杨义先. 适用于协议特征提取的关联规则改进算法 . 电子科技大学学报, 2010, 39(2): 302-305. doi: 10.3969/j.issn.1001-0548.2010.02.032
[9]	童彬, 秦志光, 贾伟峰, 宋健伟. 采用数据挖掘的拒绝服务攻击防御模型 . 电子科技大学学报, 2008, 37(4): 586-589.
[10]	牛强, 夏士雄, 周勇, 张磊. 改进的模糊C-均值聚类方法 . 电子科技大学学报, 2007, 36(6): 1257-1259,1272.
[11]	王金龙, 徐从富, 徐娇芬, 骆国靖. 利用销售数据的商品影响关系挖掘研究 . 电子科技大学学报, 2007, 36(6): 1282-1285.
[12]	朵春红, 王翠茹. 网格和密度的聚类算法在CRM中的应用 . 电子科技大学学报, 2007, 36(6): 1289-1291,1314.
[13]	桑永胜, 陆鑫. 基于数据挖掘的Internet远程教学研究 . 电子科技大学学报, 2006, 35(6): 953-955,959.
[14]	耿技, 印鉴. 改进的共享型最近邻居聚类算法 . 电子科技大学学报, 2006, 35(1): 70-72.
[15]	文琪, 彭宏. 小波变换的离群时序数据挖掘分析 . 电子科技大学学报, 2005, 34(4): 556-558.
[16]	曾异平, 朱宏, 龙文光. 趋势分析中的一种增量数据挖掘方法研究 . 电子科技大学学报, 2004, 33(4): 464-467.
[17]	叶茂, 陈勇. 基于分布模型的层次聚类算法 . 电子科技大学学报, 2004, 33(2): 171-174.
[18]	黄羽, 黄迪明, 何险峰, 武明. 遗传算法在入侵检测中的应用 . 电子科技大学学报, 2003, 32(6): 679-682.
[19]	黄进, 尹治本. 关联规则挖掘的Apriori算法的改进 . 电子科技大学学报, 2003, 32(1): 76-79.
[20]	方英武, 张广鹏, 吴德伟, 黄玉美, 赵修斌, 王轶. 分布式数据挖掘计算过程——DDCP算法研究 . 电子科技大学学报, 2003, 32(1): 80-84.

点击查看大图

图(4) / 表(3)

计量

文章访问数: 4459
HTML全文浏览量: 1256
PDF下载量: 115
被引次数: 0

全文HTML

聚类分析是一种在机器学习领域中对数据进行分析的有效方法，在数据挖掘与知识发现领域中也具有不可忽视的作用。通过聚类算法对数据进行分类分析，将一个数据集划分为若干个簇，使得每个簇中数据对象尽可能相似，而簇间数据对象尽可能相异。特别地，在大数据时代，海量数据通常不具有类标签，使得这种无监督的机器学习方法变得更加重要。另外，目前也存在适用于各类数据形态分布的聚类算法，如划分聚类、层次聚类、基于密度的聚类和基于模型的聚类等^[1-2]，它们已经广泛应用在数据预测模式、人工智能、图像识别等相关领域中^[3-5]。

在聚类分析中，经典的k-means和k-centers等方法通过多次迭代重新计算聚类中心得到最优聚类结果，但是在传统算法中初始聚类中心的选择对算法聚类结果和算法的迭代次数影响较大，不同的初始聚类中心经常会导致不同的聚类结果^[6]。在过去的十几年中，部分学者提出了各种改进方法以提高聚类算法的效率与准确率^[7]。特别地，文献[8]提出的基于图论的近邻传播算法(affinity propagation, AP)有效解决了初始聚类中心的选择对聚类结果产生的问题，是一种聚类质量和效率较好的聚类分析方法, 已在多个领域得到了应用^[9-11]，并有不少学者对它进行了研究^[12-13]。

近邻传播与传统聚类算法相比，对数据间的相似性矩阵的输入没有特殊要求从而扩大了算法的适应性^[14-15]。另外，近邻传播聚类不要求算法进行初始聚类中心的选择，避免了由初始中心产生的不利影响，使得结果具有一定的确定性。然而，传统近邻传播聚类算法无法限定目标聚类结果的类别数目，需要人工多次调整近邻传播算法的偏向参数值来达到指定的分类数目^[16]，限制了算法使用的灵活性和应用范围。鉴于近邻传播聚类算法无法实现限定分类数目的问题，本文提出一种基于近邻传播的新聚类算法，该方法通过AP聚类将原始数据集进行自适应中心代表点选择，再利用K均值将中心代表点聚类成指定的类数，最后提出改进后的近邻分类算法实现所有数据对象的聚类。该方法不仅能对AP聚类算法的结果进行确定类数分析，以便产生指定类数的聚类结果，还能提高AP聚类结果的质量。数值实验表明，相较对比算法，新方法具有更好的聚类效果。

1. 近邻传播算法

近邻传播AP聚类算法的聚类基础是数据间的相似性度量矩阵$s(i, k)$，其表示数据点${x_k}$在多大程度上适合作为数据点${x_i}$的类代表点。通常采用欧式距离作为相似性的测度指标，即任意两点之间的相似性定义为两点间距离平方的负数。如，数据点${x_i}$和数据点${x_k}$的相似性表示为$s(i, k) = - {\left\| {{x_i} - {x_k}} \right\|^2}$。在相似性矩阵中，$s(k, k)$的值被称为preferences，即偏向参数，通常取对应行的中位数作为偏向参数值。

在迭代的过程中，代表度和有效性两种信息在数据中传递，两种信息代表了不同的竞争目的。代表度$r(i, k)$是从数据点${x_i}$传到候选代表点${x_k}$的信息，反映在比较了其他点${x_i}$的候选代表点之后点${x_k}$作为点${x_i}$的代表点的合适程度。有效性$a(i, k)$是从候选代表点${x_k}$传递到数据点${x_i}$的信息，反映了考虑到其他点对点${x_k}$的支持度后点${x_k}$作为点${x_i}$的代表点的有效程度。AP算法在迭代过程中，不断更新每个数据点的代表度和有效性的值，直到产生收敛的聚类结果。AP聚类算法的计算步骤如下：

近邻传播聚类算法：$\mathit{\boldsymbol{C}} = {\rm{AP}}(\mathit{\boldsymbol{X}})$

输入：原始数据集$\mathit{\boldsymbol{X}} = \{ {x_1}, {x_2}, \cdots , {x_n}\} $

输出：聚类结果$\mathit{\boldsymbol{C}}$

1) 初始化代表性矩阵和有效性矩阵为零矩阵；

2) 根据$s(i, k) = - {\left\| {{x_i} - {x_k}} \right\|^2}$计算相似性矩阵$\mathit{\boldsymbol{S}}$，其中$s(k, k) = {\rm{median(}}\mathit{\boldsymbol{S}}{\rm{) }}$表示$s(k, k)$的取值为相似矩阵$\mathit{\boldsymbol{S}}$的中位数，有：

$$s(k, k) = {\rm{median}}(\mathit{\boldsymbol{S}}){\rm{ }}k = 1, 2 \cdots n$$

(1)

3) 更新代表性矩阵$\mathit{\boldsymbol{R}}$，更新规则为：

$$\left\{ {\begin{array}{*{20}{c}} {r(i, k) = s(i, k) - \mathop {\max }\limits_{k' \ne k} \{ a(i, k') + s(i, k')\} {\rm{ }}i \ne k} \\ {r(k, k) = s(k.k) - \mathop {\max }\limits_{k' \ne k} \{ a(k, k') + s(k, k')\} {\rm{ }}i = k} \end{array}} \right.$$

(2)

4) 更新有效性矩阵$\mathit{\boldsymbol{A}}$，更新规则为：

$$\left\{ {\begin{array}{*{20}{c}} {a(i, k) = {\rm{min\{ 0}}, r(k, k) + \sum\limits_{i' \notin \left\{ {i, k} \right\}} {{\rm{max\{ 0}}, r(i', k)\} \} } {\rm{ }}i \ne k} \\ {a(k, k) = \sum\limits_{i' \ne k} {{\rm{max\{ 0}}, r(i', k)\} \begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {}&{} \end{array}}&{} \end{array}}&{} \end{array}}&{} \end{array}}&{} \end{array}{\rm{ }}i = k} } \end{array}} \right.$$

(3)

5) 迭代步骤3)和步骤4)，当迭代次数超过最大迭代次数或者当产生收敛的聚类结果时停止计算；

6) 若$r(k, k) + a(k, k) > 0$，则数据点${x_k}$为聚类中心；

7) 将剩余数据点分配到相应的聚类中心；

8) 聚类结束。

在某些特殊情况下AP聚类会发生数据震荡，即使进行了大量迭代计算也无法产生准确的聚类结果。为了解决数据震荡，AP聚类引入了阻尼因子(damping factor)。从第二次迭代开始，$r(i, k)$和$a(i, k)$的值都是由当前迭代计算的新值和上一步迭代的值进行加权计算得到的。如当前迭代次数为$i$，则加权公式为：

$${r_i}(i, k) = \lambda {r_i} + (1 - \lambda ){r_{i - 1}}$$

(4)

$${a_i}(i, k) = \lambda {a_i} + (1 - \lambda ){a_{i - 1}}$$

(5)

在计算过程中迭代的次数受到阻尼因子$\lambda $的影响，当$\lambda $的值较小时，迭代次数较多；若$\lambda $取较大值，迭代次数也会减少。

4. 结束语

本文提出了一种对近邻传播算法进行确定类数分析的方法AP-RNC，该方法分别经过AP聚类阶段，K-means阶段和再分类阶段的计算，使得AP聚类产生的结果能够得到准确率较高的限定类数聚类结果。在保留了AP聚类产生的高质量聚类结果的基础上，用较小代价将聚类结果进行再分类，使得限定类簇的聚类准确性得到提高。新方法对异常值的敏感性较低，当局部数据点较密集时，不易产生聚类中心偏移，具有提高对边缘零散数据聚类准确率的优势。实验结果与分析表明，新方法具有更好的聚类质量。然而，由于近邻传播算法需要消耗较多计算时间，如何加快近邻传播聚类的速度以提高新算法的计算效率成为将来需要进一步研究的内容。

参考文献 (20)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于近邻传播的限定簇数聚类方法研究

doi: 10.3969/j.issn.1001-0548.2018.05.015

作者简介:
李海林(1982-), 男, 博士, 副教授, 主要从事数据挖掘与决策支持方面的研究

Research on Clustering Method with Specified Cluster Number Based on Affinity Propagation

计量

基于近邻传播的限定簇数聚类方法研究

doi: 10.3969/j.issn.1001-0548.2018.05.015

1. 华侨大学工商管理学院福建泉州 362021

2. 华侨大学现代应用统计与大数据研究中心福建厦门 361021

作者简介:
李海林(1982-), 男, 博士, 副教授, 主要从事数据挖掘与决策支持方面的研究

English Abstract

Research on Clustering Method with Specified Cluster Number Based on Affinity Propagation

1. School of Business Administration, Huaqiao University Quanzhou Fujian 362021

2. Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021

全文HTML

2.1. 簇中心代表点

2.2. 改进后的K最近邻算法

2.3. AP-RNC算法

3.1. 仿真实验

3.2. 算法聚类比较

目录

期刊在线

编辑办公

友情链接

留言板

基于近邻传播的限定簇数聚类方法研究

doi: 10.3969/j.issn.1001-0548.2018.05.015

作者简介: 李海林(1982-), 男, 博士, 副教授, 主要从事数据挖掘与决策支持方面的研究

Research on Clustering Method with Specified Cluster Number Based on Affinity Propagation

计量

出版历程

基于近邻传播的限定簇数聚类方法研究

doi: 10.3969/j.issn.1001-0548.2018.05.015

1. 华侨大学工商管理学院 福建 泉州 362021 2. 华侨大学现代应用统计与大数据研究中心 福建 厦门 361021

作者简介: 李海林(1982-), 男, 博士, 副教授, 主要从事数据挖掘与决策支持方面的研究

English Abstract

Research on Clustering Method with Specified Cluster Number Based on Affinity Propagation

1. School of Business Administration, Huaqiao University Quanzhou Fujian 362021 2. Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021

全文HTML

2.1. 簇中心代表点

2.2. 改进后的K最近邻算法

2.3. AP-RNC算法

3.1. 仿真实验

3.2. 算法聚类比较

目录

期刊在线

编辑办公

友情链接

作者简介:
李海林(1982-), 男, 博士, 副教授, 主要从事数据挖掘与决策支持方面的研究

1. 华侨大学工商管理学院福建泉州 362021

2. 华侨大学现代应用统计与大数据研究中心福建厦门 361021

作者简介:
李海林(1982-), 男, 博士, 副教授, 主要从事数据挖掘与决策支持方面的研究

1. School of Business Administration, Huaqiao University Quanzhou Fujian 362021

2. Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021