基于簇中心群的时间序列数据分类方法

李海林; 万校基

doi:10.3969/j.issn.1001-0548.2017.03.024

基于簇中心群的时间序列数据分类方法

doi: 10.3969/j.issn.1001-0548.2017.03.024

1.
华侨大学信息管理系福建泉州 362021
2.
华侨大学现代应用统计与大数据研究中心福建厦门 361021

基金项目:

国家自然科学基金 61300139

福建省社会科学规划项目 FJ2016B076

福建省自然科学基金 2015J01581

详细信息

作者简介:
李海林 (1982-), 男, 副教授, 博士, 主要从事数据挖掘与人工智能等方面的研究

中图分类号: TP273

Classification for Time Series Data Based on Center Sequences of Clusters

1.
Department of Information Management, Huaqiao University Quanzhou Fujian 362021
2.
Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021

摘要: 分类算法是时间序列数据挖掘中极为重要的任务和技术，该文提出一种基于簇中心群的时间序列数据分类方法。该方法根据时间序列训练数据集中的类别标签进行簇划分，利用近邻传播算法分别对每个簇进行中心代表点选择，构造出各代表点的代表对象集；然后借助基于动态时间弯曲的均值中心方法对各代表对象集实现中心群计算，结合改进后的K近邻算法实现时间序列数据的分类。数值实验结果表明，与传统方法相比，新方法具有更好的分类效果和计算性能。
- 近邻传播 /
- 分类算法 /
- 数据挖掘 /
- 动态时间弯曲 /
- 时间序列
Abstract: Classification algorithm is one of the important tasks and techniques in the field of time series data mining. A classification method for time series data based on center sequences of clusters is proposed in this paper. Time series in the training set are divided into several clusters according to their labels, and every cluster picks out the representation objects using affinity propagation clustering and constructs the representation subset. The barycenter averaging method based on dynamic time warping is used to calculate the center group in which the improved K nearest neighbors method is executed for time series classification. The experimental results demonstrated that the new method, compared to the traditional method, has better classification quality and calculation performance.
- affinity propagation /
- classification algorithm /
- data mining /
- dynamic time warping /
- time series

图 1 基于单一均值和簇中心群的代表对象

下载: 全尺寸图片幻灯片

图 2 K近邻分类算法分析

下载: 全尺寸图片幻灯片

图 3 训练集中各簇的中心群

下载: 全尺寸图片幻灯片

图 4 两种方法在不同数据集和K的平均消耗时间

下载: 全尺寸图片幻灯片

表 1 UCI时间序列数据集信息

序号	数据集名称	类别数目	训练集大小	测试集大小	长度
1	Adiac	37	390	391	176
2	Beef	5	30	30	470
3	CBF	3	30	900	128
4	ECG200	2	100	100	96
5	Fish	7	175	175	463
6	FaceAll	14	560	1 690	131
7	Gun_Point	2	50	150	150
8	Lighting2	2	60	61	637
9	Lighting7	7	70	73	319
10	OSULeaf	6	200	242	427
11	OliveOil	4	30	30	570
12	SwedishLeaf	15	500	625	128
13	Trace	4	100	100	275
14	TwoPatters	4	1 000	4 000	128
15	Syn.Control	6	300	300	60

下载: 导出CSV

表 2 KNN2CG方法的时间序列分类结果

序号	K						Aver
序号	1	2	3	4	5	6	Aver
1	0.383 6	0.383 6	0.383 6	0.383 6	0.383 6	0.383 6	0.383 6
2	0.500 0	0.500 0	0.500 0	0.500 0	0.500 0	0.500 0	0.500 0
3	0.003 3	0.003 3	0.004 4	0.004 4	0.004 4	0.004 4	0.004 1
4	0.130 0	0.130 0	0.170 0	0.180 0	0.170 0	0.260 0	0.173 3
5	0.234 3	0.234 3	0.257 1	0.268 6	0.274 3	0.274 3	0.257 1
6	0.143 2	0.143 2	0.155 0	0.174 6	0.187 0	0.198 2	0.166 9
7	0.173 3	0.173 3	0.393 3	0.213 3	0.213 3	0.213 3	0.230 0
8	0.114 8	0.114 8	0.082 0	0.180 3	0.114 8	0.114 8	0.120 2
9	0.219 2	0.219 2	0.205 5	0.205 5	0.205 5	0.205 5	0.210 0
10	0.413 2	0.413 2	0.409 1	0.425 6	0.446 3	0.446 3	0.425 6
11	0.133 3	0.133 3	0.133 3	0.133 3	0.133 3	0.133 3	0.133 3
12	0.232 0	0.232 0	0.238 4	0.251 2	0.260 8	0.273 6	0.248 0
13	0.000 0	0.000 0	0.020 0	0.090 0	0.090 0	0.090 0	0.048 3
14	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0
15	0.013 3	0.013 3	0.013 3	0.010 0	0.016 7	0.010 0	0.012 8
Aver	0.179 6	0.179 6	0.197 7	0.201 4	0.200 0	0.207 2	—

下载: 导出CSV

表 3 传统KNN方法的时间序列分类结果

序号	K						Aver
序号	1	2	3	4	5	6	Aver
1	0.396 4	0.434 8	0.427 1	0.445 0	0.468 0	0.475 7	0.441 2
2	0.500 0	0.500 0	0.600 0	0.533 3	0.566 7	0.533 3	0.538 9
3	0.003 3	0.017 8	0.003 3	0.023 3	0.017 8	0.036 7	0.017 0
4	0.230 0	0.160 0	0.200 0	0.180 0	0.210 0	0.200 0	0.196 7
5	0.165 7	0.205 7	0.194 3	0.217 1	0.262 9	0.251 4	0.216 2
6	0.192 3	0.229 0	0.192 3	0.186 4	0.189 9	0.188 8	0.196 4
7	0.093 3	0.133 3	0.113 3	0.173 3	0.173 3	0.180 0	0.144 4
8	0.131 1	0.114 8	0.131 1	0.131 1	0.180 3	0.163 9	0.142 1
9	0.274 0	0.328 8	0.287 7	0.260 3	0.246 6	0.246 6	0.274 0
10	0.409 1	0.442 1	0.421 5	0.433 9	0.454 5	0.466 9	0.438 0
11	0.133 3	0.166 7	0.133 3	0.200 0	0.233 3	0.233 3	0.183 3
12	0.208 0	0.201 6	0.220 8	0.206 4	0.212 8	0.228 8	0.213 1
13	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0
14	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0	0.000 0
15	0.006 7	0.010 0	0.016 7	0.013 3	0.026 7	0.023 3	0.016 1
Aver	0.182 9	0.196 3	0.196 1	0.200 2	0.216 2	0.215 3	—

下载: 导出CSV

[1]	WU X D, KUMAR V, QUINLAN J R, et al. Top 10 algorithms in data mining[J]. Knowledge and Information Systems, 2008, 14(1): 1-37. doi: 10.1007/s10115-007-0114-2
[2]	李海林, 杨丽彬.时间序列数据降维及特征表示新方法[J].控制与决策, 2013, 28(11): 1718-1722. http://cdmd.cnki.com.cn/Article/CDMD-10141-1013198523.htm LI Hai-lin, YANG Li-bin. Method of dimensionality reduction and feature representation for time series[J]. Control and Decision, 2013, 28(11): 1718-1722. http://cdmd.cnki.com.cn/Article/CDMD-10141-1013198523.htm
[3]	李正欣, 郭建胜, 惠晓滨, 等.基于共同主成分的多元时间序列降维方法[J].控制与决策, 2013, 28(4): 531-536. http://www.cnki.com.cn/Article/CJFDTOTAL-KZYC201304010.htm LI Zheng-xin, GUO Jian-sheng, HUI Xiao-bin, etal. Dimension reduction method for multivariate time series based on common principal component[J]. Control and Decision, 2013, 28(4): 531-536. http://www.cnki.com.cn/Article/CJFDTOTAL-KZYC201304010.htm
[4]	PETITJEAN F, FORESTIER G, NICHOLSON A, et al. Dynamic time warping averaging of time series allows faster and more accurate classification[C]//IEEE International Conference on Data Mining. Piscataway: IEEE, 2014: 470-479.
[5]	郭兴明, 袁志会, 丁晓蓉.经验模式分解及关联维数在心音信号分类识别中的应用[J].电子科技大学学报, 2013, 42(6): 954-960. http://www.juestc.uestc.edu.cn/CN/abstract/abstract687.shtml GUO Xing-ming, YUAN Zhi-hui, DING Xiao-rong. Application of EMD and correlation dimension in classification and recognition of heart sound[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(6): 954-960. http://www.juestc.uestc.edu.cn/CN/abstract/abstract687.shtml
[6]	KAYA H, GÜNDÜZ-ÖĞÜDÜCÜ. A distance based time series classification framework[J]. Information Systems, 2015, 51: 27-42. doi: 10.1016/j.is.2015.02.005
[7]	LI Hai-lin. Asynchronism-based principal component analysis for time series data mining[J]. Expert Systems with Applications, 2014, 41(6): 2842-2850. doi: 10.1016/j.eswa.2013.10.019
[8]	KEOGH E. Exact indexing of dynamic time warping[J]. Knowledge and Information Systems, 2005, 7(3): 358-386. doi: 10.1007/s10115-004-0154-9
[9]	FREY B J, DUECK D. Clustering by passing messages between data points[J]. Science, 2007, 315(5814): 972-976. doi: 10.1126/science.1136800
[10]	杨燕, 冯晨菲, 贾真.基于链接的模糊聚类集成方法[J].电子科技大学学报, 2014, 43(6): 887-892. http://www.juestc.uestc.edu.cn/CN/abstract/abstract510.shtml YANG Yan, FENG Chen-fei, JIA Zhen. A link-based fuzzy clustering ensemble[J]. Journal of University of Electronic Science and Technology of China, 2014, 43(6): 887-892. http://www.juestc.uestc.edu.cn/CN/abstract/abstract510.shtml
[11]	LIAO T W. Clustering of time series data survey[J]. Pattern Recognition, 2005, 38(11): 1857-1874. doi: 10.1016/j.patcog.2005.01.025
[12]	PETITJEAN F, KETTERLIN A, GANCARSKI P. A global averaging method for dynamic time warping, with applications to clustering[J]. Pattern Recognition, 2011, 44: 678-693. doi: 10.1016/j.patcog.2010.09.013
[13]	LEE Y, WEI C, CHENG T. Nearest-neighbor-based approach to time-series classification[J]. Decision Support Systems, 2012, 53(1): 207-217. doi: 10.1016/j.dss.2011.12.014
[14]	KEOGH E, ZHU Q, HU B, et al. The UCR time series classification/clustering homepage[EB/OL]. [2015-06-08]. http://www.cs.ucr.edu/~eamonn/time_series_data/.

[1]	杨骏, 敬思远, 钟勇. 面向时间序列有序分类的Shapelet抽取算法 . 电子科技大学学报, 2023, 52(6): 887-896. doi: 10.12178/1001-0548.2022278
[2]	李海林, 张丽萍. 时间序列数据挖掘中的聚类研究综述 . 电子科技大学学报, 2022, 51(3): 416-424. doi: 10.12178/1001-0548.2022055
[3]	李海林, 贾瑞颖, 谭观音. 基于K-Shape的时间序列模糊分类方法 . 电子科技大学学报, 2021, 50(6): 899-906. doi: 10.12178/1001-0548.2020380
[4]	郑文, 赵偲, 李泽堃, 武啸泽, 胡涛. 基于Web数据挖掘的COVID-19流行病学特征分析 . 电子科技大学学报, 2020, 49(3): 408-414. doi: 10.12178/1001-0548.2020079
[5]	杨文忠, 张志豪, 吾守尔·斯拉木, 温杰彬, 富雅玲, 王丽花, 王婷. 基于时间序列关系的GBRT交通事故预测模型 . 电子科技大学学报, 2020, 49(4): 615-621. doi: 10.12178/1001-0548.2019151
[6]	李海林, 魏苗. 自适应属性加权近邻传播聚类算法 . 电子科技大学学报, 2018, 47(2): 247-255. doi: 10.3969/j.issn.1001-0548.2018.02.014
[7]	李海林, 魏苗. 基于近邻传播的限定簇数聚类方法研究 . 电子科技大学学报, 2018, 47(5): 733-739. doi: 10.3969/j.issn.1001-0548.2018.05.015
[8]	刘瑶, 王瑞锦, 刘峤, 秦志光. 动态社会网络的社团结构检测与分析 . 电子科技大学学报, 2014, 43(5): 724-729. doi: 10.3969/j.issn.1001-0548.2014.05.016
[9]	李学明, 杨阳, 秦东霞, 周尚波. 基于频繁闭项集的新关联分类算法ACCF . 电子科技大学学报, 2012, 41(1): 104-109. doi: 10.3969/j.issn.1001-0548.2012.01.020
[10]	武斌, 杨义先, 郑康锋. 入侵检测中基于序列模式的告警关联分析 . 电子科技大学学报, 2009, 38(3): 415-418. doi: 10.3969/j.issn.1001-0548.2009.03.023
[11]	童彬, 秦志光, 贾伟峰, 宋健伟. 采用数据挖掘的拒绝服务攻击防御模型 . 电子科技大学学报, 2008, 37(4): 586-589.
[12]	梁冰, 刘群. 基于自动机模型数据关联性能评估算法 . 电子科技大学学报, 2008, 37(4): 606-609,629.
[13]	王金龙, 徐从富, 徐娇芬, 骆国靖. 利用销售数据的商品影响关系挖掘研究 . 电子科技大学学报, 2007, 36(6): 1282-1285.
[14]	周巧临, 傅彦. 科学数据时间序列的预测方法 . 电子科技大学学报, 2007, 36(6): 1260-1263.
[15]	桑永胜, 陆鑫. 基于数据挖掘的Internet远程教学研究 . 电子科技大学学报, 2006, 35(6): 953-955,959.
[16]	文琪, 彭宏. 小波变换的离群时序数据挖掘分析 . 电子科技大学学报, 2005, 34(4): 556-558.
[17]	曾异平, 朱宏, 龙文光. 趋势分析中的一种增量数据挖掘方法研究 . 电子科技大学学报, 2004, 33(4): 464-467.
[18]	黄羽, 黄迪明, 何险峰, 武明. 遗传算法在入侵检测中的应用 . 电子科技大学学报, 2003, 32(6): 679-682.
[19]	黄进, 尹治本. 关联规则挖掘的Apriori算法的改进 . 电子科技大学学报, 2003, 32(1): 76-79.
[20]	方英武, 张广鹏, 吴德伟, 黄玉美, 赵修斌, 王轶. 分布式数据挖掘计算过程——DDCP算法研究 . 电子科技大学学报, 2003, 32(1): 80-84.

点击查看大图

图(4) / 表(3)

计量

文章访问数: 4044
HTML全文浏览量: 1288
PDF下载量: 148
被引次数: 0

全文HTML

时间序列是一种与时间相关的数值型数据，基于时间序列的数据挖掘与分析成为目前数据研究领域中最具有挑战性的十大问题之一^[1]。在时间序列数据挖掘领域中，特别是金融时间序列数据存在时间高维性，使得传统分类算法不能直接有效地对时间序列数据进行分类，有碍于金融数据市场分析。部分学者通过数据降维与特征表示方法将高维时间序列数据挖掘进行特征提取，再结合传统聚类或分类算法实现特征对象的数据分类^[2-3]。然而，由于数据降维和特征表示在一定程度上会丢失部分重要数据信息，传统方法不能很好地对时间序列数据进行有效分类。有成果研究表明^[4]，最近邻分类算法是时间序列数据分类最为有效的方法，它能较好地实现时间序列数据分类和预测。传统分类算法的分类质量和计算效率在一定程度上取决于前期数据处理中特征表示和相似性度量等方法的性能^[5-6]。基于动态时间弯曲的最近邻分类方法是一种通过匹配异步形态相似性来对具有共同波动特征的时间序列数据进行聚类或分类，它能够提高最近邻方法的分类质量，但其平方阶的时间复杂度在一定程度上影响了其在高维时间序列数据挖掘中的应用效果^[7]。

鉴于基于动态时间弯曲距离的最近邻算法在时间序列数据分类中重要性和有效性^[8]，本文从分类质量和效率两个角度出发，提出一种基于簇中心群的时间序列分类算法。该方法利用近邻传播聚类算法对训练集中的每个簇进行代表点计算，并找到各代表点所对应的被代表对象集，利用基于动态时间弯曲的均值中心来描述每个被代表对象集，最后结合改进后的K近邻算法来讨论在不同K值下的分类情况。数值实验结果与分析表明，新方法具有更好的时间序列数据分类质量和计算性能。

1. 相关理论基础

1.1. 动态时间弯曲

动态时间弯曲 (dynamic time warping, DTW) 是时间序列数据挖掘领域中用来进行相似性度量的一种经典方法，其能较好地对时间序列数据进行形态匹配，进而得到反映时间序列相似性的最小距离^[8]。

定义1 DTW是按一定的规则从两条时间序列数据中寻找一条最优弯曲路径$P=[{{p}_{1}}, {{p}_{2}}, \cdots, {{p}_{W}}]$, 使得该弯曲路径对应元素之间的距离总和最小，即：

$$ {\mathop{\rm DTW}\nolimits} (X,Y) = \mathop {\min }\limits_P {\mkern 1mu} \sum\limits_{w = 1}^W d ({p_w}) $$

(1)

式中，$d({{p}_{w}})=D(i, j)=d({{x}_{i}}, {{y}_{j}})$，表示最优弯曲路径P中来自不同时间序列数据对应元素之间的距离, 通常使用欧氏距离来度量元素之间的距离，即$d({{x}_{i}}, {{y}_{i}})={{({{x}_{i}}-{{y}_{i}})}^{2}}$。基于动态规划方法和距离矩阵可以求解获得一条满足最优情况的路径，使得该路径中最后一个元素的累积距离最小，即DTW (X, Y)=R(n, m)，且有：

$$ \mathit{\boldsymbol{R}}(i, j)=\mathit{\boldsymbol{D}}(i, j)+\min \left\{ \begin{matrix} \mathit{\boldsymbol{R}}(i-1, j) \\ \mathit{\boldsymbol{R}}(i-1, j-1) \\ \mathit{\boldsymbol{R}}(i, j-1) \\ \end{matrix} \right. $$

(2)

DTW能够有效地匹配两条时间序列中具有相似性形态的数据点，且代价矩阵R记录了最优弯曲路径的方向和反映两条时间序列之间相似性的最小距离R(n, m)。由于需要通过累积代价矩阵R获得最优弯曲路径P，使得其计算时间复杂度为O(nm)，不利于较长时间序列之间的距离度量。

1.2. 近邻传播聚类

近邻传播 (affinity propagation, AP) 聚类^[9]是一种基于近邻信息传播的聚类算法，与其他无监督的机器学习方法一样^[10-11]，具有较高效率的分类效果。AP聚类目的是找出若干个最优代表点，使得其与所代表对象相似性之和最大。

AP聚类算法将所有数据对象视为聚类中心，为每个样本点建立与其他样本点的吸引程度信息，即相似性矩阵S，其中任意i和j，相似性矩阵中元素$s(i, j)=-\parallel {{x}_{i}}-{{y}_{j}}{{\parallel }^{2}}$。另外，AP聚类算法涉及3个重要参数：偏向参数、代表程度及合适程度。

定义2 偏向参数p(i) 表示数据点i被选作聚类中心的倾向程度，初始可以被赋予一个先验值，由样本i与其他样本之间的相似性的中位值来确定。

定义3 代表程度r(i, k) 是指由样本点x_i指向样本点x_k，表示代表点x_k积累的信息，用来说明x_k作为x_i的类代表点的程度。

定义4 合适程度a(i, k) 是从样本点x_k指向样本点x_i, 表示代表点x_i积累的信息，用来表示x_i选择x_k作为代表点的合适程度。

$$ r(i, k)\leftarrow s(i, k)-\underset{{k}'\text{s}\text{.t}\text{.}{k}'\ne k}{\mathop{\arg }}\, \{a(i, {k}')+s(i, {k}')\} $$

(3)

$$ a(i, k)\leftarrow \left\{ \begin{matrix} \begin{align} &\min \{0, r(k, k)+ \\ &\sum\limits_{{i}'\text{s}\text{.t}\text{.}{i}'\notin \{i, k\}}{\max }\{0, r({i}', k)\}\} \\ \end{align}&i\ne k \\ \sum\limits_{{i}'\text{s}\text{.t}\text{.}i\ne k}{\max }(0, r({i}', k))&i=k \\ \end{matrix} \right. $$

(4)

在AP聚类算法中，通过代表程度和合适程度两个信息量的交替更新，计算所有数据点的代表程度r(i, k) 和合适程度a(i, k) 之和，取和值最大的x_k₀作为x_i的代表点，${k_0} = \arg \mathop {\max }\limits_k {\mkern 1mu} (a(i,k) + r(i,k))$。

AP聚类算法每次需要重复交替更新a(i, k) 和r(i, k)，使其在不同替代次数下，数据集中被聚类所构成的代表点不同，直到达到指定又迭代次数或最终代表点被确定不变为止。

1.3. 均值中心序列

均值中心序列 (DTW barycenter averaging, DBA)^[12]是一种基于DTW的时间序列中心序列，利用启发式规则来计算时间序列数据集的中心。其基本思想是，在数据集X{X₁, X₂, …X_N}中，首先通过初始化中心序列C[c₁, c₂, …c_T], 再利用DTW算法计算X_i与中心序列C的弯曲路径P_i；对于每个i值，根据P_i值从X_i中选取与中心序列中数据点c_j相匹配的数据点集合X_i(j_{a_i}:j_{b_i})；最后计算所有数据点X_i(j_{a_i}:j_{b_i})(i=1, 2, …, N) 的平均值作为更新后中心序列c_j的值，即：

$$ {{c}_{{{j}'}}}={\sum\limits_{i=1}^{N}{\sum\limits_{k={{j}_{{{a}_{i}}}}}^{{{j}_{{{b}_{i}}}}}{{{\mathit{\boldsymbol{X}}}_{i}}}}(k)}/{\sum\limits_{i=1}^{N}{{{j}_{{{b}_{i}}}}}-{{j}_{{{a}_{i}}}}+1}\; $$

(5)

通过C'更新C，即C←C'，重新获得描述时间序列数据集X的均值中心序列C，直到连续两次替代中均值中心序列收敛不变为止。基于DTW的均值中心序列能够反映原始时间序列数据的形态变化。另外，DBA能够用不同长度的中心序列来描述数据集中不等长时间序列的形态变化关系。

4. 结束语

鉴于最近邻算法在时间序列分类研究中的重要性和优越性，提出了一种基于簇中心群的时间序列数据分类方法 (KNN2CG)。通过近邻传播AP聚类对训练数据集中的每个簇进行子簇划分和代表对象选择，再以代表对象为初始化中心对象，利用DBA对每个子簇进行中心序列计算，进而构建训练簇中心群。同时，结合改进的K最近邻方法，使得基于簇中心群的分类算法获得更好的分类效果和计算性能。新方法具有以下几点优势：1) 通过AP和DBA使得具有极为相似形态的时间序列数据子集被均值中心序列所描述，减少了新训练集中成员数量，提高了分类算法的计算性能。2) 中心群为每个簇提供了更为详细的总体特征描述，结合DTW使得均值中心序列能够更好地表达被描述对象的形态特征，有利于提高最近邻算法的分类质量。3) 利用平均距离来选取K个近邻对象，克服了传统K近邻方法限入局最优的问题。实验结果表明，与传统方法相比，新方法具有更好的分类质量和较高的计算效率。

本文研究工作还得到福建省高等学校新世纪优秀人才支持计划 (Z1625112) 和华侨大学中青年教师科研提升资助计划 (ZQN-PY220) 的资助，在此表示感谢。

参考文献 (14)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于簇中心群的时间序列数据分类方法

doi: 10.3969/j.issn.1001-0548.2017.03.024

作者简介:
李海林 (1982-), 男, 副教授, 博士, 主要从事数据挖掘与人工智能等方面的研究

Classification for Time Series Data Based on Center Sequences of Clusters

计量

基于簇中心群的时间序列数据分类方法

doi: 10.3969/j.issn.1001-0548.2017.03.024

1. 华侨大学信息管理系福建泉州 362021

2. 华侨大学现代应用统计与大数据研究中心福建厦门 361021

作者简介:
李海林 (1982-), 男, 副教授, 博士, 主要从事数据挖掘与人工智能等方面的研究

English Abstract

Classification for Time Series Data Based on Center Sequences of Clusters

1. Department of Information Management, Huaqiao University Quanzhou Fujian 362021

2. Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021

全文HTML

1.1. 动态时间弯曲

1.2. 近邻传播聚类

1.3. 均值中心序列

2.1. 簇中心群

2.2. 新K近邻分类

2.3. 基于簇中心群的K近邻分类方法

3.1. 实例分析

目录

期刊在线

编辑办公

友情链接

留言板

基于簇中心群的时间序列数据分类方法

doi: 10.3969/j.issn.1001-0548.2017.03.024

作者简介: 李海林 (1982-), 男, 副教授, 博士, 主要从事数据挖掘与人工智能等方面的研究

Classification for Time Series Data Based on Center Sequences of Clusters

计量

出版历程

基于簇中心群的时间序列数据分类方法

doi: 10.3969/j.issn.1001-0548.2017.03.024

1. 华侨大学信息管理系 福建 泉州 362021 2. 华侨大学现代应用统计与大数据研究中心 福建 厦门 361021

作者简介: 李海林 (1982-), 男, 副教授, 博士, 主要从事数据挖掘与人工智能等方面的研究

English Abstract

Classification for Time Series Data Based on Center Sequences of Clusters

1. Department of Information Management, Huaqiao University Quanzhou Fujian 362021 2. Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021

全文HTML

1.1. 动态时间弯曲

1.2. 近邻传播聚类

1.3. 均值中心序列

2.1. 簇中心群

2.2. 新K近邻分类

2.3. 基于簇中心群的K近邻分类方法

3.1. 实例分析

目录

期刊在线

编辑办公

友情链接

作者简介:
李海林 (1982-), 男, 副教授, 博士, 主要从事数据挖掘与人工智能等方面的研究

1. 华侨大学信息管理系福建泉州 362021

2. 华侨大学现代应用统计与大数据研究中心福建厦门 361021

作者简介:
李海林 (1982-), 男, 副教授, 博士, 主要从事数据挖掘与人工智能等方面的研究

1. Department of Information Management, Huaqiao University Quanzhou Fujian 362021

2. Research Center of Applied Statistics and Big Data, Huaqiao University Xiamen Fujian 361021