乘积季节模型在软件老化评估中的应用研究

李焱; 高强; 王勇; 刘欣然

doi:10.3969/j.issn.1001-0548.2017.03.017

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名

邮箱

手机号码

标题

留言内容

验证码

乘积季节模型在软件老化评估中的应用研究

中国科学院计算技术研究所北京海淀区 100190

国家计算机网络应急技术处理协调中心北京朝阳区 100029

中国科学院大学北京海淀区 100049

基金项目:

国家973重点基础研究发展规划项目 2011CB302605

国家科技支撑计划 2012BAH47B04

详细信息

作者简介:
李焱 (1984-), 博士生, 主要从事分布式计算、云计算方面的研究

中图分类号: TP311

Software Aging Evaluation Method Using Multiplicative Seasonal ARIMA Model

Institute of Computing Technology, Chinese Academy of Sciences Haidian Beijing 100190

National Computer Network Emergency Response Technical Coordination Center Chaoyang Beijing 100029

University of Chinese Academy of Sciences Haidian Beijing 100049

摘要: 在需要长期运行的系统中，软件老化是一种常见的现象，现有基于时序分析的软件老化评估方法，大多基于简单的自回归或ARMA模型，没有充分考虑软件老化关键指标的非平稳性、季节性等特征。该文提出一种基于乘积季节ARIMA模型的软件老化评估方法。并通过实验表明，该方法能够较好地拟合季节性负载系统的软件老化趋势，并能做出准确的预测以支撑软件再生。

关键词:

Abstract: Software aging is a common phenomenon in a system that needs long-term operation. The existing analysis methods based on time series analysis mainly focus on autoregressive moving average (ARMA) models, not fully considered the seasonality or non-stationarity of the key indicators about software aging. This paper proposes a new software aging evaluation method based on seasonal autoregressive integrated moving average (ARIMA) model. The experimental results show that the method can well fit the software aging trend of seasonal load systems, and can achieve accurate prediction for supporting software rejuvenation.

Key words:

模型

AIC值

BIC值

ARIMA (0, 1, 0)(0, 1, 0)₇₂

255.68

259.94

ARIMA (0, 1, 1)(0, 1, 0)₇₂

255.29

259.82

RIMA (1, 1, 0)(0, 1, 0)₇₂

255.36

259.88

ARIMA (1, 1, 1)(0, 1, 0)₇₂

256.57

263.36

ARIMA (0, 1, 0)(0, 1, 1)₇₂

256.68

261.2

ARIMA (0, 1, 1)(0, 1, 1)₇₂

257.29

264.08

ARIMA (1, 1, 0)(0, 1, 1)₇₂

257.06

264.83

ARIMA (1, 1, 1)(0, 1, 1)₇₂

258.54

267.59

乘积季节模型在软件老化评估中的应用研究

1. 中国科学院计算技术研究所北京海淀区 100190

2. 国家计算机网络应急技术处理协调中心北京朝阳区 100029

3. 中国科学院大学北京海淀区 100049

基金项目:

国家973重点基础研究发展规划项目 2011CB302605

国家科技支撑计划 2012BAH47B04

作者简介:
李焱 (1984-), 博士生, 主要从事分布式计算、云计算方面的研究

收稿日期: 2015-11-25

修回日期: 2016-02-24

刊出日期: 2017-06-15

中图分类号: TP311

关键词:

全文HTML

已有研究表明，当软件连续运行较长时间时，其内部的一些错误条件的积累会导致软件性能衰退甚至停止运行，这种现象称为软件老化^[1]。软件老化在需要长时间运行的系统中尤为常见，如虚拟机和虚拟机管理器^[2]、操作系统^[3]、云平台系统软件^[4]、Java虚拟机^[5]、Web服务器^[6-7]、视频点播系统^[8]等。软件老化降低了系统的可靠性与可用性，有时可能会给应用带来难以估量的损失。为了降低甚至消除软件老化带来的风险，文献[1]提出了一种名为软件再生的方法，及时评估系统老化状态并适时采取再生操作，提升了系统可靠性。如何选择再生的时机是消除软件老化风险的关键，再生太早则代价过高、效果不明显，而再生太晚则起不到降低风险的作用。

确定再生时机的方法主要分为两种：基于模型的方法和基于测量的方法^[6]。前者通过马尔科夫、随机Petri网等方法对系统建模，计算出系统的最佳再生周期；后者基于系统核心指标的观察数据进行软件老化评估，预测关键资源耗尽或是降低到一定阈值的时间，从而适时采取再生操作。基于测量的分析方法主要包括：局部线性回归、决策树、支持向量机、时间序列分析等。与基于模型的方法相比，基于测量的方法更侧重于反映真实观察数据的变化规律，也更容易在工程领域被验证^[9]。可用内存数、内存交换区使用大小、CPU利用率等是已有基于测量方法的主要观察指标，而上述指标的观察值和系统负载强相关。

值得关注的是，软件系统的老化趋势很大程度上受负载变化的影响^[6]，负载越重、老化趋势会越快。而需要长时间运行的系统其负载通常表现出一定的周期性变化趋势，呈现出time-of-day或month-of-year效应^[10]。如基于Web服务器的ERP系统负载与员工上下班周期强相关，白天工作时间系统负载较重，员工下班后系统负载会逐步降低。但现有基于测量的方法未充分考虑系统负载的周期性变化特征。文献[9]主要针对目前软件老化分析中的单参数模型及未考虑变量间关联性和影响性的多参数模型的不足，提出了运用多元时间序列模型分析软件老化的方法，但未考虑系统负载特征与变量观测值之间的关系；文献[11]采用了响应时间、吞吐率、内存使用量等多个参数以反应软件老化趋势，并基于机器学习 (M5P) 算法预测软件的宕机时间，但同样对负载特征考虑不足。文献[6]通过观察内存交换区使用数、空闲物理内存数等指标变化情况，建立了季节性自回归 (seasonal auto-regression) 模型描述软件老化，同时给出了基于已使用内存交换区大小的预测结果，但AR模型本质上是一种针对平稳时间序列的分析方法，使得季节性自回归模型在考虑季节性负载的同时忽视了其变化的不平稳性。

因此，本文提出了一种基于乘积季节性自回归求和滑动平均模型 (seasonal autoregressive integrated moving average, SARIMA) 的软件老化评估方法。该方法充分考虑了系统负载给软件老化带来的影响，既涉及了季节性因素，又纳入了对动态趋势的评估，能够更为准确地预测关键指标 (资源使用率) 的变化趋势，以提升软件老化评估的效果。最后，基于一个实际线上系统的监测数据开展实验分析，说明了该方法的有效性。

1. 乘积季节模型

时间序列分析^[12]是一种数据处理方法。该方法基于随机过程理论和数理统计学方法，研究随机数据序列所遵从的统计规律，以用于解决实际问题。时间序列分析在金融领域^[13]、机械制造^[14]、计算机领域^{[6, 9, 15-18]}等领域已有较为广泛的应用。文献[6, 9]更是直接将时序分析方法用于软件老化的评估。

1.1. ARIMA模型

自回归求和滑动平均模型 (ARIMA)，是文献[13]于20世纪70年代初提出的一种著名的时间序列预测方法，所以又称为Box-Jenkins模型。该方法通过时间序列的历史数据揭示数据随时间变化的规律，并将这种规律延伸到未来，从而具备一定的预测功能。该模型通常可表示为ARIMA (p, d, q)，其中，p为自回归项数，q为移动平均项数，d为使动态时间序列成为平稳序列所做的差分次数。常见的移动平均过程 (MA)、自回归过程 (AR)、自回归移动平均过程 (ARMA) 等都是ARIMA模型的特例。设X=(X₁, X₂, X₃, …, X_n_-1, X_n) 为一个时间序列，则ARIMA模型可表示为：

$$\left\{ \begin{array}{l} \mathit{\Phi }(B){\nabla ^d}{X_t} = \mathit{\Theta }(B){\varepsilon _t}\\ E({\mathit{\boldsymbol{\varepsilon }}_t}) = 0,{\rm{Var}}({\mathit{\boldsymbol{\varepsilon }}_t}) = {\sigma ^2},E({\mathit{\boldsymbol{\varepsilon }}_t}{\mathit{\boldsymbol{\varepsilon }}_s}) = 0,\;s \ne t\\ E({\mathit{\boldsymbol{X}}_s}{\mathit{\boldsymbol{\varepsilon }}_t}) = 0,\;\forall s ＜ t \end{array} \right.$$

(1)

$${{\nabla }^{1}}{{X}_{t}}=(1-B){{X}_{t}}={{X}_{t}}-{{X}_{t-1}}$$

(2)

$$\mathit{\Phi }(B)=1-{{\varnothing }_{1}}B-L-{{\varnothing }_{p}}{{B}^{p}}$$

(3)

$$\mathit{\Theta }(B)=1-{{\theta }_{1}}B-L-{{\theta }_{q}}{{B}^{q}}$$

(4)

式中，B为后移算子；∇^d表示向后差分算子；t为时间标志；{ε_t}表示白噪声序列；d为差分次数。若取一阶差分，即∇¹=1-B，则有:

$${{\nabla }^{1}}{{X}_{t}}=(1-B){{X}_{t}}={{X}_{t}}-{{X}_{t-1}}$$

(5)

式 (3) 中Φ(B) 阶数为p，式 (4) 中Θ(B) 阶数为q，也即模型ARIMA (p, d, q)。

1.2. 乘积季节模型

对于非平稳的时间序列 (如我国GDP值组成的时间序列，一直呈上升趋势)，普通的ARIMA模型通过d阶差分已能很好的模拟其变化规律。

但是，在某些时间序列中，存在明显的周期性变化。这种周期是由于季节性变化 (包括天、周度等变化) 或其他一些固有的因素引起的，这类序列称为季节性序列。如一个地区的气温值序列 (每隔一小时取一个观测值) 中除了含有以天为周期的变化，还含有以年为周期的变化。在计算机领域，季节性序列也比较常见，如铁路购票站点访问量序列、网上购物站点负载等。处理季节性时间序列只用以上介绍的方法是不够的，描述这类序列的模型之一是乘积季节ARIMA模型。该模型不仅考虑了不同周期中相同周期点之间的相关性，还考虑了相同周期内不同周期点之间的关系，通常比较符合时间序列观测数据的实际情况。乘积季节ARIMA模型可表示为：ARIMA (p, d, q)(k, D, m)_S，即：

$$\mathit{\Phi }(B)U({{B}^{S}}){{\nabla }^{d}}\nabla _{S}^{D}{{X}_{t}}=\mathit{\Theta }(B)V({{B}^{S}}){{\varepsilon }_{t}}$$

(6)

$$U({{B}^{S}})=1-{{\mathit{\Gamma }}_{1}}{{B}^{S}}-{{\mathit{\Gamma }}_{2}}{{B}^{2S}}-\cdots -{{\mathit{\Gamma }}_{k}}{{B}^{kS}}$$

(7)

$$V({{B}^{S}})=1-{{H}_{1}}{{B}^{S}}-{{H}_{2}}{{B}^{2S}}-\cdots -{{H}_{m}}{{B}^{mS}}$$

(8)

$$\nabla _{S}^{D}={{(1-{{B}^{S}})}^{D}}$$

(9)

式中，S为单位周期内采样点的个数；k为季节性自回归阶数；D为季节性差分阶数；m为季节性移动平均阶数。式 (6) 中∇^d、Φ(B)、Θ(B) 的表达式分别和式 (2)、式 (3)、式 (4) 一致。Φ(B) 和Θ(B) 消除同一周期的不同周期点之间的相关性；U(B^S) 和V(B)S消除不同周期的同一周期点之间的相关性。

4. 结束语

如何评估软件系统的老化状况以适时采取再生操作是软件老化研究的核心问题之一。本文提出了一种基于乘积季节ARIMA模型的软件老化评估方法，该方法基于时序分析理论，在考虑软件老化关键指标变化的非平稳性的同时，利用了指标变化的季节性趋势，能够准确地拟合系统实际负载情况。并基于某个线上系统实际监测数据集，通过实验分析，说明了该方法的有效性。未来的工作将集中于软件老化特征的提取及不同特征相关性的分析上，以更为全面地评估软件老化状况，从而生成更为科学的软件再生策略。

参考文献 (19)

[1]	HUANG Y, KINTALA C, KOLETTIS N, et al. Software rejuvenation: Analysis, module and applications[C]// Twenty-Fifth International Symposium on Fault-Tolerant Computing, 1995, FTCS-25. [S.l.]: IEEE, 1995: 381-390.
[2]	MACHIDA F, XIANG J, TADANO K, et al. Combined server rejuvenation in a virtualized data center[C]//2012 9th International Conference on Ubiquitous Intelligence & Computing and 9th International Conference on Autonomic & Trusted Computing (UIC/ATC). [S.l.]: IEEE, 2012: 486-493.
[3]	DOMENICO C, ROBERTO N, ROBERTO P, et al. Software aging analysis of the linux operating system[C]// In Proc of Int'l Symp on Software Reliability Engineering (ISSRE2010). [S.l.]: IEEE, 2010: 71-80.
[4]	ARAUJO J, MATOS R, MACIEL P, et al. Experimental evaluation of software aging effects on the eucalyptus cloud computing infrastructure[C]//Proceedings of the Middleware 2011 Industry Track Workshop. [S.l.]: ACM, 2011: 4.
[5]	COTRONEO D, ORLANDO S, RUSSO S. Characterizing aging phenomena of the java virtual machine[C]//26th IEEE International Symposium on Reliable Distributed Systems, 2007, SRDS 2007. [S.l.]: IEEE, 2007: 127-136.
[6]	GROTTKE M, LI L, VAIDYANATHAN K, et al. Analysis of software aging in a web server[J]. IEEE Transactions on Reliability, 2006, 55(3): 411-420. doi: 10.1109/TR.2006.879609
[7]	LI L, VAIDYANATHAN K, TRIVEDI K S. An approach for estimation of software aging in a web server[C]//Empirical Software Engineering, International Symposium. [S.l.]: IEEE, 2002: 91-100.
[8]	杜小智, 齐勇, 鲁慧民, 等.视频点播系统的软件老化估计和预测[J].计算机研究与发展, 2012, 48(11): 2139-2146. http://www.cnki.com.cn/Article/CJFDTOTAL-JFYZ201111027.htm DU Xiao-zhi, QI Yong, LU Hui-min, et al. Software aging pattern analysis of the video on demand system[J]. Journal of Computer Research and Development, 2011, 48(11): 2139-2146. http://www.cnki.com.cn/Article/CJFDTOTAL-JFYZ201111027.htm
[9]	郑鹏飞, 齐勇, 陈鹏飞.软件老化的多元时间序列分析方法[J].计算机科学与探索, 2012, 6(2): 125-133. http://www.cnki.com.cn/Article/CJFDTOTAL-KXTS201202006.htm ZHENG Peng-fei, QI Yong, CHEN Peng-fei. Multivariate time series analysis of software aging[J]. Journal of Frontiers of Computer Science and Technology, 2012, 6(2): 125-133. http://www.cnki.com.cn/Article/CJFDTOTAL-KXTS201202006.htm
[10]	WILLIAMS A, ARLITT M, WILLIAMSON C, et al. Web workload characterization: Ten years later[M]//Web Content Delivery. [S.l.]: Springer US, 2005: 3-21.
[11]	ALONSO J, TORRES J, BERRAL J, et al. Adaptive on-line software aging prediction based on machine learning[C]//Proceedings of the IEEE/IFIP International Conference on Dependable Systems and Networks. Washington, DC, USA: IEEE Computer Society, 2010: 507-516.
[12]	CHATFIELD C. The analysis of time series: an introduction[M]. [S.l.]: CRC, 2013.
[13]	巩师恩, 范从来.二元劳动力结构与通货膨胀动态形成机制——基于新凯恩斯菲利普斯曲线框架[J].财经研究, 2013, 3: 75-86. http://www.cnki.com.cn/Article/CJFDTOTAL-CJYJ201303006.htm GONG Shi-en, FAN Cong-lai. Dual labor structure and dynamic formation mechanism of inflation: Based on the framework of new keynesian phillips curve[J]. Journal of Finance and Economics, 2013, 3: 75-86. http://www.cnki.com.cn/Article/CJFDTOTAL-CJYJ201303006.htm
[14]	CHEN K Y, WANG C H. A hybrid SARIMA and support vector machines in forecasting the production values of the machinery industry in Taiwan[J]. Expert Systems with Applications, 2007, 32(1): 254-264. doi: 10.1016/j.eswa.2005.11.027
[15]	TSENG F M, TZENG G H. A fuzzy seasonal ARIMA model for forecasting[J]. Fuzzy Sets and Systems, 2002, 126(3): 367-376. doi: 10.1016/S0165-0114(01)00047-1
[16]	袁小坊, 陈楠楠, 王东, 等.城域网应用层流量预测模型[J].计算机研究与发展, 2009, 46(3): 434-442. http://www.cnki.com.cn/Article/CJFDTOTAL-JFYZ200903013.htm YUAN Xiao-fang, CHEN Nan-nan, WANG Dong, et al. Traffic prediction models of traffics at application layer in metro area network[J]. Journal of Computer Research and Development, 2009, 46(3): 434-442. http://www.cnki.com.cn/Article/CJFDTOTAL-JFYZ200903013.htm
[17]	黄建国, 罗航, 王厚军, 等.运用GA-BP神经网络研究时间序列的预测[J].电子科技大学学报, 2009, 38(5): 687-692. http://www.juestc.uestc.edu.cn/CN/abstract/abstract985.shtml HUANG Jian-guo, LUO Hang, WANG Hou-jun, et al. Prediction of time sequence based on GA-BP neural net[J]. Journal of University of Electronic Science and Technology of China, 2009, 38(5): 687-692. http://www.juestc.uestc.edu.cn/CN/abstract/abstract985.shtml
[18]	吴少智, 吴跃, 徐鹏, 等.支持向量回归的颅内压时间系列无损估计方法[J].电子科技大学学报, 2011, 40(6): 956-960. http://www.juestc.uestc.edu.cn/CN/abstract/abstract1414.shtml WU Shao-zhi, WU Yue, XU Peng, et al. Support vector regression based time series mining approach for non-invasive ICP assessment[J]. Journal of University of Electronic Science and Technology of China, 2011, 40(6): 956-960. http://www.juestc.uestc.edu.cn/CN/abstract/abstract1414.shtml
[19]	R-Project. Rcasting fnctions for tme sries and lnear mdels[EB/OL]. [2015-11-01]. http://cran.r-project.org/web/packages/forecast/index.html.

[1]	何海江. 基于排序学习算法的软件错误定位模型研究 . 电子科技大学学报, 2017, 46(3): 577-582. doi: 10.3969/j.issn.1001-0548.2017.03.016
[2]	杨宏宇, 唐瑞文. 基于耗电分析的Android平台恶意软件检测 . 电子科技大学学报, 2016, 45(6): 981-985. doi: 10.3969/j.issn.1001-0548.2016.06.018
[3]	耿技, 聂鹏, 秦志光. 软件可靠性模型现状与研究 . 电子科技大学学报, 2013, 42(4): 565-570. doi: 10.3969/j.issn.1001-0548.2013.04.007
[4]	刘啸滨, 郭兵, 沈艳, 朱建, 王继禾, 伍元胜. 基于ARM处理器的嵌入式软件能耗统计模型 . 电子科技大学学报, 2012, 41(5): 770-774. doi: 10.3969/j.issn.1001-0548.2012.05.024
[5]	刘啸滨, 郭兵, 沈艳, 王继禾, 伍元胜. 嵌入式软件算法级功耗BP网络模型研究 . 电子科技大学学报, 2011, 40(6): 921-926. doi: 10.3969/j.issn.1001-0548.2011.06.022
[6]	雷航, 马成功. Markov模型的软件可靠性测试充分性问题的研究 . 电子科技大学学报, 2010, 39(1): 101-105. doi: 10.3969/j.issn.1001-0548.2010.01.023
[7]	罗光春, 孙殿余, 赖晓龙, 李炯. 行为学软件度量的研究 . 电子科技大学学报, 2009, 38(3): 423-425. doi: 10.3969/j.issn.1001-0548.2009.03.025
[8]	姚奕, 刘晓明, 黄松. 基于模糊偏序关系的软件测试评价方法 . 电子科技大学学报, 2007, 36(3): 503-505,509.
[9]	张俐佳, 唐雪飞, 汪林川. 一种面向Aspect的软件分析设计方法 . 电子科技大学学报, 2007, 36(1): 100-103.
[10]	陈伟, 丁秋林. 可扩展数据清理软件平台的研究 . 电子科技大学学报, 2006, 35(1): 100-103.
[11]	施俞行, 高峰, 罗克露, 梁军峰. 一种适用于智能家电嵌入式软件的框架构件模型 . 电子科技大学学报, 2006, 35(5): 807-810.
[12]	曹玉英, 钱光弟, 唐华. 多雷达信号模拟器的软件设计 . 电子科技大学学报, 2005, 34(5): 622-625.
[13]	韩熙利, 王厚军, 戴志坚, 田铮. 基于PXI总线的虚拟数字示波器软件设计 . 电子科技大学学报, 2005, 34(5): 676-679.
[14]	孙靖, 刘晓明. 负指数分布排错时间的软件可靠性模型 . 电子科技大学学报, 2005, 34(1): 53-56.
[15]	解梅, 张自然. SDL软件设计技术研究 . 电子科技大学学报, 2003, 32(1): 61-64.
[16]	陈文宇. 面向对象软件的测试 . 电子科技大学学报, 2001, 30(6): 613-617.
[17]	梅登华. 面向客体多机系统的软件可靠性模型 . 电子科技大学学报, 1999, 28(2): 191-194.
[18]	蒋芹, 林昌禄. 任意线天线阵分析及通用软件的实现 . 电子科技大学学报, 1998, 27(3): 284-287.
[19]	徐文芳. 化简逻辑函数软件设计 . 电子科技大学学报, 1997, 26(5): 539-543.
[20]	雷航, 熊光泽, 刘锦德. 基于任务模块的实时软件可靠性模型 . 电子科技大学学报, 1997, 26(1): 70-74.

留言板