-
随着集成系统复杂性的日益增加,系统建模和可靠性保证面临越来越大的挑战。在可靠性分析的各种场景中,虽然指数分布模型已被较广泛地用于建立系统寿命模型[1],但由于指数分布的风险函数是恒定的,因此直接将指数分布用于描述系统寿命,存在无法描述损伤过程和无法准确反映故障累积效果的问题,最典型的例子是将指数分布简单应用于描述人类死亡率和电子设备生命周期,效果不够理想。对这类过程,通常需要采用具备浴盆特征的风险函数所对应的寿命分布来准确描述。韦伯分布作为指数分布的概括,以及它的带有浴盆型风险函数的扩展得到了重视,并被广泛应用于许多领域[2-4]。
目前关于指数分布推广的研究,主要集中在广义韦伯分布的累积分布函数的参数加法上。大多数情况下,这些韦伯类型的一般化是通过简单的参数加法技术来实现的。此方法一般除保留了原有的参数,还引入了一些新的参数,使得模型对寿命数据的拟合,多数情况下优于没有新参数的模型。
基于参数加法,文献[5]提出了四参数广义指数模型,称为广义指数化线性指数分布。结果表明,这一扩展可以导出一系列指数型分布,如指数化韦伯分布。结合韦伯分布和改进的五参数韦伯分布,文献[6]提出了一种修正的韦伯分布扩展。基于此,文献[7]又提出了一个离散五参数修正型的韦伯分布,并发现基于这种分布的离散数据拟合胜过其他3个修正的韦伯模型。
尽管韦伯推广在寿命模型中具有良好的效果,但由于参数估计过程复杂,参数物理意义不明确(至少这些参数在这些广义的分布中,不能直接指示系统的当前状态),限制了韦伯推广的应用[8-10]。
本文提出了一种广义双参数指数分布,它可以作为可靠性分析的基础,例如浴盆型风险函数的构造和有用寿命预测。与传统的参数加法不同,本文用最大熵原理得到广义指数分布。从物理角度看,这种广义分布的主要优点是两个参数都具有明显的物理意义。一个参数具有分形意义,表示系统的稳定程度;另一个参数则与系统的平均行为密切相关。两个参数均可以用来刻画系统的性能。
-
基于Rényi熵,可以通过最大熵方法,得到广义指数分布:
$${f_q}(x) = \frac{1}{\lambda }{\left(1 + \frac{{q - 1}}{q}\right)^{q/(1 - q)}}{\left(1 - \frac{1}{\lambda }\frac{{q - 1}}{q}(x - \lambda )\right)^{1/(q - 1)}}$$ (1) 式中,q是分形参数;λ是分布的期望值;q和λ都是非负的。根据参数q和λ的值,概率密度函数
${f_q}$ 会有不同的形态。图1所示为不同的参数q时固定均值λ下的${f_q}$ 形态。可以看出q-指数分布是单峰分布,也是右偏分布。因此,q-指数分布可以被考虑用于对寿命相关的可靠性分析。计算可得,q-指数分布的累积分布函数是:
$${F_q}(x) = \frac{{qx}}{{\lambda (2q - 1)}}\left[ {{}_2{F_1}\left( {\frac{1}{{1 - q}},1,2,\frac{{(q - 1)x}}{{\lambda (2q - 1)}}} \right)} \right]$$ (2) 式中,
${}_2{F_1}$ 是高斯超几何函数。 -
下面将给出q-指数分布的两个主要的衍生分布,它们在生存分析、压缩感知、剩余使用寿命预测和其他的可靠性相关领域有潜在实用价值。
首先,当q→1时,该分布简化为均值为λ的指数分布:
$$ \underset{q\to 1}{\rm{lim}}{f}_{q}(x)=\frac{1}{\lambda }{{\rm{e}}}^{-\frac{x}{\lambda }}\quad \lambda >0,x>0$$ 其次,使用式(1)可以得到一个广义的q-拉普拉斯分布:
$${g_q}(x) = \frac{1}{{2\lambda }}{\left(1 + \frac{{q - 1}}{q}\right)^{q/(1 - q)}}{\left[ {1 - \frac{1}{\lambda }\frac{{q - 1}}{q}\left(\left| {\left. x \right|} \right. - \lambda \right)} \right]^{{1 / {(q - 1)}}}}$$ (3) 图2显示了不同参数值q和固定λ值(λ=10)的广义拉普拉斯分布。拉普拉斯分布在压缩感知领域起到了重要作用[11-13],这里衍生出的拉普拉斯分布在统计信号处理和机器学习领域具有潜在应用价值。
-
生存函数是表示一系列事件的随机变量函数,通常用于表示一些基于时间的系统失败或死亡概率。假设T表示产品使用寿命,其分布函数为F(t),那么该产品寿命大于t的概率为:
S(t)=P(T>t)=1−F(t)
式中,S(t)被称为生存函数。在此基础上,可用风险函数刻画已有效使用到t时刻的产品,在[t,t+Δt]极短时间内“死亡”的风险:
$$h(t) = \mathop {\lim }\limits_{\Delta t \to 0} \frac{{P(t \leqslant T < t + \Delta t)}}{{S(t)\Delta t}}$$ 据此计算可得q-指数分布的生存函数:
$$S(x) = 1 - {}_2{F_1}\left( {1 - \frac{1}{{1 - q}},1,2,\frac{{(q - 1)x}}{{\lambda (2q - 1)}}} \right)\frac{{qx}}{{\lambda (2q - 1)}}$$ (4) 风险函数:
$$ h(x) = \dfrac{{\dfrac{1}{\lambda }{{\left( {1 + \dfrac{{q - 1}}{q}} \right)}^{q/(1 - q)}}}}{{1 - F\dfrac{{qx}}{{\lambda (2q - 1)}}{{\left( {1 - \dfrac{{q - 1}}{{\lambda q}}\left( {x - \lambda } \right)} \right)}^{1/\left( {q - 1} \right)}}}} $$ (5) 式中,
$F{ = _2}{F_1}\left( {\dfrac{1}{{1 - q}},1,2,\dfrac{{(q - 1)x}}{{\lambda (2q - 1)}}} \right)$ 。图3为具有不同参数值的风险函数图像,可以看到风险函数具有许多不同的形状,q-指数分布中当q>1,显示递增特性;当q<1,显示递减性。
注意到q-指数分布的风险函数呈现多态性,其中部分具有澡盆特征。可根据实际使用环境,选择恰当的q-指数建模风险过程,从而可以提高寿命估计精度。
-
q-指数分布
${f_q}$ 的均值是λ,方差是:$$\begin{split} & \qquad\;\;{\mu ^2} = D(x) = \int\nolimits_0^\infty {x^2}{f_q}(x){\rm{d}}x = \\ & \frac{{{{(2 - 1/q)}^{q/(1 - q)}}{q^{1/(1 - q)}}{{(2q - 1)}^{q/(q - 1)}}}}{{3q - 2}}{\lambda ^2} \end{split}$$ 可以得到分布的k阶矩为:
$\begin{aligned} & \;\;\; m{\mu ^k} = \displaystyle\int_0^\infty {{x^r}{\rm{d}}F(x)} = \displaystyle\int_0^\infty {{x^r}{f_q}(x){\rm{d}}x}= \\& \int_0^\infty {{x^r}\frac{1}{\lambda }{{\left(1 + \frac{{q - 1}}{q}\right)}^{q/(1 - q)}}{{\left( {1 - \frac{1}{\lambda }\frac{{q - 1}}{q}(x - \lambda )} \right)}^{{1 / {(q - 1)}}}}{\rm{d}}x} = \\& \;\;\; \frac{1}{\lambda }\frac{q}{{2q - 1}}\frac{{{x^{k + 1}}}}{{k + 1}}\left[ {{}_2{F_1}\left( {\frac{1}{{1 - q}},1 + k,2 + k,\frac{{(q - 1)x}}{{\lambda (2q - 1)}}} \right)} \right] \end{aligned}$ 式中,k表示分布的k阶矩。
-
为了在不同场景下选择恰当的参数,这里给出两种估计q-指数分布中参数的方法:最大似然估计法(maximum likelihood estimation,MLE)和信息似然估计法。最大似然估计法适用于满足高斯分布的数据集,信息似然估计法适用于高斯和非高斯分布的数据集。
-
根据式(1),建立对数似然函数:
$$\begin{split} & {\psi _L} = \log L = n\ln \left( {1/\lambda } \right) + \frac{{nq}}{{1 - q}}\ln \left( {1 + \frac{{q - 1}}{q}} \right) + \\ & \quad\frac{1}{{q - 1}}\sum\limits_{i = 1}^n {\ln \left( {1 - \frac{1}{\lambda }\frac{{q - 1}}{q}({x_i} - \lambda )} \right)} \end{split} $$ 然后有:
$$\begin{aligned} & \qquad\qquad\qquad \frac{{\partial {\psi _L}}}{{\partial q}} = \frac{1}{{{{(q - 1)}^2}(2q - 1)}}\times\\ & \qquad\bigg[ (2{q^2} - 3q + 1)\bigg/{q^2}\sum\limits_{i = 1}^n { - \frac{{{x_i}/\lambda - 1}}{{{x_i}/q(\lambda - 1) - {x_i}/\lambda + 2}}} \bigg] + \\ & \frac{1}{{{{(q - 1)}^2}(2q - 1)}}(1 - 2q)\sum\limits_{i = 1}^n \log \left( {{x_i}/q(\lambda - 1) - {x_i}/\lambda + 2} \right) +\\ & \qquad\;\;\frac{1}{{{{(q - 1)}^2}(2q - 1)}} n\left( {1 - q + (2q - 1)\log (2 - 1/q)} \right) \end{aligned} $$ $$\frac{{\partial {\psi _L}}}{{\partial \lambda }} = - \frac{n}{\lambda } + \sum\limits_{i = 1}^n {\frac{{{x_i}}}{{{\lambda ^2}q - \lambda (q - 1)(x{}_i - \lambda )}}} $$ q和λ可以通过求解方程组(6)获得:
$$\left\{ \begin{aligned} & \frac{{\partial {\psi _L}}}{{\partial \lambda }} = 0 \\ & \frac{{\partial {\psi _L}}}{{\partial q}} = 0 \end{aligned} \right.$$ (6) -
另一个估计Rényi信息未知参数的方法,将信息论和谱估计相结合,可在最小先验的条件下,取得经验风险最小的参数估计值[14]。具体步骤如下:
首先,已知Rényi信息频谱定义为:
$${{\cal L}_R}(\lambda ) = \frac{1}{{1 - \lambda }}\log \left(\int {{f^\lambda }(x){\rm{d}}x}\right) $$ (7) 当
$\lambda \to 1$ ,$$\mathop {\lim }\limits_{\lambda \to 1} {{\cal L}_R}(\lambda ) = \int {f(x)\log f(x){\rm{d}}x} $$ (8) Rényi信息频谱趋向于香农熵。
同时,Rényi信息的频谱梯度被定义为:
$${{\cal L}_R}(1) = - \frac{1}{2}D(\log (f(X)))$$ (9) 式中,
$D( \cdot )$ 是随机变量x的方差。令
${\phi _f}: = - 2{L_R}(1)$ 一方面,将式(1)中的
${f_q}$ 代入式(9)计算${\varphi _f}$ ,根据文献[13]可得:$${\phi _f} = - 2\mathop {\lim }\limits_{\lambda \to 1} {{\cal L}_R}(\lambda ) = \frac{1}{{{q^2}}}$$ (10) 另一方面,使用核方法估计
${\varphi _f}$ 。具体而言,${\varphi _f}$ 可以通过核方法计算如下:$${\hat \varphi _f} = {\hat \Delta _2} - \hat \Delta _1^2$$ (11) 式中,
$${\hat \Delta _i} = \int {{f_n}(x){{\log }^i}{f_n}} (x){\rm{d}}x\quad i = 1,2$$ (12) ${f_n}(x)$ 是为无参数内核密度估计量,定义为:$${f_n}(x) = \frac{1}{n}\sum\limits_{i = 1}^n {\frac{1}{{{b_n}}}} K\left( {\frac{{x - {X_i}}}{{{b_n}}}} \right)$$ 假设
$K( \cdot )$ 为有界变分的概率密度函数(核函数),其支撑集位于部分有限区间。${X_i}$ 是随机变量$X$ 的样本。设${b_n}$ 为满足以下收敛条件的序列:$$\mathop {\lim }\limits_{n \to \infty } {b_n} = 0,\quad \mathop {\lim }\limits_{n \to \infty } n{b_n} = \infty ,\quad \mathop {\lim }\limits_{n \to \infty } \frac{{\log {b_n}^{ - 1}}}{{n{b_n}}} = 0$$ 比较式(10)和式(11),式(1)中的参数q可以通过求解式(13)得到:
$$q = \frac{1}{{\sqrt {\mathop {{\phi _f}}\limits^ \wedge } }}$$ (13) -
本文使用了3个与可靠性相关的实验去评估q-指数分布在可靠性分析中的有效性,包括白血病病人生存期分析、设备寿命预测以及锂电池寿命预测。
第一个数据集是40个白血病病人的生存期数据[15],它具有不断增加的风险率。第二个数据集来自50个组件的样本[16],具有浴盆型风险的风险率。利用K-S统计量评估了q-指数与上述两个著名数据集的拟合结果,并计算出赤池信息准则(AIC)值和贝叶斯信息准则(BIC)值,用于比较它和其他广义指数分布的拟合优越度。第三个实验建立了关于3组锂电池的容量退化模型,与普通指数分布的结果相比,利用q-指数分布可以得到更准确的剩余寿命预测结果。
-
该数据集由文献[15]给出,数据源自沙特阿拉伯卫生医院部门,如表1所示。它记录了40名白血病患者的生命周期。
表 1 40名白血病患者的生存期
患者
编号生存期/天 患者
编号生存期/天 患者
编号生存期/天 患者
编号生存期/天 1 115 11 807 21 1222 31 1578 2 181 12 865 22 1251 32 1578 3 255 13 924 23 1277 33 1599 4 418 14 983 24 1290 34 1603 5 441 15 1024 25 1357 35 1605 6 461 16 1062 26 1369 36 1696 7 516 17 1063 27 1408 37 1735 8 739 18 1165 28 1455 38 1799 9 743 19 1191 29 1478 39 1815 10 789 20 1222 30 1549 40 1852 基于双参数模型的生存函数经验估计如图4所示,图5描述了模型的经验和拟合风险函数。同时,由于该数据集所示患者死亡风险是随时间上升的,因此,韦伯分布、线性失效率分布(linear failure rate distribution, LFR)和q-指数分布均可作为数据拟合的候选者。为了判断上述哪个密度函数更适合数据拟合,用MLE方法对3种模型参数进行了估计,如表2所示。然后利用几种不同的测试统计测度对拟合结果进行了评估。
由统计学可知,K-S值表示分隔程度,一般大于0.2即表明模型具有良好的分隔性能。由表3可知,q-指数分布与韦伯分布、指数分布和LFR分布的K-S均有良好分隔能力。同时,由表3列出的对数似然函数值可知,q-指数分布与韦伯分布、指数分布的最大似然函数值均在相近水平,所以q-指数分布可以充分利用先验信息获得对未知参数的最大似然估计。
表 2 白血病数据集各模型参数的MLE值
模型 参数的最大似然估计值 LFR(a,b) $\hat a = 9.501 \times {10^{ - 4}},\hat b = 4.229 \times {10^{ - 7}}$ 指数分布 $\hat \lambda = 1\;137$ 韦伯分布 $\hat \sigma = 1\;143.3,\hat c = 1.055$ q-指数分布 $\hat q = 1.9,\hat \lambda = 1\;137$ 表 3 白血病数据的对数似然函数值和K-S
模型 对数似然函数值 K-S LFR(a,b) −318.458 0.385 指数分布 −321.446 0.308 韦伯分布 −319.874 0.282 q-指数分布 −299.511 0.205 根据统计学原理,p值是判断原假设是否成立的依据,一般认为p>0.05,说明两组样本无统计学差异。由表4可知,q-指数分布与韦伯分布的p值在相近水平,q-指数分布具备描述寿命分布的能力。同时,通过计算AIC或者BIC值,相比指数分布、韦伯分布和LFR分布,不难发现q-指数分布具有更小的AIC或BIC值,因此q-指数分布具有更好的寿命数据拟合性。
表 4 白血病数据集各模型的p值、AIC和BIC
模型 p值 AIC BIC LFR(a,b) 0.006 640.916 644.2938 指数分布 0.050 644.892 646.5808 韦伯分布 0.090 643.747 647.1258 q-指数分布 0.085 603.022 606.3998 -
如表5所示,这是由文献[17]提供的50台设备的寿命数据,已有研究人员利用韦伯分布[18-21]、指数分布[5]、LFR分布[22]分析了这个数据集。表6给出了所使用的每个分布参数的MLE估计值。图6和图7分别给出了设备数据集的经验参数生存函数以及风险函数。
表 5 50台设备的生存期
设备
编号生存期/月 设备
编号生存期/月 设备
编号生存期/月 设备
编号生存期/月 1 0.1 2 0.2 3 1 4 1 5 1 6 1 7 1 8 1 9 3 10 6 11 7 12 11 13 12 14 47 15 50 16 55 17 18 18 18 19 18 20 18 21 18 22 21 23 32 24 36 25 40 26 45 27 46 28 60 29 63 30 63 31 67 32 67 33 67 34 67 35 72 36 75 37 79 38 82 39 82 40 83 41 84 42 84 43 84 44 85 45 85 46 85 47 85 48 85 49 86 50 86 表 6 设备时间数据集各模型参数的MLE值
模型 参数的最大似然估计值 LFR(a,b) $\hat a = 0.014,\hat b = 2.4 \times {10^{ - 4}}$ 指数分布 $\hat \lambda = 45.686$ 韦伯分布 $\hat \sigma = 44.913,\hat c = 0.949$ q-指数分布 $\hat q = 24.213\;2,\hat \lambda = 42.372\;8$ 已知Aarset数据集的风险函数具有浴盆形状。不失一般性和为了分析简便,本文只专注风险函数中单调递增部分,使用双参数分布来近似风险函数。为了进行参数比较,使用似然检验去对比原假设和备选假设。此外,利用AIC[23]在多个模型中选择最优模型。最适合数据拟合的模型应具有最低的AIC。表7和表8给出了对数似然函数值、K-S值、p值、AIC和BIC值[24]。
表 7 设备时间数据集各模型的对数似然函数值和K-S值
模型 对数似然函数值 K-S LFR(a,b) −238.0640 0.258 指数分布 −241.0896 0.226 韦伯分布 −241.0020 0.226 q-指数分布 −219.7252 0.204 表 8 设备时间数据的P值,AIC和BIC
模型 p值 AIC BIC LFR(a,b) 0.253 480.128 483.9520 指数 0.408 484.179 486.0912 韦伯 0.408 486.004 489.8280 q-指数分布 0.607 443.450 459.0100 对于Aarset数据集,由表7可知q-指数分布的K-S值大于0.2,所以具备良好的分隔能力。由所列对数似然函数值可知,q-指数分布与韦伯分布、指数分布的对数似然函数值在相近水平,说明q-指数分布亦可以充分利用先验信息获得对未知参数的最大似然估计。
由表8知,q-指数分布的p值大于0.05,因而具备描述Aarset数据集的能力。同时,可以看出q-指数分布在本文所提到的所有分布中具有最小的AIC和最小的BIC值。这说明在所列分布中,q-指数分布能够最好地拟合本数据集。
-
估计剩余使用寿命(remaining useful life,RUL)有助于降低实际系统中发生灾难性事件的概率[25]。为了研究所提出的q-指数分布的有效性,本文采用美国宇航局(NASA) Prognostics公司(PCoE)的3个电池数据集来预测锂电池的剩余使用寿命。在该数据集中用电池容量来表征寿命,容量越低,剩余寿命越少。
3组电池(即蓄电池005、蓄电池006和蓄电池 018)属于同一类型,通过在室温下工作在3种不同的状态下(充电、放电和阻抗)进行加速老化试验[26]。这种电池的额定容量是2 Ah,当电池容量减少到额定容量的70%(从2 Ah减少到1.4 Ah)时,电池就会达到使用寿命终止(EOL)标准,容量数据如图8所示。
容量退化过程可用状态空间模型来描述:
$$\left\{ \begin{aligned} & {x_k} = h({x_{k - 1}}) + {w_{k - 1}} \\ &{y_k} = {x_k} + {\upsilon _k} \\ \end{aligned} \right.$$ (14) 式中,
${x_k}$ 表示k周期的真实容量值;${y_k}$ 表示k周期的预测值;${w_{k - 1}}$ 表示环境的扰动;${\upsilon _k}$ 表示观测噪声。分别采用指数分布和q-指数分布作为
$h({x_k})$ 来描述容量状态转换,采用粒子滤波算法[27]自适应地确定预测容量值,并使用最大似然法确定指数分布和q-指数分布的相应参数。由粒子滤波基本原理可知,按照频率派的概率观点[24],这里剩余寿命预测的概率分布可以通过对粒子滤波每个周期间隔内的粒子个数计数得到。间隔内粒子数越多,说明该区间代表大多数情况下的寿命长度。
在电池005实验中,共有168个循环样本,分别用前60个、80个和100个样本点训练粒子滤波器,设定粒子滤波预测的起始时间分别为T=60、80、100。当起始点T=100时,RUL的分布直方图和RUL预测结果如图9、图10和表9所示。其中,图9b使用参数q=1.001。
此外,为了定量评价预测精度,将预测误差定义如下:
$${e_{{\rm{RUL}}}} = {\rm{RU}}{{\rm{L}}_P} - {\rm{RU}}{{\rm{L}}_t}$$ (15) 式中,RULP表示预测的周期数;RULt表示真实的周期数。
如图10(其中q=1.001)所示,电池005的真实寿命周期的结束数为124,使用q-指数分布相对能更好地拟合实际值。根据表9,在指数分布假设下,在起始预测点T=60时,粒子滤波算法预测的寿命周期数为152。根据上述定义,指数分布模型预测误差为:
$${e_{{\rm{RUL}}}} = {\rm{RU}}{{\rm{L}}_p} - {\rm{RU}}{{\rm{L}}_t} = 152 - 124 = 28$$ 表 9 不同起始点T下锂电池的RUL预测结果
电池编号 T 实际
寿命(RULt)指数分布预测寿命 q-指数分布预测寿命 q 指数分布预测误差 q-指数分布预测误差 q-指数分
布比指数
分布预测
误差缩小/%电池005 60 124 152 147 1.001 28 23 17.857 80 124 138 134 1.001 14 10 28.571 100 124 131 128 1.001 7 4 42.857 电池006 60 108 106 106 1.010 −2 −2 0 80 108 99 99 1.010 −9 −9 0 100 108 107 107 1.010 −1 −1 0 电池018 60 96 92 94 0.990 −4 −2 50.000 80 96 103 101 0.990 7 5 28.571 100 96 94 95 0.990 −2 −1 50.000 同样以T=60为起始预测点,q-指数分布在q=1.001的情况下,预测误差为23,小于指数分布假设的结果。因此,提出的q-指数分布辅助粒子滤波算法对电池005的剩余使用寿命有更准确的估计。
同理,观察图11(其中q=1.010)与图12(其中q=0.990)中电池006和电池018的结果,结合表9,发现对于电池006而言,真实寿命周期的结束数为108,而在指数分布假设下,在起始预测点T=60、80、100时,使用q-指数分布获得预测结果均与指数分布的相同,说明基于q-指数分布的粒子滤波方法至少可以获得和指数分布假设下一样的估计精度。
对于电池018而言,真实寿命周期的结束数为96,在指数分布假设下,在起始预测点T=60时,预测的寿命周期数为92,预测误差为−4。而q-指数分布在q=0.990的情况下,如表9所示的同一点的预测误差为−2,误差预测减小了50%。对于T=80和T=100的起始预测点,使用q-指数分布均可取得更准确的效果。
q-Exponential Distribution Based on Rényi Entropy and Its Application on Reliability Analysis
-
摘要: 基于最大Rényi熵原理,在归一化和均值约束下,提出了一种具有封闭表达式的双参数广义指数分布, 记为q-指数分布。该文研究了该分布的统计性质,指出可以分别利用极大似然法和信息似然法估计q-指数分布参数, 并将该分布用于可靠性分析。利用两个已知的数据集进行了验证,实验结果表明,所提出的q-指数分布比其他常用分布,如韦伯分布和线性失效率分布,能够更好地拟合数据集。此外,锂电池剩余寿命估计实验表明,采用q-指数分布比采用传统指数分布,估计精度至少提高17.857%。Abstract: We propose a two-parameter generalized exponential distribution with closed-form expression based on the maximum Rényi entropy principle under the normalization and mean constraints, which is referred as the q-exponential distribution. The statistical properties of this distribution are investigated. The maximum likelihood method and information likelihood method are used to estimate the parameters of the proposed distribution, respectively. Two well-known data sets are employed to evaluate the q-exponential distribution, and the experimental results demonstrate that the proposed distribution can fit the data sets better than other well-known distributions, such as Weibull distribution and linear failure rate distribution. Additionally, the experiment results of life estimation of the Li-ion batteries prove that compared with the exponential distribution, the proposed distribution can give more accurate prediction. In the last experiment, the estimation accuracy is improved by at least 17.857%.
-
表 1 40名白血病患者的生存期
患者
编号生存期/天 患者
编号生存期/天 患者
编号生存期/天 患者
编号生存期/天 1 115 11 807 21 1222 31 1578 2 181 12 865 22 1251 32 1578 3 255 13 924 23 1277 33 1599 4 418 14 983 24 1290 34 1603 5 441 15 1024 25 1357 35 1605 6 461 16 1062 26 1369 36 1696 7 516 17 1063 27 1408 37 1735 8 739 18 1165 28 1455 38 1799 9 743 19 1191 29 1478 39 1815 10 789 20 1222 30 1549 40 1852 表 2 白血病数据集各模型参数的MLE值
模型 参数的最大似然估计值 LFR(a,b) $\hat a = 9.501 \times {10^{ - 4}},\hat b = 4.229 \times {10^{ - 7}}$ 指数分布 $\hat \lambda = 1\;137$ 韦伯分布 $\hat \sigma = 1\;143.3,\hat c = 1.055$ q-指数分布 $\hat q = 1.9,\hat \lambda = 1\;137$ 表 3 白血病数据的对数似然函数值和K-S
模型 对数似然函数值 K-S LFR(a,b) −318.458 0.385 指数分布 −321.446 0.308 韦伯分布 −319.874 0.282 q-指数分布 −299.511 0.205 表 4 白血病数据集各模型的p值、AIC和BIC
模型 p值 AIC BIC LFR(a,b) 0.006 640.916 644.2938 指数分布 0.050 644.892 646.5808 韦伯分布 0.090 643.747 647.1258 q-指数分布 0.085 603.022 606.3998 表 5 50台设备的生存期
设备
编号生存期/月 设备
编号生存期/月 设备
编号生存期/月 设备
编号生存期/月 1 0.1 2 0.2 3 1 4 1 5 1 6 1 7 1 8 1 9 3 10 6 11 7 12 11 13 12 14 47 15 50 16 55 17 18 18 18 19 18 20 18 21 18 22 21 23 32 24 36 25 40 26 45 27 46 28 60 29 63 30 63 31 67 32 67 33 67 34 67 35 72 36 75 37 79 38 82 39 82 40 83 41 84 42 84 43 84 44 85 45 85 46 85 47 85 48 85 49 86 50 86 表 6 设备时间数据集各模型参数的MLE值
模型 参数的最大似然估计值 LFR(a,b) $\hat a = 0.014,\hat b = 2.4 \times {10^{ - 4}}$ 指数分布 $\hat \lambda = 45.686$ 韦伯分布 $\hat \sigma = 44.913,\hat c = 0.949$ q-指数分布 $\hat q = 24.213\;2,\hat \lambda = 42.372\;8$ 表 7 设备时间数据集各模型的对数似然函数值和K-S值
模型 对数似然函数值 K-S LFR(a,b) −238.0640 0.258 指数分布 −241.0896 0.226 韦伯分布 −241.0020 0.226 q-指数分布 −219.7252 0.204 表 8 设备时间数据的P值,AIC和BIC
模型 p值 AIC BIC LFR(a,b) 0.253 480.128 483.9520 指数 0.408 484.179 486.0912 韦伯 0.408 486.004 489.8280 q-指数分布 0.607 443.450 459.0100 表 9 不同起始点T下锂电池的RUL预测结果
电池编号 T 实际
寿命(RULt)指数分布预测寿命 q-指数分布预测寿命 q 指数分布预测误差 q-指数分布预测误差 q-指数分
布比指数
分布预测
误差缩小/%电池005 60 124 152 147 1.001 28 23 17.857 80 124 138 134 1.001 14 10 28.571 100 124 131 128 1.001 7 4 42.857 电池006 60 108 106 106 1.010 −2 −2 0 80 108 99 99 1.010 −9 −9 0 100 108 107 107 1.010 −1 −1 0 电池018 60 96 92 94 0.990 −4 −2 50.000 80 96 103 101 0.990 7 5 28.571 100 96 94 95 0.990 −2 −1 50.000 -
[1] BARLOW R E, PROSCHAN F. Mathematical theory of reliability[M]. [S. l.]: Society for Industrial and Applied Mathematics, 1996. [2] WEIBULL W. Wide applicability[J]. Journal of Applied Mechanics, 1951, 103(730): 293-297. [3] 邓炳杰, 陈晓慧. Weibull分布下基于遗传算法的设备寿命预测[J]. 数学杂志, 2016, 36(2): 385-392. doi: 10.3969/j.issn.0255-7797.2016.02.021 DENG Bing-jie, CHEN Xiao-hui. Device life prediction based on genetic algorithm under Weibull distribution[J]. Journal of Mathematics, 2016, 36(2): 385-392. doi: 10.3969/j.issn.0255-7797.2016.02.021 [4] 吕佳, 高慧, 华思蕊. Weibull分布和指数分布以及均匀分布的关系研究[J]. 甘肃科学学报, 2017, 29(3): 1-3. LÜ Jia, GAO Hui, HUA Si-rui. Study on the relationship between Weibull distribution and exponential distribution and uniform distribution[J]. Journal of Gansu Sciences, 2017, 29(3): 1-3. [5] SARHAN A M, AHMAD A A, ALASBAHI I A. Exponentiated generalized linear exponential distribution[J]. Applied Mathematical Modelling, 2013, 37(5): 2838-2849. doi: 10.1016/j.apm.2012.06.019 [6] ALMALKI S J, YUAN J. A new modified Weibull distribution[J]. Reliability Engineering & System Safety, 2013, 111: 164-170. [7] ALMALKI S J, NADARAJAH S. A new discrete modified Weibull distribution[J]. IEEE Trans on Reliability, 2014, 63(1): 68-80. doi: 10.1109/TR.2014.2299691 [8] JIANG H, XIE M, TANG L C. On MLEs of the parameters of a modified Weibull distribution for progressively type-2 censored samples[J]. Journal of Applied Statistics, 2010, 37(4): 617-627. doi: 10.1080/02664760902803289 [9] SOLIMAN A A, ABDELLAH A H, ABOUELHEGGAG N A, et al. Modified Weibull model: A Bayes study using MCMC approach based on progressive censoring data[J]. Reliability Engineering & System Safety, 2012, 100: 48-57. [10] UPADHYAY S K, GUPTA A. A Bayes analysis of modified Weibull distribution via Markov chain Monte Carlo simulation[J]. Journal of Statistical Computation and Simulation, 2010, 80(3): 241-254. doi: 10.1080/00949650802600730 [11] MALLOY M L, NOWAK R D. Near-optimal adaptive compressed sensing[J]. IEEE Trans on Information Theory, 2014, 60(7): 4001-4012. doi: 10.1109/TIT.2014.2321552 [12] ZHANG P, GAN L, SUN S, et al. Modulated unit-norm tight frames for compressed sensing[J]. IEEE Trans on Signal Processing, 2015, 63(15): 3974-3985. doi: 10.1109/TSP.2015.2425809 [13] BI D, XIE Y, LI X, et al. A sparsity basis selection method for compressed sensing[J]. IEEE Signal Processing Letters, 2015, 22(10): 1738-1742. doi: 10.1109/LSP.2015.2429748 [14] SONG K S. Rényi information, loglikelihood and an intrinsic distribution measure[J]. Journal of Statistical Planning and Inference, 2001, 93(1-2): 51-69. doi: 10.1016/S0378-3758(00)00169-5 [15] MAHMOUD M A W, ALAM F M A. The generalized linear exponential distribution[J]. Statistics & probability Letters, 2010, 80(11-12): 1005-1014. [16] ABOUAMMOH A M, ABDULGHANI S A, QAMBER I S. On partial orderings and testing of new better than renewal used classes[J]. Reliability Engineering & System Safety, 1994, 43(1): 37-41. [17] AARSET M V. How to identify a bathtub hazard rate[J]. IEEE Trans on Reliability, 1987, 36(1): 106-108. [18] MUDHOLKAR G S, SRIVASTAVA D K. Exponentiated Weibull family for analyzing bathtub failure-rate data[J]. IEEE Trans on Reliability, 1993, 42(2): 299-302. doi: 10.1109/24.229504 [19] XIE M, LAI C D. Reliability analysis using an additive Weibull model with bathtub-shaped failure rate function[J]. Reliability Engineering & System Safety, 1996, 52(1): 87-93. [20] LAI C D, XIE M, MURTHY D N P. A modified Weibull distribution[J]. IEEE Trans on Reliability, 2003, 52(1): 33-37. doi: 10.1109/TR.2002.805788 [21] SILVA G O, ORTEGA E M M, CORDEIRO G M. The beta modified Weibull distribution[J]. Lifetime Data Analysis, 2010, 16(3): 409-430. doi: 10.1007/s10985-010-9161-1 [22] AKAIKE H. A new look at the statistical model identification[J]. IEEE Trans on Automatic Control, 1974, 19(6): 716-723. doi: 10.1109/TAC.1974.1100705 [23] 朱立蓉, 徐哲峰. Z_p上一种指数函数的分布[J]. 纯粹数学与应用数学, 2020, 36(2): 161-167. doi: 10.3969/j.issn.1008-5513.2020.02.002 ZHU Li-rong, XU Zhe-feng. The distribution of an exponential function over Z_p[J]. Pure and Applied Mathematics, 2020, 36(2): 161-167. doi: 10.3969/j.issn.1008-5513.2020.02.002 [24] SCHWARZ G. Estimating the dimension of a model[J]. The Annals of Statistics, 1978, 6(2): 461-464. [25] DONG G, CHEN Z, WEI J, et al. Battery health prognosis using Brownian motion modeling and particle filtering[J]. IEEE Trans on Industrial Electronics, 2018, 65(11): 8646-8655. doi: 10.1109/TIE.2018.2813964 [26] GOEBEL K, SAHA B, SAXENA A, et al. Prognostics in battery health management[J]. IEEE Instrumentation & Measurement Magazine, 2008, 11(4): 33-40. [27] ARULAMPALAM M S, MASKELL S, GORDON N, et al. A tutorial on particle filters for online nonlinear/non-Gaussian Bayesian tracking[J]. IEEE Trans on Signal Processing, 2002, 50(2): 174-188. doi: 10.1109/78.978374