留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于量子条件主方程的隐马尔可夫模型

李晓瑜 胡勇 卢俊邑 朱钦圣

李晓瑜, 胡勇, 卢俊邑, 朱钦圣. 基于量子条件主方程的隐马尔可夫模型[J]. 电子科技大学学报, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241
引用本文: 李晓瑜, 胡勇, 卢俊邑, 朱钦圣. 基于量子条件主方程的隐马尔可夫模型[J]. 电子科技大学学报, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241
LI Xiaoyu, HU Yong, LU Junyi, ZHU Qinsheng. Hidden Markov Model Based on the Quantum Conditional Master Equation[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241
Citation: LI Xiaoyu, HU Yong, LU Junyi, ZHU Qinsheng. Hidden Markov Model Based on the Quantum Conditional Master Equation[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241

基于量子条件主方程的隐马尔可夫模型

doi: 10.12178/1001-0548.2021241
基金项目: 国家重点研发计划(2018YFA0306703)
详细信息
    作者简介:

    李晓瑜(1984-),女,博士,副教授,主要从事量子计算与量子机器学习、人工智能与数字孪生方面的研究

    通讯作者: 李晓瑜,E-mail:xiaoyuuestc@uestc.edu.cn朱钦圣,E-mail: zhuqinsheng@uestc.edu.cn
  • 中图分类号: O41

Hidden Markov Model Based on the Quantum Conditional Master Equation

图(5)
计量
  • 文章访问数:  7041
  • HTML全文浏览量:  2745
  • PDF下载量:  60
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-07-15
  • 修回日期:  2021-08-30
  • 刊出日期:  2021-09-28

基于量子条件主方程的隐马尔可夫模型

doi: 10.12178/1001-0548.2021241
    基金项目:  国家重点研发计划(2018YFA0306703)
    作者简介:

    李晓瑜(1984-),女,博士,副教授,主要从事量子计算与量子机器学习、人工智能与数字孪生方面的研究

    通讯作者: 李晓瑜,E-mail:xiaoyuuestc@uestc.edu.cn朱钦圣,E-mail: zhuqinsheng@uestc.edu.cn
  • 中图分类号: O41

摘要: 相比于经典的隐马尔可夫模型,量子隐马尔可夫模型有着求解速度快和参数数量少的优点而备受关注。但是在从经典到量子的转变过程中,可以发现量子隐马尔可夫过程与量子开放系统有着紧密的联系。不同于前人的研究,该文从开放量子系统出发,研究了量子隐马尔可夫与开放系统所对应的主方程之间的联系,并展示了两个工作:1) 研究了量子开放系统的条件主方程和量子隐马尔可夫模型之间的联系,并以量子输运系统为例,从理论上得到了量子条件主方程和量子隐马尔可夫模型之间的对应关系;2) 提出了一种基于极大似然估计思想的学习算法来解决量子隐马尔可夫模型中的参数求解问题。

English Abstract

李晓瑜, 胡勇, 卢俊邑, 朱钦圣. 基于量子条件主方程的隐马尔可夫模型[J]. 电子科技大学学报, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241
引用本文: 李晓瑜, 胡勇, 卢俊邑, 朱钦圣. 基于量子条件主方程的隐马尔可夫模型[J]. 电子科技大学学报, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241
LI Xiaoyu, HU Yong, LU Junyi, ZHU Qinsheng. Hidden Markov Model Based on the Quantum Conditional Master Equation[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241
Citation: LI Xiaoyu, HU Yong, LU Junyi, ZHU Qinsheng. Hidden Markov Model Based on the Quantum Conditional Master Equation[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 644-649. doi: 10.12178/1001-0548.2021241
  • 近年来,随着数据信息的爆炸式增长,传统的机器学习算法已经暴露出了求解效率低、运行速度慢等弊端。为了更好地适应人类社会发展的需求,量子计算的发展成为了一个不可抵挡的趋势。量子计算利用量子比特进行数据信息的读取、存储和计算。不同于经典比特,量子比特因其叠加性和纠缠性从而实现高效的并行计算,这说明量子计算更能适应当前飞速爆炸的数据信息处理。量子计算起源于文献[1]对量子图灵机的构想和文献[2]关于绕过经典计算机模拟量子力学困难的想法。近年来,不管是量子计算的硬件实现,还是算法开发都取得了较快的发展。目前实现量子计算的实际物理系统有如下几种:离子阱[3]、中性原子[4]、光量子[5]、超导约瑟夫森结[6]、腔量子电动力学[7]、液体核磁共振[8]及量子点[9]等。其中,量子点和超导约瑟夫森结等基于固体器件的方法因其更适合集成化和小型化而被看好[10]。近年来,量子计算已在金融、哈密顿量模拟、化学、生物、制药及材料等各个领域取得成功[11-16],这些应用相比于经典计算方法都有较高的加速性和准确度。

    在机器学习领域中,隐马尔可夫模型是一个重要模型,其在股市行情预测[17-18]、自然语言处理[19-20]、蛋白质测序[21-22]等领域已有成功应用。经典的隐马尔可夫模型包含评估、解码、学习3个问题。在隐藏状态维度比较小的情况下,经典的Baum-Welch、Viterbi及EM算法可以有效地求解。但当隐马尔可夫模型的隐藏状态维度和观测空间的维度增大时,经典算法在求解速度上就显得乏力了。为了解决这个问题,人们把目光移向量子计算领域。类比于经典隐马尔可夫模型是随机过程的特点,文献[23]用随机的量子算符去测量一个开放的量子系统,将得到的结果定义为量子隐马尔可夫模型,并用Kraus算符给出了量子隐马尔可夫模型的数学定义。和经典隐马尔可夫模型类似,量子隐马尔可夫模型也是一个随机的概率图模型,也涉及经典隐马尔可夫模型所存在的3个问题,但其中最重要的问题是如何求解模型参数——Kraus算符,即学习问题。文献[24]根据EM算法的思想提出一个用数据估计Kraus算符的矩阵形式的算法,但此算法在隐藏状态维度比较小的情况下才有效且容易陷入局部最优解。不过该研究通过数值实验证明了在模型复杂度和精度上量子隐马尔可夫模型优于经典隐马尔可夫模型。文献[25]基于流形上的优化理论提出一种全新的学习算法来求解Kraus算符且解决了文献[24]算法的问题。从另一方面来讲,量子隐马尔可夫模型和一个量子开放系统相关,描述开放系统演化的重要方法之一是量子主方程。文献[26]证明了量子开放系统的量子主方程可以和一个量子隐马尔可夫模型等价,这表明量子隐马尔可夫模型可以和真实的物理系统相对应。在一个特定的量子开放系统——量子输运系统里,文献[27]提出的量子条件主方程比量子主方程能够更细致地描述电荷比特的输运过程。量子条件主方程的特点是:它体现了因测量方式所导致的量子系统内部状态变化的联系。而从文献[23]给出的量子隐马尔可夫模型最初的定义来看,量子隐马尔可夫模型也涉及对量子态的测量,这就激发了本文利用量子条件主方程来研究量子隐马尔可夫模型的兴趣,并希望从中找出量子隐马尔可夫模型更加细致的演化过程。本文以量子输运系统为例介绍了量子条件主方程,从经典隐马尔可夫模型的角度提出了量子隐马尔可夫模型,并从量子条件主方程方向推导出了量子隐马尔可夫模型,给出了量子条件主方程的系数矩阵和Kraus算符之间的关系,最后提出了求解量子隐马尔可夫模型参数的算法。

    • 主方程(master equation)是统计物理中最重要的方程之一,用以描述随机变量概率分布演化,广泛应用于金融、生物学、人口动力学、布朗运动、流体及半导体等问题。本文用${P_1}({y_1},{t_1})$来表示随机变量$Y$${t_1}$时刻取值为${y_1}$的概率。${P_2}({y_1},{t_1};{y_2},{t_2})$表示随机变量$Y$${t_1}$时刻取值为${y_1}$,在${t_2}$时刻取值为${y_2}$的联合概率。假设在${t_1}$时刻随机变量取值为${y_1}$,在经过时间间隔$\tau $后随机变量$Y$取值为${y_2}$,就有:

      $$ {P_1}({y_2},t + \tau ) = \int {{P_1}} ({y_1},{t_1}){P_{1|1}}({y_1},{t_1}|{y_2},{t_1} + \tau ){\text{d}}{y_1} $$ (1)

      式中,${P_{1|1}}({y_1},{t_1}|{y_2},{t_2})$表示在${t_1}$时刻随机变量$Y$取值为${y_1}$的条件下,在${t_2}$时刻随机变量$Y$取值为${y_2}$的概率。定义${W_{{t_1}}}({y_1},{y_2})$为系统在时间间隔$\tau $内,从状态${y_1}$${y_2}$的单位时间的转变概率密度函数,那么在时间间隔$\tau $内从状态${y_1}$${y_2}$的概率密度函数为$\tau {W_{{t_1}}}({y_1},{y_2})$,在$\tau $内不转变的概率密度函数为$1 - \tau \int {\rm{d}}y{W_{{t_1}}}({y_1},y)\text{×} $$ \delta ({y_1} - {y_2})$,因此:

      $$ \begin{split} & {P_{1|1}}({y_1},{t_1}|{y_2},{t_1} + \tau ) = \tau {W_{{t_1}}}({y_1},{y_2}) +\\ & 1 - \tau \int {{\rm{d}}y{W_{{t_1}}}({y_1},y)} \delta ({y_1} - {y_2}) + O({\tau ^2}) \end{split} $$ (2)

      把式(2)对时间步长$\tau $取极限,写成微分形式就有:

      $$ \begin{split} & \frac{{\partial {P_1}({y_2},t)}}{{\partial t}} = \int {{\rm{d}}{y_1}\{ W({y_1},{y_2}){P_1}({y_1},t)} -\\ & \qquad\quad W({y_2},{y_1}){P_1}({y_2},t)\} \end{split} $$ (3)

      称式(3)为主方程。

    • 隐马尔可夫模型是一个描述具有马尔可夫动力学演化性质的概率图模型,如图1所示。其中,${X_t}$表示$t$时刻的隐藏状态,${Y_t}$表示在$t$时刻的观测值。

      图  1  隐马尔可夫模型

      这里矩阵${{\boldsymbol{A}}}$${{\boldsymbol{C}}}$分别表示状态转移矩阵和观测矩阵,两者都是与时间无关的常数矩阵。这样一个隐马尔可夫模型可用参数$\lambda = ({\boldsymbol{A}},{\boldsymbol{C}},{\boldsymbol{\varPi }})$来定义。${\boldsymbol{\varPi }}$是初始时刻的状态向量。隐藏状态的更新和获得观测结果由式(4)给出:

      $$ \begin{split} & {X_t} = {\boldsymbol{A}}{X_{t - 1}} \\ & {Y_t} = {\boldsymbol{C}}{X_t} \\ \end{split} $$ (4)
    • 在真实的物理系统中,由于量子系统和环境有耦合作用,薛定谔方程描述量子开放系统就显得不那么有效。为了描述量子开放系统,人们提出了量子主方程。量子主方程的核心思想是,把环境的密度矩阵和量子系统的密度矩阵耦合起来,再计算出整体的密度矩阵的演化方程,然后对环境做偏迹得到系统的演化方程。后来,为了更加细致地描述系统的演化,文献[27]把环境空间进行划分,得到了量子条件主方程。为了展示如何推导出量子条件主方程,本文用一个量子输运系统进行说明。考虑一个如图2所示的量子输运系统,$L$$R$分别表示左右电极,$S$表示量子点系统,$V$表示外部施加的电压。

      图  2  量子输运系统示意图

      电子在外部电压的激励下从右边电极经过量子点系统到达左边电极。这个复合系统的哈密顿量可以表示为:

      $$ H = {H_s}(a_\mu ^\dagger ,{a_\mu }) + {H_E} + {H^\prime } $$ (5)

      式中,${H_s}(a_\mu ^\dagger ,{a_\mu })$是量子点的哈密顿量;$a_\mu ^\dagger ({a_\mu })$表示产生(湮灭)算符;${H_E}$表示左右电极的哈密顿量;${H^\prime }$表示电极和量子点耦合的哈密顿量。在量子点和电极处于弱耦合的情况下,把${H^\prime }$看成是一个微扰,根据二阶矩累积展开可以得到一个描述约化密度矩阵演化的方程:

      $$ \dot \rho (t) = - i\mathcal{L}\rho (t) - \int_0^t {{\rm{d}}\tau \langle {\mathcal{L}^\prime }(t)\mathcal{G}(t,\tau ){\mathcal{L}^\prime }(\tau ){\mathcal{G}^\dagger }(t,\tau )\rangle \rho (t)} $$ (6)

      这里刘维尔超算符定义为$\mathcal{L} = [{H_s},( \cdots )]$${\mathcal{L}^\prime } = [{H^\prime }, $$ ( \cdots )]$$\mathcal{G} = G(t,\tau ) \times ( \cdots ) \times {G^\dagger }(t,\tau )$,其中$G(t,\tau )$是和系统哈密顿量${H_S}$有关的传播子。约化密度矩阵是对复合系统的密度矩阵做偏迹得来的,即$\rho (t) = {\text{T}}{{\text{r}}_E} $$ [{\rho _T}(t)]$。式(6)中的求偏迹操作是对电极所在空间的所有自由度,这并不能反映电子输运的细致过程。当没有电子经过量子点的系统时,电极所处的空间记为${E^{(0)}}$,它由左右两个孤立电极的波函数直积而形成${E^{(0)}} = {\text{span}}\{ |{\psi _L}\rangle \otimes |{\psi _R}\rangle \} $。当$n$个电子从右电极经过量子点到左电极,此时电极所在的空间记为${E^{(n)}}(n = 1,2, \cdots )$,即把电极所处的整个希尔伯特空间按照通过的电子数进行划分,如图3所示。则式(6)中的电极空间$E$可表示为$E = { \oplus _n}{E^{(n)}}$,便得到描述量子输运系统的量子条件主方程:

      $$ \begin{split} &{{\dot \rho }^{(n)}}(t) = - i\mathcal{L}{\rho ^{(n)}}(t) -\\ & \int_0^t {{\text{d}}\tau } {\text{T}}{{\text{r}}_{{E^{(n)}}}}[{\mathcal{L}^\prime }(t)\mathcal{G}(t,\tau ){\mathcal{L}^\prime }(\tau ){\mathcal{G}^\dagger }(t,\tau ){\rho _T}(t)] \\ \end{split} $$ (7)

      式中,${\rho ^{(n)}} = {\text{T}}{{\text{r}}_{{E^{(n)}}}}[{\rho _T}(t)]$表示在$t$时间内有$n$个电子经过量子点系统时系统的密度矩阵。

      图  3  电极所在希尔伯特空间划分示意图,五边形表示电极的整个希尔伯特空间

    • 和经典的马尔可夫过程类似,量子隐马尔可夫模型也可以用一组参数${\lambda _Q} = (\rho _0 ,\{ K\} )$来定义。${\rho _0}$与经典隐马尔可夫模型中的初始状态向量${\boldsymbol{\varPi }}$对应,Kraus算符$K$与矩阵${\boldsymbol{A}}$${\boldsymbol{C}}$相对应。对照经典隐马尔可夫模型的示意图,可以用如图4的线路模型来表示量子隐马尔可夫。

      图  4  量子隐马尔可夫模型的线路表示

      图中,${K_y}$表示输出为$y$时的Kraus算符,${\rho _t}$${\rho _{t - 1}}$分别表示$t$时刻和$t - 1$时刻的密度矩阵。其中,${\rho _0}$表示初始时刻的密度矩阵;$\{ K\} $是一组Kraus算符且对所有的算符满足条件$\displaystyle\sum\limits_m {K_m^\dagger {K_m}} = I$。和经典隐马尔可夫模型相比,这里Kraus算符$\{ K\} $同时起着演化隐藏状态和测量输出结果的作用。由于量子坍缩的特性,在没有对系统进行观测时,密度矩阵演化遵循以下计算:

      $$ \rho (t + \Delta t) = \sum\limits_m {{K_m}\rho (t)K_m^\dagger } $$ (8)

      当对系统进行观测后(假设观测结果为$y$),量子隐马尔可夫的状态掩护和测量结果用式(9)表示:

      $$ \rho (t + \Delta t) = \frac{{{K_y}\rho (t)K_y^\dagger }}{{{\text{Tr}}[{K_y}\rho (t)K_y^\dagger ]}} $$ (9)

      观测到结果为$y$的概率为$P(y,t) = {\text{Tr}}[{K_y}\rho (t)K_y^\dagger ]$。为了求解量子隐马尔可夫的模型参数$\{ K\} $,文献[24]提出了一个极大似然估计法。假设已知一组观测序列${y_1},{y_2}, \cdots ,{y_T}$,根据这组观测数据可以构造极大似然函数:

      $$ L = - \ln {\text{tr}}\left( {{K_{{y_T}}} \cdots {K_{{y_2}}}{K_{{y_1}}}{\rho _0}K_{{y_1}}^\dagger K_{{y_2}}^\dagger \cdots K_{{y_T}}^\dagger } \right) $$ (10)

      然后,量子隐马尔可夫模型的参数求解问题就可以转化成一个有约束的优化问题:

      $$ \begin{split} & {\min _K}\quad L(\{ K\} ) \\ & {\text{s}}{\text{.t}}{\text{.}}\quad \quad \sum\nolimits_m {K_m^\dagger {K_m}} = I,{K_m} \in {\mathbb{C}^{n \times n}} \end{split} $$ (11)

      ${K_m}$按列堆叠成一个新的维度为$nm \times n$的新矩阵${\boldsymbol{\kappa}} = {[{K_1},{K_2}, \cdots ,{K_m}]^{\rm{T}}}$。则式(11)中的约束条件就可以改写为:

      $$ {{\boldsymbol{\kappa}} ^{\boldsymbol{\dagger}} }{\boldsymbol{\kappa}} = I,{\boldsymbol{\kappa}} \in {\mathbb{C}^{nm \times n}} $$ (12)

      文献[28]指出式(12)中的${\boldsymbol{\kappa}} $处于Stiefel流形上,并且可以用如下的梯度下降算法来求解:

      $$ \begin{split} & G = \frac{{\partial L}}{{\partial {\boldsymbol{\kappa}} }} \\ & {\boldsymbol{\kappa}} = {\boldsymbol{\kappa}} - \tau U{(I + \frac{\tau }{2}{V^\dagger }U)^{ - 1}}{V^\dagger }{\boldsymbol{\kappa}} \end{split} $$ (13)

      式中,$U = [G,{\boldsymbol{\kappa}} ]$$V = [{\boldsymbol{\kappa}} , - G]$$\tau $是一个处在区间$[0,1]$的实数。

    • 本节将以量子输运系统为例展示量子条件主方程和量子隐马尔可夫模型之间的关系,并给出求解与量子条件主方程相对应的量子隐马尔可夫模型参数$\{ K\} $的算法。

      假设式(5)中的哈密顿量具有如下形式:

      $$ \begin{split} & H={H}_{S}({a}_{\mu }^\dagger,{a}_{\mu })+{\displaystyle \sum _{\alpha =L,R}{\displaystyle \sum _{\mu k}\epsilon_{\alpha \mu k}{d}_{\alpha \mu k}^\dagger{d}_{\alpha \mu k}}}+\\ & \quad {\displaystyle \sum _{\alpha =L,R}{\displaystyle \sum _{\mu k}({t}_{\alpha \mu k}{a}_{\mu }^\dagger{d}_{\alpha \mu k}+\text{H}\text{.c}\text{.})}}\end{split} $$ (14)

      式中,$L$$R$分别表示左右电极;$\mu $$k$代表电子处在的能级和、自旋状态和动量;$d_{\alpha \mu k}^\dagger $${d_{\alpha \mu k}}$分别表示处于电极中的电子的产生和湮灭算符;${t_{\alpha \mu k}}$代表电极和量子点系统的耦合强度。文献[27]详细介绍了在哈密顿量为式(14)情况下的量子主方程和量子条件主方程的具体形式,其中,量子主方程为:

      $$ \dot \rho (t) = - i\mathcal{L}\rho (t) - \frac{1}{2}\sum\limits_\mu {\{ [a_\mu ^\dagger ,A_\mu ^{( - )}\rho (t) - \rho (t)A_\mu ^{( + )}] + {\text{H}}{\text{.c}}{\text{.}}\} } $$ (15)

      量子条件主方程为:

      $$ \begin{split} & {{\dot \rho }^{(n)}}(t) = - i\mathcal{L}{\rho ^{(n)}}(t) - \frac{1}{2}{\sum _\mu }\{ [a_\mu ^\dagger A_\mu ^{( - )}{\rho ^{(n)}} + {\rho ^{(n)}}A_\mu ^{( + )}a_\mu ^\dagger - \\ &\qquad A_{L\mu }^{( - )}{\rho ^{(n)}}a_\mu ^\dagger - a_\mu ^\dagger {\rho ^{(n)}}A_{L\mu }^{( + )} - A_{R\mu }^{( - )}{\rho ^{(n - 1)}}a_\mu ^\dagger -\\ &\qquad\qquad a_\mu ^\dagger {\rho ^{(n + 1)}}A_{R\mu }^{( + )}] + {\text{H}}{\text{.c}}{\text{.}}\} \end{split} $$ (16)

      式(15)和式(16)之间的关系是:对式(16)按照指标$n$求和就可以导出式(15)。为了方便讨论,本文先考虑在量子点系统中只有单能级参与电荷比特输运的情况下:$A_L^{( + )} = {\Gamma _L}a$$A_L^{( - )} = 0$$A_R^{( - )} = {\varGamma _R}a$$A_R^{( + )} = 0$${\varGamma _L}$${\varGamma _R}$是非负实数。则式(15)和式(16)可以简化为:

      $$ \dot \rho (t) = - i\mathcal{L}\rho (t) - \frac{1}{2}\{ [{a^\dagger },{\varGamma _R}a\rho - \rho {\varGamma _L}a] + {\text{H}}{\text{.c}}{\text{.}}\} $$ (17)
      $$ \begin{split} & {{\dot \rho }^{(n)}}(t) = - i\mathcal{L}{\rho ^{(n)}}(t) - \frac{1}{2}\{ [{\varGamma _R}{a^\dagger }a{\rho ^{(n)}} + {\varGamma _L}{\rho ^{(n)}}a{a^\dagger }- \\ &\quad {\varGamma _L}{a^\dagger }{\rho ^{(n)}}a - {\varGamma _R}a{\rho ^{(n - 1)}}{a^\dagger }] + {\text{H}}{\text{.c}}{\text{.}}\} \end{split} $$ (18)

      经过推导[29],式(17)和式(18)可以写成如下形式:

      $$ \tag{19a}\rho (t + \Delta t) = \sum\limits_{m = 0}^2 {{K_m}\rho (t)K_m^\dagger } $$
      $$\tag{19b} {\rho ^{(n)}}(t + \Delta t) = \sum\limits_{m = 0}^1 {{K_m}{\rho ^{(n)}}(t)K_m^\dagger + {K_2}{\rho ^{(n - 1)}}(t)K_2^\dagger } $$

      在更一般的情况下,式(15)和式(16)可以写成如下形式:

      $$\tag{20a} \rho (t + \Delta t) = \sum\limits_{m = 0}^{2\mu } {{K_m}\rho (t)K_m^\dagger } $$
      $$ \begin{split} & {\rho ^{(n)}}(t + \Delta t) = \sum\limits_{m = 0}^{2\mu } {{K_m}{\rho ^{(n)}}(t)K_m^\dagger }+ \\ & \sum\limits_{m = 0}^\mu {K_m^\prime {\rho ^{(n - 1)}}(t)K_m^{\prime \dagger } + K_m^{\prime \prime }{\rho ^{(n + 1)}}(t)K_m^{\prime \prime \dagger }} \end{split}\tag{20b} $$

      以上结果表明,描述输运系统的量子主方程和量子条件主方程经过等价变换可以写成和量子隐马尔可夫模型类似的形式。从式(20a)可以看出,原有的整体密度矩阵$\rho $的演化被拆分成了若干个小密度矩阵的演化,因此本文认为量子隐马尔可夫模型中原有的状态可以被拆分成若干个子状态从而实现更加精确的Kraus算符的求解。式(20a)和式(20b)均可以表示量子隐马尔可夫模型,它们两者之间的关系是:对式(20b)按照指标$n$进行求和可得到类似于式(20a)的形式,不同之处在于对于每一个给定的观测值$y$,式(20a)所表示的模型只有一个Kraus算符相对应,而式(20b)所表示的模型有3个Kraus算符相对应。虽然在参数数量上式(20b)是式(20a)的3倍,但由于式(20b)描述了隐藏状态内部细致的联系,求解出的Kraus的准确率将会高于式(20a)所描述的模型。所以,本文基于式(20b)提出了一种求解Kraus算符的方法。为了更加清晰地描述式(20b)所表示的量子隐马尔可夫模型,用图5展示了式(20b)对应的图模型。其中双点划线箭头代表属于$\{ K\} $中的Kraus算符${K_m}$,黑色实线(虚线)箭头代表属于$\{ {K^\prime }\} $中的Kraus算符$K_m^\prime $,单点划线箭头代表属于$\{ {K^{\prime \prime }}\} $中的Kraus算符${K^{\prime \prime }}$。可以发现图5类似于神经网络,图5中的计算是按时刻进行前向传播的过程。假设已知一组序列${y_0},{y_1}, \cdots ,{y_T}$,经过$T$个时刻的前向传播,可以按照如下的迭代方式构造出似然函数:

      图  5  式(20b)对应的展开计算图

      $$ \begin{split} & L = - \ln {{{\rm{tr}}}} ({\rho _T}) \\ & {\rho _T} = \rho _T^{(0)} + \rho _T^{(1)} + \cdots + \rho _T^{( \cdots )} \\ & \rho _T^{(0)} = {K_{{y_{T - 1}}}}\rho _{T - 1}^{(0)}K_{{y_{T - 1}}}^\dagger + K_{{y_{T - 1}}}^{\prime \prime }\rho _{T - 1}^{(1)}K_{{y_{T - 1}}}^{''\dagger } \\ & \rho _T^{(1)} = K_{{y_{T - 1}}}^\prime \rho _{T - 1}^{(0)}K_{{y_{T - 1}}}^{\prime \dagger } + {K_{{y_{T - 1}}}}\rho _{T - 1}^{(1)}K_{{y_{T - 1}}}^\dagger + \\ & K_{{y_{T - 1}}}^{\prime \prime }\rho _{T - 1}^{(2)}K_{{y_{T - 1}}}^{''\dagger } \\ & \vdots \\ & \rho _T^{(n)} = K_{{y_{T - 1}}}^\prime \rho _{T - 1}^{(n - 1)}K_{{y_{T - 1}}}^{\prime \dagger } + {K_{{y_{T - 1}}}}\rho _{T - 1}^{(n)}K_{{y_{T - 1}}}^\dagger +\\ & K_{{y_{T - 1}}}^{\prime \prime }\rho _{T - 1}^{(n + 1)}K_{{y_{T - 1}}}^{''\dagger } \\ \end{split} $$ (21)

      然后用似然函数对所有可能的Kraus算符求导,再进行梯度下降算法就可以求出满足给定序列似然函数最小的Kraus算符的矩阵形式。本文把上述步骤总结为一个求解Kraus算符的算法,具体步骤如下。

      输入:一组时间序列数据、初始时刻的密度矩阵和Kraus算符的初始值

      输出:Kraus算符的矩阵数值形式

      1) 初始化$t = 0$时刻的密度矩阵$\rho _0^{(0)},\rho _0^{(1)}, \cdots ,\rho _0^{(n)}$以及Kraus算符;

      2) 带入式(21)进行向前传播计算到最后时刻$T$

      3) 按照式(21)计算似然函数值;

      4) 计算似然函数对所有Kraus算符的导数,并用梯度下降法更新Kraus算符,带入步骤2)和3)中,直到似然函数梯度趋近于0;

      5) 结束计算,报告Kraus算符的值。

    • 本文以量子输运系统为例研究了量子隐马尔可夫模型以及对应的参数求解算法。在参与输运能级不同的条件下,建立了条件主方程与量子隐马尔可夫模型的对应关系,即给出了量子主方程的系数和量子隐马尔可夫模型中的状态演化的Kraus算符的对应关系。最后提出了一种求解量子隐马尔可夫模型的参数的算法。本文首次把实际的物理系统和机器学习中的量子隐马尔可夫模型联系起来,为进一步用真实物理系统来实现机器学习算法奠定基础。量子隐马尔可夫模型的优势在于求解速度快和精度高,因此能在隐藏状态维度较大的模型参数求解问题上表现出优越性。同时由于量子条件主方程中指标$n$对状态空间的划分,使得量子隐马尔可夫模型中的隐藏状态划分更加精细,从而实现更高精度的求解。

参考文献 (29)

目录

    /

    返回文章
    返回