基于量子条件主方程的隐马尔可夫模型

2021-10-13 04:50李晓瑜胡勇卢俊邑朱钦圣
电子科技大学学报 2021年5期
关键词:马尔可夫量子电极

李晓瑜,胡勇,卢俊邑,朱钦圣*

(1.电子科技大学信息与软件工程学院 成都 610054;2.电子科技大学物理学院 成都 610054)

近年来,随着数据信息的爆炸式增长,传统的机器学习算法已经暴露出了求解效率低、运行速度慢等弊端。为了更好地适应人类社会发展的需求,量子计算的发展成为了一个不可抵挡的趋势。量子计算利用量子比特进行数据信息的读取、存储和计算。不同于经典比特,量子比特因其叠加性和纠缠性从而实现高效的并行计算,这说明量子计算更能适应当前飞速爆炸的数据信息处理。量子计算起源于文献[1]对量子图灵机的构想和文献[2]关于绕过经典计算机模拟量子力学困难的想法。近年来,不管是量子计算的硬件实现,还是算法开发都取得了较快的发展。目前实现量子计算的实际物理系统有如下几种:离子阱[3]、中性原子[4]、光量子[5]、超导约瑟夫森结[6]、腔量子电动力学[7]、液体核磁共振[8]及量子点[9]等。其中,量子点和超导约瑟夫森结等基于固体器件的方法因其更适合集成化和小型化而被看好[10]。近年来,量子计算已在金融、哈密顿量模拟、化学、生物、制药及材料等各个领域取得成功[11-16],这些应用相比于经典计算方法都有较高的加速性和准确度。

在机器学习领域中,隐马尔可夫模型是一个重要模型,其在股市行情预测[17-18]、自然语言处理[19-20]、蛋白质测序[21-22]等领域已有成功应用。经典的隐马尔可夫模型包含评估、解码、学习3 个问题。在隐藏状态维度比较小的情况下,经典的Baum-Welch、Viterbi 及EM 算法可以有效地求解。但当隐马尔可夫模型的隐藏状态维度和观测空间的维度增大时,经典算法在求解速度上就显得乏力了。为了解决这个问题,人们把目光移向量子计算领域。类比于经典隐马尔可夫模型是随机过程的特点,文献[23]用随机的量子算符去测量一个开放的量子系统,将得到的结果定义为量子隐马尔可夫模型,并用Kraus 算符给出了量子隐马尔可夫模型的数学定义。和经典隐马尔可夫模型类似,量子隐马尔可夫模型也是一个随机的概率图模型,也涉及经典隐马尔可夫模型所存在的3 个问题,但其中最重要的问题是如何求解模型参数——Kraus 算符,即学习问题。文献[24]根据EM 算法的思想提出一个用数据估计Kraus 算符的矩阵形式的算法,但此算法在隐藏状态维度比较小的情况下才有效且容易陷入局部最优解。不过该研究通过数值实验证明了在模型复杂度和精度上量子隐马尔可夫模型优于经典隐马尔可夫模型。文献[25]基于流形上的优化理论提出一种全新的学习算法来求解Kraus 算符且解决了文献[24]算法的问题。从另一方面来讲,量子隐马尔可夫模型和一个量子开放系统相关,描述开放系统演化的重要方法之一是量子主方程。文献[26]证明了量子开放系统的量子主方程可以和一个量子隐马尔可夫模型等价,这表明量子隐马尔可夫模型可以和真实的物理系统相对应。在一个特定的量子开放系统——量子输运系统里,文献[27]提出的量子条件主方程比量子主方程能够更细致地描述电荷比特的输运过程。量子条件主方程的特点是:它体现了因测量方式所导致的量子系统内部状态变化的联系。而从文献[23]给出的量子隐马尔可夫模型最初的定义来看,量子隐马尔可夫模型也涉及对量子态的测量,这就激发了本文利用量子条件主方程来研究量子隐马尔可夫模型的兴趣,并希望从中找出量子隐马尔可夫模型更加细致的演化过程。本文以量子输运系统为例介绍了量子条件主方程,从经典隐马尔可夫模型的角度提出了量子隐马尔可夫模型,并从量子条件主方程方向推导出了量子隐马尔可夫模型,给出了量子条件主方程的系数矩阵和Kraus 算符之间的关系,最后提出了求解量子隐马尔可夫模型参数的算法。

1 背景

1.1 主方程

主方程(master equation)是统计物理中最重要的方程之一,用以描述随机变量概率分布演化,广泛应用于金融、生物学、人口动力学、布朗运动、流体及半导体等问题。本文用P1(y1,t1)来表示随机变量Y在t1时刻取值为y1的概率。P2(y1,t1;y2,t2)表示随机变量Y在t1时刻取值为y1,在t2时刻取值为y2的联合概率。假设在t1时刻随机变量取值为y1,在经过时间间隔τ 后随机变量Y取值为y2,就有:

式中,P1|1(y1,t1|y2,t2)表示在t1时刻随机变量Y取值为y1的条件下,在t2时刻随机变量Y取值为y2的概率。定义Wt1(y1,y2)为系统在时间间隔 τ内,从状态y1到y2的单位时间的转变概率密度函数,那么在时间间隔τ内从状态y1到y2的概率密度函数为τWt1(y1,y2),在τ内不转变的概率密度函数为,因此:

把式(2)对时间步长 τ取极限,写成微分形式就有:

称式(3)为主方程。

1.2 隐马尔可夫模型

隐马尔可夫模型是一个描述具有马尔可夫动力学演化性质的概率图模型,如图1 所示。其中,Xt表示t时刻的隐藏状态,Yt表示在t时刻的观测值。

图1 隐马尔可夫模型

这里矩阵A和C分别表示状态转移矩阵和观测矩阵,两者都是与时间无关的常数矩阵。这样一个隐马尔可夫模型可用参数λ=(A,C,Π)来定义。Π是初始时刻的状态向量。隐藏状态的更新和获得观测结果由式(4)给出:

2 量子条件主方程和量子隐马尔可夫模型

2.1 量子条件主方程

在真实的物理系统中,由于量子系统和环境有耦合作用,薛定谔方程描述量子开放系统就显得不那么有效。为了描述量子开放系统,人们提出了量子主方程。量子主方程的核心思想是,把环境的密度矩阵和量子系统的密度矩阵耦合起来,再计算出整体的密度矩阵的演化方程,然后对环境做偏迹得到系统的演化方程。后来,为了更加细致地描述系统的演化,文献[27]把环境空间进行划分,得到了量子条件主方程。为了展示如何推导出量子条件主方程,本文用一个量子输运系统进行说明。考虑一个如图2 所示的量子输运系统,L和R分别表示左右电极,S表示量子点系统,V表示外部施加的电压。

图2 量子输运系统示意图

电子在外部电压的激励下从右边电极经过量子点系统到达左边电极。这个复合系统的哈密顿量可以表示为:式中,Hs(,aµ)是量子点的哈密顿量;(aµ)表示产生(湮灭)算符;HE表示左右电极的哈密顿量;H′表示电极和量子点耦合的哈密顿量。在量子点和电极处于弱耦合的情况下,把H′看成是一个微扰,根据二阶矩累积展开可以得到一个描述约化密度矩阵演化的方程:

这里刘维尔超算符定义为L=[Hs,(···)],L′=[H′,(···)]。G=G(t,τ)×(···)×G†(t,τ),其中G(t,τ)是和系统哈密顿量HS有关的传播子。约化密度矩阵是对复合系统的密度矩阵做偏迹得来的,即ρ(t)=TrE[ρT(t)]。式(6)中的求偏迹操作是对电极所在空间的所有自由度,这并不能反映电子输运的细致过程。当没有电子经过量子点的系统时,电极所处的空间记为E(0),它由左右两个孤立电极的波函数直积而形成E(0)=span{|ψL〉⊗|ψR〉}。当n个电子从右电极经过量子点到左电极,此时电极所在的空间记为E(n)(n=1,2,···),即把电极所处的整个希尔伯特空间按照通过的电子数进行划分,如图3 所示。则式(6)中的电极空间E可表示为E=⊕nE(n),便得到描述量子输运系统的量子条件主方程:

图3 电极所在希尔伯特空间划分示意图,五边形表示电极的整个希尔伯特空间

式中,ρ(n)=TrE(n)[ρT(t)]表示在t时间内有n个电子经过量子点系统时系统的密度矩阵。

2.2 量子隐马尔科夫模型

和经典的马尔可夫过程类似,量子隐马尔可夫模型也可以用一组参数λQ=(ρ0,{K})来定义。ρ0与经典隐马尔可夫模型中的初始状态向量 Π对应,Kraus 算符K与矩阵A和C相对应。对照经典隐马尔可夫模型的示意图,可以用如图4 的线路模型来表示量子隐马尔可夫。

图4 量子隐马尔可夫模型的线路表示

图中,Ky表示输出为y时的Kraus 算符,ρt和ρt−1分别表示t时刻和t−1时刻的密度矩阵。其中,ρ0表示初始时刻的密度矩阵;{K}是一组Kraus算符且对所有的算符满足条件。和经典隐马尔可夫模型相比,这里Kraus 算符 {K}同时起着演化隐藏状态和测量输出结果的作用。由于量子坍缩的特性,在没有对系统进行观测时,密度矩阵演化遵循以下计算:

当对系统进行观测后(假设观测结果为y),量子隐马尔可夫的状态掩护和测量结果用式(9)表示:

观测到结果为y的概率为P(y,t)=Tr[Kyρ(t)]。为了求解量子隐马尔可夫的模型参数 {K},文献[24]提出了一个极大似然估计法。假设已知一组观测序列y1,y2,···,yT,根据这组观测数据可以构造极大似然函数:

然后,量子隐马尔可夫模型的参数求解问题就可以转化成一个有约束的优化问题:

把Km按列堆叠成一个新的维度为nm×n的新矩阵κ=[K1,K2,···,Km]T。则式(11)中的约束条件就可以改写为:

文献[28]指出式(12)中的 κ处于Stiefel 流形上,并且可以用如下的梯度下降算法来求解:

式中,U=[G,κ];V=[κ,−G];τ是一个处在区间[0,1]的实数。

2.3 量子条件主方程和量子隐马尔可夫模型的联系

本节将以量子输运系统为例展示量子条件主方程和量子隐马尔可夫模型之间的关系,并给出求解与量子条件主方程相对应的量子隐马尔可夫模型参数 {K}的算法。

假设式(5)中的哈密顿量具有如下形式:

式中,L和R分别表示左右电极;µ和k代表电子处在的能级和、自旋状态和动量;和dαµk分别表示处于电极中的电子的产生和湮灭算符;tαµk代表电极和量子点系统的耦合强度。文献[27]详细介绍了在哈密顿量为式(14)情况下的量子主方程和量子条件主方程的具体形式,其中,量子主方程为:

量子条件主方程为:

式(15)和式(16)之间的关系是:对式(16)按照指标n求和就可以导出式(15)。为了方便讨论,本文先考虑在量子点系统中只有单能级参与电荷比特输运的情况下:,ΓL和 ΓR是非负实数。则式(15)和式(16)可以简化为:

经过推导[29],式(17)和式(18)可以写成如下形式:

在更一般的情况下,式(15)和式(16)可以写成如下形式:

以上结果表明,描述输运系统的量子主方程和量子条件主方程经过等价变换可以写成和量子隐马尔可夫模型类似的形式。从式(20a)可以看出,原有的整体密度矩阵 ρ的演化被拆分成了若干个小密度矩阵的演化,因此本文认为量子隐马尔可夫模型中原有的状态可以被拆分成若干个子状态从而实现更加精确的Kraus 算符的求解。式(20a)和式(20b)均可以表示量子隐马尔可夫模型,它们两者之间的关系是:对式(20b)按照指标n进行求和可得到类似于式(20a)的形式,不同之处在于对于每一个给定的观测值y,式(20a)所表示的模型只有一个Kraus 算符相对应,而式(20b)所表示的模型有3 个Kraus 算符相对应。虽然在参数数量上式(20b)是式(20a)的3 倍,但由于式(20b)描述了隐藏状态内部细致的联系,求解出的Kraus 的准确率将会高于式(20a)所描述的模型。所以,本文基于式(20b)提出了一种求解Kraus 算符的方法。为了更加清晰地描述式(20b)所表示的量子隐马尔可夫模型,用图5 展示了式(20b)对应的图模型。其中双点划线箭头代表属于 {K}中的Kraus 算符Km,黑色实线(虚线)箭头代表属于{K′}中的Kraus 算符Km′,单点划线箭头代表属于{K′′}中的Kraus 算符K′′。可以发现图5 类似于神经网络,图5 中的计算是按时刻进行前向传播的过程。假设已知一组序列y0,y1,···,yT,经过T个时刻的前向传播,可以按照如下的迭代方式构造出似然函数:

图5 式(20b)对应的展开计算图

然后用似然函数对所有可能的Kraus 算符求导,再进行梯度下降算法就可以求出满足给定序列似然函数最小的Kraus 算符的矩阵形式。本文把上述步骤总结为一个求解Kraus 算符的算法,具体步骤如下。

3 结束语

本文以量子输运系统为例研究了量子隐马尔可夫模型以及对应的参数求解算法。在参与输运能级不同的条件下,建立了条件主方程与量子隐马尔可夫模型的对应关系,即给出了量子主方程的系数和量子隐马尔可夫模型中的状态演化的Kraus 算符的对应关系。最后提出了一种求解量子隐马尔可夫模型的参数的算法。本文首次把实际的物理系统和机器学习中的量子隐马尔可夫模型联系起来,为进一步用真实物理系统来实现机器学习算法奠定基础。量子隐马尔可夫模型的优势在于求解速度快和精度高,因此能在隐藏状态维度较大的模型参数求解问题上表现出优越性。同时由于量子条件主方程中指标n对状态空间的划分,使得量子隐马尔可夫模型中的隐藏状态划分更加精细,从而实现更高精度的求解。

猜你喜欢
马尔可夫量子电极
《量子电子学报》征稿简则
决定未来的量子计算
针对电极事故的控制系统方案应用
新量子通信线路保障网络安全
一种简便的超声分散法制备碳量子点及表征
多状态马尔可夫信道的时延分析
三维电极体系在废水处理中的应用
三维镍@聚苯胺复合电极的制备及其在超级电容器中的应用
基于SOP的核电厂操纵员监视过程马尔可夫模型
应用马尔可夫链对品牌手机市场占有率进行预测