量子自注意力神经网络的时间序列预测

陈欣; 李闯; 金凡

doi:10.12178/1001-0548.2022340

量子自注意力神经网络的时间序列预测

doi: 10.12178/1001-0548.2022340

1.
中金金融认证中心有限公司，北京 100176

详细信息

作者简介:
陈欣，博士，高级工程师，主要从事机器学习与量子计算等方面的研究

通讯作者: 李闯，E-mail：zhangqh@zhejianglab.com

Research on Time Series Prediction via Quantum Self-Attention Neural Networks

1.
China Financial Certification Authority, Beijing 100176, China

摘要: 在“量子−经典”混合模式下，设计了多头量子自注意力神经网络预测模型（MQSAPN）用以进行时间序列预测，模型包括多头量子自注意力模块以及变分量子线路预测模块两部分。通过对输入数据按时间步长分别进行量子态编码以及 K 、 Q 、 V 的计算，借鉴已有研究使用高斯函数进行自注意力系数的估计方式，将量子自注意力特征提取后的数据再次编码到变分预测线路中，经过线路演化及测量，最终获取预测结果。完整流程与模型搭建均采用VQNet框架实现。在天气学变量的时间序列预测任务中，该模型表现出与经典多头自注意力模型预测模型以及长短期记忆单元网络模型相当的预测精度。此外，相对于同样是量子机器学习的data-reuploading变分线路而言，在近乎同等规模线路深度与参数量的前提下，表现出更高的预测精度，这也进一步验证了引入量子自注意力机制的有效性。值得指出的是，作为预测部分的变分线路会随着输入数据量的增多（如时间窗加长、特征变量规模增加等），其参数量与线路深度也会显著增加，尽管多层QSA能够较好地进行特征表达，但依然有可能因遇到“贫瘠高原”困难而成为整个网络的瓶颈。
- 量子计算 /
- 量子机器学习 /
- 自注意力机制 /
- 时间序列预测
Abstract: A Multi-head Quantum Self-Attention Predict Network (MQSAPN) is designed in hybrid manner, which could be used in time-series forecasting. MQSAPN comprises two components, one is the Multi-head Quantum Self-Attention (MQSA) model, and the other is the predicting Variational Quantum Circuits (pVQC). When fed with sequential inputs, the MQSA firstly computes the key, query, and value vectors corresponding to all time steps through the variational circuits, and then according to exist studies, the attention is estimated via Gaussian function. With residual link on input and multi-head features, the output of MQSA were pushed to pVQC part, which was encoded into quantum circuit again, and the prediction would be ultimately calculated out by measurements on observables. The prediction results of MQSAPN numerical experiments on atmospheric variables indicate the effectiveness of quantum self-attention, by comparison with the results of a data-reuploading VQC model with almost same amount of parameters. The accuracy of predicting is close to classic multi-head transformer model and LSTM net. To be noted, as input time window extends or the more features are adopted, the number of parameters of pVQC will also increases correspondingly, which makes the pVQC part become the bottleneck of the whole model due to ‘barren plateau’ problems during training process.
- quantum computing /
- quantum machine learning /
- self-attention /
- time series prediction

图 1 经典自注意力机制计算流程

下载: 全尺寸图片幻灯片

图 2 多头量子自注意力网络架构

下载: 全尺寸图片幻灯片

图 3 计算K、Q以及V的量子线路

下载: 全尺寸图片幻灯片

图 4 single-head量子自注意力网络层

下载: 全尺寸图片幻灯片

图 5 原始数据（训练时段）变化序列

下载: 全尺寸图片幻灯片

图 6 训练数据集上5个变量间连续800天的相关系数热图

下载: 全尺寸图片幻灯片

图 7 时间序列预测方案

下载: 全尺寸图片幻灯片

图 8 采用4量子比特构建预测模块（角度编码线路与变分预测线路）

下载: 全尺寸图片幻灯片

图 9 Data-reuploading 变分量子线路

下载: 全尺寸图片幻灯片

表 1 目标变量与特征变量

目标变量	特征变量
APRE	APRE，WS
MINT	MINT，MAXT
MAXT	MAXT，MINT
RH	RH，MAXT
WS	WS，APRE

下载: 导出CSV

表 2 时间序列预测实验设计方案

训练方案	SH/MH	QSA层数	线路门数	参数门数	最大深度	时间窗/天
t4-layer3-sh	Single-Head	3	81	52	14	4
t4-layer6-sh	Single-Head	6	126	88	14	4
t8-layer3-sh	Single-Head	3	137	96	26	8
t4-layer1-mh	Multi-Head	1	108	48	14	4
t4-layer3-mh	Multi-Head	3	204	96	20	4
t8-layer3-mh	Multi-Head	3	168	96	30	8
DRL-8	–	–	130	48	40	8

下载: 导出CSV

表 3 测试集预测精度

序号	方案	气压	最低温度	最高温度	相对湿度	风速
（1）	t4-layer3-sh	0.9989	0.9365	0.9314	0.9139	0.5157
（2）	t4-layer6-sh	0.9989	0.9381	0.9303	0.9309	0.5326
（3）	t8-layer3-sh	0.9988	0.9413	0.9329	0.9311	0.5486
（4）	t4-layer1-mh	0.9988	0.9403	0.9267	0.9278	0.5041
（5）	t4-layer3-mh	0.9988	0.9410	0.9302	0.9237	0.5540
（6）	t8-layer3-mh	0.9988	0.9431	0.9312	0.9172	0.5113
（7）	DRL-8	0.9987	0.9288	0.9260	0.9227	0.4267
（8）	CMHSA-t8	0.9987	0.9401	0.9326	0.9236	0.5531
（9）	CMHSA-t4	0.9987	0.9421	0.9311	0.9254	0.5434
（10）	LSTM-t4	0.9988	0.9402	0.9288	0.9330	0.4453
（11）	LSTM-t8	0.9989	0.9403	0.9308	0.9280	0.5122

下载: 导出CSV

[1]	BROOKS M. Beyond quantum supremacy: The hunt for useful quantum computers[J]. Nature, 2019, 574(7776): 19-22. doi: 10.1038/d41586-019-02936-3
[2]	PRESKILL J. Quantum computing in the NISQ era and beyond[J]. Quantum, 2018, 2: 79. doi: 10.22331/q-2018-08-06-79
[3]	FEDOROV D A, PENG B, GOVIND N, et al. VQE method: A short survey and recent developments[J]. Materials Theory, 2022, 6(1): 1-21. doi: 10.1186/s41313-021-00031-7
[4]	MOLL N, BARKOUTSOS P, BISHOP L S, et al. Quantum optimization using variational algorithms on near-term quantum devices[J]. Quantum Science and Technology, 2018, 3(3): 030503. doi: 10.1088/2058-9565/aab822
[5]	BIAMONTE J, WITTEK P, PANCOTTI N, et al. Quantum machine learning[J]. Nature, 2017, 549(7671): 195-202. doi: 10.1038/nature23474
[6]	HAVLÍČEK V, CÓRCOLES A D, TEMME K, et al. Supervised learning with quantum-enhanced feature spaces[J]. Nature, 2019, 567(7747): 209-212. doi: 10.1038/s41586-019-0980-2
[7]	BOIXO S, ISAKOV S V, SMELYANSKIY V N, et al. Characterizing quantum supremacy in near-term devices[J]. Nature Physics, 2018, 14(6): 595-600. doi: 10.1038/s41567-018-0124-x
[8]	HUANG H Y, BROUGHTON M, MOHSENI M, et al. Power of data in quantum machine learning[J]. Nature Communications, 2021, 12(1): 1-9. doi: 10.1038/s41467-020-20314-w
[9]	BOX G E, PIERCE D A. Distribution of residual autocorrelations in autoregressive-integrated moving average time series models[J]. Journal of the American Statistical Association, 1970, 65(332): 1509-1526. doi: 10.1080/01621459.1970.10481180
[10]	ELMAN J L. Finding structure in time[J]. Cognitive Science, 1990, 14(2): 179-211. doi: 10.1207/s15516709cog1402_1
[11]	PASCANU R, MIKOLOV T, BENGIO Y. Understanding the exploding gradient problem[EB/OL]. [2022-08-20]. https://arxiv.org/pdf/1211.5063v1.pdf.
[12]	GRAVES A. Supervised sequence labelling with recurrent neural networks[M]. [S.l.]: Springer, 2012.
[13]	CHUNG J, GULCEHRE C, CHO K, et al. Empirical evaluation of gated recurrent neural networks on sequence modeling[EB/OL]. [2022-08-25]. https://arxiv.org/pdf/1412.3555.pdf.
[14]	BENGIO Y, SIMARD P, FRASCONI P. Learning long-term dependencies with gradient descent is difficult[J]. IEEE Transactions on Neural Networks, 1994, 5(2): 157-166. doi: 10.1109/72.279181
[15]	VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[J]. Advances in Neural Information Processing Systems, 2017, 30: 5998-6008.
[16]	LI S, JIN X, XUAN Y, et al. Enhancing the locality and breaking the memory bottleneck of transformer on time series forecasting[C]//Proceedings of the 33rd International Conference on Neural Information Processing Systems. Vancouver: [s.n.], 2019: 5243-5253.
[17]	LIU Z, LIN Y, CAO Y, et al. Swin transformer: Hierarchical vision transformer using shifted windows[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. [S.l.]: IEEE, 2021: 10012-10022.
[18]	DOSOVITSKIY A, BEYER L, KOLESNIKOV A, et al. An image is worth 16x16 words: Transformers for image recognition at scale[C]//International Conference on Learning Representations. Vienna: [s.n.], 2021.
[19]	FARHI E, NEVEN H. Classification with quantum neural networks on near term processors[EB/OL]. [2022-08-26]. https://arxiv.org/pdf/1802.06002.pdf.
[20]	WEI S, CHEN Y, ZHOU Z, et al. A quantum convolutional neural network on nisq devices[J]. AAPPS Bulletin, 2022, 32(1): 1-11. doi: 10.1007/s43673-021-00031-2
[21]	WIEBE N, BOCHAROV A, SMOLENSKY P, et al. Quantum language processing[J]. [2022-09-10]. https://arxiv.org/pdf/1902.05162.pdf.
[22]	MEICHANETZIDIS K, GOGIOSO S, DE FELICE G, et al. Quantum natural language processing on near-term quantum computers[EB/OL]. [2022-09-12]. https://arxiv.org/abs/2005.04147v1.
[23]	AZEVEDO C R, FERREIRA T A. The application of qubit neural networks for time series forecasting with automatic phase adjustment mechanism[C]//Encontro Nacional de Inteligência Artificial. [S.l]: [s.n.], 2007: 1112-1121.
[24]	DASKIN A. A walk through of time series analysis on quantum computers[EB/OL]. [2022-09-18]. https://www.engineeringvillage.com/app/doc/?docid=cpx_fb76050180f2128638M640b10178163134.
[25]	EMMANOULOPOULOS D, DIMOSKA S. Quantum machine learning in finance: Time series forecasting[EB/OL]. [2022-09-22]. https://arxiv.org/abs/2202.00599.
[26]	DI SIPIO R, HUANG J H, CHEN S Y C, et al. The dawn of quantum natural language processing[C]//ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). [S.l.]: IEEE, 2022: 8612-8616.
[27]	CHEN S Y C, YOO S, FANG Y L L. Quantum long short-term memory[C]//ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). [S.l.]: IEEE, 2022: 8622-8626.
[28]	LI G, ZHAO X, WANG X. Quantum self-attention neural networks for text classification[EB/OL]. [2022-09-25]. https://arxiv.org/abs/2205.05625.
[29]	VOITA E, TALBOT D, MOISEEV F, et al. Analyzing multi-head selfattention: Specialized heads do the heavy lifting, the rest can be pruned[EB/OL]. [2022-09-28]. https://arxiv.org/abs/1905.09418v2.
[30]	DEVLIN J, CHANG M W, LEE K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[EB/OL]. [2022-10-03]. https://arxiv.org/pdf/1810.04805.pdf.
[31]	杨璐, 南刚强, 陈明轩, 等. 基于三种机器学习方法的降水相态高分辨率格点预报模型的构建及对比分析[J]. 气象学报, 2021, 79(6): 1022-1034. doi: 10.11676/qxxb2021.059 YANG L, NAN G Q, CHEN M X, et al. The construction and comparison of high resolution precipitation type prediction models based on three machine learning methods[J]. Acta Meteorologica Sinica, 2021, 79(6): 1022-1034. doi: 10.11676/qxxb2021.059
[32]	朱复成. 中尺度天气数值模拟及近年来国外的进展[J]. 气象科技, 1987(4): 1-7. doi: 10.19517/j.1671-6345.1987.04.001 ZHU F C. Recent developments on mesoscale system simulaiton[J]. Meterorological Science and Technology, 1987(4): 1-7. doi: 10.19517/j.1671-6345.1987.04.001
[33]	CHEN Z Y, XUE C, CHEN S M, et al. Vqnet: Library for a quantumclassical hybrid neural network[EB/OL]. [2022-10-12]. https://arxiv.org/pdf/1901.09133.pdf.
[34]	WIERSEMA R, ZHOU C, DE SEREVILLE Y, et al. Exploring entanglement and optimization within the hamiltonian variational ansatz[J]. PRX Quantum, 2020, 1(2): 020319. doi: 10.1103/PRXQuantum.1.020319
[35]	SCHULD M, KILLORAN N. Quantum machine learning in feature hilbert spaces[J]. Physical Review Letters, 2019, 122(4): 040504. doi: 10.1103/PhysRevLett.122.040504
[36]	ÉREZ-SALINAS A, CERVERA-LIERTA A, GIL-FUSTER E, et al. Data re-uploading for a universal quantum classifier[J]. Quantum, 2020, 4: 226. doi: 10.22331/q-2020-02-06-226
[37]	MCCLEAN J R, BOIXO S, SMELYANSKIY V N, et al. Barren plateaus in quantum neural network training landscapes[J]. Nature Communications, 2018, 9(1): 1-6. doi: 10.1038/s41467-017-02088-w

[1]	张仕斌, 黄晨猗, 李晓瑜, 郑方聪, 李闯, 刘兆林, 杨咏熹. 量子模糊信息管理数学模型研究 . 电子科技大学学报, 2024, 53(2): 284-290. doi: 10.12178/1001-0548.2022355
[2]	侯敏, 张仕斌, 黄曦. 量子模糊朴素贝叶斯分类算法 . 电子科技大学学报, 2024, 53(1): 149-154. doi: 10.12178/1001-0548.2022344
[3]	吴涵卿, 袁淏木, 陈柄任, 吴磊, 李鑫, 李晓瑜. 量子近似优化算法在投资组合优化中的应用 . 电子科技大学学报, 2023, 52(5): 642-648. doi: 10.12178/1001-0548.2022019
[4]	张辰逸, 尚涛, 刘建伟. 基于交换门的前瞻启发式量子线路映射算法 . 电子科技大学学报, 2023, 52(4): 489-497. doi: 10.12178/1001-0548.2022339
[5]	储贻达, 徐维, 周彦桦, 张学锋. 基于变分量子虚时演化和UCC Ansatz的基态求解器 . 电子科技大学学报, 2023, 52(1): 8-13. doi: 10.12178/1001-0548.2022429
[6]	张少东, 杨兴耀, 于炯, 李梓杨, 刘岩松. 基于对比学习和傅里叶变换的序列推荐算法 . 电子科技大学学报, 2023, 52(4): 610-619. doi: 10.12178/1001-0548.2022164
[7]	闫丽丽, 颜金歌, 张仕斌. 基于自适应网络的量子模糊推理系统 . 电子科技大学学报, 2023, 52(4): 482-488. doi: 10.12178/1001-0548.2022220
[8]	陈柄任, 袁淏木, 吴涵卿, 吴磊, 李鑫, 李晓瑜. 基于量子判别分析法的量子连续投资组合优化算法 . 电子科技大学学报, 2023, 52(6): 802-808. doi: 10.12178/1001-0548.2022109
[9]	侯晓凯, 吴热冰, 王子竹, 王晓霆. 基于变分量子分类器的量子对抗攻击生成算法 . 电子科技大学学报, 2023, 52(2): 162-167. doi: 10.12178/1001-0548.2023006
[10]	郭磊, 王邱龙, 薛伟, 郭济. 基于注意力机制的光线昏暗条件下口罩佩戴检测 . 电子科技大学学报, 2022, 51(1): 123-129. doi: 10.12178/1001-0548.2021222
[11]	范兴奎, 刘广哲, 王浩文, 马鸿洋, 李伟, 王淑梅. 基于量子卷积神经网络的图像识别新模型 . 电子科技大学学报, 2022, 51(5): 642-650. doi: 10.12178/1001-0548.2022279
[12]	颜世露, 相里朋, 崔巍. 区块链在量子时代的机遇和挑战 . 电子科技大学学报, 2022, 51(2): 162-169. doi: 10.12178/1001-0548.2021374
[13]	李冠中, 李绿周. 精确Grover量子搜索算法概述 . 电子科技大学学报, 2022, 51(3): 342-346. doi: 10.12178/1001-0548.2022100
[14]	朱献超, 侯晓凯, 吴绍君, 祝峰. 基于情景记忆的量子深度强化学习 . 电子科技大学学报, 2022, 51(2): 170-175. doi: 10.12178/1001-0548.2022043
[15]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[16]	张仕斌, 黄曦, 昌燕, 闫丽丽, 程稳. 大数据环境下量子机器学习的研究进展及发展趋势 . 电子科技大学学报, 2021, 50(6): 802-819. doi: 10.12178/1001-0548.2021332
[17]	李学明, 岳贡, 陈光伟. 基于多模态注意力机制的图像理解描述新方法 . 电子科技大学学报, 2020, 49(6): 867-874. doi: 10.12178/1001-0548.2019228
[18]	吴睿智, 朱大勇, 王春雨, 秦科. 基于图卷积神经网络的位置语义推断 . 电子科技大学学报, 2020, 49(5): 739-744. doi: 10.12178/1001-0548.2020152
[19]	闫理跃, 王厚军, 刘震. 考虑奇点扰动问题的时间序列预测方法 . 电子科技大学学报, 2019, 48(6): 850-857. doi: 10.3969/j.issn.1001-0548.2019.06.008
[20]	廖进昆, 侯文婷, 刘永智, 廖翊韬, 代志勇. 量子比特的门操作与共形映照 . 电子科技大学学报, 2007, 36(1): 132-133,149.

点击查看大图

图(9) / 表(3)

计量

文章访问数: 4455
HTML全文浏览量: 1210
PDF下载量: 60
被引次数: 0

全文HTML

时间序列预测作为序列建模的重要方面，广泛存在于金融、能源、交通、气象、公共卫生等领域。并且随着机器学习/深度学习方法的迅猛发展，序列建模在高可用（high available）场景中（如在线机器翻译、实时语音识别、自然语言处理、计算机视觉等领域）已得到了较广泛的应用。另一方面，随着量子计算机领域近来在“中等含噪量子计算”（Noisy Intermediate-Scale Quantum, NISQ）取得了突破性进展^[1-2]，使用几十至数百量子比特（qubit）运行特定类型的量子算法成为可能，如变分量子本征求解器算法（Variational Quantum Eigensolver, VQE）^[3]、量子近似优化算法（Quantum Approximate Optimization Algorithm, QAOA）^[4]以及量子机器学习（Quantum Machine Learning, QML）^[5]等通过“量子−经典”混合方式实现的算法。这些算法一方面利用量子叠加（superposition）与纠缠（entanglement）的特性可以实现高并行的处理速度（个别算法可达到指数级别加速），另一方面通过量子编码实现数据的并行存储。文献[6]认为QML通过将原始特征映射到希尔伯特空间，能够实现从经典方法难以采样的复杂分布中稳定采样，因而其具有经典方法不具备的优势^[7]。此外，文献[8]从核方法（kernel method）的角度，通过对比预测误差界限（error-bounding），认为在量子比特数较少时，量子机器学习与经典机器学习算法的差异主要取决于训练数据的特性，而随着构建模型的量子比特数量逐渐增多，量子算法的优势才会更容易显现。

从序列预测的一般方法而言，通过选取特征变量的历史时期（早于预测时间点）数据作为输入，通过建立模型，实现对未来时间点的预测。较早时期的统计建模方法，如自回归滑动平均模型（Autoregressive Integrated Moving Average Model, ARIMA）^[9]，通过提取差分信息建立线性模型可以实现对平稳序列的预测。考虑到基于统计方法的预测模型对数据自身的统计特性有较为严格的要求（如平稳性、各态历经性），并且模型对于多变量间的非线性拟合能力有限。因此，能够保留较长时期的数据信号并对变量间非线性关系具有较好拟合能力的深度学习方法，成为近年来的主流方法。递归神经网络（RNN）^[10]在时序列建模方面表现出色，但由于其存在梯度消失和爆炸的问题^[11]，使其在使用较长历史数据进行训练时遇到困难。进一步地，长短期记忆模型（Long Short-Term Memory, LSTM）^[12]以及门控单元网络（Gated Recurrent Unit, GRU）通过实现网络内部结构的“门控”机制^[13]，将输入数据进行多次变换、连接与状态再输出，从而实现对较长时期输入信号更好地“捕捉”并且较大幅度缓解梯度消失与爆炸的问题^[14]。而现有的RNN网络架构存在对全局长时间依赖（long term dependency）信息提取不足及难以并行的缺点，新提出的Transformer框架依据自注意力机制（Self-Attention, SA）^[15]，则可以较好地解决这两方面困难。该框架在自然语言处理方面表现突出^[16]，同时也在计算机视觉方面（如视觉分类、目标检测等）取得了较好的效果^[17-18]，这也进一步展现了自注意力机制具有更强的可拓展性以及整合输入数据点之间的相关性并增强数据表达的能力。

另一方面，在量子算法领域，近期已有越来越多的适用于NISQ量子硬件特性的量子神经网络方法（Quantum Neural Network, QNN）^[19]被提出，如量子卷积神经网络^[20]、量子自然语言处理方法（Quantum NLP, QNLP）^[21-22]等，而基于变分量子线路进行时间序列预测的研究也开展得较早^[23-24]。在金融领域，量子时间序列预测方法也应用在对股票等资产价格的预测方面^[25]。文献[26]采用量子线路进一步“增强”经典深度学习的方法，通过将输入的文本嵌入信息转化到描述量子态的希尔伯特空间中，量子部分的计算可以在NISQ硬件上真实运行，同时该研究也认为现有的量子−经典混合架构对于构建复杂的序列处理模型（如LSTM, Transformer）来处理NLP领域的问题是可行的，并且该研究也初步实现了量子−经典混合的Transformer架构。类似地，文献[27]提出并实现了Quantum LSTM（QLSTM）的量子经典混合架构，其主要思想是在基本LSTM单元（LSTM Cell）中引入变分量子线路（Variational Quantum Circuit, VQC）对输入数据的中间结果进行多次转换，即将量子线路演化的测量结果作为门（记忆门、输出门、遗忘门）间的交换数据。该模型在预测动力系统时间序列任务中可以达到与经典LSTM精度相当且收敛更快的特点。进一步地，文献[28]提出了一种线路和结构更加简化的量子自注意力神经网络（Quantum Self-Attention Neural Network, QSANN），该研究的优势在于计算自注意力系数（或相似度系数）时，通过量子线路测量得到K与Q的数值后输入高斯函数直接计算结果，而不是按照一般自注意力机制的内积运算。从而在文本分类任务中，QSANN利用高斯函数可以有效提取词向量间的潜在联系，还可以显著提升训练效率，其分类精度与经典自注意力网络相当，相较于其他QNLP模型具有显著提升。

鉴于QSANN^[28]在文本分类方面所表现出的优越性能，本研究主要针对QSANN的自注意力机制编码部分进行多头扩展，并通过构建变分线路实现多变量的时间序列预测模型，采取“单步”预测方案，在典型天气学要素变量数据上进行验证和测试。

3. 结束语

本研究在“量子−经典”混合的模式下，设计了多头量子自注意力神经网络预测模型，主要包括多头量子自注意力模块以及变分量子线路预测模块两部分。完整流程与模型搭建均采用本源量子−VQNet框架实现。本研究可以确定在序列预测任务上引入QSA具有一定优势。其次，进行“多头”扩展的QSA神经网络模型在预测精度上具有一定的提升但并不显著，可能与本研究构建的特征输入维度较低有关，推测在更高嵌入维度下会有较好表现。另外，选择较长的时间窗作为输入有更高精度的表现。最后，作为预测功能的变分线路模块依然可能因为“贫瘠高原”的问题困扰而影响模型的最终表现。未来在改进预测线路模块的设计时，也要提升KQV各自数值的线路设计。

参考文献 (37)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

量子自注意力神经网络的时间序列预测

doi: 10.12178/1001-0548.2022340

作者简介:
陈欣，博士，高级工程师，主要从事机器学习与量子计算等方面的研究

通讯作者: 李闯，E-mail：zhangqh@zhejianglab.com

Research on Time Series Prediction via Quantum Self-Attention Neural Networks

计量

量子自注意力神经网络的时间序列预测

doi: 10.12178/1001-0548.2022340

1. 中金金融认证中心有限公司，北京 100176

作者简介:
陈欣，博士，高级工程师，主要从事机器学习与量子计算等方面的研究

通讯作者: 李闯，E-mail：zhangqh@zhejianglab.com

English Abstract

Research on Time Series Prediction via Quantum Self-Attention Neural Networks

1. China Financial Certification Authority, Beijing 100176, China

全文HTML

1.1. 自注意力机制

1.2. 量子自注意力机制

2.3. 模型搭建

2.1. 数据预处理与评估

2.2. 特征选择

2.3. 预测实验

目录

期刊在线

编辑办公

友情链接

留言板

量子自注意力神经网络的时间序列预测

doi: 10.12178/1001-0548.2022340

作者简介: 陈欣，博士，高级工程师，主要从事机器学习与量子计算等方面的研究

通讯作者: 李闯，E-mail：zhangqh@zhejianglab.com

Research on Time Series Prediction via Quantum Self-Attention Neural Networks

计量

出版历程

量子自注意力神经网络的时间序列预测

doi: 10.12178/1001-0548.2022340

1. 中金金融认证中心有限公司，北京 100176

作者简介: 陈欣，博士，高级工程师，主要从事机器学习与量子计算等方面的研究

通讯作者: 李闯，E-mail：zhangqh@zhejianglab.com

English Abstract

Research on Time Series Prediction via Quantum Self-Attention Neural Networks

1. China Financial Certification Authority, Beijing 100176, China

全文HTML

1.1. 自注意力机制

1.2. 量子自注意力机制

2.3. 模型搭建

2.1. 数据预处理与评估

2.2. 特征选择

2.3. 预测实验

目录

期刊在线

编辑办公

友情链接

作者简介:
陈欣，博士，高级工程师，主要从事机器学习与量子计算等方面的研究

作者简介:
陈欣，博士，高级工程师，主要从事机器学习与量子计算等方面的研究