量子模糊朴素贝叶斯分类算法

侯敏; 张仕斌; 黄曦

doi:10.12178/1001-0548.2022344

量子模糊朴素贝叶斯分类算法

doi: 10.12178/1001-0548.2022344

侯敏^{1, 2},
张仕斌^{1, 2, ,},
黄曦³

1.
成都信息工程大学网络空间安全学院，成都 610225
2.
先进密码技术与系统安全四川省重点实验室，成都 610225
3.
西南交通大学信息科学与技术学院，成都 610031

基金项目: 国家自然科学基金（62076042）；国家重点研发计划“网络空间安全治理”重点专项课题（2022YFB3103103）；成都市重点研发项目（2023-XT00-00002-GX）；四川省重点研发计划项目（2022YFS0571）

详细信息

作者简介:
侯敏，主要从事量子通信、量子机器学习等方面的研究

通讯作者: 张仕斌，E-mail：cuitzsb@cuit.edu.cn

中图分类号: TP391

Quantum Fuzzy Naive Bayesian Classification Algorithm

HOU Min^{1, 2},
ZHANG Shibin^{1, 2
, ,},
HUANG Xi³

1.
School of Cybersecurity, Chengdu University of Information Technology, Chengdu 610225, China
2.
Advanced Cryptography and System Security Key Laboratory of Sichuan Province, Chengdu 610225, China
3.
School of Information Science and Technology, Southwest Jiaotong University, Chengdu 610031, China

摘要: 以传统朴素贝叶斯算法为基础，研究并提出一种高效、准确的量子模糊贝叶斯分类算法。首先将“模糊集合理论 + 朴素贝叶斯理论”交叉融合，定义模糊先验概率、模糊条件概率，将朴素贝叶斯推广至模糊朴素贝叶斯，构建模糊贝叶斯模型；其次，将“模糊贝叶斯模型 + 量子计算”交叉融合，将模糊数据集量子化（编码到量子态上）并设计量子线路，提出一种量子模糊朴素贝叶斯分类算法；最后，将该算法应用到鸢尾花数据集。仿真实验表明，与传统朴素贝叶斯分类算法相比，该算法具有较高的分类效率和准确率。
- 模糊集合理论 /
- 朴素贝叶斯分类 /
- 量子计算 /
- 量子机器学习
Abstract: In today’s era of big data, it is difficult for traditional naive Bayesian algorithms to efficiently and accurately deal with the complexity and uncertainty of big data. Based on the traditional Naive Bayes algorithm, this paper proposes an efficient and accurate quantum fuzzy Bayesian classification algorithm. First, the “fuzzy set theory + naive Bayes theory” is cross-integrated, the fuzzy prior probability and fuzzy conditional probability are defined, and the naive Bayes is extended to fuzzy naive Bayes to construct a fuzzy Bayes model; Secondly, a quantum fuzzy naive Bayesian classification algorithm is investigated and implemented by quantizing fuzzy data sets (encoding to quantum states) and designing quantum circuits. Finally, the algorithm proposed in this paper is applied to the iris dataset. Simulation experiments show that the proposed classification algorithm has higher classification efficiency and accuracy compared with the traditional Naive Bayesian classification algorithm.
- fuzzy set theory /
- naive bayesian classification /
- quantum computing /
- quantum machine learning

图 1 量子模糊朴素贝叶斯算法的分类过程

下载: 全尺寸图片幻灯片

图 2 量子计数线路图

下载: 全尺寸图片幻灯片

图 3 鸢尾花数据集

下载: 全尺寸图片幻灯片

图 4 仿真实验的测试数据集

下载: 全尺寸图片幻灯片

图 5 仿真实验测量结果

下载: 全尺寸图片幻灯片

图 6 测试数据集中样本及真实类别标签

下载: 全尺寸图片幻灯片

图 7 本文算法所对应的样本与分类标签

下载: 全尺寸图片幻灯片

表 1 鸢尾花4种属性的均值 cm

类别	花萼长度	花萼宽度	花瓣瓣长	花瓣宽度
Setosa	5	3.41	1.46	0.24
Versicolour	5.94	2.76	4.29	1.33
Virginica	6.55	2.97	5.49	1.99

下载: 导出CSV

表 2 鸢尾花4种属性的方差 cm

类别	花萼长度	花萼宽度	花瓣瓣长	花瓣宽度
Setosa	0.37	0.38	0.18	0.11
Versicolour	0.47	0.31	0.41	0.19
Virginica	0.63	0.32	0.52	0.27

下载: 导出CSV

表 3 算法准确率对比

参数	文献[3]	文献[10]	文献[11]	本文算法
数据集	iris dataset	−	−	iris dataset
测试集的比例	0.25	−	−	0.25
时间复杂度	$ O\left( {MN} \right) $	$ O\left( {\dfrac{{{{\log }^2}M + \log N}}{{{\partial ^3}}}} \right) $	$ O\left( {M\log \left( {MN + \sqrt M } \right)} \right) $	$ O\left( {\sqrt {MN} } \right) $
准确率/%	84.21	−	−	95

下载: 导出CSV

[1]	李建中, 李英姝. 大数据计算的复杂性理论与算法研究进展[J]. 软件学报, 2016, 46(9): 1255-1275. LI J Z, LI Y S. Research progress in complexity theory and algorithms for big data computing[J]. Software Journal, 2016, 46 (9): 1255-1275.
[2]	张仕斌, 黄曦, 昌燕, 等. 大数据环境下量子机器学习的研究进展及发展趋势[J]. 电子科技大学学报, 2021, 50(6): 802-819. ZHANG S B, HUANG X, CHANG Y, et al. Research progress and development trend of quantum machine learning under big data environment[J]. Journal of University of Electronic Science and Technology of China, 2021, 50 (6): 802-819.
[3]	郭秀娟, 李庆凯, 孟庆楠, 等. 基于朴素贝叶斯算法分析鸢尾花数据集分类[J]. 工业和信息化教育, 2022, 4(6): 82-84. GUO X J, LI Q K, MENG Q N, et al. Analysis of the iris dataset classification based on a naive Bayesian algorithm[J]. Industry and Information Education, 2022, 4 (6): 82-84.
[4]	蒋良孝. 朴素贝叶斯分类器及其改进算法研究[D]. 北京: 中国地质大学, 2009. JIANG L X. Naive Bayesian classifier and its improved algorithm study[D]. Beijing: China University of Geosciences, 2009.
[5]	李静梅, 孙丽华, 张巧荣, 等. 一种文本处理中的朴素贝叶斯分类器[J]. 哈尔滨工程大学学报, 2003, 24(1): 71-74. LI J M, SUN L H, ZHANG Q R, et al. A naive Bayes classifier in text processing[J]. Journal of Harbin Engineering University, 2003, 24(1): 71-74.
[6]	周龙. 基于朴素贝叶斯的分类方法研究[D]. 合肥: 安徽大学, 2006. ZHOU L. Naive Bayes-based classification methods research[D]. Hefei: Anhui University, 2006 .
[7]	PARRA-RODRIGUEZ A, LOUGOVSKI P, LAMATA L, et al. Digital-analog quantum computation[J]. PhysicalReview A, 2020, 101(2): 022305.
[8]	BIAMONTE J, WITTEK P, PANCOTTI N, et al. Quantum machine learning[J]. Nature, 2017, 549(7671): 195-202. doi: 10.1038/nature23474
[9]	DAS S S, DENG D L, DUAN L M. Machine learning meets quantum physics[J]. Physics Today, 2019, 72(3): 48-54.
[10]	SHAO C P. Quantum speedup of bayes’classifiers[J]. Journal of Physics A: Mathematical and theoretical, 2020, 53(4): 045301.
[11]	陆春悦, 郭躬德, 林崧. 基于量子计数的贝叶斯二元分类算法[J]. 南京师大学报(自然科学版), 2021, 44(4): 117-121. LU C Y, GUO G D, LIN S. A Bayesian binary classification algorithm based on quantum counting[J]. Nanjing Normal University Daily (Natural Science edition), 2021, 44(4): 117-121.
[12]	OZOLS M, ROETTELER M, ROLAND J. Quantum rejection sampling[J]. ACM Transactions on Computation Theory, 2011, 5(3): 1-11.
[13]	LOW G H, YODER T J, CHUANG I L. Quantum inference on Bayesian networks[J]. Physical Review A, 2014, 89(6): 1-12.
[14]	MD O, BARBOSA L S. Quantum Bayesian decision-making[J]. Foundations of Science, 2021, 9(7): 1572.
[15]	毕文豪, 周杰, 张安, 等. 杂波环境下基于最大熵模糊聚类的JPDA算法[J]. 系统工程与电子技, 2022, 6(29): 1-11. BI W H, ZHOU J, ZHANG A, et al. JPDA algorithm based on maximum entropy fuzzy clustering in clutter environment[J]. Systems Engineering and Electronic Technology 2022, 6(29): 1-11.
[16]	支建勋. 基于模糊K-means聚类算法的区域数据智能分析方法[J]. 电子设计工程, 2022, 30(10): 46-49. ZHI J X. Intelligent analysis method of regional data based on fuzzy K-means clustering algorithm[J]. Electronic Design Engineering, 2022, 30(10): 46-49.
[17]	于涛. 基于故障树贝叶斯网络的TDS-8SA顶驱装置故障分析与诊断[D]. 大连: 大连海洋大学, 2022. YU T. Fault analysis and diagnosis of TDS-8SA top drive device based on fault tree bayesian network[D]. Dalian: Dalian Ocean University, 2022.
[18]	TANG Y, PAN W, LI H, et al. Fuzzy naive Bayes classifier based on fuzzy clustering[EB/OL]. [2022-08-21]. https://ieeexplore.ieee.org/document/1176401.
[19]	王国才. 朴素贝叶斯分类器的研究与应用[D]. 重庆: 重庆交通大学, 2010. WANG G C. Research and application of the Naive Bayes classifier[D]. Chongqing: Chongqing Jiaotong University, 2010.
[20]	MICHAEL A, NIELSEN ISAAC L, CHUANG. Quantum computing, and quantum information[M]. Beijing: Tsinghua University Press, 2004.
[21]	BRASSARD G, HOYER P, MOSCA M, et al. Quantum amplitude amplification and estimation[EB/OL]. [2022-09-02]. https://arxiv.org/pdf/quant-ph/0005055.pdf.

[1]	张仕斌, 黄晨猗, 李晓瑜, 郑方聪, 李闯, 刘兆林, 杨咏熹. 量子模糊信息管理数学模型研究 . 电子科技大学学报, 2024, 53(2): 284-290. doi: 10.12178/1001-0548.2022355
[2]	陈欣, 李闯, 金凡. 量子自注意力神经网络的时间序列预测 . 电子科技大学学报, 2024, 53(1): 110-118. doi: 10.12178/1001-0548.2022340
[3]	吴涵卿, 袁淏木, 陈柄任, 吴磊, 李鑫, 李晓瑜. 量子近似优化算法在投资组合优化中的应用 . 电子科技大学学报, 2023, 52(5): 642-648. doi: 10.12178/1001-0548.2022019
[4]	张辰逸, 尚涛, 刘建伟. 基于交换门的前瞻启发式量子线路映射算法 . 电子科技大学学报, 2023, 52(4): 489-497. doi: 10.12178/1001-0548.2022339
[5]	储贻达, 徐维, 周彦桦, 张学锋. 基于变分量子虚时演化和UCC Ansatz的基态求解器 . 电子科技大学学报, 2023, 52(1): 8-13. doi: 10.12178/1001-0548.2022429
[6]	陈柄任, 袁淏木, 吴涵卿, 吴磊, 李鑫, 李晓瑜. 基于量子判别分析法的量子连续投资组合优化算法 . 电子科技大学学报, 2023, 52(6): 802-808. doi: 10.12178/1001-0548.2022109
[7]	闫丽丽, 颜金歌, 张仕斌. 基于自适应网络的量子模糊推理系统 . 电子科技大学学报, 2023, 52(4): 482-488. doi: 10.12178/1001-0548.2022220
[8]	侯晓凯, 吴热冰, 王子竹, 王晓霆. 基于变分量子分类器的量子对抗攻击生成算法 . 电子科技大学学报, 2023, 52(2): 162-167. doi: 10.12178/1001-0548.2023006
[9]	陈小明, 陈雷, 阎亚龙. 诱骗态量子密钥分发中不可区分假设的合理性和安全性验证 . 电子科技大学学报, 2022, 51(4): 482-487. doi: 10.12178/1001-0548.2022068
[10]	王育齐, 陈庚, 钱伟中. 区块链环境下用户身份匿名的量子委托计算协议 . 电子科技大学学报, 2022, 51(6): 802-811. doi: 10.12178/1001-0548.2022178
[11]	范兴奎, 刘广哲, 王浩文, 马鸿洋, 李伟, 王淑梅. 基于量子卷积神经网络的图像识别新模型 . 电子科技大学学报, 2022, 51(5): 642-650. doi: 10.12178/1001-0548.2022279
[12]	颜世露, 相里朋, 崔巍. 区块链在量子时代的机遇和挑战 . 电子科技大学学报, 2022, 51(2): 162-169. doi: 10.12178/1001-0548.2021374
[13]	李冠中, 李绿周. 精确Grover量子搜索算法概述 . 电子科技大学学报, 2022, 51(3): 342-346. doi: 10.12178/1001-0548.2022100
[14]	朱献超, 侯晓凯, 吴绍君, 祝峰. 基于情景记忆的量子深度强化学习 . 电子科技大学学报, 2022, 51(2): 170-175. doi: 10.12178/1001-0548.2022043
[15]	张仕斌, 黄曦, 昌燕, 闫丽丽, 程稳. 大数据环境下量子机器学习的研究进展及发展趋势 . 电子科技大学学报, 2021, 50(6): 802-819. doi: 10.12178/1001-0548.2021332
[16]	陆鑫, 廖建明. 基于模糊集理论的软件质量评估研究 . 电子科技大学学报, 2007, 36(3): 652-655.
[17]	刘震, 周明天. 基于核方法的贝叶斯邮件分类网络研究 . 电子科技大学学报, 2007, 36(3): 587-589,593.
[18]	廖进昆, 侯文婷, 刘永智, 廖翊韬, 代志勇. 量子比特的门操作与共形映照 . 电子科技大学学报, 2007, 36(1): 132-133,149.
[19]	杨斌, 聂在平, 夏耀先, 蒋荣生. 基于贝叶斯神经网络的非参数回归 . 电子科技大学学报, 2002, 31(2): 159-162.
[20]	沈伟慈. 一种基于模糊贝叶斯理论推测信元丢弃率分布的方法 . 电子科技大学学报, 1999, 28(4): 402-404.

点击查看大图

图(7) / 表(3)

计量

文章访问数: 4054
HTML全文浏览量: 944
PDF下载量: 29
被引次数: 0

全文HTML

随着大数据日益增长，传统的机器学习算法很难满足海量大数据的处理^[1]。大数据的复杂性也带来了不确定性，如何高效、准确地解决大数据的复杂性和不确定性问题已成为目前大数据领域的研究热点^[2]。

朴素贝叶斯算法是较常见的机器学习算法，相比其他机器学习算法，它能准确地处理小规模数据集，计算速度远胜传统SVM，收敛速度快于逻辑回归算法^[3]。近年来，朴素贝叶斯算法引起了不少学者关注。文献[4]提出了隐藏扩展的朴素贝叶斯分类算法、局部克隆的朴素贝叶斯排列算法和基于相似度的实例加权的朴素贝叶斯分类算法，并探讨了改进算法在若干实际问题的应用价值；文献[5]提出基于EM算法（期望值最大算法）自动训练的朴素贝叶斯算法，并验证了该算法具有高准确率；文献[6]对朴素贝叶斯的独立性假设进行改进，提高了分类准确率。然而，在当今大数据时代，在分析处理大数据问题时其高准确率与高效性难以同时满足。

量子计算被认为是最有可能突破现有计算能力瓶颈的新兴技术^[7]。学者们都在积极探索将“量子计算+机器学习”交叉融合，提出研究量子贝叶斯算法^[8-9]。文献[10]提出了基于块编码的量子贝叶斯分类算法，实现了指数级加速，然而该算法只适用于厄米矩阵；文献[11]提出了一种基于量子计数的贝叶斯二元分类算法，实现了指数级加速，且适用于更广泛的数据集；文献[12]提出了量子拒绝采样算法，相比经典拒绝采样算法，它在运行时能提供平方级加速；文献[13]将贝叶斯网络图结构组织到量子态上，实现平方级加速；文献[14]基于文献[13]引入效用函数将量子贝叶斯推理扩展到量子贝叶斯决策，也能实现平方级加速。

研究者们将模糊理论与传统人工智能算法相结合，陆续提出了模糊聚类算法^[15]、模糊K-Means算法^[16]、模糊贝叶斯网络^[17]等算法。文献[18]提出了基于模糊聚类模糊朴素贝叶斯分类算法，该算法能高效处理连续变量分类的问题；文献[19]提出了一种基于粗糙集的特征加权朴素贝叶斯分类器，提高了分类性能。

本文将“朴素贝叶斯算法+量子计算+模糊理论”交叉融合，提出一种量子模糊朴素贝叶斯分类算法。