-
随着各应用领域的数据量呈爆炸式增长,物理世界、人类社会和网络空间中的数据不断连接和融合,催生了大数据时代的到来[1]。大数据时代给人们的生活和工作带来了无限的发展机遇,也引发了前所未有的挑战。一方面,通过对大数据的挖掘与分析,可以发现其中隐含的有价值的数据和信息;另一方面,大数据类型、结构、模式以及关系的复杂性是大数据区别于传统数据的根本所在,必将会带来不可预测的不确定性问题[2-3]。不确定性因素给处理大数据算法的准确性、高效性、安全性、鲁棒性带来了巨大挑战[4]。高效、安全、准确处理大数据所具有的复杂性和不确定性问题已经成为大数据知识发现的前提和关键。
现有的计算策略(如采样[5]、降维[6]、分治、特征提取[7]、分布式计算等)在处理具有复杂结构、超高维的大数据问题上需要消耗大量的计算资源。近年来兴起的增量学习[8] (Incremental Learning)通过处理连续传入的信息流实现新旧知识的整合、优化,进一步节约计算资源;粒计算[9] (Granular Computing) 通过将大数据中的信息粒化,将合适的粒度颗粒作为处理对象从而缩减数据规模,提高了解决大数据问题的质量和效率。然而,数据本身的不确定性和处理数据过程中的不确定性,不可避免地会导致这些计算策略的性能大大降低。值得注意的是,模糊集理论已经成为表示数据本身和处理数据过程中的各种不确定性的重要工具[10-11]:一方面,通过建立模糊规则减少原始数据中的不确定性[12];另一方面,直觉模糊集 (Intuitionistic Fuzzy Set, IFS) [13-14]引入犹豫度表示现实世界中的犹豫边界,能够更好地将存在于海量数据和各种类型数据转换中的不确定性以及模型学习计算中的不确定性定量、准确地描述。
量子计算是一种结合量子力学处理信息的方式,利用量子比特的存储能力和并行计算能力来提高处理大数据的计算效率,在处理大数据所具有的复杂性和不确定问题上有更大优势[15-16]。然而量子系统容易受到噪声干扰,这些噪声会影响量子比特和量子线路从而降低量子机器学习算法的性能[17]。在达到理想的纠错效果之前,参数化量子线路 (Parameterized-Quantum Circuit, PQC) 是一种实现量子算法和展示量子优势的具体方法,通过使用量子−经典混合系统找到问题的近似解[18-19]。
本文将“不确定性问题 + 直觉模糊集理论 + 量子计算”交叉融合,利用直觉模糊集理论易于刻画具有不确定性问题的优势,将大数据所具有的不确定性问题模糊化;引入量子计算理论,将模糊信息(即不确定性问题模糊化后的信息)量子化;以量子态作为信息处理单元,构建基于直觉模糊集理论的量子模糊信息管理数学模型(简称量子模糊信息管理数学模型),并给出了与此模型相关基础问题的定义。
-
为了验证量子模糊信息管理数学模型的可行性、合理性和有效性,使用Iris数据集[21]在Pennylane[22]量子计算框架下进行实验。具体来说,基于量子模糊信息管理数学模型构建混合量子−经典模糊神经网络,通过模糊层将数据进行模糊化处理,减少数据中的不确定性;同时将数据编码为量子态(量子模糊向量)作为量子神经网络的输入。实验表明,基于量子模糊信息管理数学模型的量子模糊神经网络面对不确定性数据时的性能优于量子神经网络。
-
由于量子计算模拟环境使用的资源较多,在本实验中选取数据集中的前100个样本(即山鸢尾与杂色鸢尾)打乱后进行实验,选择30%的样本作为测试集,验证算法的准确性。对于数据的不确定性模拟,随机选取Iris数据集中的部分样本添加一定大小的噪声扰动。噪声样本中每个特征值都会根据扰动大小发生改变。本文选择噪声样本数量为
${\text{\{ }}10,15,20,25,30,35,40,45{\text{\} }}$ 、扰动大小为$ \{ 0.1, 0.2, 0.3,0.4,0.5\} $ 进行实验。图4展示了随机选择30个噪声样本,噪声扰动大小为0.2时,噪声对数据的影响。 -
正如前文所述,对于不确定性的数据,模型首先需要通过隶属度、非隶属度和犹豫度来描述数据的不确定性。根据文献[4,23],本实验使用高斯函数作为隶属度函数,将输入变量进行直觉模糊化处理,结合实际情况将模型中的直觉指数(即犹豫度)设置为0.1。模糊化操作的最后一步是将所有特征的隶属度进行AND模糊逻辑运算。之后,模型需要将模糊化后的数据转化为量子态。根据定义2,本文采用振幅编码[24-25]将模糊样本编码成量子态(量子模糊向量)作为量子神经网络的输入。
采用文献[24]提出的量子神经网络电路模型作为比较基准,量子神经网络中用于训练的线路称为ansatz。采用StronglyEntanglingLayers[24]作为ansatz线路,层数设置为5层,在数值模拟中通过parameter-shift rule[26-27]获得量子线路中的梯度值,量子线路中的参数更新借助Pennylane Tensorflow 插件,将量子电路转换为Kears层并添加到经典层中。对于整个混合量子−经典模糊神经网络,迭代轮次为30,批量大小设置为5,采用交叉熵作为损失函数,利用Adam自适应优化器[28]进行优化,学习率为0.01。为公平比较量子模糊信息管理数学模型的有效性,将未进行模糊化操作的数据直接作为量子神经网络[24]的输入,量子神经网络的结构以及参数设置与混合量子−经典模糊神经网络相同。
-
采用量子模糊信息管理数学模型建模后的量子模糊神经网络模型与纯量子神经网络模型在未受噪声干扰影响下的训练结果如图5所示。
在未添加噪声样本时,两种模型在Iris分类任务中表现出色,准确率达到100%。但随着噪声样本数量以及噪声扰动的增加,未经过量子模糊信息管理数学模型建模的量子神经网络准确率不断降低,而本文模型几乎不受噪声干扰,面对数据中的不确定性因素有更好的性能表现。
噪声样本
数量噪声扰动大小 0.1 0.2 0.3 0.4 0.5 10 98.34±1.66 98.34±1.66 94.50±2.17 94.50±2.17 92.92±1.24 15 91.66±2.41 92.67±1.83 90.56±1.10 91.67±1.66 92.46±0.79 20 91.25±0.41 94.16±2.17 94.50±2.17 94.50±2.17 91.67±1.66 25 94.50±2.17 94.50±2.17 93.09±1.41 89.17±2..67 88.33±1.66 30 90.83±0.83 91.25±1.66 91.08±1.01 90.41±1.26 88.75±0.42 35 86.67±3.33 85.00±1.67 86.67±3.33 86.25±0.42 86.67±2.08 40 91.67±1.66 91.67±1.66 91.67±1.66 91.67±1.66 91.67±1.66 45 88.75±2.92 89.17±2.50 88.87±0.27 87.91±0.42 85.54±2.37 噪声样本
数量噪声扰动大小 0.1 0.2 0.3 0.4 0.5 10 100 100 100 100 100 15 100 100 100 100 100 20 100 100 100 100 100 25 100 100 100 99.90±0.03 99.87±0.20 30 100 100 100 99.93±0.02 100 35 100 100 100 99.83±0.12 99.50±0.33 40 100 100 100 99.80±0.05 99.34±0.83 45 100 100 98.34±1.66 98.34±1.66 99.17±0.83
Research on Mathematical Model of Quantum Fuzzy Information Management
doi: 10.12178/1001-0548.2022355
- Received Date: 2022-10-21
- Rev Recd Date: 2022-12-30
- Available Online: 2024-04-01
- Publish Date: 2024-03-30
-
Key words:
- big data /
- quantum computing /
- intuitionistic fuzzy set theory /
- quantum model information management /
- quantum fuzzy neural networks
Abstract: In order to efficiently deal with the complexity and uncertainty of big data, this paper integrates “uncertainty problem + intuitionistic fuzzy set theory + quantum computing”, to build a quantum fuzzy information management mathematical model based on intuitionistic fuzzy set theory. To verify the feasibility, rationality and validity of this model, a simulation experiment of quantum fuzzy neural network based on parameterized quantum circuit is designed under uncertainty environment. The experimental results show that the quantum fuzzy neural network based on this model can more objectively, accurately and comprehensively reflect the knowledge information contained in each object in the uncertainty problem, and improve the accuracy of the algorithm processing big data.
Citation: | ZHANG Shibin, HUANG Chenyi, LI Xiaoyu, ZHENG Fangcong, LI Chuang, LIU Zhaolin, YANG Yongxi. Research on Mathematical Model of Quantum Fuzzy Information Management[J]. Journal of University of Electronic Science and Technology of China, 2024, 53(2): 284-290. doi: 10.12178/1001-0548.2022355 |