多属性泛化的<i>K</i>-匿名算法

宋明秋; 王琳; 姜宝彦; 邓贵仕

doi:10.3969/j.issn.1001-0548.2017.06.018

多属性泛化的K-匿名算法

doi: 10.3969/j.issn.1001-0548.2017.06.018

大连理工大学系统工程研究所大连辽宁 116024

基金项目:

国家自然科学基金面上项目 71171028

国家科技支撑计划 2013BAH01B03

详细信息

作者简介:
宋明秋(1967-), 女, 博士, 副教授, 主要从事信息安全、隐私保护方面的研究

中图分类号: TP301.6

K-Anonymity Algorithm Based on Multi Attribute Generalization

Institute of Systems Engineering, Dalian University of Technology Dalian Liaoning 116024

摘要: 针对现有的K-匿名模型中存在泛化属性选取不唯一和数据过度泛化的问题，提出多属性泛化的K-匿名算法。在K-匿名模型实现的过程中，引入属性近似度概念，定量刻画准标识符属性的离散程度，进而确定泛化的准标识符属性；同时采用广度优先泛化的方法，避免数据被过度泛化，最终实现数据表的K-匿名要求。实验结果表明，多属性泛化的K-匿名模型可以提高泛化后数据精度，其处理效率和Datafly算法相当。该算法有效地解决了取值最多准标识符属性存在多个时的泛化属性选取问题，并且防止属性被过度泛化，提高数据的可用性。
- 泛化 /
- K-匿名 /
- 隐私保护 /
- 关系型数据
Abstract: Aiming at the major issues for data over-generalization and no unique attributes of K-anonymity model, a modified K-anonymity algorithm based on multiple attributes generalization is proposed in this paper. The conception of attribute approximation degree is introduced which describes the discrete degree of quasi-identifiers, and determines the candidate quasi-identifier attribute to be generalized. In the meantime, breadth-first generalization is exploited to avoid over-generalization and meets the K-anonymity requirements ultimately. The experimental results show that the new K-anonymity algorithm based on multiple attribute generalization can improve data precision and its efficiency is equal to Datafly algorithm. The proposed algorithm can effectively solve the issue of generalization attribute selecting when quasi-identifiers are not unique, the over-generalization of quasi-identifiers attributes can be avoided, and the usability of data can be improved.
- generalization /
- K-anonymity /
- privacy protecting /
- relational data

图 1 准标识符属性泛化层次图

下载: 全尺寸图片幻灯片

图 2 算法运行时间随K值变化情况

下载: 全尺寸图片幻灯片

图 3 算法运行时间随数据量的变化情况

下载: 全尺寸图片幻灯片

图 4 数据精度随K值变化情况

下载: 全尺寸图片幻灯片

表 1 K-匿名模型实例

序号	肤色	邮编	出生日期	性别
T1	白	1160^**	1991	女
T2	白	1160^**	1991	女
T3	白	1160^**	1991	女
T4	黄	1161^**	1989	男
T5	黄	1161^**	1989	男
T6	黄	1161^**	1989	男
T7	黑	1162^**	1990	女
T8	黑	1162^**	1990	女
T9	黑	1162^**	1990	女
T10	黑	1162^**	1990	女

下载: 导出CSV

表 2 医疗信息表

年龄	性别	邮编	身体状况
22	男	110024	胃溃疡
22	女	110031	感冒
33	男	110024	健康
33	女	110032	胃炎
28	男	110024	发烧
28	女	110033	感冒
30	男	110024	咽炎
30	女	110034	心脏病
26	男	110024	胃溃疡
26	女	110034	咽炎

下载: 导出CSV

表 3 数据结构示意表

编号	名称	类型	属性类型	不同值个数	可泛化层级
1	年龄	数值型	QID	74	4
2	受教育时间	数值型	QID	16	4
3	婚姻状况	文本型	QID	7	2
4	种族	文本型	QID	5	2
5	性别	文本型	QID	2	2
6	每周工作时长	数值型	QID	99	2
7	国籍	文本型	QID	41	4
8	年收入	数值型	SA

下载: 导出CSV

[1]	LIN Chi, SONG Zi-hao, SONG Hou-bing, et al. Differential privacy preserving in big data analytics for connected health[J]. Journal of Medical Systems, 2016, 40(4):1-9. doi: 10.1007/s10916-016-0446-0
[2]	CHEN De-yan, ZHAO Hong. Data security and privacy protection issues in cloud computing[C]//2012 International Conference on Computer Science and Electronics Engineering. Hangzhou, China:IEEE, 2012, 1:647-651.
[3]	COX L H. Suppression methodology and statistical disclosure control[J]. Journal of the American Statistical Association, 1980, 75(370):377-385. doi: 10.1080/01621459.1980.10477481
[4]	SWEENEY L. K-anonymity:a model for protecting privacy[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002, 10(5):557-570. doi: 10.1142/S0218488502001648
[5]	SWEENEY L. Achieving K-anonymity privacy protection using generalization and suppression[J]. International Journal on Uncertainty, Fuzziness and Knowledge-based Systems, 2002, 10(5):571-588. doi: 10.1142/S021848850200165X
[6]	SUN Xiao-xun, WANG Hua, LI Jiu-yong, et al. Publishing anonymous survey rating data[J]. Data Mining and Knowledge Discovery, 2011, 23(3):379-406. doi: 10.1007/s10618-010-0208-4
[7]	SORIACOMAS J, DOMINGOFERRER J, SANCHEZ D and MARTINEZ S. Enhancing data utility in differential privacy via microaggregation-based K-anonymity[J]. The VLDB Journal, 2014, 23(5):771-794. doi: 10.1007/s00778-014-0351-4
[8]	MACHANAVAJJHALA A, KIFER D, GEHRKE J. L -diversity:Privacy beyond K-anonymity[J]. ACM Transactions on Knowledge Discovery from Data, 2006, 1(1):24. http://www.truststc.org/pubs/465/L%20Diversity%20Privacy.pdf
[9]	CHEN Rui, FUNG B C M, MOHAMMED N, et al. Privacy-preserving trajectory data publishing by local suppression[J]. Information Sciences, 2011, 231(1):83-97. https://spectrum.library.concordia.ca/976944/1/fung2011.pdf
[10]	SORIACOMAS J, DOMINGOFERRER J, SANCHEZ D, et al. T-Closeness through microaggregation:Strict privacy with enhanced utility preservation[J]. IEEE Transactions on Knowledge & Data Engineering, 2015, 27(11):3098-3110. doi: 10.1109/TKDE.2015.2435777
[11]	夏赞珠, 韩建民, 于娟, 等.用于实现(k, e)-匿名模型的MDAV算法[J].计算机工程, 2010, 36(15):159-161. doi: 10.3969/j.issn.1000-3428.2010.15.056 XIA Zan-zhu, HAN Jian-ming, YU Juan, et al. MDAV Algorithm for implementing (k, e)-Anonymity model[J]. Computer Engineering, 2010, 36(15):159-161 doi: 10.3969/j.issn.1000-3428.2010.15.056
[12]	杨高明, 李敬兆, 杨静, 等. (k, l)-多样性数据发布研究[J].计算机科学, 2013, 40(8):140-145. https://static-content.springer.com/esm/art:10.1186/1471-2105-11... YANG Gao-ming, LI Jing-zhao, YANG Jing, et al. Achieving(k, l)-diversity in privacy preserving data publishing[J]. Computer Science, 2013, 40(8):140-145. https://static-content.springer.com/esm/art:10.1186/1471-2105-11...
[13]	LIU Qinghai, SHEN Hong, SANG Ying-peng. Privacypreserving data publishing for multiple numerical sensitive attributes[J]. Tsinghua Science and Technology, 2015, 20(3):246-254. doi: 10.1109/TST.2015.7128936
[14]	彭长根, 丁红发, 朱义杰, 等.隐私保护的信息熵模型及其度量方法[J].软件学报, 2016, 27(8):1891-1903. http://kns.cnki.net/KCMS/detail/detail.aspx?filename=rjxb201608001&dbname=CJFD&dbcode=CJFQ PENG Chang-gen, DING Hong-fa, ZHU Yi-jie, et al. Information entropy models and privacy metrics methods for privacy protection[J]. Journal of Software, 2016, 27(8):1891-1903. http://kns.cnki.net/KCMS/detail/detail.aspx?filename=rjxb201608001&dbname=CJFD&dbcode=CJFQ
[15]	刘向宇, 李佳佳, 安云哲, 等.一种保持结点可达性的高效社会网络图匿名算法[J].软件学报, 2016, 32(8):1904-1921. http://www.cnki.com.cn/Article/CJFDTotal-HKGX201506007.htm LIU Xiang-yu, LI Jia-jia, AN Yun-zhe, et al. On reachability preserving graph anonymization in social networks[J]. Journal of Software, 2016, 32(8):1904-1921. http://www.cnki.com.cn/Article/CJFDTotal-HKGX201506007.htm
[16]	LI Xiu-hua, MIAO Mei-xia, LIU Hai, et al. An incentive mechanism for K-anonymity in LBS privacy protection based on credit mechanism[J]. Soft Computing, 2017, 21(14):3907-3917. doi: 10.1007/s00500-016-2040-2
[17]	韦茜, 李星毅.基于K-匿名的快递信息隐私保护应用[J].计算机应用研究, 2014, 31(2):555-557. http://d.wanfangdata.com.cn/Thesis/Y2538054 WEI Qian, LI Xing-yi. Express information protection application based on K-anonymity[J]. Application Research of Computers, 2014, 31(2):555-557. http://d.wanfangdata.com.cn/Thesis/Y2538054
[18]	OLIVEIRA S R M, ZAIANE O R. Privacy preserving clustering by data transformation[J]. Journal of Information and Data Management, 2010, 1(1):37-51. https://seer.lcc.ufmg.br/index.php/jidm/article/view/32/0
[19]	吕品, 钟珞, 王文兵, 等. MA-Datafly:一种支持多属性泛化的K-匿名方法[J].计算机工程与应用, 2013, 49(4):138-139. http://industry.wanfangdata.com.cn/dl/Detail/Periodical?id=... LÜ Pin, ZHONG Luo, WANG Wen-bing, et al. MA-Datafly:K-anonymity approaches for supporting multi-attribute generalization[J]. Computer Engineering & Applications, 2013, 49(4):138-139. http://industry.wanfangdata.com.cn/dl/Detail/Periodical?id=...
[20]	HUNDEPOOL A, DOMINGOFERRER J, FRANCONI L, et al. Statistical disclosure control[M]. Chichester, UK:John Wiley & Sons Ltd, 2012.
[21]	LI Tian-cheng, LI Ning-hui, ZHANG Jian, et al. Slicing:a new approach for privacy preserving data publishing[J]. IEEE Transactions on, Knowledge and Data Engineering, 2012, 24(3):561-574. doi: 10.1109/TKDE.2010.236
[22]	MURPHY P M, AHA D W. University of California Irvine machine learning repository[EB/OL]. (1996-02-15). http://archive.ics.uci.edu/ml/.
[23]	晏华, 刘贵松.采用熵的多维K-匿名划分方法[J].电子科技大学学报, 2007, 36(6):1228-1231. http://www.docin.com/p-20577872.html YAN Hua, LIU Gui-Song. Multidimensional K-anonymity partition method using entropy[J]. Journal of University of Electronic Science and Technology of China, 2007, 36(6):1228-1231. http://www.docin.com/p-20577872.html

[1]	赵庶旭, 张占平, 王小龙, 韩淑梅, 元琳, 张家祯. 基于安全与低能耗的传感云边缘协同优化策略 . 电子科技大学学报, 2023, 52(1): 85-94. doi: 10.12178/1001-0548.2022009
[2]	刘东, 裴锡凯, 赖金山, 王瑞锦, 张凤荔. 融合边缘智能计算和联邦学习的隐私保护方案 . 电子科技大学学报, 2023, 52(1): 95-101. doi: 10.12178/1001-0548.2022176
[3]	王永, 冉珣, 尹恩民, 王利. 满足差分隐私保护的矩阵分解推荐算法 . 电子科技大学学报, 2021, 50(3): 405-413. doi: 10.12178/1001-0548.2020359
[4]	有超群, 李乐民. SFC限制下的隐私保护型多域最短路问题 . 电子科技大学学报, 2020, 49(4): 537-541. doi: 10.12178/1001-0548.2019190
[5]	王瑞锦, 余苏喆, 李悦, 唐榆程, 张凤荔. 基于环签名的医疗区块链隐私数据共享模型 . 电子科技大学学报, 2019, 48(6): 886-892. doi: 10.3969/j.issn.1001-0548.2019.06.013
[6]	吴迭, 鲁力, 张凤荔. 一种Gen2v2标准下的高效隐私保护认证协议 . 电子科技大学学报, 2019, 48(3): 397-401, 461. doi: 10.3969/j.issn.1001-0548.2019.03.014
[7]	张永棠, 罗海波. 考虑用户-发布者关系的个性化微博搜索模型 . 电子科技大学学报, 2018, 47(4): 626-632. doi: 10.3969/j.issn.1001-0548.2018.04.024
[8]	张少波, 刘琴, 李雄, 王国军. 基于缓存候选结果集的轨迹隐私保护方法 . 电子科技大学学报, 2018, 47(3): 449-454. doi: 10.3969/j.issn.1001-0548.2018.03.020
[9]	李晓瑜, 俞丽颖, 雷航, 唐雪飞. 一种K-means改进算法的并行化实现与应用 . 电子科技大学学报, 2017, 46(1): 61-68. doi: 10.3969/j.issn.1001-0548.2017.01.010
[10]	张大方, 徐鸿玥, 李睿. 无线体域网中隐私保护安全kNN查询协议 . 电子科技大学学报, 2017, 46(5): 722-727. doi: 10.3969/j.issn.1001-0548.2017.05.014
[11]	朱国斌, 谭元巍, 赵洋, 熊虎, 秦志光. 高效的安全几何交集计算协议 . 电子科技大学学报, 2014, 43(5): 781-786. doi: 10.3969/j.issn.1001-0548.2014.05.026
[12]	陈勋, 韩臻, 刘吉强. 涉密网络中的数据保护技术 . 电子科技大学学报, 2013, 42(1): 144-148. doi: 10.3969/j.issn.1001-0548.2013.01.029
[13]	刘忠宝, 王士同. 面向大规模数据的隐私保护学习机 . 电子科技大学学报, 2013, 42(2): 272-276. doi: 10.3969/j.issn.1001-0548.2013.02.018
[14]	陈文宇, 刘井波, 孙世新. 层次分析的神经网络集成方法 . 电子科技大学学报, 2008, 37(3): 432-435.
[15]	王金龙, 徐从富, 徐娇芬, 骆国靖. 利用销售数据的商品影响关系挖掘研究 . 电子科技大学学报, 2007, 36(6): 1282-1285.
[16]	晏华, 刘贵松. 采用熵的多维K-匿名划分方法 . 电子科技大学学报, 2007, 36(6): 1228-1231.
[17]	韩仲明. 通有连续时间神经网络的K-稳定性 . 电子科技大学学报, 2005, 34(2): 261-264.
[18]	李毅超, 陈波, 周明天. 一种依据慈善算法的偶图k-完全匹配 . 电子科技大学学报, 2004, 33(5): 566-569.
[19]	肖琨, 余永健, 黄顺吉. 一种单视广义极化K-分布纹理参数的估计方法 . 电子科技大学学报, 1999, 28(5): 476-480.
[20]	钟守铭, 王毅. 具有时滞的非线性系统的k-全局稳定性 . 电子科技大学学报, 1997, 26(1): 94-98.

点击查看大图

图(4) / 表(3)

计量

文章访问数: 4029
HTML全文浏览量: 1684
PDF下载量: 118
被引次数: 0

全文HTML

随着网络技术的高速发展，大量的个人信息被政府部门、科研机构等有关组织存储、发布，导致隐私信息被曝光，先进的数据挖掘算法在提高信息有效性的同时，也导致了隐私泄露的问题^[1]。如何在数据共享的同时，实现有效合理的隐私保护方法^[2]就显得尤为重要。

早在20世纪80年代初，文献[3]首次提出了匿名化的概念，并指出这种技术手段可应用于隐私信息的保护。文献[4]提出K-匿名模型的数据匿名化隐私保护方法，通过泛化和抑制^[5]、分解和排列^[6]以及微聚集和凝聚^[7]等方式对原始数据进行匿名化处理，有效地解决了链接攻击问题。文献[8]在K-匿名模型的基础上提出了一种新的隐私保护模型即l-多样性模型，对数据表中的敏感属性进行相关约束，提升发布的数据表对于同质攻击或背景知识攻击等的防范。此后，(a, K)-匿名模型^[9]使用a阈值对敏感属性进行约束；针对l-多样性模型在一些特殊情况下不适用的问题提出了t-closeness模型^[10]，要求敏感属性接近全局分布；而(K, e)-匿名模型^[11]和(K, l)-匿名模型^[12]等模型为针对敏感属性为数值型数据的近似攻击提供了解决方案^[13]。文献[14]用信息熵模型刻画属性的隐私程度，进而为信息泄露风险量化提供支撑。此外，K匿名模型在多领域的应用也成为现阶段的研究热点，文献[15]将K-匿名技术应用到社会网络图的隐私保护，应用位置服务数据^[16]和快递信息^[17]等隐私保护也采用K-匿名技术。

现有的K-匿名模型研究主要集中于高效近似算法的设计和多领域的应用，在模型算法实现中，没有考虑取值最多的准标识符属性不唯一的情况，以及选取的准标识符属性一直被泛化，从而导致数据精度过低的问题。针对这一问题，本文讨论泛化属性选取方法，每次泛化操作之前通过准标识符属性取值的种类及其近似度选定泛化属性，有效避免单一属性的过度泛化，提高泛化后数据集的可用性。

2. 多属性泛化的K-匿名算法

2.1. 基本思想

在多属性泛化的K-匿名算法中，需要匿名化处理的准标识符属性是由数据表中的准标识符属性值的种类决定。选取取值种类最多的属性作为优先泛化的属性，按其预先给定的泛化层次进行泛化。

首先，针对属性过度泛化问题。多属性泛化的K-匿名算法在每次泛化和K-匿名检验后都重新选取需要泛化的准标识符属性。这样降低了给定的数据表被过度泛化的可能性，加快关系型数据表满足K-匿名的要求，提高泛化后数据的可用性。

其次，针对属性选取不唯一问题，Datafly算法在泛化的准标识符属性选取这一环节中，都没有考虑取值最多的准标识符属性同时存在多个的情况。因此，引入属性近似度这一概念，依据准标识符属性近似度的值，选取近似度最大的准标识符属性优先进行泛化。

定义 6 属性近似度。准标识符属性的近似度即准标识符属性的域值之间的离散程度。准标识符属性的近似度越高，其属性值分布越不均匀，对其进行泛化不仅可以降低背景知识攻击等的威胁，还可以加快数据表满足K-匿名模型。

2.2. 泛化属性选取

在多属性泛化的K-匿名算法中，只对关系型数据表中的准标识符属性进行泛化处理。实际的关系型数据表中通常存在多个准标识符属性，需要进行如下分析来选取优先泛化的属性：

1) 取值最多的准标识符属性只存在一个。

当取值最多的准标识符属性只存在一个的时候，多属性泛化的K-匿名算法选取这一准标识符属性进行泛化处理。

2) 属性值种类最多的准标识符属性不唯一。

当属性值种类最多的准标识符属性存在多个时，多属性泛化的K-匿名算法选取近似度值高的准标识符属性作为泛化属性，优先进行泛化。近似度高的准标识符属性的取值离散程度大，分布不均匀，使得某些等价组内记录条数过少，无法满足K-匿名要求。对近似度高的准标识符属性进行泛化，可以增加等价组内记录的条数，减少包含记录条数过少的等价组，进而加速实现K-匿名模型。

根据前面对准标识符属性近似度的定义，标准差反映一组数据的离散程度，故用标准差来描述准标识符属性的近似度，计算步骤和公式如下：

1) 统计数据表中准标识符属性各取值在数据表中的频数f_i及属性域值的总数量n。

2) 该准标识符属性各取值的出现概率p_i和该属性取值的平均概率 $\overline {{p_i}} $ 为：

$${p_i} = \frac{{{f_i}}}{n}$$

(2)

$$\overline {{p_i}} = \frac{1}{n}\sum\limits_1^n {{p_i}} $$

(3)

3) 求出该准标识符属性的方差为：

$$D(x) = \frac{1}{n}\sum\limits_{i = 1}^n {{{({p_i} - \overline {{p_i}} )}^2}} $$

(4)

4) 对D(x)开方，得标准差σ(x)即反映属性的近似度为：

$$\tau \Leftrightarrow \sigma (x) = \sqrt {D(x)} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{({p_i} - \overline {{p_i}} )}^2}} } $$

(5)

例如，表 2是医疗信息发布表，它包含3个准标识符属性{年龄，性别，邮编}和1个敏感属性{身体状况}。准标识符属性“年龄”有5个取值，依次为{22, 26, 28, 30, 33}：同样，准标识符属性“性别”、“邮编”的取值种类数依次为2、5。对该数据表的准标识符属性进行泛化处理，年龄和邮编这两个准标识符属性种类数取值最多且均为5。若采用多属性泛化的K-匿名算法，计算这两个属性的近似度τ，得τ_年龄=0，τ_邮编=0.2。由于τ_邮编＞τ_年龄，选取准标识符属性“邮编”先进行泛化。若采用Datafly算法将会在“邮编”和“年龄”这两个准标识符属性中随机选取一个进行泛化。假设要求表 2泛化后满足K=2的要求，则经Datafly算法泛化后数据精度是0.583，而经多属性泛化的K-匿名算法泛化后数据精度是0.667，可见多属性泛化的K-匿名算法泛化后的数据可用性高于Datafly算法。

表 2 医疗信息表

年龄	性别	邮编	身体状况
22	男	110024	胃溃疡
22	女	110031	感冒
33	男	110024	健康
33	女	110032	胃炎
28	男	110024	发烧
28	女	110033	感冒
30	男	110024	咽炎
30	女	110034	心脏病
26	男	110024	胃溃疡
26	女	110034	咽炎

2.3. 多属性泛化的K-匿名算法

在算法运行前，需要输入数据：泛化层次K值和数据表中的准标识符属性及其泛化层次。

根据初始的设定对所输入的数据表进行K-匿名检验。如果数据表满足K-匿名，那么系统会自动将所输入的数据输出。如果数据表不满足K-匿名，多属性泛化的K-匿名算法进入准标识符属性分析选取阶段，即计算各准标识符属性的取值种类数。如果存在多个属性值种类最多的准标识符属性，那么计算种类最多的准标识符属性的近似度，选取其近似度最大的属性作为优先泛化属性。对该属性进行一次泛化。泛化完毕后，再次对处理后的数据表进行检验，验证数据表是否满足K-匿名要求。如果检验结果为“是”，那么系统将处理后的数据输出；如果检验结果为“否”，那么表格将再次进入泛化属性选取和K-匿名检验的循环，直到其符合K-匿名要求为止，步骤如下所示。

输入：关系型数据表PT，准标识符属性名称，给定K值，准标识符属性的泛化层次

输出：匿名处理后的数据表PT^*

步骤：

m=0;

if (关系型数据表满足K-匿名)

输出匿名处理后的数据表;

else

计算每一个准标识符属性值的种类数

and找到属性取值种类数最多的准标识符属性;

if (属性值种类最多的准标识符属性为1)

选取该准标识符属性A；

else计算属性值种类最多的准标识符属性近似度

and选择近似度最高的属性A；

end if;

将该属性A按其泛化层次图从m层泛化至m+1层，得到数据表;

return关系型数据表;

end if。

4. 结束语

匿名算法的效率和处理后数据的可用性是衡量K-匿名算法的两个重要指标。针对经典Datafly算法存在泛化属性选取过于单一的问题，提出了多属性泛化的K-匿名算法。在该算法中，由准标识符属性值的种类数量确定需要优先泛化的准标识符属性；并针对泛化过程中可能出现取值最多的准标识符属性同时存在多个的情况，引入属性近似度的概念，选取属性近似度最大的准标识符属性优先泛化，有效地控制属性过度泛化的问题，提高泛化后数据的可用性。通过与经典Datafly算法进行实验对比，多属性泛化的K-匿名算法泛化后数据精度更高，运算时间和Datafly算法相当，具有更好的实际应用价值。

参考文献 (23)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

多属性泛化的K-匿名算法

doi: 10.3969/j.issn.1001-0548.2017.06.018

作者简介:
宋明秋(1967-), 女, 博士, 副教授, 主要从事信息安全、隐私保护方面的研究

K-Anonymity Algorithm Based on Multi Attribute Generalization

计量

多属性泛化的K-匿名算法

doi: 10.3969/j.issn.1001-0548.2017.06.018

大连理工大学系统工程研究所大连辽宁 116024

作者简介:
宋明秋(1967-), 女, 博士, 副教授, 主要从事信息安全、隐私保护方面的研究

English Abstract

K-Anonymity Algorithm Based on Multi Attribute Generalization

Institute of Systems Engineering, Dalian University of Technology Dalian Liaoning 116024

全文HTML

1.1. 数据匿名

1.2. 数据精度

1.3. Datafly算法分析

2.1. 基本思想

2.2. 泛化属性选取

2.3. 多属性泛化的K-匿名算法

3.1. 实验数据集

3.2. 实验环境

3.3. 实验分析

目录

期刊在线

编辑办公

友情链接

留言板

多属性泛化的K-匿名算法

doi: 10.3969/j.issn.1001-0548.2017.06.018

作者简介: 宋明秋(1967-), 女, 博士, 副教授, 主要从事信息安全、隐私保护方面的研究

K-Anonymity Algorithm Based on Multi Attribute Generalization

计量

出版历程

多属性泛化的K-匿名算法

doi: 10.3969/j.issn.1001-0548.2017.06.018

大连理工大学系统工程研究所 大连 辽宁 116024

作者简介: 宋明秋(1967-), 女, 博士, 副教授, 主要从事信息安全、隐私保护方面的研究

English Abstract

K-Anonymity Algorithm Based on Multi Attribute Generalization

Institute of Systems Engineering, Dalian University of Technology Dalian Liaoning 116024

全文HTML

1.1. 数据匿名

1.2. 数据精度

1.3. Datafly算法分析

2.1. 基本思想

2.2. 泛化属性选取

2.3. 多属性泛化的K-匿名算法

3.1. 实验数据集

3.2. 实验环境

3.3. 实验分析

目录

期刊在线

编辑办公

友情链接

作者简介:
宋明秋(1967-), 女, 博士, 副教授, 主要从事信息安全、隐私保护方面的研究

大连理工大学系统工程研究所大连辽宁 116024

作者简介:
宋明秋(1967-), 女, 博士, 副教授, 主要从事信息安全、隐私保护方面的研究