基于LSTM的内部用户安全行为评估方法

陶晓玲; 孔凯传; 赵峰; 赵培超

doi:10.3969/j.issn.1001-0548.2019.05.019

基于LSTM的内部用户安全行为评估方法

doi: 10.3969/j.issn.1001-0548.2019.05.019

陶晓玲^1,2,
孔凯传³,
赵峰^1,3, ,,
赵培超¹

1.
桂林电子科技大学广西高校云计算与复杂系统重点实验室广西桂林 541004
2.
西安电子科技大学综合业务网理论及关键技术国家重点实验室西安 710071
3.
桂林电子科技大学信息与通信学院广西桂林 541004

基金项目:

国家自然科学基金 61962015

广西自然科学基金 2016GXNSFAA380098

广西科技计划项目广西重点研发计划AB17195045

详细信息

作者简介:
陶晓玲(1977-), 女, 教授, 主要从事云计算、网络安全及计算智能方面的研究

通讯作者: 赵峰, E-mail:zhaofeng@guet.edu.cn

中图分类号: TP393

Internal User Security Behavior Evaluation Method Based on LSTM

1.
Guangxi Colleges and Universities Key Laboratory of Cloud Computing and Complex Systems, Guilin University of Electronic Technology Guilin Guangxi 541004
2.
School Key Lab of Integrated Sevices Networks, Xidian University Xi'an 710071
3.
School of Information and Communication, Guilin University of Electronic Technology Guilin Guangxi 541004

摘要: 内部用户安全行为评估方法由于较少考虑用户操作行为的前后关联性，导致用户操作行为评估的准确率受到影响。针对该情况，结合长短期记忆网络（LSTM）适合处理时间序列问题的特性，提出了一种基于LSTM的内部用户安全行为评估方法。该方法首先对数据作向量化处理；然后按照N vs 1方案进行数据划分，利用LSTM算法对已知用户操作行为习惯进行统一建模；最后使用双峰阈值（bimodal threshold）机制来确定判决阈值，并对用户操作行为进行评估。实验结果表明，该方法的数据划分方案提升了其检测未知用户操作异常的能力，而且通过引入双峰阈值机制，提高了其检测未知用户异常操作的查准率与查全率。
- 双峰阈值 /
- 数据划分 /
- 内部用户安全行为评估 /
- LSTM
Abstract: The internal user security behavior assessment method affects the accuracy of the user's operational behavior assessment due to less considers the contextual relevance of the user's operational behaviors. In view of this situation, and considering the characteristics of long-short term memory (LSTM) is suitable for dealing with time series problems, an internal user security behavior evaluation method based on LSTM is proposed. In this method, the data are vectorized firstly and then divided according to the N vs. 1 scheme. The LSTM algorithm is used to uniformly model the known user's behavior habits. Finally, the decision threshold is determined by the bimodal threshold mechanism and user behaviors are evaluated. Experimental results show that the data partitioning scheme of this method improves the ability to detect abnormal operation of unknown users, and by introducing a bimodal threshold mechanism, the accuracy and recall of the algorithm for detecting abnormal operations of unknown users are improved.
- bimodal threshold /
- data partitioning /
- internal user security behavior evaluation /
- LSTM
图 1 N vs 1数据划分方案

下载: 全尺寸图片幻灯片

图 2 内部用户安全行为评估模型

下载: 全尺寸图片幻灯片

图 3 优化函数对比图

下载: 全尺寸图片幻灯片

图 4 模型变化趋势

下载: 全尺寸图片幻灯片

图 5 双峰阈值直方图

下载: 全尺寸图片幻灯片

图 6 未知用户异常检测

下载: 全尺寸图片幻灯片

表 1 算法实验结果

%

算法 Precision Recall F1

TF-IDF+NB 94.15 82.00 85.60

N-Gram+HMM 83.42 91.33 87.20

词汇表+LSTM 83.26 89.33 86.19

词汇表+LSTM+Bimodal Method 98.38 98.00 98.09

下载: 导出CSV

[1]	NURSE J R C, BUCKLEY O, LEGG P A, et al. Understanding insider threat: A framework for characterising attacks[C]//IEEE Security and Privacy Workshops. San Jose, USA: IEEE Computer Society, 2014: 214-228. https://ieeexplore.ieee.org/document/6957307
[2]	TRZECIAK R F. SEI Cyber minute: Insider threats[EB/OL].[2018-12-18]. http://resources.sei.cmu.edu/library/asset-view.cfm?assetid=496626.
[3]	COLLINS L M, THEIS C M, TRZECIAK R F, et al. Common sense guide to prevention and detection of insider threats 5th edition[R].[S.l.]: Carnegie Mellon University, 2016.
[4]	MATHEW S, PETROPOULOS M, NGO H Q, et al. A data-centric approach to insider attack detection in database systems[C]//Recent Advances in Intrusion Detection. Ottawa, Canada: Springer, 2010: 382-401. doi: 10.1007%2F978-3-642-15512-3_20
[5]	LANE T D. Machine learning techniques for the computer security domain of anomaly detection[D]. West Lafayette: Purdue University, 2000.
[6]	LANE T D, BRODLEY C E. An empirical study of two approaches to sequence learning for anomaly detection[J]. Machine Learning, 2003, 51(1):73-107. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=c7565060f0f37fd79bf5676dfc6df206
[7]	肖喜, 田新广, 翟起滨, 等.基于shell命令和Markov链模型的用户伪装攻击检测[J].通信学报, 2011, 32(3):98-105. doi: 10.3969/j.issn.1000-436X.2011.03.013 XIAO Xi, TIAN Xin-guang, ZHAI Qi-bin, et al. Masquerade detection based on shell commands and Markov chain models[J]. Journal on Communications, 2011, 32(3):98-105. doi: 10.3969/j.issn.1000-436X.2011.03.013
[8]	HUANG L, STAMP M. Masquerade detection using profile hidden Markov models[J]. Computers & Security, 2011, 30(8):732-747. http://d.old.wanfangdata.com.cn/NSTLQK/NSTL_QKJJ0224896980/
[9]	SCHONLAU M, DUMOUCHEL W, JU W H, et al. Computer intrusion:Detecting masquerades[J]. Statistical Science, 2001, 16(1):58-74. doi: 10.1214/ss/998929476
[10]	MAXION R A, TOWNSEND T N. Masquerade detection using truncated command lines[C]//International Conference on Dependable Systems and Networks. Washington, USA: IEEE Computer Society, 2002: 219-228.
[11]	MAXION R A, TOWNSEND T N. Masquerade detection using enriched command lines[C]//International Conference on Dependable Systems and Networks. San Francisco, USA: IEEE Computer Society, 2003: 5-14.
[12]	DASH S K, REDDY K S, PUJARI A K. Adaptive Naive Bayes method for masquerade detection[J]. Security and Communication Networks, 2011, 4(4):410-417. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=10.1002/sec.168
[13]	SEN S. Using instance-weighted naive Bayes for adapting concept drift in masquerade detection[J]. International Journal of Information Security, 2014, 13(6):583-590. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=38cbf5df87005925edf5f145243f2f1d
[14]	KIM H S, CHA S D. Empirical evaluation of SVM-based masquerade detection using UNIX commands[J]. Computers & Security, 2005, 24(2):160-168. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=7599729d2db9f29830cef770c597f52b
[15]	SALEM M B, STOLFO S J. Modeling user search behavior for masquerade detection[C]//Recent Advances in Intrusion Detection. Menlo Park, USA: Springer, 2011: 181-200.
[16]	COULL S, BRANCH J, SZYMANSKI B, et al. Intrusion detection: A bioinformatics approach[C]//Computer Security Applications Conference. Las Vegas, USA: IEEE Computer Society, 2003: 24-33.
[17]	JIAN Z, SHIRAI H, TAKAHASHI I, et al. Masquerade detection by boosting decision stumps using UNIX commands[J]. Computers and Security, 2007, 26(4):311-318. doi: 10.1016/j.cose.2006.11.008
[18]	RAVEENDRAN R, DHANYA K A. Applicability of clustering techniques on masquerade detection[C]//International Conference on Advances in Computing, Communications and Informatics. Delhi, India: IEEE, 2014: 2343-2348.
[19]	SCHONLAU M. Masquerading user data[EB/OL].[2018-12-18]. http://www.schonlau.net/intrusion.html.

[1]	彭宏伟, 曹梦玲, 黄天, 王青松, 朱少立, 徐大为. H型栅PMOS跨导双峰效应建模 . 电子科技大学学报, 2022, 51(6): 947-952. doi: 10.12178/1001-0548.2021368
[2]	代翔. 基于事件模式及类型的事件检测模型 . 电子科技大学学报, 2022, 51(4): 592-599. doi: 10.12178/1001-0548.2021377
[3]	王磊, 孙志成, 王磊, 陈端兵, 蒋家玮. 基于DRSN-CW和LSTM的轴承故障诊断 . 电子科技大学学报, 2022, 51(6): 921-927. doi: 10.12178/1001-0548.2021385
[4]	王瑞, 闫方, 逯静, 杨文艺. 运用Dropout-LSTM模型的新冠肺炎趋势预测 . 电子科技大学学报, 2021, 50(3): 414-421. doi: 10.12178/1001-0548.2020403
[5]	李莉, 杜丽霞, 张子柯. 基于多变量LSTM神经网络的澳大利亚大火预测研究 . 电子科技大学学报, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
[6]	陆超, 李晓瑜, 姚艳玲, 唐晓澜, 彭宇, 王书福. 面向航空发动机多传感器并行预测模型的设计与实现 . 电子科技大学学报, 2021, 50(4): 580-585. doi: 10.12178/1001-0548.2020365
[7]	聂敏, 张杨, 邓辉, 王伟, 夏虎, 周涛. 利用基本信息和行为数据发现高校贫困学生 . 电子科技大学学报, 2020, 49(5): 795-800. doi: 10.12178/1001-0548.2020139
[8]	田文洪, 曾柯铭, 莫中勤, 吝博强. 基于卷积神经网络的驾驶员不安全行为识别 . 电子科技大学学报, 2019, 48(3): 381-387. doi: 10.3969/j.issn.1001-0548.2019.03.012
[9]	王丹琛, 张仕斌, 徐扬, 许宁. 基于业务用户行为的计算机动态取证评估模型研究 . 电子科技大学学报, 2015, 44(6): 921-927. doi: 10.3969/j.issn.1001-0548.2015.06.022
[10]	刘晶, 王峰, 胡亚慧, 李石君. 基于微博行为数据的不活跃用户探测 . 电子科技大学学报, 2015, 44(3): 410-414. doi: 10.3969/j.issn.1001-0548.2015.03.016
[11]	宋竹, 秦志光, 罗嘉庆, 张悦涵. 电信数据中用户行为特征测量与分析 . 电子科技大学学报, 2015, 44(6): 934-939. doi: 10.3969/j.issn.1001-0548.2015.06.024
[12]	任飞, 刘贤洪, 秦志光. 智能电视安全存储数据访问方法 . 电子科技大学学报, 2014, 43(1): 144-148. doi: 10.3969/j.issn.1001-0548.2014.01.024
[13]	王磊, 卢显良, 陈明燕, 张伟, 张顺生. 基于多核计算的雷达并行仿真结构 . 电子科技大学学报, 2014, 43(1): 113-118. doi: 10.3969/j.issn.1001-0548.2014.01.019
[14]	吴祖峰, 王鹏飞, 秦志光, 蒋绍权. 改进的Louvain社团划分算法 . 电子科技大学学报, 2013, 42(1): 105-108.
[15]	杨海林, 王家廞, 郭爱芳. 数字地球中新的空间划分方法 . 电子科技大学学报, 2012, 41(4): 557-560. doi: 10.3969/j.issn.1001-0548.2012.04.015
[16]	陈晓梅, 孟晓风, 王国华. 自适应阈值估计的MS模型仿真建模 . 电子科技大学学报, 2011, 40(1): 58-63. doi: 10.3969/j.issn.1001-0548.2011.01.011
[17]	梁冰, 刘群. 基于自动机模型数据关联性能评估算法 . 电子科技大学学报, 2008, 37(4): 606-609,629.
[18]	晏华, 刘贵松. 采用熵的多维K-匿名划分方法 . 电子科技大学学报, 2007, 36(6): 1228-1231.
[19]	马义德, 钱志柏, 陈娜. 基于FCM的动态结合全局图像阈值分割 . 电子科技大学学报, 2006, 35(3): 349-351.
[20]	陈雷霆, 文立玉, 李志刚. 信息安全评估研究 . 电子科技大学学报, 2005, 34(3): 373-376.

点击查看大图

图(6) / 表(1)

计量

文章访问数: 4530
HTML全文浏览量: 1408
PDF下载量: 127
被引次数: 0

全文HTML

目前，内部威胁已成为最具挑战性的网络安全问题之一^[1]。内部用户安全行为分析技术作为内部威胁检测的重要组成部分，近年来受到了国内外专家学者的高度重视。相关调查表明，在众多安全事故当中，内部用户攻击已成为主要诱因^[2-4]。内部用户因拥有企业或组织内部的特殊权限，了解公司网络及系统漏洞，一旦内部用户发起攻击，其所造成的损失相比外部攻击而言往往更为严重。

内部用户行为评估技术主要通过学习用户行为习惯来评估用户的异常操作行为，从而发出告警信息。本文既考虑用户之间操作行为的个体差异性，又考虑用户内部操作习惯的前后关联性，结合LSTM适合处理有一定时序相关问题的特性，提出一种基于LSTM的内部用户安全行为评估方法。

1. 相关工作

内部用户安全行为分析技术主要通过学习用户行为习惯来建立分析模型，根据模型建立时所采用的学习方法归纳，主要有隐马尔科夫(hidden Markov model, HMM)、贝叶斯分类器、支持向量机(support vector machine, SVM)等检测方法。

文献[5-6]利用隐马尔科夫模型对用户操作行为进行模型构建，并使用Baum-Welch算法对HMM模型进行训练。文献[7]将用户操作命令出现的频率结合到HMM模型当中，相比原有HMM模型，减少了状态个数与转移矩阵存储量，具备较高的检测准确率。文献[8]提出了一种基于位置信息的轮廓隐马尔可夫模型(PHMMS)，实验结果表明当训练数据较少时，PHMMS模型相对于HMM模型而言具备更高的异常检测率。

文献[9]研究了基于统计理论的用户安全行为检测方法，并结合6种不同的统计学方法进行实验分析。文献[10-11]假设用户操作命令按照一定频率出现，并在文献[9]的基础上提出基于贝叶斯分类器的用户安全行为检测方法，该方法原理简单，适应性强，准确率有所提高。文献[12]提出延迟检测的概念，引入时间偏差，采用朴素贝叶斯方法对用户行为进行分析，消除了正常用户和入侵用户行为模式在时间上的不一致性产生的影响。文献[13]针对朴素贝叶斯检测器漏检率较高的问题，提出一种基于实例加权的朴素贝叶斯方法(IWNB)，根据分配给每个实例的权重逐步更新用户行为，实验表明IWNB方法相比贝叶斯分类器具有更高的查准率与查全率。

文献[14]将支持向量机用于用户安全行为检测，通过两个不同的UNIX命令集合进行实验，实验表明SVM是一种有效的用户行为检测方法。文献[15]提出了一种基于共生矩阵与支持向量机的伪装检测方法，与已有SVM相比具有更好的异常检测效果。此外，也有文献采用基于生物信息^[16]、决策树^[17]、聚类分析^[18]的方法对用户安全行为进行分析。以上文献中，大多是从用户的转移属性、频率属性的角度来对用户安全行为进行分析，较少考虑到用户之间操作行为的个体差异性及用户自身操作习惯的前后关联性。针对以上情况，本文充分考虑用户间的差异性，提出新的数据划分方案实现多用户组合；并结合用户自身操作习惯的前后相关性，利用LSTM算法对用户操作习惯进行建模。

5. 结束语

本文提出一种基于LSTM的内部用户安全行为评估方法。该方法在数据划分阶段考虑用户之间操作存在差异性，提出将多用户进行组合来构建训练模型，使模型充分学习各类用户的操作行为习惯。另外，考虑到用户内部操作存在前后关联性，选用LSTM算法对用户操作行为习惯进行学习，并利用双峰阈值机制生成判决阈值来评估用户安全行为。实验结果表明，本文提出的评估方法能够在学习已知用户操作行为的基础上，对未知用户操作行为进行准确评估，模型具备检测未知用户异常行为的能力。

参考文献 (19)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于LSTM的内部用户安全行为评估方法

doi: 10.3969/j.issn.1001-0548.2019.05.019

作者简介:
陶晓玲(1977-), 女, 教授, 主要从事云计算、网络安全及计算智能方面的研究

通讯作者: 赵峰, E-mail:zhaofeng@guet.edu.cn

Internal User Security Behavior Evaluation Method Based on LSTM

计量

基于LSTM的内部用户安全行为评估方法

doi: 10.3969/j.issn.1001-0548.2019.05.019

1. 桂林电子科技大学广西高校云计算与复杂系统重点实验室广西桂林 541004

2. 西安电子科技大学综合业务网理论及关键技术国家重点实验室西安 710071

3. 桂林电子科技大学信息与通信学院广西桂林 541004

作者简介:
陶晓玲(1977-), 女, 教授, 主要从事云计算、网络安全及计算智能方面的研究

通讯作者: 赵峰, E-mail:zhaofeng@guet.edu.cn

English Abstract

Internal User Security Behavior Evaluation Method Based on LSTM

全文HTML

2.1. N vs 1数据划分方案

2.2. 双峰阈值判别机制

3.1. 数据处理模块

3.2. LSTM+双峰网络模块

4.1. 实验环境及数据集

4.2. 实验结果分析

目录

期刊在线

编辑办公

友情链接

%
算法	Precision	Recall	F1
TF-IDF+NB	94.15	82.00	85.60
N-Gram+HMM	83.42	91.33	87.20
词汇表+LSTM	83.26	89.33	86.19
词汇表+LSTM+Bimodal Method	98.38	98.00	98.09

留言板

基于LSTM的内部用户安全行为评估方法

doi: 10.3969/j.issn.1001-0548.2019.05.019

作者简介: 陶晓玲(1977-), 女, 教授, 主要从事云计算、网络安全及计算智能方面的研究

通讯作者: 赵峰, E-mail:zhaofeng@guet.edu.cn

Internal User Security Behavior Evaluation Method Based on LSTM

计量

出版历程

基于LSTM的内部用户安全行为评估方法

doi: 10.3969/j.issn.1001-0548.2019.05.019

1. 桂林电子科技大学广西高校云计算与复杂系统重点实验室 广西 桂林 541004 2. 西安电子科技大学综合业务网理论及关键技术国家重点实验室 西安 710071 3. 桂林电子科技大学信息与通信学院 广西 桂林 541004

作者简介: 陶晓玲(1977-), 女, 教授, 主要从事云计算、网络安全及计算智能方面的研究

通讯作者: 赵峰, E-mail:zhaofeng@guet.edu.cn

English Abstract

Internal User Security Behavior Evaluation Method Based on LSTM

全文HTML

2.1. N vs 1数据划分方案

2.2. 双峰阈值判别机制

3.1. 数据处理模块

3.2. LSTM+双峰网络模块

4.1. 实验环境及数据集

4.2. 实验结果分析

目录

期刊在线

编辑办公

友情链接

作者简介:
陶晓玲(1977-), 女, 教授, 主要从事云计算、网络安全及计算智能方面的研究

1. 桂林电子科技大学广西高校云计算与复杂系统重点实验室广西桂林 541004

2. 西安电子科技大学综合业务网理论及关键技术国家重点实验室西安 710071

3. 桂林电子科技大学信息与通信学院广西桂林 541004

作者简介:
陶晓玲(1977-), 女, 教授, 主要从事云计算、网络安全及计算智能方面的研究