面向NDN中名字查找的哈希布鲁姆过滤器

李玮; 张大方; 徐冰

doi:10.3969/j.issn.1001-0548.2017.05.016

面向NDN中名字查找的哈希布鲁姆过滤器

doi: 10.3969/j.issn.1001-0548.2017.05.016

湖南大学信息科学与工程学院长沙 410082

基金项目:

国家973项目 2012CB315805

国家自然科学基金 61173167

国家自然科学基金 61472130

详细信息

通讯作者: 李玮(1972-), 男, 博士, 主要从事可信系统与网络、大数据处理等方面的研究

中图分类号: TP393

Hash Bloom Filters for Name Lookup in Named Data Networking

College of Computer Science and Electronics Engineering, Hunan University Changsha 410082

摘要: 该文设计了一种面向NDN中名字查找的哈希布鲁姆过滤器（HBF）。HBF由位于片内存储器中的g个计数器布鲁姆过滤器（CBF）、g个计数器和位于片外存储器中的g个哈希表组成，每个哈希表与1个CBF和1个计数器关联。为了避免因部分CBF存入名字过多而导致HBF的高误判率，HBF通过二次哈希选择算法将NDN路由器中FIB/CS/PIT表项完整信息均匀分散保存于g个CBF和g个哈希表中，同时也利于数据包转发的并行处理。理论分析和实验结果表明在名字查找过程中，HBF利用片内存储器中CBF的定位与过滤作用，大幅度减少片外存储器的访问开销，提高数据包转发速率，有效避免泛洪攻击。
- 数据包转发速率 /
- 哈希布鲁姆过滤器 /
- 命名数据网络 /
- 名字查找 /
- 二次哈希选择算法
Abstract: To provide quick name lookup technique, the paper designs a Hash bloom filter (HBF). The HBF consists of g on-chip counter bloom filters (CBFs), g on-chip counters and g off-chip Hash tables. Each Hash table is associated with a CBF and a counter. To reduce the false positive rate introduced by unbalanced name insertion in to CBFs, we propose two-Hash-choice algorithm which evenly disperses the FIB/CS/PIT entries into g Hash tables and CBFs. Moreover, HBF has a good feature of parallel processing of data packet forwarding because HBF adopts multiple Hash tables and CBFs. Theoretical and simulated results demonstrate that HBF can achieve very efficient name lookup by well utilizing the on-chip memory through localization and filtering function of CBF. Therefore, the proposed HBF improves data packet forwarding rate and effectively avoids flooding attacks.
- data packet forwarding rate /
- Hash bloom filter /
- named data networking /
- name lookup /
- two-Hash-choice algorithm

图 1 HBF结构示意图

下载: 全尺寸图片幻灯片

图 2 片外存储器访问次数比较(r=0.001)

下载: 全尺寸图片幻灯片

图 3 总体访问成本比较(r=0.001)

下载: 全尺寸图片幻灯片

表 1 Cost_HT与Cost_HBF理论对比

r	0.01	0.1	0.2	0.3	0.4	0.5
Max(Cost_HT/Cost_HBF)	40.55	13.69	7.78	5.37	4.07	3.25

下载: 导出CSV

表 2 Cost_HT与Cost_HBF实际结果对比

r	0.001	0.01	0.1
Max(Cost_HT/Cost_HBF)	47.9	33.02	12.15

下载: 导出CSV

表 3 HBF与d-left HTPIT访问次数及访问成本对比

算法	片外存储器访问次数	总体访问成本
HBF	625.47	79 173.79
d-left HTPIT	2 446.03	298 415.51

下载: 导出CSV

[1]	谢高岗, 张玉军, 刘韵洁, 等.未来互联网体系结构研究综述[J].计算机学报, 2012, 35(6):1109-1119. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJX201206004.htm XIE Gao-gang, ZHANG Yu-jun, LIU Yun-jie, et al. A survey on future internet architecture[J]. Chinese Journal of Computers, 2012, 35(6):1109-1119. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJX201206004.htm
[2]	ZHANG L, ESTRIN D, JACOBSON V, et al. Named data networking (ndn) project. in Technical Report, NDN-0001, 2010[EB/OL].[2010-10-31]. http://www.named-data.net/.
[3]	JACOBSON V, SMETTERS D K, THORNTON J D, et al. Networking named content[C]//Proceedings of International Conference on Emerging Networking Experiments and Technologies. Rome, Italy:IEEE, 2009:1-12.
[4]	汪漪. 内容中心网络路由查找关键技术研究[D]. 北京: 清华大学, 2013. http://cdmd.cnki.com.cn/Article/CDMD-10003-1014020853.htm WANG Yi. Research on name lookup in named data networking[D]. Beijing:Tsinghua University, 2013. http://cdmd.cnki.com.cn/Article/CDMD-10003-1014020853.htm
[5]	YUAN H, SONG T, CROWLEY P. Scalable NDN forwarding:Concepts, issues and principles[C]//Proceedings of International Conference on Computer Communication Networks. Munich, Germany:IEEE, 2012:1-9.
[6]	MATTEO V, DIEGO P, LEONARDO L.On the design and implementation of a wire-speed pending interest table[C]//Proceedings of IEEE International Workshop on Emerging Design Choices in Name-Oriented Networking. Turin, Italy:IEEE, 2013:1-6.
[7]	YUAN Hao-wei, CROWLEY P. Scalable pending interest table design:from principles to practice[C]//Proceedings of IEEE International Conference on Computer Communications. Toronto, Canada:IEEE, 2014:2049-2057.
[8]	WEI You, BERTRAND M, PATRICK T, et al. Realistic storage of pending requests in content-centric network routers[C]//Proceedings of the 1st IEEE International Conference on Communications in China:Communications QoS and Reliability. Beijing, China:IEEE, 2012:121-125.
[9]	WANG Yi, HE Ke-qiang, LIU Bin, et al. Scalable name lookup in NDN using effective name component encoding[C]//Proceedings of International Conference on Distributed Computing Systems. Macau, China:IEEE, 2012:688-696.
[10]	DAI H, LIU B, CHEN Y, et al. On pending interest table in named data networking[C]//Proceedings of ACM/IEEE Architectures for Networking and Communications Systems. Austin, Texas, USA:IEEE, 2012:211-222.
[11]	LI Z, BI J, WANG S. Compression of pending interest table with bloom filter in content centric network[C]//Proceedings of ACM International Conference on Future Internet Technologies. Seoul, Korea:ACM, 2012:47.
[12]	WEI You, BERTRAND M, PATRICK T, et al. DiPIT:a distributed bloom-filter based PIT table for CCN Nodes[C]//Proceedings of IEEE International Conference on Computer Communications and Networks. Munich, Germany:IEEE, 2012:1-7
[13]	WANG Yi, PAN Tian, LIU Bin, et al. NameFilter:Achieving fast name lookup with low memory cost via applying two-stage Bloom filters[C]//Proceedings of IEEE International Conference on Computer Communications, Mini-conference. Turin, Italy:IEEE, 2013:95-99.
[14]	BlOOM B. Space/time trade-offs in hash coding with a llowable errors[J]. Communications of the ACM, 1970, 13(7):422-426. doi: 10.1145/362686.362692
[15]	BRODER A, MITZENMACHER M. Network applications of bloom filters:a survey[J]. Internt Mathematics, 2005, 1(4):485-509. doi: 10.1080/15427951.2004.10129096
[16]	SARANG D, PRAVEEN K, DAVID E T. Longest prefix matching using bloom filters[C]//Proceedings of ACM International Conference on the Applications, Technologies, Architectures, and Protocols for Computer Communication. Karlsruhe, Germany:ACM, 2006:201-212.
[17]	严蔚敏, 吴伟明.数据结构[M].北京:清华大学出版社, 2011. YAN Wei-min, WU Wei-ming. Data structure[M]. Beijing:Tsinghua University Press, 2011.
[18]	PERINO M D, VARVELLO. A reality check for content contric networking[C]//ACM SIGCOMM Workshop on Information-Centric Networking. Toronto, Canada:ACM, 2011:44-49.
[19]	URLBLACKLIST. Blacklist data set[EB/OL].[2014-09-23]. http://www.urlblacklist.com/.
[20]	ZHANG Ting, WANG Yi, LIU Bin, et al. NDNBench:a benchmark for named data networking lookup[C]//Proceedings of IEEE Global Communications Conference, incorporating the Global Internet Symposium. Atlanta, GA, USA:IEEE, 2013:2152-2157.

[1]	张俐. 基因数据的交互依赖特征选择算法 . 电子科技大学学报, 2022, 51(5): 754-759. doi: 10.12178/1001-0548.2021136
[2]	王柯俨, 宋娟, 李云松, 郭杰. 基于配准和二次码率控制的光谱图像压缩 . 电子科技大学学报, 2017, 46(1): 9-14. doi: 10.3969/j.issn.1001-0548.2017.01.002
[3]	邓江, 曾葆青. Al掺杂MgO保护层对二次电子发射系数的影响 . 电子科技大学学报, 2015, 44(3): 375-380. doi: 10.3969/j.issn.1001-0548.2015.03.010
[4]	胡爱娜. 基于能耗均衡的无线传感网络自适应数据存取算法 . 电子科技大学学报, 2014, 43(2): 235-240. doi: 10.3969/j.issn.1001-0548.2014.02.015
[5]	曹晓东, 石寅, 张强. 用于交换芯片地址表查找的快速并行Hash算法研究 . 电子科技大学学报, 2014, 43(2): 287-291. doi: 10.3969/j.issn.1001-0548.2014.02.025
[6]	任高明, 夏靖波, 乔向东, 杨仝. 一种用于小流估计的数据包公平抽样算法 . 电子科技大学学报, 2014, 43(4): 601-606. doi: 10.3969/j.issn.1001-0548.2014.04.023
[7]	周涛. 网络大数据——复杂网络的新挑战: 如何从海量数据获取信息? . 电子科技大学学报, 2013, 42(1): 7-8. doi: 10.3969/j.issn.1001-0548.2013.01.004
[8]	陈勋, 韩臻, 刘吉强. 涉密网络中的数据保护技术 . 电子科技大学学报, 2013, 42(1): 144-148. doi: 10.3969/j.issn.1001-0548.2013.01.029
[9]	于雪莲, 李中志, 汪学刚. 反向预测加权邻域数据关联算法 . 电子科技大学学报, 2010, 39(3): 364-367. doi: 10.3969/j.issn.1001-0548.2010.03.008
[10]	金大志, 杨中海, 戴晶怡. 中子发生器中二次电子抑制的数值模拟 . 电子科技大学学报, 2009, 38(1): 83-86.
[11]	于泠, 陈波. 入侵数据特征并行选择算法 . 电子科技大学学报, 2008, 37(2): 266-269.
[12]	何坚强, 张焕春, 经亚枝. 具有数据包丢失的NCS反馈调度研究 . 电子科技大学学报, 2006, 35(5): 791-793,822.
[13]	匡胤, 黄迪明. 基于抗体网络的邮件过滤器设计 . 电子科技大学学报, 2006, 35(5): 811-814.
[14]	徐毅, 阮成礼, 魏茂刚. 一种性能优越的二次时频分布 . 电子科技大学学报, 2005, 34(5): 581-584.
[15]	王波, 黄迪明. 遗传神经网络在邮件过滤器中的应用 . 电子科技大学学报, 2005, 34(4): 505-508.
[16]	李咏红, 杜平安. 面向对象的参数化CAD二次开发方法研究 . 电子科技大学学报, 2004, 33(5): 597-599,610.
[17]	姚兴苗, 李乐民, 胡光岷. 快速路由器的路由查找和流分类算法研究 . 电子科技大学学报, 2004, 33(6): 663-666.
[18]	李扬, 胡钢, 戴睿. OBS边缘节点中变长数据包突发汇聚实现 . 电子科技大学学报, 2004, 33(6): 734-737.
[19]	廖恬瑜, 涂晓东, 黄协. 高速路由查找算法的研究 . 电子科技大学学报, 2004, 33(6): 722-725,729.
[20]	赵延文, 聂在平. 短电位测井仪二维测量数据解释 . 电子科技大学学报, 1997, 26(3): 249-253.

点击查看大图

图(3) / 表(3)

计量

文章访问数: 3639
HTML全文浏览量: 1212
PDF下载量: 80
被引次数: 0

全文HTML

为了解决TCP/IP体系结构在路由扩展性、动态性、安全性、QoS、可靠性等方面日益突出的问题^[1]，人们进行了大量研究，并取得了丰硕的研究成果，命名数据网络(named data networking, NDN)^[2-3]就是其中的代表之一。NDN转发层中需要维护FIB (forwarding information base)、CS(content store)、PIT (pending interest table)3类信息。

可扩展的转发层是NDN广泛发展的关键，而FIB/CS/PIT中快速名字查找又是转发层的核心问题，特别是FIB与PIT不仅需要遵循最长前缀匹配(longest prefix matching, LPM)的规则进行名字查找，而且需要在大规模的名字集合中实现快速查找和更新，以满足路由器的传输速率。尽管传统网络体系中面向IP地址的最长前缀匹配算法已经非常成熟，但NDN命名特点使得名字查找比IP地址查找更加复杂；同时没有上限的名字空间造成路由器中路由表项数过多，空间急剧膨胀，这给NDN中名字存储和快速查找带来了巨大的挑战。目前针对NDN的名字查找技术有4种思路，分别是TCAM、哈希表、多步长字符特里树(multi-bit character trie)、布鲁姆过滤器(bloom filter, BF)。

文献[2]最早提出使用TCAM实现快速名字查找，但是由于一个名字的长度可能达到几百个字节，导致一个名字被拆分成多段存于TCAM中，因此需要多次TCAM查找，降低了查询速度，远远达不到IP地址查找时的效率^[4]。

文献[3, 5]将CS、FIB、PIT分别存放于3个不同哈希表中，文献[6-7]采用线性链式哈希表和d-left哈希表等哈希技术来解决哈希冲突问题，减少查询时的访问次数。尽管哈希表具有O(1) 的线性查找速度，但由于多个数据包达到时对同一个哈希表进行查询或更新操作，严重降低数据包的并发处理性能。同时由于哈希表占用空间较大，无法将CS/FIB/PIT等信息保存于访问速度较快但空间受到限制的SRAM中，只能保存于DRAM中，DRAM与SRAM(片内)访问延迟比为55:0.45^[8]，当网络中出现大量泛洪攻击时，攻击包直接访问时延较高的DRAM，耗尽路由器内存资源，导致网络拥塞。

基于编码技术和特里树，文献[9-10]提出了名字词元编码特里树(name component encoding trie, NCET)或编码名字前缀特里树(encode name prefix trie, ENPT)来进行名字查找。但NCET或ENPT采用词元-编码映射表会增加额外存储空间、访问成本和名字词元分解成本。

为了压缩名字占用空间，文献[11-13]提出采用结构简洁和查询快速的BF来表示FIB或PIT，分别是DiPIT、UBF、Namefilter。但由于BF假阳性而无法进行有效回路检查；同时由于BF只能记忆元素是否属于某个集合，无法记忆元素详细信息，例如无法保存PIT时间戳等信息，这样对PIT中的过期表项就无法进行有效处理；UBF、DiPIT、Namefilter也未提及FIB、FIT中除了名字字段之外其余字段的存储设计方式。

为了有效解决上述问题，本文设计了一种面向NDN名字查找的哈希布鲁姆过滤器(HBF)。HBF由位于片内存储器中的g个计数器布鲁姆过滤器(counting bloom filter, CBF)、g个计数器和位于片外存储器中的g个哈希表组成。理论分析和实验结果表明HBF利用片内存储器中CBF的定位与过滤作用，大幅度减少片外存储器的访问开销，从而降低HBF的总体访问成本，提高数据包转发速率，有效避免泛洪攻击。通过理论和实验分析了HBF总体访问成本的影响因素，找出了最优参数设置，为工业界推广应用提供了理论设计依据。

1. 相关工作

文献[16]首次提出利用BF加速IP地址查找。文献[13]据此提出Namefilter，直接使用名字前缀来代替IP前缀，将第二部分中哈希表换成n个BF。由于NDN中名字前缀集合数目不定，Namefilter中BF个数就无法确定，这就要求NDN路由器动态调整BF的个数。由于FPGA、ASIC等专用硬件不能支持运行时动态创建BF，造成该方法无法适用基于FPGA、ASIC的硬件平台。

文献[12]提出了基于BF的数据结构DiPIT，用于PIT的存储和快速查询及更新。DiPIT为NDN路由器中每个端口创建一个BF，用于存储经该端口的数据请求包的名字，同时创建一个共享BF，用来降低每个BF假阳性带来的误判。DiPIT中采用BF只能表示名字字段，无法表示PIT中每个表项的时间戳、Nonce列表、Face列表等字段。对于一些超过时限的PIT表项，DiPIT采用周期性衰减BF中每个计数器值的策略，会删除一些处于正常时限内的PIT表项，导致无法转发部分数据回复包。

为了有效存储PIT表项，文献[7]提出了一种基于d-left哈希表的PIT数据结构(d-left HTPIT)，当d=2时，d-left HTPIT由于占用空间大，只能存储于空间较大但访问时延较大的片外存储器(如DRAM)中，而每次名字查找平均访问次数为 $d\left[ {\sum\limits_{I=1}^{E}{i}}/{E}\; \right]$ ，有时还需要查询overflow table，更加降低数据包处理效率。为了提高哈希表的并行处理速度，则需要不断增加d，但这样又会增加名字查找过程中对哈希表的访问次数。特别是遭遇泛洪攻击时，由于频繁的片外存储单元访问而导致NDN路由器宕机。

NDN的实现原型CCNx提出名字前缀哈希表(name prefix hash table, NPHT)^[23]建立FIB和PIT共同的索引。FIB和PIT表项详细信息分别存于2个不同的哈希表中。NPHT最大优势是通过前缀之间的关联关系来提高最长前缀匹配效率。但NPHT存储了FIB或PIT名字的所有字符，内存空间占用较大，而且由于FIB与PIT索引存于同一个哈希表，这势必成为多个数据包并行处理时的访问瓶颈。

4. 结束语

本文提出了一种名为哈希布鲁姆过滤器的数据结构及相应查询算法，该结构通过CBF的定位与过滤作用，避免查找时对g个哈希表的遍历操作，大幅度减少对片外存储器的访问开销，降低名字查找的总体访问成本，提高名字查找速率，有效避免泛洪攻击。本文对HBF总体访问成本Cost_H_BF与m/n、r、k、a等参数关系进行了系统理论分析和实验验证，为工业界应用提供了设计依据。

同时通过与类似研究成果d-left HTPIT对比，HBF在NDN名字查找过程的内存访问次数(片外存储器)和总体访问成本大幅度降低，在其占用最少片内存储器空间情况下(每个名字消耗12 bits)，片外存储器访问次数和总体访问成本约为d-left HTPIT的25%；当其占用空间提高到每个名字消耗40 bits时，片外存储器访问次数约为d-left HTPIT的1% (HBF中k=7)。而这样的比较结果还是在d-left HTPIT中哈希表个数d设为最小值时取得的，此时d-left HTPIT中哈希表会成为数据包并发处理时资源访问的瓶颈。为了解决此问题则需要提高哈希表个数d，那么HBF在总体访问成本的优势就会更加突出。

参考文献 (20)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

面向NDN中名字查找的哈希布鲁姆过滤器

doi: 10.3969/j.issn.1001-0548.2017.05.016

通讯作者: 李玮(1972-), 男, 博士, 主要从事可信系统与网络、大数据处理等方面的研究

Hash Bloom Filters for Name Lookup in Named Data Networking

计量

面向NDN中名字查找的哈希布鲁姆过滤器

doi: 10.3969/j.issn.1001-0548.2017.05.016

湖南大学信息科学与工程学院长沙 410082

通讯作者: 李玮(1972-), 男, 博士, 主要从事可信系统与网络、大数据处理等方面的研究

English Abstract

Hash Bloom Filters for Name Lookup in Named Data Networking

College of Computer Science and Electronics Engineering, Hunan University Changsha 410082

全文HTML

2.1. HBF结构和原理

2.2. HBF算法分析

3.1. 实验方案及数据

3.2. 实验结果分析

目录

期刊在线

编辑办公

友情链接

留言板

面向NDN中名字查找的哈希布鲁姆过滤器

doi: 10.3969/j.issn.1001-0548.2017.05.016

通讯作者: 李玮(1972-), 男, 博士, 主要从事可信系统与网络、大数据处理等方面的研究

Hash Bloom Filters for Name Lookup in Named Data Networking

计量

出版历程

面向NDN中名字查找的哈希布鲁姆过滤器

doi: 10.3969/j.issn.1001-0548.2017.05.016

湖南大学信息科学与工程学院 长沙 410082

通讯作者: 李玮(1972-), 男, 博士, 主要从事可信系统与网络、大数据处理等方面的研究

English Abstract

Hash Bloom Filters for Name Lookup in Named Data Networking

College of Computer Science and Electronics Engineering, Hunan University Changsha 410082

全文HTML

2.1. HBF结构和原理

2.2. HBF算法分析

3.1. 实验方案及数据

3.2. 实验结果分析

目录

期刊在线

编辑办公

友情链接

湖南大学信息科学与工程学院长沙 410082