留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

有效的爬行Ajax页面的网络爬行算法

李华波 吴礼发 赖海光 郑成辉 黄康宇

李华波, 吴礼发, 赖海光, 郑成辉, 黄康宇. 有效的爬行Ajax页面的网络爬行算法[J]. 电子科技大学学报, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024
引用本文: 李华波, 吴礼发, 赖海光, 郑成辉, 黄康宇. 有效的爬行Ajax页面的网络爬行算法[J]. 电子科技大学学报, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024
LI Hua-bo, WU Li-fa, LAI Hai-guang, ZHENG Cheng-hui, HUANG Kang-yu. Efficient Algorithm for Crawling Ajax Web Pages[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024
Citation: LI Hua-bo, WU Li-fa, LAI Hai-guang, ZHENG Cheng-hui, HUANG Kang-yu. Efficient Algorithm for Crawling Ajax Web Pages[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024

有效的爬行Ajax页面的网络爬行算法

doi: 10.3969/j.issn.1001-0548.2013.01.024
基金项目: 

江苏省自然科学基金(BK2010132)

详细信息
    作者简介:

    李华波(1981-),男,博士,主要从事网络安全方面的研究.

  • 中图分类号: TP393.08

Efficient Algorithm for Crawling Ajax Web Pages

计量
  • 文章访问数:  3365
  • HTML全文浏览量:  110
  • PDF下载量:  39
  • 被引次数: 0
出版历程
  • 收稿日期:  2011-04-12
  • 修回日期:  2012-09-18
  • 刊出日期:  2013-02-15

有效的爬行Ajax页面的网络爬行算法

doi: 10.3969/j.issn.1001-0548.2013.01.024
    基金项目:

    江苏省自然科学基金(BK2010132)

    作者简介:

    李华波(1981-),男,博士,主要从事网络安全方面的研究.

  • 中图分类号: TP393.08

摘要: Ajax页面的生成和页面导航需要执行客户端的JavaScript代码, 传统网络爬行算法无法获取Ajax页面全部内容. 分析了Ajax的工作方式, 阐述了爬行Ajax网页所面临的主要问题, 提出并实现了一种有效爬行Ajax页面的网络爬行算法. 该算法可控制客户端浏览器动态生成页面内容和完成页面导航, 为爬行过的页面分配标识编号并生成相应静态页面. 实验结果表明, 提出的算法所爬行的Ajax页面数量明显多于传统方法, 同时, 采用的双重消重策略可有效减少算法的时间耗费.

English Abstract

李华波, 吴礼发, 赖海光, 郑成辉, 黄康宇. 有效的爬行Ajax页面的网络爬行算法[J]. 电子科技大学学报, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024
引用本文: 李华波, 吴礼发, 赖海光, 郑成辉, 黄康宇. 有效的爬行Ajax页面的网络爬行算法[J]. 电子科技大学学报, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024
LI Hua-bo, WU Li-fa, LAI Hai-guang, ZHENG Cheng-hui, HUANG Kang-yu. Efficient Algorithm for Crawling Ajax Web Pages[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024
Citation: LI Hua-bo, WU Li-fa, LAI Hai-guang, ZHENG Cheng-hui, HUANG Kang-yu. Efficient Algorithm for Crawling Ajax Web Pages[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(1): 115-120. doi: 10.3969/j.issn.1001-0548.2013.01.024

目录

    /

    返回文章
    返回