留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于弱监督学习的中文百科数据属性抽取

贾真 杨燕 何大可

贾真, 杨燕, 何大可. 基于弱监督学习的中文百科数据属性抽取[J]. 电子科技大学学报, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022
引用本文: 贾真, 杨燕, 何大可. 基于弱监督学习的中文百科数据属性抽取[J]. 电子科技大学学报, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022
JIA Zhen, YANG Yan, HE Da-ke. Attribute Extraction of Chinese Online Encyclopedia Based on Weakly Supervised Learning[J]. Journal of University of Electronic Science and Technology of China, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022
Citation: JIA Zhen, YANG Yan, HE Da-ke. Attribute Extraction of Chinese Online Encyclopedia Based on Weakly Supervised Learning[J]. Journal of University of Electronic Science and Technology of China, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022

基于弱监督学习的中文百科数据属性抽取

doi: 10.3969/j.issn.1001-0548.2014.05.022
基金项目: 

国家自然科学基金(61170111, 61202043, 61262058)

详细信息
    作者简介:

    贾真(1975-),女,博士生,主要从事信息抽取、内容安全、知识工程方面的研究.

  • 中图分类号: TP391

Attribute Extraction of Chinese Online Encyclopedia Based on Weakly Supervised Learning

计量
  • 文章访问数:  3481
  • HTML全文浏览量:  166
  • PDF下载量:  75
  • 被引次数: 0
出版历程
  • 收稿日期:  2014-02-24
  • 修回日期:  2014-07-08
  • 刊出日期:  2014-10-15

基于弱监督学习的中文百科数据属性抽取

doi: 10.3969/j.issn.1001-0548.2014.05.022
    基金项目:

    国家自然科学基金(61170111, 61202043, 61262058)

    作者简介:

    贾真(1975-),女,博士生,主要从事信息抽取、内容安全、知识工程方面的研究.

  • 中图分类号: TP391

摘要: 提出基于弱监督学习的属性抽取方法, 利用知识库中已有结构化的属性信息自动获取训练语料, 有效解决了训练语料不足问题. 针对训练语料存在的噪声问题, 提出基于关键词过滤的训练语料优化方法. 提出n元模式特征提取方法, 该特征能够缓解传统n-gram特征稀疏性问题. 实验数据源来自互动百科, 从互动百科信息盒中抽取结构化属性信息构建知识库, 从百科条目文本中自动获取训练数据和测试数据. 实验结果表明, 关键词过滤能有效提高训练语料的质量, 与传统n-gram特征相比, n元模式特征能够提高属性抽取的性能.

English Abstract

贾真, 杨燕, 何大可. 基于弱监督学习的中文百科数据属性抽取[J]. 电子科技大学学报, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022
引用本文: 贾真, 杨燕, 何大可. 基于弱监督学习的中文百科数据属性抽取[J]. 电子科技大学学报, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022
JIA Zhen, YANG Yan, HE Da-ke. Attribute Extraction of Chinese Online Encyclopedia Based on Weakly Supervised Learning[J]. Journal of University of Electronic Science and Technology of China, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022
Citation: JIA Zhen, YANG Yan, HE Da-ke. Attribute Extraction of Chinese Online Encyclopedia Based on Weakly Supervised Learning[J]. Journal of University of Electronic Science and Technology of China, 2014, 43(5): 758-763. doi: 10.3969/j.issn.1001-0548.2014.05.022

目录

    /

    返回文章
    返回