留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

快速的文本倾向性分类方法

李艳玲 戴冠中 覃森

李艳玲, 戴冠中, 覃森. 快速的文本倾向性分类方法[J]. 电子科技大学学报, 2007, 36(6): 1232-1236.
引用本文: 李艳玲, 戴冠中, 覃森. 快速的文本倾向性分类方法[J]. 电子科技大学学报, 2007, 36(6): 1232-1236.
LI Yan-ling, DAI Guan-zhong, QIN Sen. A Rapid Method for Text Tendency Classification[J]. Journal of University of Electronic Science and Technology of China, 2007, 36(6): 1232-1236.
Citation: LI Yan-ling, DAI Guan-zhong, QIN Sen. A Rapid Method for Text Tendency Classification[J]. Journal of University of Electronic Science and Technology of China, 2007, 36(6): 1232-1236.

快速的文本倾向性分类方法

基金项目: 

国家863计划项目(2005AA147030)

详细信息
    作者简介:

    李艳玲(1970-),女,在职博士生,副教授,主要从事数据挖掘、网络信息安全等方面的研究.

  • 中图分类号: TP391

A Rapid Method for Text Tendency Classification

Funds: 

Supported by the National 863 Projects (2005AA147030)

计量
  • 文章访问数:  3589
  • HTML全文浏览量:  134
  • PDF下载量:  45
  • 被引次数: 0
出版历程
  • 收稿日期:  2007-08-20
  • 刊出日期:  2007-12-15

快速的文本倾向性分类方法

    基金项目:

    国家863计划项目(2005AA147030)

    作者简介:

    李艳玲(1970-),女,在职博士生,副教授,主要从事数据挖掘、网络信息安全等方面的研究.

  • 中图分类号: TP391

摘要: 提出了一种快速的文本倾向性分类方法,即采用类别空间模型描述词语对类别的倾向性,基于词的统计特征实现分类;针对倾向性分类的复杂性,在综合考虑词频、词的文本频、词的分布三种统计特征的基础上,提出一种新的二次特征提取方法:第一次特征提取,采用组合特征提取方法,除去低频词以及在各类中均匀分布的噪音词;第二次特征提取,去除类别倾向性不明显的词。实验表明该分类方法不仅具有较高的分类性能,而且运行速度快,在信息检索、信息过滤、内容安全管理等方面具有一定的实用价值。

English Abstract

李艳玲, 戴冠中, 覃森. 快速的文本倾向性分类方法[J]. 电子科技大学学报, 2007, 36(6): 1232-1236.
引用本文: 李艳玲, 戴冠中, 覃森. 快速的文本倾向性分类方法[J]. 电子科技大学学报, 2007, 36(6): 1232-1236.
LI Yan-ling, DAI Guan-zhong, QIN Sen. A Rapid Method for Text Tendency Classification[J]. Journal of University of Electronic Science and Technology of China, 2007, 36(6): 1232-1236.
Citation: LI Yan-ling, DAI Guan-zhong, QIN Sen. A Rapid Method for Text Tendency Classification[J]. Journal of University of Electronic Science and Technology of China, 2007, 36(6): 1232-1236.

目录

    /

    返回文章
    返回