作者:刘祥楼;张淼;刘得军;姜继玉; 时间:2008-01-01 点击数:
刘祥楼;张淼;刘得军;姜继玉;
1:大庆石油学院电子科学学院
2:大庆石油学院电子科学学院
3:中国石油大学(北京)机电工程学院
4:大庆石油学院电子科学学院 黑龙江大庆163318
摘要(Abstract):
自动文本分类是信息处理的主要研究内容.分析中文文本分类的基本过程和主要技术,并用支持向量机(SVM)实现文本分类.比较多项式、径向基和Sigmoid核函数的分类效果.结果表明,将中文自然语言平台的语料库中1900个文本作为测试样本和训练样本,采用径向基核函数的SVM分类算法,实现中文文本分类的效果最佳,总准确率达到88.579%.
关键词(KeyWords):文本分类;支持向量机;核函数;特征项选择
Abstract:
Keywords:
基金项目(Foundation):黑龙江省教育厅科学技术研究资助项目(11511015)
作者(Author):刘祥楼;张淼;刘得军;姜继玉;
Email:
参考文献(References):
[1]巩军,刘鲁.一种k-NN文本分类器的改进方法[J].情报学报,2007,26(1):56-59.
[2]刘华.改进的简单贝叶斯文本分类[J].暨南大学学报,2007,28(1):48-51.
[3]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-41.
[4]陈治纲,何丕廉,孙越恒,等.基于向量空间模型的文本分类系统的研究与实现[J].中文信息学报,2005,19(1):36-40.
[5]JOHN A A.Combininginf-ormation extraction with genetic algor-ithms for text mining[J].IEEEIntel-ligent Systems,2004,19(3):22-30.
2019 版权所有©东北石油大学 | 地址:黑龙江省大庆市高新技术产业开发区学府街99号 | 邮政编码:163318
信息维护:学报 | 技术支持:现代教育技术中心
网站访问量: