互联网络科技信息自动抽取系统的开发

作者:程显林;王敬山;韩冬;姜建国; 时间:2008-01-01 点击数:

程显林;王敬山;韩冬;姜建国;

  • 1:大庆职业学院计算机系

  • 2:大庆石油学院机械科学与工程学院

  • 3:大庆石油学院电气信息工程学院

摘要(Abstract):

为自动从网页中抽取所需科技信息,根据两类知识:一类描绘网页本身的特点及识别各网页信息对象的确定模式知识;另一类描述网页信息记录块及各网页信息对象的非确定模式知识,提出一种基于知识库的信息抽取方法,给出初步实现的可以运行的原型系统.该系统依据前一类知识,经过动态分析,获得后一类知识,然后利用这2类知识自动完成从信息内容类似,但其表现形式各异的网页中抽取所需的科技信息.应用结果表明:实验网页论文信息被成功提取.

关键词(KeyWords):Internet;信息抽取;半结构化数据;抽取器

Abstract:

Keywords:

基金项目(Foundation):大庆市科技攻关项目(SGG2007038)

作者(Author):程显林;王敬山;韩冬;姜建国;

Email:

参考文献(References):

2019 版权所有©东北石油大学 | 地址:黑龙江省大庆市高新技术产业开发区学府街99号 | 邮政编码:163318

信息维护:学报 | 技术支持:现代教育技术中心

网站访问量: