作者:马瑞民;邹会文;王浩畅; 时间:2009-01-01 点击数:
马瑞民;邹会文;王浩畅;
1:大庆石油学院计算机与信息技术学院
摘要(Abstract):
针对篮球比赛中各项流式数据,利用数据流的概念离散化预处理并结合改进的朴素贝叶斯分类算法及阈值方法,在有限的内存中设计出一种动态的分类挖掘,即设立最小有用信息阈值删除垃圾信息;在信息属于可用信息的情况下,利用阈值从连续的数据流中对数据进行分类并发现新类.实验表明该方法的正确性和有效性.
关键词(KeyWords):数据流;数据预处理;动态分类;阈值;朴素贝叶斯分类算法
Abstract:
Keywords:
基金项目(Foundation):黑龙省自然科学基金项目(F200603);;
黑龙江省教育厅科学技术研究项目(11521008)
作者(Author):马瑞民;邹会文;王浩畅;
Email:
参考文献(References):
[1]Widmer G,Kubat M.Learningin the presence of concept drift and hidden contexts[J].Machine Learning,1996,23(1):69-101.
[2]Domingos P,Hulten G.Mining High-Speed Data Streams[C].Proceedings of the Association for Computing Machinery,the6th In-ternational Conference on Knowledge Discovery and Data Mining,2000:71-80.
[3]Bauer E,Kohavi R.An empirical comparison of voting classification algorithms:Bagging,boosting,and variants.Machine Learning,1999,36(1-2):105-139.
[4]金澈清,钱伟宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181.
[5]Han Jiawei,Kamber M.数据挖掘:概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2007.
[6]曲俊义.篮球运动动员的气质类型与战术位置研究[J].北京体育大学学报,2007,30(S1):152-153.
[7]王小龙,马瑞民.一种挖掘数值型数据流上的分类的方法[J].计算机应用,2006,26(S2):164-168.
2019 版权所有©东北石油大学 | 地址:黑龙江省大庆市高新技术产业开发区学府街99号 | 邮政编码:163318
信息维护:学报 | 技术支持:现代教育技术中心
网站访问量: