基于主要特征抽取的重现概念漂移处理算法

冯超 文益民 汤凌冰 桂林电子科技大学计算机科学与工程学院 桂林541004 桂林电子科技大学广西可信软件重点实验室 桂林541004 湖南商学院计信学院 长沙410205

关键词:重现概念漂移 主要特征 影响因子 数据流 hoeffding不等式 

摘要:针对重现概念漂移检测中的概念表征和分类器选择问题,提出了一种适用于含重现概念漂移的数据流分类的算法———基于主要特征抽取的概念聚类和预测算法(Conceptual clustering and predic‐tion through main feature extraction ,MFCCP)。MFCCP通过计算不同批次样本的主要特征及影响因子的差异度以识别重复出现的概念,为每个概念维持且及时更新一个分类器,并依据Hoeffding不等式选择最合适的分类器对当前样本集实施分类,以提高对概念漂移的反应能力。在3个数据集上的实验表明:M FCCP在含重现概念漂移的数据集上的分类准确率,对概念漂移的反应能力及对概念漂移检测的准确率均明显优于其他4种对比算法,且M FCCP也适用于对不含重现概念漂移的数据流进行分类。

数据采集与处理杂志要求:

{1}基金项目:如果论文是项目成果,请按“项目名称(项目号)”的形式写出。项目名称与项目号两者都要有。

{2}稿件应具有科学性、创新性和实用性,论点明确、论据可靠、数据准确、逻辑严谨、文字通顺。

{3}文中图表或插图请附清晰的原图文件(tif. 或eps.格式,不低于600 像素)。

{4}注释是对论文中某一特定内容的解释或补充说明,用带圈数字注于当页页脚。

{5}稿件文字、标点、年代、数字等书写方式均以国家有关规定为准。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数据采集与处理

北大期刊
1-3个月下单

关注 17人评论|0人关注
相关期刊
服务与支付