作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (23): 50-52. doi: 10.3969/j.issn.1000-3428.2010.23.017

• 软件技术与数据库 • 上一篇    下一篇

基于条件误分类的决策树剪枝算法

徐晶1,刘旭敏1,关永1,董睿2   

  1. (1.首都师范大学信息工程学院, 北京 100048; 2.滨州水文水资源勘测局, 山东 滨州 256609)
  • 出版日期:2010-12-05 发布日期:2010-12-14
  • 作者简介:徐晶(1984-),女,硕士研究生,主研方向:数据挖掘;刘旭敏、关永,教授、博士;董睿,工程师
  • 基金资助:
    国家自然科学基金资助项目(60873006);北京市教育委员会科技发展计划基金资助重点项目(KZ200710028014);北京市自然科学基金资助项目(4082009);北京市科技新星计划基金资助项目(2008B57);北京市属高等学校人才强教计划基金资助项目

Pruning Algorithm of Decision Tree Based on Condition Misclassification

XU Jing1,LIU Xumin1,GUAN Yong1,DONG Rui2   

  1. (1.School of Information Engineering, Capital Normal University, Beijing 100048, China; 2.Binzhou Hydrology and Water Resources Office, Binzhou 256609, China)
  • Online:2010-12-05 Published:2010-12-14

摘要: 在建立决策树分类模型时,剪枝的方法直接影响分类器的分类效果。通过研究基于误差率的剪枝算法,引入条件误差的概念,改进剪枝标准的评估方法,针对决策树的模型进行优化,提出条件误差剪枝方法,并将其应用于C4.5算法中。实验结果表明,条件误差剪枝方法有效地解决剪枝不充分和过剪枝的情况,在一定程度上提高了准确率。

关键词: 决策树, 误分类剪枝, 条件误分类

Abstract: The methods of pruning have great influence on the effect of the decision tree. By researching on the pruning method based on misclassification, this paper introduces the conception of condition misclassification and improves the standard of pruning, it proposes the conditional misclassification pruning method for decision tree optimization and applies it in C4.5 algorithm. Experimental result shows that the condition misclassification pruning can avoid over pruned problem and nonenough pruned problem to some extent and improve the accuracy rate of classification.

Key words: decision tree, misclassification pruning, condition misclassification

中图分类号: