决策树决策法是

来源:学生作业帮助网 编辑:作业帮 时间:2024/04/28 05:13:30
决策树决策法是

决策树决策法是
决策树决策法是

决策树决策法是
决策树分类算法是数据挖掘技术中的一种预测模型,它通过次序、无规则的样本数据集推理出决策树表示形式,并用于目标数据集的分类.它可以用来处理高维数据且具有很好的准确率,其构造不需要任何领域知识或参数设置,因此适合于探测式知识发现.目前决策树分类算法已经成功地应用于许多领域的分类,如商业、医学、制造和生产、金融分析、天文学和分子生物学等.
决策树整体结构类似于流程图的树结构,其中每个内部节点(非叶节点)表示在某个属性上的测试,每个分枝代表一个测试输出,而每个树叶节点(或终结点)存放一个类标号.树的最顶层节点是根节点.
在决策树的构建过程中,采用自顶向下的递归方式,在树的内部结点进行属性值(预测变量)的比较并根据不同的属性值判断从该结点向下的分支直至叶节点的形成,为了避免决策树过于复杂和庞大,同时防止过度拟合现象的发生,需要在生成决策树的过程中或者是结束后对决策树进行剪枝.
“如何使用决策树分类?”我们可以直接利用生成的决策树模型,即给定一个与样本数据具有相同属性但类标号未知元组X,在决策树上测试数据集的属性值,根据某条由根到叶节点的路径,该叶节点就存放着该元组的类预测;我们也可以将决策树模型转换成分类规则集,每条规则对应由根到叶节点路径上的判断条件以及叶节点中的类别,然后利用规则集对未知元组进行类别划分.
目前主要的决策树分类算法有:在20世纪80年代后期和80年代初期,机器学习研究者I.Ross.Quinlan开发了决策树算法,称作ID3.Quinlan后来提出了C4.5.1984年几位统计学家(L.Breiman,J.Friedman,R.Qlshen和C.Stone)出版了分类与回归树(CART).C5.0是Quinlan在C4.5算法的基础上引入Boosting技术而来新算法,但是Quinlan提出的C5.0算法是直接做成应用软件进行商业化的,因此Quinlan对C5.0算法的步骤及数学描述还未公布,此外还有张晓贺开发的用于遥感影像分类的提升树GLC树.