7.1 引言
决策树学习是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则,通常用来形成分类器,可以对未知数据进行分类。在各种决策树分类的算法中,早期的是CLS学习算法和CART算法。最有影响的是Quinlan提出的ID3算法,在ID3算法的基础上,他又提出了C4.5算法。为了适应处理大规模数据集的需要,后来又提出了若干改进的算法,如SLIQ算法、SPRINT算法、PUBLIC算法等。ID3(Iterative Dichotomizer 3)算法是Quinlan在1986年提出的,它是决策树算法的代表,绝大多数决策树算法都是在它的基础上加以改进而实现的。它采用分治策略,在决策树各级结点上选择属性时, ...... (共490字) [阅读本文]>>