如何进行网站制作,湖南人工智能建站系统软件,企业网站首页flash,seo关键词词库决策树
上图的数据集是一个特征值X采用分类值#xff0c;即只取几个离散值#xff0c;同时也是一个二元分类任务#xff0c;即标签Y只有两个值 上图为之前数据集对应的决策树#xff0c;最顶层的节点称为根节点#xff0c;椭圆形节点称为决策节点#xff0c;矩形节点称…决策树
上图的数据集是一个特征值X采用分类值即只取几个离散值同时也是一个二元分类任务即标签Y只有两个值 上图为之前数据集对应的决策树最顶层的节点称为根节点椭圆形节点称为决策节点矩形节点称为叶子节点 决策树学习算法的工作是在所有可能的决策树中选择一个在训练集上能表现良好并能很好的推广到新数据即交叉验证集和测试集的决策树
决策树的学习过程
在构建决策树的过程中有几个关键决定 决定一如何选择特征作为每一个节点决策树算法通过最大化纯度来选择特征作为节点从而对数据集进行拆分 决定二什么时候停止拆分当某个节点处的数据的纯度为100%时当拆分某个节点后会导致决策树超过最大深度时当拆分节点后对纯度影响太小时当某个节点的示例数量太少时根节点的深度为0停止拆分的原因是为了确保我们的树不会变得太大和太笨重保持树很小就不太容易过拟合