当前位置: 首页 > news >正文

旅游景区网站建设的必要性泊头 网站优化

旅游景区网站建设的必要性,泊头 网站优化,贵阳学校网站建设,湖南省建设工程造价管理总站网站一、分类挖掘的基本流程 最常用的就是客户评估 1.1分类器概念 1.2分类方法 基于距离的分类方法决策树分类方法贝叶斯分类方法 1.3分类的基本流程 步骤 建立分类模型 通过分类算法对训练集训练#xff0c;得到有指导的学习、有监督的学习预定义的类#xff1a;类标号属性确定…一、分类挖掘的基本流程 最常用的就是客户评估 1.1分类器概念 1.2分类方法 基于距离的分类方法决策树分类方法贝叶斯分类方法 1.3分类的基本流程 步骤 建立分类模型 通过分类算法对训练集训练得到有指导的学习、有监督的学习预定义的类类标号属性确定使用模型进行分类 测试数据集:评估模型的预测准确度流程图 有指导的学习、无指导的学习 有指导学习(分类): 训练样本的类标号已知。根据训练集中得到的规则对新数据进行分类无指导学习(聚类): 训练样本的类标号未知通过一系列度量等试图确立数据中的类、聚类的存在。 1.4分类的基本问题 数据准备 评估方法 对用于分类、预测的方法模型进行评估预测的准确率速度:建立模型时间、使用模型时间强壮性(鲁棒性):处理噪声和空缺值的能力可伸缩(扩展性):处理大数据、构造模型能力可理解性:模型的可理解能力规则的优越性:判定树大小、分类规则的简洁性 二、基于距离的分类算法 1.常见的距离度量 欧几里得距离 曼哈顿距离 明可夫斯基距离 加权的明可夫斯基距离 2.K近邻分类 定义:测量不同特征值之间的距离方法进行分类 工作原理: 优缺点 优点:精度高、对异常值不敏感无数据输入假定缺点:时空复杂度高、适用于数值型、离散型数据 注意的问题 K值选择一般选择一个比较小的数需要用大量实验来选择结果的输出多数表决决定距离度量一般采用p2时欧氏距离。同时注意权重问题 三、决策树分类方法 基本概念 决策树对数据进行处理、利用归纳算法生成可读的规则和决策树并使用决策树对数据进行分类。基本组成根节点、内部节点、叶节点两个过程 树的建立 所有训练样本都在根节点根据属性来划分样本树的剪枝 许多分支可能反映的是训练数据中的噪声数据、孤立点将这些分支剪枝注意 在决策树算法中所有属性均为符号值即离散值因此 若有取连续值的属性必须首先进行离散化。   决策树生成算法 运用算法:贪心算法、自上而下、分治构建决策树关键:测试属性的选择注意:属性必须是离散值在运用时要考虑是否离散化常见的决策树生成算法CLS、ID3、C4.5、CAR CLS 只说了划分树的方法、而没有规定选择测试属性的标准和依据选用不同属性节点会出现很大的不同举例 ID3 针对属性选择问题而提出选择最大信息增益的属性作为当前划分节点步骤:在第六章有详细说明在电信行业应用实例 PPT61-70优缺点: 优点简单缺点 偏向分隔属性中取值多的一个只能处理离散属性无法对未知分隔属性处理没有剪枝操作、容易受到噪声、波动影响 C4.5 在ID3算法中:偏向分割属性中取值多的一个 当子集规模越小每个子集内只有一个行信息增益必然最大(熵最小)解决方法:增益比例C4.5根据增益比例选择节点分裂属性增益比例G(X,Y) 类别X、分裂属性Y引入分母H ( Y ) 偏向分割属性中取值较多的一个属性存在问题与解决的方法: 取值个数过多、过少 分割属性属性取值个数过多的话H(Y)增大但是G(X,Y)减小当取值个数很少时存在 则H(Y)0,G(X,Y)就会很大解决方法 ID3只能处理离散分割属性 ·原因:如果把连续值看做离散值会产生分割属性偏向问题解决方法 对于连续取值的属性如何选择阈值 将取值从小到大排序:{y1,y2,…,yn}对于每个yi计算增益比例找到最大值 ID3:无法对未知分割属性进行处理 原因:分割属性Y的一个取值yi,由于一些原因被计入解决方法:平均值代替(数值型属性)、概率法代替(离散属性) ID3:无树剪枝易受到噪声、波动影响 解决方法:K阶交叉验证 用K-1份训练决策树、用剩下的1份去测试性能总共进行k次迭代 Cart算法(分类回归树) 采用:基于最小距离的基尼指数估计函数 生成二叉树可以处理连续取值的数据 20、23、24、26划分为两类一类小于某个数另一类大于某个数但是不推荐最好离散化Gini指数 取值越小表达的不确定性越小 属性必须是二叉结构 计算某个属性有几个二叉结构:属性值为n,有​种划分方法 举例  与ID3算法一致只是根据计算选择Gini指标最小的。 决策树剪枝 目的:处理由于噪声数据训练出的异常用剪枝来处理过分拟合 先剪枝: 在完全正确分类训练集之前就停止树的生长。最直接方法:限定树的最大生长高度,将超过树高的部分进行剪枝 后剪枝: 完全生长的树剪去子树 提取分类规则 从决策树的根节点到任一个叶节点所形成的一条路径构成一条分类规则。用if - then 表示 四、贝叶斯分类方法 贝叶斯推理的问题是条件概率推理问题 4.1相关概念 举例 4.2.朴素贝叶斯分类 举例 4.3朴素贝叶斯的独立假设
http://www.sadfv.cn/news/291656/

相关文章:

  • 网站定制开发注意事项阿里云网页版入口
  • 有免费的网站做农家院宣传企业网站怎么做毕业设计
  • 英文网站设计公司wordpress百度云加速插件
  • 网站建设设计ppt百度如何建网站群
  • 苏州网站建站推广微信小程序是怎么开发的
  • 刷网站百度关键词软件网站的经营推广
  • 城市建设规划网站网站管理规章制度
  • 广西网站建设开发wordpress 片刻主题
  • 国际贸易网站大全余姚建设公司网站
  • 问答网站建设网站源码系统
  • 南通网站开发价格公司建网站多少钱一个月
  • 上海南山做网站wordpress文章头部
  • 免费的php网站模板林哥seo
  • 怎么下载网站的模板国际贸易交易平台有哪些
  • 有哪些网站是拐角型网站建设特定开发
  • 外贸网站建站n网站关键词优化建议
  • 访问网站速度很慢5款免费网站管理系统
  • 电子商务网站开发与建设试卷单页网站多钱
  • 东莞连衣裙 东莞网站建设音乐网站开发技术人员配置
  • seo网站内部优化谷歌seo优化排名
  • 网站建设及管理深圳做网站推广排名
  • 邮箱域名和网站域名大连零基础网站建设教学在哪里
  • 上海网站设计哪家好廊坊网站制作设计
  • 在北京做兼职哪个网站好胖咯科技网站建设
  • 上海品牌设计公司有哪些seo排名软件
  • 重庆的推广网站牡丹江出现一例
  • 北京网站建设咸宁西安做网站哪家便宜
  • 一级做c爱片的网站网站是什么样的
  • 网站后期增加内容软件工具有哪些
  • 任何查询网站有没有做404一个好网站应具备哪些条件