当前位置: 首页 > news >正文

wordpress 登陆页面太原关键词排名优化

wordpress 登陆页面,太原关键词排名优化,python自学免费教程,山西省吕梁市属于哪个市摘要#xff1a; 在本文中#xff0c;将通过十个实例介绍在机器学习项目中起关键作用的统计学方法。 统计学和机器学习是两个密切相关的领域。两者的界限有时非常模糊#xff0c;例如有一些明显属于统计学领域的方法可以很好地处理机器学习项目中的问题。事实上#xff0c…摘要 在本文中将通过十个实例介绍在机器学习项目中起关键作用的统计学方法。 统计学和机器学习是两个密切相关的领域。两者的界限有时非常模糊例如有一些明显属于统计学领域的方法可以很好地处理机器学习项目中的问题。事实上机器学习预测建模项目必须通过统计学方法才能有效的进行。 在本文中我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。这将证明统计学的有效知识对解决预测建模问题是必不可少的。 1、问题框架 在预测建模问题中影响最大的可能就是问题框架了。它要对问题类型做不同的选择例如选择回归或分类以及问题的输入输出的结构和类型。 问题框架并不总是显而易见的。对于该领域的初入门者需要对领域的观察发现结果进行深入研究。而对于那些总是从传统角度看待问题的领域专家来说则需要从多角度考虑数据。 在构思问题框架时统计学方法能够帮助探索数据包括 ·探索性数据分析通过总结和可视化探索数据的ad hoc视图。 ·数据挖掘自动发现数据中的结构化关系和模式。 2、数据理解 数据理解意味着要对变量的分布和变量之间的关系有一个深入的了解。这些知识有些来自领域的专业知识或者需要专业知识来解释。然而不论是领域专家还是新手都是从这个领域的观察资料中获益。 统计方法的两大分支可用于帮助理解数据 ·汇总统计该方法使用统计量总结变量之间的分布和关系。 ·数据可视化该方法使用可视化方法如图解、散点图、曲线图来总结变量之间的分布和关系。 3、数据清理 通过直接观察发现的成果往往不能作为最原始的数据。因为尽管数据是数字化的它还是会受到进程的影响损害数据保真度并且反过来这些数据还会对下游进程或模型造成影响。 一些例子包括 ·数据损坏。 ·数据错误。 ·数据丢失。 识别和修复数据问题的过程被称为数据清理。 统计学中有些方法可用来进行数据清理例如 ·异常点检测识别分布中远离预期值的异常值。 ·归责修复或填充观察结果中的损坏值或缺失值。 4、数据选择 在建模时并非所有的观察值或所有的变量都是相关的。 将数据范围不断缩小直到剩余元素对预测结果最有效的过程称为数据选择。 用于数据选择的两种统计方法为 ·数据样本系统地从较大数据集中创建小的具有代表性的样本。 ·特征选择自动识别与输出结果最相关的变量。 5、数据准备 通常数据是不能直接用于建模的。所以为了匹配已选好的问题框架或学习算法要对数据进行一些转换来改变数据的形状或结构。 可使用以下统计方法进行数据准备 ·扩展如标准化、规范化等方法。 ·编码类似整数编码和热编码的方法。 ·变换类似Box-Cox方法那样的功率转换方法。 6、模型评估 预测建模问题的关键是评估学习方法当在训练模型中对没见过的数据进行预测时需要对模型的技能进行评估。这种训练和评估预测模型的过程称为实验设计。 ·实验设计该方法能够通过设计系统实验来比较独立变量对输出结果的影响如机器学习算法的选择对预测精度的影响。 有些实验设计的方法可以重新采样数据集从而更经济的使用数据来预估模型技能。 ·重采样方法为了训练和评估预测模型系统地将数据集分成子集的方法。 7、模型配置 一个给定的机器学习算法通常具有一套超参数通过超参数实现对特定问题量身定制学习方法。超参数的配置本质上是经验性的而不是分析性的所以需要大量实验来评估不同超参数值对模型技能的影响。 使用统计的两个子领域之一对不同超参数配置之间的结果进行解释和比较即 ·统计假设检验该方法能在给定结果的假设或预期的情况下量化观察结果的可能性。 ·估算统计能够用置信区间量化结果的不确定性。 8、模型选择 众多机器学习算法中的某一个也许刚好适用于给定的预测建模问题。所以选择一种方法作为解决方案的过程称为模型选择。这可能会涉及到一套标准不仅要考虑项目利益相关方还有对问题评估方法预测技巧的要求。 可以使用与模型配置一样的两类统计方法来解释不同模型的估算技能即统计假设检验和估算统计方法从而实现模型选择。 9、模型表示 一旦最终模型得到训练那它基于真实数据部署后就可以进行实际预测并呈现出最终结果。 最终模型表示的一部分包括展示模型的评估技能。 估计统计领域的一些方法可以通过使用容忍区间和置信区间达到量化机器学习模型评估技能的不确定性。 ·估计统计。该方法通过置信区间量化模型技能的不确定性。 10、模型的预测 最后是时候使用最终模型对我们不知道的真实结果预测新数据了。预测中非常重要的一部分是量化预测的可信度。 我们可以使用与模型表示一样的估计统计方法来量化这种不确定性。 总结 通过本文你应该了解到了统计方法在整个预测建模项目过程中的重要性。 数十款阿里云产品限时折扣中赶紧点击领劵开始云上实践吧 本文由北邮爱可可-爱生活 老师推荐阿里云云栖社区组织翻译。 文章原标题《10 Examples of How to Use Statistical Methods in a Machine Learning Project》 作者Jason Brownlee 译者奥特曼审校袁虎。 文章为简译更为详细的内容请查看原文 原文链接
http://www.sadfv.cn/news/251516/

相关文章:

  • 江苏瀚和建设网站wordpress别名 文章id
  • 网站的链接要怎么做潍坊网站制作保定公司电话
  • 合肥建设企业网站临沂门户网站制作
  • 车公庙网站建设免费的静态网站托管
  • 如何做微信个人网站上海中心设计公司是谁
  • 博罗网站定制公司网站建设厂家
  • 建设网站需要花钱吗排版设计专业
  • 门户网站建设方案公司深圳做网站推广公司哪家好
  • 网站建设方案项目书一个网站的二级目录在另一台服务器上_怎么做
  • 个人网页设计教程北京官网seo收费
  • 视频运营管理网站百杭网络推广公司
  • 创建网站公司好所有浏览器大全图片
  • 北京建设局投诉网站云计算运维工程师
  • 苏州学做网站镇江网站建设和优化推广多少钱
  • 做游戏网站公司做亚马逊网站费用
  • 中卫网站设计公司排名最便宜的购物app
  • 公司网站搜索引擎优化广州工商注册名字查询
  • 创可贴在线设计网站做网络写手最好进那个网站
  • 做公司网站需要注意什么建设网站要注册公司吗
  • 佛山新网站建设方案做网站的公司叫什么软件
  • 电子商务网站建设需要开发哪些模块职业培训机构资质
  • 织梦素材网站模板郴州网络推广服务
  • jsp淘宝客网站找人做网站注意哪些
  • 网站可以做无形资产吗安康创宇网站建设
  • 网站建设广州市找网站公司企业备案
  • 怎样登录建设银行官方网站商务网站设计报告
  • 企业网站建设门户温州市鹿城区建设小学网站
  • 茂名网站建设系统公司logo制作
  • 如何推广网站话术网页编辑简单分为网页美工编辑和
  • 个人网站做商城会怎样广西壮族自治区绕口令