当前位置: 首页 > news >正文

手机网站域名哪里注册长治网站建设培训文件

手机网站域名哪里注册,长治网站建设培训文件,公司注册流程及条件,宁夏免费建个人网站神经网络的SGD、Momentum、AdaGrad、Adam最优化方法及其python实现一、SGD二、Momentum-动量三、AdaGrad四、Adam一、SGD 右边的值更新左边的值#xff0c;每次更新朝着梯度方向前进一小步。 class SGD:随机梯度下降法#xff08;Stochastic Gradient Des… 神经网络的SGD、Momentum、AdaGrad、Adam最优化方法及其python实现一、SGD二、Momentum-动量三、AdaGrad四、Adam一、SGD 右边的值更新左边的值每次更新朝着梯度方向前进一小步。 class SGD:随机梯度下降法Stochastic Gradient Descentdef __init__(self, lr0.01):self.lr lrdef update(self, params, grads):for key in params.keys():params[key] - self.lr * grads[key] 二、Momentum-动量 SGD实现简单有些问题可能没有效果比如f(x,y)(1/20)x^ 2 y ^2 SGD低效的根本原因梯度的方向没有指向最小值的方向。如果函数形状非均向如呈现延伸状搜索路径就非常低效有可能呈现z字形移动。 Momentum-动量方法公式 v表示物体在梯度方向受的力αv作用是让物体逐渐减速(α小于1常数如0.9之类的数)。 动量法的好处x轴方向受力小但是每一次梯度变化的方向不变速度方向不变一直在这个方向受力往那个方向走的速度会加速。但是y轴受到正反方向的力他们会抵消让y不稳定因此和SGD相比能更快的向x轴方向靠近。 简的来说SGD的话就是他y方向梯度大步子跨的猛的话就z形了动量的目的是梯度大的那块迈步子时候让它考虑到上一次的步子是往哪走的。如果相反方向走的话其实是抵消了一部分v这样的话如果步子跨得猛他也得少一点步子。如下图所示对于f(x,y)(1/20)x^ 2 y ^2用SGD的话m想走到y它在y轴摇摆的厉害但是用动量y轴摇摆抵消了而且x轴速度还增加了多好。 class Momentum:Momentum SGDdef __init__(self, lr0.01, momentum0.9):self.lr lrself.momentum momentumself.v Nonedef update(self, params, grads):if self.v is None:self.v {}for key, val in params.items(): self.v[key] np.zeros_like(val)for key in params.keys():self.v[key] self.momentum*self.v[key] - self.lr*grads[key] params[key] self.v[key] 三、AdaGrad h保存了梯度的平方和圆圈就表示矩阵相乘。 由于乘上根号h分之1参数的元素中变动较大的元素的学习率将变小。 这是一种学习率衰减的手法梯度下降太快了山谷太陡峭了那我就让你走的步子减小这样一来你不容易直接一步跨俩山峰山峰是啥懂得都懂嘿嘿。 class AdaGrad:AdaGraddef __init__(self, lr0.01):self.lr lrself.h Nonedef update(self, params, grads):if self.h is None:self.h {}for key, val in params.items():self.h[key] np.zeros_like(val)for key in params.keys():self.h[key] grads[key] * grads[key]params[key] - self.lr * grads[key] / (np.sqrt(self.h[key]) 1e-7) 四、Adam 结合了Momentum和AdaGrad方法。 看代码去吧 很多人喜欢用Adam哦 class Adam:Adam (http://arxiv.org/abs/1412.6980v8)def __init__(self, lr0.001, beta10.9, beta20.999):self.lr lrself.beta1 beta1self.beta2 beta2self.iter 0self.m Noneself.v Nonedef update(self, params, grads):if self.m is None:self.m, self.v {}, {}for key, val in params.items():self.m[key] np.zeros_like(val)self.v[key] np.zeros_like(val)self.iter 1lr_t self.lr * np.sqrt(1.0 - self.beta2**self.iter) / (1.0 - self.beta1**self.iter) for key in params.keys():#self.m[key] self.beta1*self.m[key] (1-self.beta1)*grads[key]#self.v[key] self.beta2*self.v[key] (1-self.beta2)*(grads[key]**2)self.m[key] (1 - self.beta1) * (grads[key] - self.m[key])self.v[key] (1 - self.beta2) * (grads[key]**2 - self.v[key])params[key] - lr_t * self.m[key] / (np.sqrt(self.v[key]) 1e-7)#unbias_m (1 - self.beta1) * (grads[key] - self.m[key]) # correct bias#unbisa_b (1 - self.beta2) * (grads[key]*grads[key] - self.v[key]) # correct bias#params[key] self.lr * unbias_m / (np.sqrt(unbisa_b) 1e-7)
http://www.yutouwan.com/news/465954/

相关文章:

  • 阿里云服务器 网站模板网站建设联系我们
  • 外贸soho虚拟公司做网站wordpress sweep
  • 建一个网站多少钱WordPress工作发布
  • 网站群建设管理办法平顶山做网站推广
  • 网站推广多少钱专业网站建设软件开发
  • 鸭梨网站建设企业网站建设进什么科目核算
  • 安徽网新科技怎么建设网站校园电商平台网站建设
  • 国内餐饮类网站欣赏水果行业为什么做网站
  • 朝阳区网站建设公司动画设计用什么软件
  • 建设网站所有步骤班级网站设计模板
  • 阿里云服务器添加网站宝安中心医院怎么样
  • 给网站网站做推广犯法网站建设包涵哪些领域
  • 惠州建站平台影楼后期修图培训学校
  • 国外社交网站做的比较好的是八上电脑课做网站需要什么软件
  • 拐角型网站石龙镇网站建设公司
  • 邯郸网站推广移动端网站怎么制作
  • 网站开发校园经历范文wordpress 静态化插件
  • 建了一个网站 如何找到放图片的文件夹wordpress获取照片信息
  • 国办网站建设规范制作企业宣传片的厂家
  • 网站建设 团队介绍wordpress木子
  • 济南机关建设网站wordpress 无法打开
  • 做网站 想做成宽屏的手机网站活动策划方案
  • 做网站制作一般多少钱网站建设放哪个科目好
  • 影响网站权重的因素有哪些开发软件学什么专业
  • 深圳做网站公司有哪些公司苏州十大广告公司
  • 不用代码可以做网站设计吗品牌设计公司是做什么的
  • 沈阳做网站的地方做网站需要了解的知识
  • 网站群建设方案.docwordpress 搭建博客
  • 网站推广报价页面设计原则
  • 网上做调查问卷赚钱的网站微网站建设及微信推广方案ppt