当前位置: 首页 > news >正文

网站流量利用线上营销方案

网站流量利用,线上营销方案,长沙房地产交易网,制作公司网页可以用网上图片吗文章目录 相关资料 优化算法梯度下降学习率牛顿法 随机梯度下降小批量随机梯度下降动量法动量法解决上述问题 AdaGrad 算法RMSProp算法Adam学习率调度器余弦学习率调度预热 相关资料 李沐 动手学深度学习 优化算法 优化算法使我们能够继续更新模型参数#xff0c;并使损失函… 文章目录 相关资料 优化算法梯度下降学习率牛顿法 随机梯度下降小批量随机梯度下降动量法动量法解决上述问题 AdaGrad 算法RMSProp算法Adam学习率调度器余弦学习率调度预热 相关资料 李沐 动手学深度学习 优化算法 优化算法使我们能够继续更新模型参数并使损失函数的值最小化。优化算法的性能直接影响模型的训练效率。 优化问题中大多数目标函数都很复杂没有解析解。相反必须使用数值优化算法。 优化与深度学习之间的关系 优化和深度学习的目标是根本不同的。前者关注的是最小化目标后者则关注在给定有限数量的情况下寻找合适的模型。训练误差和泛化误差通常不同由于优化算法的目标函数通常是基于训练数据集的损失函数因此优化的目标是减少训练误差。但是深度学习或更广义地说统计推断的目标是减少泛化误差。为了实现后者除了使用优化算法来减少训练误差之外我们还需要注意过拟合。 深度学习中使用优化的挑战 这里关注局部最小值、鞍点和梯度消失 鞍点saddle point, 函数的所有梯度都消失但不是全局最小值也不是局部最小值的任何位置。较高维度的鞍点可能会更加隐蔽。 梯度消失。假设我们想最小化函数 f ( x ) t a n h ( x ) f(x) tanh(x) f(x)tanh(x) 然后我们恰好从 x4 开始。正如我们所看到的那样f 的梯度接近零。更具体地说 f ′ ( x ) 1 − t a n h 2 ( x ) f^{}(x) 1 - tanh^2(x) f′(x)1−tanh2(x)因此 f ′ ( 4 ) 0.0013 f^{}(4) 0.0013 f′(4)0.0013. 惩罚的概念 梯度下降 在凸问题背景下设计和分析算法是非常有启发性的。 凸优化的入门以及凸目标函数上非常简单的随机梯度下降算法的证明。 为什么梯度下降算法可以优化目标函数 学习率 学习率learning rate决定目标函数能否收敛到局部最小值以及何时收敛到最小值。 牛顿法 随机梯度下降 目标函数通常是训练数据集中每个样本的损失函数的平均值。 给定 n 个样本的训练数据集我们假设 f i ( x ) f_i(x) fi​(x)是关于索引 i i i 的训练样本的损失函数其中 X X X 是参数向量。然后我们得到目标函数 X X X的目标函数的梯度计算为 其中 μ \mu μ是学习率。我们可以看到每次迭代的计算代价从梯度下降的 O ( n ) O(n) O(n)降至常数 O ( 1 ) O(1) O(1). 小批量随机梯度下降 动量法 这个动量法似乎不是针对学习率的改变。而是针对每个 x i x_{i} xi​ 的值。 动量法可以解决变量之间梯度变化不一致导致的一些问题 动量法解决上述问题 AdaGrad 算法 在AdaGrad算法中我们允许每个坐标有单独的学习率。 然而在深度学习中我们可能希望更慢地降低学习率。 这引出了许多AdaGrad算法的变体。 优化算法本身会根据梯度调节其实际的学习率。 RMSProp算法 以RMSProp算法作为将速率调度与坐标自适应学习率分离的简单修复方法。 Adam 学习率调度器 多项式衰减 分段常数表 余弦学习率调度 它所依据的观点是我们可能不想在一开始就太大地降低学习率而且可能希望最终能用非常小的学习率来“改进”解决方案。 预热 在某些情况下初始化参数不足以得到良好的解。 这对某些高级网络设计来说尤其棘手可能导致不稳定的优化结果。 对此一方面我们可以选择一个足够小的学习率 从而防止一开始发散然而这样进展太缓慢。 另一方面较高的学习率最初就会导致发散。 解决这种困境的一个相当简单的解决方法是使用预热期在此期间学习率将增加至初始最大值然后冷却直到优化过程结束。 class CosineScheduler:def __init__(self, max_update, base_lr0.01, final_lr0,warmup_steps0, warmup_begin_lr0):self.base_lr_orig base_lrself.max_update max_updateself.final_lr final_lrself.warmup_steps warmup_stepsself.warmup_begin_lr warmup_begin_lrself.max_steps self.max_update - self.warmup_stepsdef get_warmup_lr(self, epoch):increase (self.base_lr_orig - self.warmup_begin_lr) \* float(epoch) / float(self.warmup_steps)return self.warmup_begin_lr increasedef __call__(self, epoch):if epoch self.warmup_steps:return self.get_warmup_lr(epoch)if epoch self.max_update:self.base_lr self.final_lr (self.base_lr_orig - self.final_lr) * (1 math.cos(math.pi * (epoch - self.warmup_steps) / self.max_steps)) / 2return self.base_lrscheduler CosineScheduler(max_update20, base_lr0.3, final_lr0.01) d2l.plot(torch.arange(num_epochs), [scheduler(t) for t in range(num_epochs)])scheduler CosineScheduler(20, warmup_steps5, base_lr0.3, final_lr0.01) d2l.plot(torch.arange(num_epochs), [scheduler(t) for t in range(num_epochs)])
http://www.sadfv.cn/news/39458/

相关文章:

  • 汕头网站网店建设wordpress nginx伪静态
  • dedecms 网站地图 插件长沙精品网站建设公司
  • 华侨城网站开发有关做美食的网站有哪些
  • 怎样自己搭建一个做影视的网站门户网站团队建设
  • 帝国网站怎么仿站重庆南川网站制作公司哪家专业
  • 宜州网站建设铜陵市住房和城乡建设局网站
  • 网站建设开发的条件网站开发下载哪个
  • 重庆住房和城乡建设部网站的打印准考证跨境电商网站建设流程
  • 怎么给公司做简单网站兰州官网seo诊断
  • 康桥网站建设网站开发是否用html5
  • phpstudy做网站运营的坏处深圳建设网站哪家好
  • 做数码测评的网站企业邮箱格式是什么样的
  • 企业网站的设计与实现网站开发全程实例课本代码
  • 标签化网站wordpress分页
  • 做博客网站的空间容量需要多少wordpress会员管理
  • 企业网站seo推广鹰潭做网站的
  • 西北网站建设优惠券网站建设
  • 大邑县建设局网站网络营销渠道优化
  • 网站基本建设的原理总结网站推广策划书的共同特点
  • html 类似淘宝购物网站上加载时获取属性并可多选过滤 代码做衣服接订单的网站
  • 郴州网站制作公司地址创建吃的网站怎么做
  • 网站开发的论文课题wordpress外链论坛
  • 旅游网站建设设计学习做网站可以吗
  • 地方网站做外卖全国蔬莱网站建设
  • 网站后台功能模块医院网站源码下载
  • 定制网站设计建网站的公司广州
  • 网络推广建立站点如何建立网站建设职业
  • 网站如何取消验证码建材网站建设方案
  • 湘潭学校网站建设 磐石网络专注oa管理系统是什么
  • 西安企业网站排名优化工具比较好的app创意想法