当前位置: 首页 > news >正文

广州地址设计网站中国建筑工程门户商城

广州地址设计网站,中国建筑工程门户商城,海南营销网站建设,电脑网页设计论文地址#xff1a;Excellent-Paper-For-Daily-Reading/summarize at main 类别#xff1a;综述 时间#xff1a;2023/11/03 摘要 这篇论文比较久了#xff0c;但仍能从里面获得一些收获#xff0c;论文主要是讨论并研究了不同的非线性激活函数的影响#xff0c;sig…论文地址Excellent-Paper-For-Daily-Reading/summarize at main 类别综述 时间2023/11/03 摘要 这篇论文比较久了但仍能从里面获得一些收获论文主要是讨论并研究了不同的非线性激活函数的影响sigmoid函数它的非零均值会在Hessian中诱发重要的奇异值很容易导致在隐藏层中达到饱和区域且也证实了sigmoid激活函数在随机初始化的深度网络并不是很合适。不过却又发现处于处于饱和的神经元能够自己“逃脱出”饱和状态。这可能是由于训练算法中的一些机制例如学习率的调整或梯度剪切。 此外论文还讨论了雅可比矩阵的奇异值与训练困难之间的关系。当雅可比矩阵的奇异值远大于1时训练会更加困难这表明了梯度问题在深度网络中的重要性。 实验 sigmoid 在监督学习期间对于深度架构的不同隐藏层激活值(sigmoid曲线的输出)的平均值和标准差(竖条)。顶部隐藏层在0处迅速饱和(减慢所有学习速度)然后在epoch 100左右慢慢去饱和。 tanh 上图分别为 tanh 作为激活函数的激活值情况和 softsign 函数作为激活函数的激活值情况。其中实线表示上下标准差而没有实线的点则表示 98% 的数据分布。 首先看上面的图像可以看出从第一层到第五层在标准均匀初始化权值的前提下逐渐每层都慢慢到了饱和区 对于这个现象文中也没有给出合理的解释。再观察下面的图像可以看出 softsign 函数的激活值比 tanh 函数的激活值区域饱和区的速度慢因此效果也就更好。 Softsign 上图表示激活值在学习结束时归一化的直方图分布在同一层上的所有神经元和300个测试示例。两幅图中上面的表示的是激活函数为 tanh 下面表示的是激活函数为 softsign处在 0 附近的激活值是线性区而 (-0.8, -0.6) 和 (0.6, 0.8) 区域处于非线性区。 总结 训练迭代是理解深度网络中训练困难的一个强大的研究工具。当从小的随机权重初始化时应该避免Sigmoid激活(在0周围不对称)因为它们产生较差的学习动态顶部隐藏层初始饱和。保持层到层的转换这样激活和梯度都很好地流动(即雅可比矩阵在1左右)似乎是有帮助的并且可以消除纯监督深度网络和使用无监督学习预训练的深度网络之间的很大一部分差异。
http://www.sadfv.cn/news/80592/

相关文章:

  • win7 iis架设网站建的网站403
  • 品牌网站建设要多少钱手机制作app需要什么软件
  • 上海网站制作福州wordpress制作自定义页面的方法
  • 莱芜找工作网站网站百度推广和优化
  • 手机网站建立教程网站后台信息发布这样做
  • 桂林市生活网官方网站房地产推广策略
  • 小网站推荐电商网站建设基本流程图
  • 西樵网站开发中信建设有限责任公司陈晓佳简历
  • 东莞大型网站建设成都建设网站哪家好
  • 贸易网站怎么做电子商务网站建设管理论文
  • 建站是什么意思网站视频是什么软件做的
  • 购物网站开发中查看订单的实现逻辑美食网站建设实施方案
  • 两学一做的做题网站是多少vs2012 建网站
  • 济南正规网站建设公司手机网站图片切换
  • 北京网站设计定制开发建设公司泰顺网站建设
  • 电子商务网站平台有哪些网站建设分金手指排名十二
  • 建站点怎么做网站前端做网站维护
  • 临安区规划建设局网站网站建设基础书本
  • 门户网站开发 论文企业邮箱登录入口126
  • 陕西省建设厅网站劳保统筹基金华为软件开发工程师月薪多少
  • 网站建设样式c 网站开发怎么弹出输入框
  • 网站建设软件kan微信公众号网站制作
  • 德州网站建设维护免费商品展示页面设计模板
  • 河南住房和城乡建设厅网官方网站注册推广
  • 深圳建站服务中心广州网站建设十年乐云seo
  • 北京网站制作合肥欧米茄女士手表网站
  • 国内外网站网站网站与平台的区别
  • 网络品牌网站建设价格如何自己做网站界面
  • 帮企网站建设2021年最新企业所得税政策
  • 电子商城网站建设 模板免费企业名录数据