河北唐山建设工程协会网站,wordpress后台系统,怎么下载app,南京网站建设 个人目录
深度学习、神经网络、机器学习、人工智能的关系
大白话解释深度学习
传统机器学习 VS 深度学习
深度学习的优缺点
4种典型的深度学习算法
卷积神经网络 – CNN
循环神经网络 – RNN
生成对抗网络 – GANs
深度强化学习 – RL
总结
深度学习 深度学习、神经网络…目录
深度学习、神经网络、机器学习、人工智能的关系
大白话解释深度学习
传统机器学习 VS 深度学习
深度学习的优缺点
4种典型的深度学习算法
卷积神经网络 – CNN
循环神经网络 – RNN
生成对抗网络 – GANs
深度强化学习 – RL
总结
深度学习 深度学习、神经网络、机器学习、人工智能的关系
深度学习、机器学习、人工智能
简单来说
深度学习是机器学习的一个分支(最重要的分支)机器学习是人工智能的一个分支 深度学习、神经网络
深度学习的概念源于人工神经网络的研究但是并不完全等于传统神经网络。
不过在叫法上很多深度学习算法中都会包含”神经网络”这个词比如卷积神经网络、循环神经网络。
所以深度学习可以说是在传统神经网络基础上的升级约等于神经网络。 大白话解释深度学习 假设深度学习要处理的信息是“水流”而处理数据的深度学习网络是一个由管道和阀门权重阈值组成的巨大水管网络。网络的入口是若干管道开口网络的出口也是若干管道开口。
这个水管网络有许多层每一层由许多个可以控制水流流向与流量的调节阀。根据不同任务的需要水管网络的层数、每层的调节阀数量可以有不同的变化组合。对复杂任务来说调节阀的总数可以成千上万甚至更多。水管网络中每一层的每个调节阀都通过水管与下一层的所有调节阀连接起来组成一个从前到后逐层完全连通的水流系统。 那么计算机该如何使用这个庞大的水管网络来学习识字呢
比如当计算机看到一张写有“田”字的图片就简单将组成这张图片的所有数字在计算机里图片的每个颜色点都是用“0”和“1”组成的数字来表示的全都变成信息的水流从入口灌进水管网络。 我们预先在水管网络的每个出口都插一块字牌对应于每一个我们想让计算机认识的汉字。这时因为输入的是“田”这个汉字等水流流过整个水管网络计算机就会跑到管道出口位置去看一看是不是标记由“田”字的管道出口流出来的水流最多。如果是这样就说明这个管道网络符合要求。如果不是这样就调节水管网络里的每一个流量调节阀让“田”字出口“流出”的水最多。
这下计算机要忙一阵了要调节那么多阀门好在计算机的速度快暴力的计算加上算法的优化总是可以很快给出一个解决方案调好所有阀门让出口处的流量符合要求。 下一步学习“申”字时我们就用类似的方法把每一张写有“申”字的图片变成一大堆数字组成的水流灌进水管网络看一看是不是写有“申”字的那个管道出口流水最多如果不是我们还得再调整所有的阀门。这一次要既保证刚才学过的“田”字不受影响也要保证新的“申”字可以被正确处理。 如此反复进行知道所有汉字对应的水流都可以按照期望的方式流过整个水管网络。这时我们就说这个水管网络是一个训练好的深度学习模型了。当大量汉字被这个管道网络处理所有阀门都调节到位后整套水管网络就可以用来识别汉字了。这时我们可以把调节好的所有阀门都“焊死”静候新的水流到来。 与训练时做的事情类似未知的图片会被计算机转变成数据的水流灌入训练好的水管网络。这时计算机只要观察一下哪个出水口流出来的水流最多这张图片写的就是哪个字。
深度学习大致就是这么一个用人类的数学知识与计算机算法构建起来的整体架构再结合尽可能多的训练数据以及计算机的大规模运算能力去调节内部参数尽可能逼近问题目标的半理论、半经验的建模方式。 传统机器学习 VS 深度学习
传统机器学习和深度学习的相似点 在数据准备和预处理方面两者是很相似的。
他们都可能对数据进行一些操作
数据清洗数据标签归一化去噪降维 传统机器学习和深度学习的核心区别 传统机器学习的特征提取主要依赖人工针对特定简单任务的时候人工提取特征会简单有效但是并不能通用。
深度学习的特征提取并不依靠人工而是机器自动提取的。这也是为什么大家都说深度学习的可解释性很差因为有时候深度学习虽然能有好的表现但是我们并不知道他的原理是什么。 深度学习的优缺点 优点1学习能力强
从结果来看深度学习的表现非常好他的学习能力非常强。
优点2覆盖范围广适应性好
深度学习的神经网络层数很多宽度很广理论上可以映射到任意函数所以能解决很复杂的问题。
优点3数据驱动上限高
深度学习高度依赖数据数据量越大他的表现就越好。在图像识别、面部识别、NLP 等部分任务甚至已经超过了人类的表现。同时还可以通过调参进一步提高他的上限。
优点4可移植性好
由于深度学习的优异表现有很多框架可以使用例如 TensorFlow、Pytorch。这些框架可以兼容很多平台。 缺点1计算量大便携性差
深度学习需要大量的数据很大量的算力所以成本很高。并且现在很多应用还不适合在移动设备上使用。目前已经有很多公司和团队在研发针对便携设备的芯片。这个问题未来会得到解决。
缺点2硬件需求高
深度学习对算力要求很高普通的 CPU 已经无法满足深度学习的要求。主流的算力都是使用 GPU 和 TPU所以对于硬件的要求很高成本也很高。
缺点3模型设计复杂
深度学习的模型设计非常复杂需要投入大量的人力物力和时间来开发新的算法和模型。大部分人只能使用现成的模型。
缺点4没有”人性”容易存在偏见
由于深度学习依赖数据并且可解释性不高。在训练数据不平衡的情况下会出现性别歧视、种族歧视等问题。 4种典型的深度学习算法 卷积神经网络 – CNN
CNN的价值
能够将大数据量的图片有效的降维成小数据量(并不影响结果)能够保留图片的特征类似人类的视觉原理
CNN 的基本原理
卷积层 – 主要作用是保留图片的特征池化层 – 主要作用是把数据降维可以有效的避免过拟合全连接层 – 根据不同任务输出我们想要的结果
CNN 的实际应用
图片分类、检索目标定位检测目标分割人脸识别骨骼识别 循环神经网络 – RNN RNN是一种能有效的处理序列数据的算法。比如文章内容、语音音频、股票价格走势…
之所以他能处理序列数据是因为在序列中前面的输入也会影响到后面的输出相当于有了“记忆功能”。但是 RNN 存在严重的短期记忆问题长期的数据影响很小哪怕他是重要的信息。
于是基于 RNN 出现了 LSTM 和 GRU 等变种算法。这些变种算法主要有几个特点
长期信息可以有效的保留挑选重要信息保留不重要的信息会选择“遗忘”
RNN 几个典型的应用如下
文本生成语音识别机器翻译生成图像描述视频标记 生成对抗网络 – GANs
假设一个城市治安混乱很快这个城市里就会出现无数的小偷。在这些小偷中有的可能是盗窃高手有的可能毫无技术可言。假如这个城市开始整饬其治安突然开展一场打击犯罪的「运动」警察们开始恢复城市中的巡逻很快一批「学艺不精」的小偷就被捉住了。之所以捉住的是那些没有技术含量的小偷是因为警察们的技术也不行了在捉住一批低端小偷后城市的治安水平变得怎样倒还不好说但很明显城市里小偷们的平均水平已经大大提高了。
警察们开始继续训练自己的破案技术开始抓住那些越来越狡猾的小偷。随着这些职业惯犯们的落网警察们也练就了特别的本事他们能很快能从一群人中发现可疑人员于是上前盘查并最终逮捕嫌犯小偷们的日子也不好过了因为警察们的水平大大提高如果还想以前那样表现得鬼鬼祟祟那么很快就会被警察捉住。为了避免被捕小偷们努力表现得不那么「可疑」而魔高一尺、道高一丈警察也在不断提高自己的水平争取将小偷和无辜的普通群众区分开。随着警察和小偷之间的这种「交流」与「切磋」小偷们都变得非常谨慎他们有着极高的偷窃技巧表现得跟普通群众一模一样而警察们都练就了「火眼金睛」一旦发现可疑人员就能马上发现并及时控制——最终我们同时得到了最强的小偷和最强的警察。 深度强化学习 – RL
强化学习算法的思路非常简单以游戏为例如果在游戏中采取某种策略可以取得较高的得分那么就进一步「强化」这种策略以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。
在 Flappy bird 这个游戏中我们需要简单的点击操作来控制小鸟躲过各种水管飞的越远越好因为飞的越远就能获得更高的积分奖励。
这就是一个典型的强化学习场景
机器有一个明确的小鸟角色——代理需要控制小鸟飞的更远——目标整个游戏过程中需要躲避各种水管——环境躲避水管的方法是让小鸟用力飞一下——行动飞的越远就会获得越多的积分——奖励 你会发现强化学习和监督学习、无监督学习 最大的不同就是不需要大量的“数据喂养”。而是通过自己不停的尝试来学会某些技能。
了解更多《一文看懂什么是强化学习基本概念应用场景主流算法》 总结
深度学习属于机器学习的范畴深度学习可以说是在传统神经网络基础上的升级约等于神经网络。
深度学习和传统机器学习在数据预处理上都是类似的。核心差别在特征提取环节深度学习由机器自己完成特征提取不需要人工提取。 深度学习的优点
学习能力强覆盖范围广适应性好数据驱动上限高可移植性好
深度学习的缺点
计算量大便携性差硬件需求高模型设计复杂没有”人性”容易存在偏见 深度学习的4种典型算法
卷积神经网络 – CNN循环神经网络 – RNN生成对抗网络 – GANs深度强化学习 – RL 深度学习
的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征以发现数据的分布式特征表示。
深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法为解决深层结构相关的优化难题带来希望随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法它利用空间相对关系减少参数数目以提高训练性能。
深度学习是机器学习中一种基于对数据进行表征学习的方法。
观测值例如一幅图像可以使用多种方式来表示如每个像素强度值的向量或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务例如人脸识别或面部表情识别。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
深度学习是机器学习研究中的一个新的领域其动机在于建立、模拟人脑进行分析学习的神经网络它模仿人脑的机制来解释数据例如图像声音和文本。
同机器学习方法一样深度机器学习方法也有监督学习与无监督学习之分不同的学习框架下建立的学习模型很是不同例如卷积神经网络Convolutional neural networks简称CNNs就是一种深度的监督学习下的机器学习模型而深度置信网Deep Belief Nets简称DBNs就是一种无监督学习下的机器学习模型。 深度学习也称为深度结构化学习 或分层学习是基于学习数据表示的更广泛的机器学习方法系列的一部分而不是特定于任务的算法。学习可以是监督半监督或无监督。
深度学习架构如深度神经网络深度置信网络和递归神经网络已应用于计算机视觉语音识别自然语言处理音频识别社交网络过滤机器翻译生物信息学药物设计医学图像分析等领域。 材料检查和棋盘游戏程序它们产生的结果可与人类专家相媲美在某些情况下优于人类专家。
深度学习模型受到生物神经系统中信息处理和通信模式的模糊启发但与生物大脑尤其是人类大脑的结构和功能特性存在各种差异这使得它们与神经科学证据不相容。