运城市网站建设公司,安徽道遂建设工程有限公司网站,2021跨境电商最火的产品,西安网站建设公司找哪家马同学
从数学上讲#xff0c;卷积就是一种运算。
某种运算#xff0c;能被定义出来#xff0c;至少有以下特征#xff1a;
首先是抽象的、符号化的 其次#xff0c;在生活、科研中#xff0c;有着广泛的作用 比如加法#xff1a;
[公式] #xff0c;是抽象的…马同学
从数学上讲卷积就是一种运算。
某种运算能被定义出来至少有以下特征
首先是抽象的、符号化的 其次在生活、科研中有着广泛的作用 比如加法
[公式] 是抽象的本身只是一个数学符号 在现实中有非常多的意义比如增加、合成、旋转等等 卷积是我们学习高等数学之后新接触的一种运算因为涉及到积分、级数所以看起来觉得很复杂。
1 卷积的定义 这两个式子有一个共同的特征 这个特征有什么意义 如果遍历这些直线就好比把毛巾沿着角卷起来
此处受到 荆哲卷积为什么叫「卷」积 答案的启发。
只看数学符号卷积是抽象的不好理解的但是我们可以通过现实中的意义来习惯卷积这种运算正如我们小学的时候学习加减乘除需要各种苹果、糖果来帮助我们习惯一样。
我们来看看现实中这样的定义有什么意义。
2 离散卷积的例子丢骰子
我有两枚骰子 把这两枚骰子都抛出去
求
这里问题的关键是两个骰子加起来要等于4这正是卷积的应用场景。
我们把骰子各个点数出现的概率表示出来
那么两枚骰子点数加起来为4的情况有 3 连续卷积的例子做馒头
楼下早点铺子生意太好了供不应求就买了一台机器不断的生产馒头。 4 图像处理
4.1 原理
有这么一副图像可以看到图像上有很多噪点
高频信号就好像平地耸立的山峰
看起来很显眼。
平滑这座山峰的办法之一就是把山峰刨掉一些土填到山峰周围去。用数学的话来说就是把山峰周围的高度平均一下。
平滑后得到
4.2 计算
卷积可以帮助实现这个平滑算法。
有噪点的原图可以把它转为一个矩阵 记得刚才说过的算法把高频信号与周围的数值平均一下就可以平滑山峰。
比如我要平滑 [公式] 点就在矩阵中取出 [公式] 点附近的点组成矩阵 [公式] 和 [公式] 进行卷积计算后再填回去
要注意一点为了运用卷积 [公式] 虽然和 [公式] 同维度但下标有点不一样
我用一个动图来说明下计算过程 此图出处Convolutional Neural Networks - Basics
palet
1. 对卷积的困惑
卷积这个概念很早以前就学过但是一直没有搞懂。教科书上通常会给出定义给出很多性质也会用实例和图形进行解释但究竟为什么要这么设计这么计算背后的意义是什么往往语焉不详。作为一个学物理出身的人一个公式倘若倘若给不出结合实际的直观的通俗的解释也就是背后的“物理”意义就觉得少了点什么觉得不是真的懂了。 并且也解释了先对g函数进行翻转相当于在数轴上把g函数从右边褶到左边去也就是卷积的“卷”的由来。
然后再把g函数平移到n在这个位置对两个函数的对应点相乘然后相加这个过程是卷积的“积”的过程。
这个只是从计算的方式上对公式进行了解释从数学上讲无可挑剔但进一步追问为什么要先翻转再平移这么设计有何用意还是有点费解。
在知乎已经很多的热心网友对卷积举了很多形象的例子进行了解释如卷地毯、丢骰子、打耳光、存钱等等。读完觉得非常生动有趣但过细想想还是感觉有些地方还是没解释清楚甚至可能还有瑕疵或者还可以改进这些后面我会做一些分析。
带着问题想了两个晚上终于觉得有些问题想通了所以就写出来跟网友分享共同学习提高。不对的地方欢迎评论拍砖。。。
明确一下这篇文章主要想解释两个问题 卷积这个名词是怎么解释“卷”是什么意思“积”又是什么意思 卷积背后的意义是什么该如何解释
2. 考虑的应用场景
为了更好地理解这些问题我们先给出两个典型的应用场景
1. 信号分析
一个输入信号f(t)经过一个线性系统其特征可以用单位冲击响应函数g(t)描述以后输出信号应该是什么实际上通过卷积运算就可以得到输出信号。
2. 图像处理
输入一幅图像f(x,y)经过特定设计的卷积核g(x,y)进行卷积处理以后输出图像将会得到模糊边缘强化等各种效果。
对卷积的理解 对卷积这个名词的理解所谓两个函数的卷积本质上就是先将一个函数翻转然后进行滑动叠加。
在连续情况下叠加指的是对两个函数的乘积求积分在离散情况下就是加权求和为简单起见就统一称为叠加。
整体看来是这么个过程
翻转——滑动——叠加——滑动——叠加——滑动——叠加…
多次滑动得到的一系列叠加值构成了卷积函数。
卷积的“卷”指的的函数的翻转从 g(t) 变成 g(-t) 的这个过程同时“卷”还有滑动的意味在里面吸取了网友李文清的建议。如果把卷积翻译为“褶积”那么这个“褶”字就只有翻转的含义了。
卷积的“积”指的是积分/加权求和。
有些文章只强调滑动叠加求和而没有说函数的翻转我觉得是不全面的有的文章对“卷”的理解其实是“积”我觉得是张冠李戴。
对卷积的意义的理解 从“积”的过程可以看到我们得到的叠加值是个全局的概念。以信号分析为例卷积的结果是不仅跟当前时刻输入信号的响应值有关也跟过去所有时刻输入信号的响应都有关系考虑了对过去的所有输入的效果的累积。在图像处理的中卷积处理的结果其实就是把每个像素周边的甚至是整个图像的像素都考虑进来对当前像素进行某种加权处理。所以说“积”是全局概念或者说是一种“混合”把两个函数在时间或者空间上进行混合。 那为什么要进行“卷”直接相乘不好吗我的理解进行“卷”翻转的目的其实是施加一种约束它指定了在“积”的时候以什么为参照。在信号分析的场景它指定了在哪个特定时间点的前后进行“积”在空间分析的场景它指定了在哪个位置的周边进行累积处理。
3. 举例说明
下面举几个例子说明为什么要翻转以及叠加求和的意义。
例1信号分析
如下图所示输入信号是 f(t) 是随时间变化的。系统响应函数是 g(t) 图中的响应函数是随时间指数下降的它的物理意义是说如果在 t0 的时刻有一个输入那么随着时间的流逝这个输入将不断衰减。换言之到了 tT时刻原来在 t0 时刻的输入f(0)的值将衰减为f(0)g(T)。
考虑到信号是连续输入的也就是说每个时刻都有新的信号进来所以最终输出的是所有之前输入信号的累积效果。如下图所示在T10时刻输出结果跟图中带标记的区域整体有关。其中f(10)因为是刚输入的所以其输出结果应该是f(10)g(0)而时刻t9的输入f(9)只经过了1个时间单位的衰减所以产生的输出应该是 f(9)g(1)如此类推即图中虚线所描述的关系。这些对应点相乘然后累加就是T10时刻的输出信号值这个结果也是f和g两个函数在T10时刻的卷积值。
显然上面的对应关系看上去比较难看是拧着的所以我们把g函数对折一下变成了g(-t)这样就好看一些了。看到了吗这就是为什么卷积要“卷”要翻转的原因这是从它的物理意义中给出的。
上图虽然没有拧着已经顺过来了但看上去还有点错位所以再进一步平移T个单位就是下图。它就是本文开始给出的卷积定义的一种图形的表述
所以在以上计算T时刻的卷积时要维持的约束就是 t (T-t) T 。这种约束的意义大家可以自己体会。
例2丢骰子
在本问题 如何通俗易懂地解释卷积中排名第一的 马同学在中举了一个很好的例子下面的一些图摘自马同学的文章在此表示感谢用丢骰子说明了卷积的应用。
要解决的问题是有两枚骰子把它们都抛出去两枚骰子点数加起来为4的概率是多少?
分析一下两枚骰子点数加起来为4的情况有三种情况134 224, 314
因此两枚骰子点数加起来为4的概率为 写成卷积的方式就是 在这里我想进一步用上面的翻转滑动叠加的逻辑进行解释。
首先因为两个骰子的点数和是4为了满足这个约束条件我们还是把函数 g 翻转一下然后阴影区域上下对应的数相乘然后累加相当于求自变量为4的卷积值如下图所示
进一步如此翻转以后可以方便地进行推广去求两个骰子点数和为 n 时的概率为f 和 g的卷积 f*g(n)如下图所示
由上图可以看到函数 g 的滑动带来的是点数和的增大。这个例子中对f和g的约束条件就是点数和它也是卷积函数的自变量。有兴趣还可以算算如果骰子的每个点数出现的概率是均等的那么两个骰子的点数和n7的时候概率最大。
例3图像处理
还是引用知乎问题 如何通俗易懂地解释卷积中 马同学的例子。图像可以表示为矩阵形式下图摘自马同学的文章
对图像的处理函数如平滑或者边缘提取也可以用一个g矩阵来表示如
从卷积定义来看应该是在x和y两个方向去累加对应上面离散公式中的i和j两个下标而且是无界的从负无穷到正无穷。可是真实世界都是有界的。例如上面列举的图像处理函数g实际上是个3x3的矩阵意味着在除了原点附近以外其它所有点的取值都为0。考虑到这个因素上面的公式其实退化了它只把坐标u,v附近的点选择出来做计算了。所以真正的计算如下所示 首先我们在原始图像矩阵中取出u,v处的矩阵 请注意以上公式有一个特点做乘法的两个对应变量a,b的下标之和都是u,v其目的是对这种加权求和进行一种约束。这也是为什么要将矩阵g进行翻转的原因。以上矩阵下标之所以那么写并且进行了翻转是为了让大家更清楚地看到跟卷积的关系。这样做的好处是便于推广也便于理解其物理意义。实际在计算的时候都是用翻转以后的矩阵直接求矩阵内积就可以了。
以上计算的是u,v处的卷积延x轴或者y轴滑动就可以求出图像中各个位置的卷积其输出结果是处理以后的图像即经过平滑、边缘提取等各种处理的图像。
再深入思考一下在算图像卷积的时候我们是直接在原始图像矩阵中取了u,v处的矩阵为什么要取这个位置的矩阵本质上其实是为了满足以上的约束。因为我们要算uv处的卷积而g矩阵是3x3的矩阵要满足下标跟这个3x3矩阵的和是u,v只能是取原始图像中以uv为中心的这个3x3矩阵即图中的阴影区域的矩阵。
推而广之如果如果g矩阵不是3x3而是7x7那我们就要在原始图像中取以uv为中心的7x7矩阵进行计算。由此可见这种卷积就是把原始图像中的相邻像素都考虑进来进行混合。相邻的区域范围取决于g矩阵的维度维度越大涉及的周边像素越多。而矩阵的设计则决定了这种混合输出的图像跟原始图像比究竟是模糊了还是更锐利了。 4. 对一些解释的不同意见
上面一些对卷积的形象解释如知乎问题卷积为什么叫「卷」积中 荆哲 以及问题 如何通俗易懂地解释卷积中 马同学 等人提出的如下比喻
其实图中“卷”的方向是沿该方向进行积分求和的方向并无翻转之意。因此这种解释并没有完整描述卷积的含义对“卷”的理解值得商榷。
一些参考资料 《数字信号处理第二版》程乾生北京大学出版社
《信号与系统引论》 郑君里应启珩杨为理高等教育出版社
https://www.zhihu.com/question/22298352