免费ftp服务器申请网站,河北省住房和城乡建设部网站,求职网站建设方案,网上书店网站建设实训报告总结先点明几个名词
MCMC方法#xff1a;马尔可夫链-蒙特卡洛方法 (千万别叫成梅特罗波利斯蒙特卡罗方法了)
Metropolis-Hastings采样#xff1a;梅特罗波利斯-哈斯廷斯采样
Gibbs采样#xff1a;吉布斯采样
还是介绍一下学习MCMC和Gibbs采样比较好的一个资料#xff1a;随机采…先点明几个名词
MCMC方法马尔可夫链-蒙特卡洛方法 (千万别叫成梅特罗波利斯蒙特卡罗方法了)
Metropolis-Hastings采样梅特罗波利斯-哈斯廷斯采样
Gibbs采样吉布斯采样
还是介绍一下学习MCMC和Gibbs采样比较好的一个资料随机采样方法与整理和受限玻尔兹曼机RBM学习笔记一预备知识(资料挺好的本文就差不多是这两个资料的精简版主要围绕啊MCMC和Gibbs讲解)
吉布斯采样在后面一个博客有matlab代码http://blog.csdn.net/zb1165048017/article/details/51778694
MCMC方法在后面有理论和代码分析https://blog.csdn.net/zb1165048017/article/details/80584031
蒙特卡洛方法
回忆一下前面一个文章蒙特卡洛方法其中有一步骤就是用来计算积分的转换成一个函数乘以一个概率密度函数。说过一句话“样本的容量足够大时可以认为该事件的发生频率即为其概率”。当n足够大的时候可以得到也就是g(x)在p(x)分布上的均值。然后就可以用均值近似积分的值其实不难发现还是拿那个用一个圆和其外接正方形理解就相当于我们做了N次试验每次试验都是丢一堆点到这个正方形包围区域然后正方形内的点数(这个地方这样想比较方便点构成面那么我们就可以把正方形的面积想象成无数个点)也就是正方形近似的面积了同理被丢到圆内的点构成了圆的面积。回到那个用均值计算积分的累加式上它就相当于我做了n次丢点的实验所有的点构成了样本f(x)而1/p(x)就代表了点落在圆内的概率大小。
【注】概率密度函数表示瞬时值落在某指定范围内的概率因此是幅值的函数它随所取范围的幅值而变化。马尔可夫链蒙特卡洛方法(MCMC方法)
前面已经介绍过关于HMM的相关知识了主要就是分别用何种方法解决哪三种问题。马尔可夫链(通常我们说的就是一阶的情况)阐述的是事物发生的当前状态只与前面一个状态有关比如明天天气状态只与今天的天气有关与前天或者以前的天气状态无关。具体表述就是
代表的是第t1时刻的状态为 i 的概率为它的前一时刻 t 的所有可能状态 k 乘以状态 k 到状态 i 的转移概率。
举个栗子哈~~还是天气的那个以明天的天气为起点我们想预测后天的天气为晴的概率多大我们需要知道明天的天气但是明天天气有很多种可能由初始概率可以知道明天天气分别为阴、晴、多云等的概率然后分别乘以阴天到晴天的概率、晴天到晴天的转移概率、多云到晴天的转移概率等然后相加就可以得到后天晴天的概率。在前面的文章有栗子有需要可以去看看栗子就可以了。
然后出现了这样一个理论当我们一直进行状态转移到达一定次数的时候这个状态发生的概率就会趋于稳定了就比如我们用天气一直预测今天的比如晴天我预测明天天气分别为阴、晴、多云的概率然后用明天可能出现的天气情况预测后天的天气情况然后我们一直计算假如计算到达今年12月份最后一天的天气概率就会发现这个概率跟12月份下旬的每天的天气概率分布情况差不多差距很小。用数学的方法表示就是
代表的就是我们以初始状态的天气概率不断的乘以这个转移矩阵(乘一次就是转移了一次乘两次就是转移了两次)当乘的次数越来越多的时候概率分布变化会逐渐趋近与稳定。就像前面MC中说过的我们不断的采样最终的状态一定是一个稳定状态最接近样本分布的状态。
上面这个情况称为马氏链定理对于各态遍历的马尔可夫链(满足两个条件非周期性也就是状态转移不是按照某种规律循环而是随机转移的另一个条件是不可约也就是每一个状态都可有其它任何一种状态转移过来不可能存在一种状态转移的概率为0)不管初始的概率如何取值随着转移次数的增多随机变量的取值分布最终会收敛于唯一的平稳分布。这个就是MCMC理论的基础。
现在的问题就是这个转移概率矩阵去怎么选择让我们的初始状态沿着马尔可夫链按照这个转移概率矩阵去转移最终得到的平稳分布正好是我们需要的概率分布。采样的时候我们直接按照这个概率转移几次达到我们需要的概率分布的时候便去采样就可以了。随之便出现了下一个方法梅特罗波利斯哈斯廷斯采样。梅特罗波利斯哈斯廷斯采样
首先有一个概念需要知道叫做细致平稳条件
如果非周期的马氏转移矩阵P和分布π(x)满足那么就成π(x)是马氏链的平稳分布。式子被称为细致平稳条件。也就是我们从状态 i 转移到状态 j 的时候损失的概率质量刚好可以用从 j 到 i 状态转移增加的概率质量补回来。
但是这个细致平稳条件我们一般是达不到的。随后就有大牛想到加入了一个变量叫做转移提议分布Qji表示当前状态 i 提议转移到 j 状态用它来建议下一步是个什么状态然后用一个概率去接受它。就跟相亲一样老爸老妈给你建议某个妹子的概率是多少但是这还不够你还得有一个接受她的概率才能和她结婚。
这个就是接受概率。到底接不接受呢我们产生一个随机的[0,1] 范围的数如果α 大于这个数就接受小于就拒绝转移保持原状态。
然后细指平稳条件就成了下面酱紫然后推理一步可以轻松发现π(x)分布下的π(j)状态经过转移达到的状态依旧是满足π(x)分布为π(i)。
所以梅特罗波利斯哈斯廷斯采样的精髓在于(自我感觉哈)提出了一个转移提议分布让细致平稳条件成为可能。此时新的转移矩阵为那么问题又来了这里面有一个随机数和接受概率的比较两个东西都比较随机造成了这种方法的不稳定性如果接受概率一直灰常小那么我每次都拒绝了这状态还咋转移。于是大牛又来了~~~吉布斯采样Gibbs采样
后面有篇博文详细介绍了吉布斯采样http://blog.csdn.net/zb1165048017/article/details/51778694
条件概率的计算公式复习一下先然后看一个比较有意思的式子推导可以很清晰的发现两个状态的相互转移概率其实是相等的也就是满足细致平稳条件。也就是说我们固定一个按照x这个方向去转移状态到达下一个状态这个过程是满足细致平稳分布的。
用其它文章的话来说就是这跟上面的梅特罗波利斯蒙特卡洛方法有什么关系呢其实关键就在于Gibbs规定了转移方向在这个方向是你的接受概率必须为1其它方向必须为0这便消除了随机性的影响。最后再举一个栗子串一下还是相亲的栗子。刚开始的时候是满世界找对象世界上每个妹子在你面前出现的概率叫做初始概率然后你在世界上行走去每个地方概率为转移概率然后不断地走走遍大江南北世界各地不断的转移状态你就会发现每个地方的妹子的属性(身高、年纪、性格等)分布差不多给你一个新地方你不去就能猜到那边妹子的平均身高平均年龄等特征这时候妹子们的状态分布就会趋于一种平稳状态。除非你改变去每个地方的概率或者世界上突然被外星人抓走了一种类型妹子这时候就会处于另一种稳态。这种就叫做马尔可夫链蒙特卡洛方法。
然后有的人就很聪明了他想我到处吓跑干啥累死了走遍各地让妹子的分布达到稳态这还不得老了。接着父母就开始忙活了父母帮儿子找媳妇父母每次给儿子按照某种提议分布去建议儿子娶这个娶那个儿子每看到一个妹子就以一定的接受概率去接受它这种方法就是梅特罗波利斯哈斯廷斯采样。
最后有人就发现有些类型的妹子我非常喜欢有些不喜欢有些又有点拿捏不定怎么办这时候我不想麻烦了不喜欢和拿捏不定的我统统不要我就要一种风格的妹子妹子的各种属性满足某种分布几分萌萌哒几分瘦几分年纪等然后看到从样本中找到第一个这样风格的妹子接下来按照上一个选中的妹子风格和我们希望的风格分布不断采样找这种风格的妹子当我找到数量足够的妹子(即Gibbs里面的n)这时候我就得到了我喜欢的风格的妹子们了(期望的样本分布)。好吧如果有什么不对的谢谢大家指正我会不断完善的~~~~谢谢啦~~~