当前位置: 首页 > news >正文

道滘镇仿做网站提供网站建设收益分录

道滘镇仿做网站,提供网站建设收益分录,装酷网装修平台,国内十个免费自学网站变分推断公式推导 背景介绍 机器学习中的概率模型可分为频率派和贝叶斯派。频率派最终是求一个优化问题#xff0c;而贝叶斯派则是求一个积分问题。 频率派 举几个例子#xff1a; 线性回归 样本数据#xff1a;{(xi,yi)}i1N\{(x_i,y_i)\}_{i1}^N{(xi​,yi​)}i1N​ 模…变分推断公式推导 背景介绍 机器学习中的概率模型可分为频率派和贝叶斯派。频率派最终是求一个优化问题而贝叶斯派则是求一个积分问题。 频率派 举几个例子 线性回归 样本数据{(xi,yi)}i1N\{(x_i,y_i)\}_{i1}^N{(xi​,yi​)}i1N​ 模型f(w)wTxf(w)w^Txf(w)wTx 策略损失函数L(w)∑i1N∣∣wTxi−yi∣∣2L(w)\sum_{i1}^N||w^Tx_i-y_i||^2L(w)∑i1N​∣∣wTxi​−yi​∣∣2w^arg⁡min⁡wL(w)\hat{w}\arg\min_wL(w)w^argminw​L(w) 这就是一个无约束优化问题。 算法解法 解析解线性回归问题形式比较简单可直接由最小二乘法求出解析解w∗(XTX)−1XTYw^*(X^TX)^{-1}X^TYw∗(XTX)−1XTY数值解对于其他较为复杂的算法无法解析。有一些求数值解的方法如梯度下降等。 SVM 模型f(w)sign(wTxb)f(w)sign(w^Txb)f(w)sign(wTxb)策略损失函数min12wTws.t.yi(wTxib≥1)min\frac{1}{2}w^Tw\ \ \ \ s.t.\ y_i(w^Tx_ib\ge 1)min21​wTw    s.t. yi​(wTxi​b≥1)。 是一个有约束的凸优化问题。算法解法有 QP、拉格朗日对偶等。 EM算法 θ(t1)arg⁡max⁡θ∫Zlog⁡P(X,Z∣θ)P(Z∣X,θ(t))dZ\theta^{(t1)}\arg\max_{\theta}\int_Z\log P(X,Z|\theta)P(Z|X,\theta^{(t)})dZ θ(t1)argθmax​∫Z​logP(X,Z∣θ)P(Z∣X,θ(t))dZ EM算法也是通过迭代来求解最大对数似然的数值解。 贝叶斯派 为什么说贝叶斯派是求积分呢我们先来看贝叶斯定理 P(θ∣X)P(X∣θ)P(θ)P(X)P(\theta|X)\frac{P(X|\theta)P(\theta)}{P(X)} P(θ∣X)P(X)P(X∣θ)P(θ)​ 贝叶斯推断要求得后验 P(θ∣X)P(\theta|X)P(θ∣X) 。 贝叶斯决策。决策可以理解为就是做预测。即 XXX 为已知的 NNN 个样本数据。决策就是求 P(x~∣X)∫θP(x~∣X)dθ∫θP(x~∣θ)P(θ∣X)dθP(\tilde{x}|X)\int_\theta P(\tilde{x}|X)d\theta\int_\theta P(\tilde{x}|\theta)P(\theta|X)d\theta P(x~∣X)∫θ​P(x~∣X)dθ∫θ​P(x~∣θ)P(θ∣X)dθ 在通过贝叶斯推断求得后验 P(θ∣X)P(\theta|X)P(θ∣X) 之后就可以按照上式进行贝叶斯决策。而且上面这个式子也可以写成关于后验的期望的形式期望就是求积分 P(x~∣X)Eθ∣X[P(x~∣θ)]P(\tilde{x}|X)\mathbb{E}_{\theta|X}[P(\tilde{x}|\theta)] P(x~∣X)Eθ∣X​[P(x~∣θ)] 贝叶斯派的关键就是求得后验 P(θ∣X)P(\theta|X)P(θ∣X) 即贝叶斯推断的过程。贝叶斯推断又可分为精确推断和近似推断 精确推断近似推断 确定性近似变分推断本文的主题随机近似MCMC、MH、Gibbs 公式推导 符号含义XXX 为观测数据ZZZ 为隐变量和参数。注意这里参数 θ\thetaθ 也一同表示在 ZZZ 中了。 再强调一下我们的目的求后验 P(Z∣X)P(Z|X)P(Z∣X) 。 下面的前几步与 EM 算法导出的做法类似详见 EM算法公式推导 区别只是把参数 θ\thetaθ 合并到了 ZZZ 中步骤这里就不一一说明了。 log⁡P(X)log⁡P(X,Z)−log⁡P(Z∣X)log⁡P(X,Z)q(Z)−log⁡P(Z∣X)q(Z)∫Zq(Z)log⁡P(X,Z)q(Z)dZ−∫Zq(Z)log⁡P(Z∣X)q(Z)dZELBOKL(q(Z)∣∣P(Z∣X))L(q)KL(q(Z)∣∣P(Z∣X))\begin{align} \log P(X)\log P(X,Z)-\log P(Z|X)\\ \log \frac{P(X,Z)}{q(Z)}-\log \frac{P(Z|X)}{q(Z)}\\ \int_Zq(Z)\log\frac{P(X,Z)}{q(Z)}dZ-\int_Zq(Z)\log \frac{P(Z|X)}{q(Z)}dZ\\ ELBOKL(q(Z)||P(Z|X))\\ \mathcal{L}(q)KL(q(Z)||P(Z|X)) \end{align} logP(X)​logP(X,Z)−logP(Z∣X)logq(Z)P(X,Z)​−logq(Z)P(Z∣X)​∫Z​q(Z)logq(Z)P(X,Z)​dZ−∫Z​q(Z)logq(Z)P(Z∣X)​dZELBOKL(q(Z)∣∣P(Z∣X))L(q)KL(q(Z)∣∣P(Z∣X))​​ 经过一系列变形得到 EBLOKLEBLOKLEBLOKL 的形式这里我们将 ELBOELBOELBO 记为 L(q)\mathcal{L}(q)L(q) 就是所谓的变分。 我们是要求的是后验 P(Z∣X)P(Z|X)P(Z∣X) 如果其与 q(Z)q(Z)q(Z) 的 KL 散度接近0那么就能用 q(Z)q(Z)q(Z) 来对其进行近似。而等式左边 log⁡P(X)\log P(X)logP(X) 与 ZZZ 无关因此 ELBOKLELBOKLELBOKL 在 q(Z)q(Z)q(Z) 变化时是个定值因此要让 KL 尽量小就转换为让 ELBO 尽量大即有 q^(Z)arg⁡max⁡q(Z)L(q)→q(Z)≈P(Z∣X)\hat{q}(Z)\arg\max_{q(Z)}\mathcal{L}(q)\ \ \ \ \rightarrow\ \ \ \ q(Z)\approx P(Z|X) q^​(Z)argq(Z)max​L(q)    →    q(Z)≈P(Z∣X) 接下来我们根据平均场理论将 q(Z)q(Z)q(Z) 划分为 MMM 个相互独立的份 q(Z)∏i1Mqi(Zi)q(Z)\prod_{i1}^Mq_i(Z_i) q(Z)i1∏M​qi​(Zi​) 之后在求解的时候我们会先固定 q1,q2,…,qj−1,…,qMq_1,q_2,\dots,q_{j-1},\dots,q_Mq1​,q2​,…,qj−1​,…,qM​ 然后求解单个分量 qjq_jqj​ 最后将所有分量连乘起来得到完整的 q(Z)q(Z)q(Z) 。 首先先将 q(Z)q(Z)q(Z) 代回到原式中 L(q)∫Zq(Z)log⁡P(X,Z)dZ−∫Zlog⁡q(Z)dZ①−②\mathcal{L}(q)\int_Zq(Z)\log P(X,Z)dZ-\int_Z\log q(Z)dZ①-②\\ L(q)∫Z​q(Z)logP(X,Z)dZ−∫Z​logq(Z)dZ①−② 一项一项地来看 ①∫Zq(Z)log⁡P(X,Z)dZ∫Z∏i1Mqi(Zi)log⁡P(X,Z)dZ∫Zjqj(Zj)∫Zi(i≠j)∏i≠jMqi(Zi)log⁡P(X,Z)dZi(i≠j)dZj∫Zjqj(Zj)∫Zi(i≠j)log⁡P(X,Z)∏i≠jMqi(Zi)dZi(i≠j)dZj∫Zjqj(Zj)⋅E∏i≠jMqi(Zi)[log⁡P(X,Z)]dZj\begin{align} ①\int_Zq(Z)\log P(X,Z)dZ\\ \int_Z\prod_{i1}^Mq_i(Z_i)\log P(X,Z)dZ\\ \int_{Z_j}q_j(Z_j)\int_{Z_i(i\ne j)}\prod_{i\ne j}^Mq_i(Z_i)\log P(X,Z)dZ_{i(i\ne j)}dZ_j\\ \int_{Z_j}q_j(Z_j)\int_{Z_i(i\ne j)}\log P(X,Z)\prod_{i\ne j}^Mq_i(Z_i)dZ_{i(i\ne j)}dZ_j\\ \int_{Z_j}q_j(Z_j)\cdot\mathbb{E}_{\prod_{i\ne j}^Mq_i(Z_i)}[\log P(X,Z)]dZ_j \end{align} ①​∫Z​q(Z)logP(X,Z)dZ∫Z​i1∏M​qi​(Zi​)logP(X,Z)dZ∫Zj​​qj​(Zj​)∫Zi​(ij)​ij∏M​qi​(Zi​)logP(X,Z)dZi(ij)​dZj​∫Zj​​qj​(Zj​)∫Zi​(ij)​logP(X,Z)ij∏M​qi​(Zi​)dZi(ij)​dZj​∫Zj​​qj​(Zj​)⋅E∏ijM​qi​(Zi​)​[logP(X,Z)]dZj​​​ 先将 q(Z)q(Z)q(Z) 进行拆分为 MMM 份然后将第 jjj 份拆出来其他份的积分写成期望的形式见到积分就考虑能写成期望 然后看后面一项 ②∫Zq(Z)log⁡q(Z)dZ∫Z∏i1Mqi(Zi)log⁡∏i1Mqi(Zi)dZ∫Z∏i1Mqi(Zi)∑i1Mlog⁡qi(Zi)dZ∫Z∏i1Mqi(Zi)[log⁡q1(Z1)log⁡q2(Z2)⋯log⁡qM(ZM)]dZ\begin{align} ②\int_Zq(Z)\log q(Z)dZ\\ \int_Z\prod_{i1}^Mq_i(Z_i)\log\prod_{i1}^M q_i(Z_i)dZ\\ \int_Z\prod_{i1}^Mq_i(Z_i)\sum_{i1}^M\log q_i(Z_i)dZ\\ \int_Z\prod_{i1}^Mq_i(Z_i)[\log q_1(Z_1)\log q_2(Z_2)\dots\log q_M(Z_M)]dZ\\ \end{align} ②​∫Z​q(Z)logq(Z)dZ∫Z​i1∏M​qi​(Zi​)logi1∏M​qi​(Zi​)dZ∫Z​i1∏M​qi​(Zi​)i1∑M​logqi​(Zi​)dZ∫Z​i1∏M​qi​(Zi​)[logq1​(Z1​)logq2​(Z2​)⋯logqM​(ZM​)]dZ​​ 写成 MMM 份log 里面乘变外面加把连加号写开然后我们看其中一项比如第一项 ∫Z∏i1Mqi(Zi)⋅log⁡q1(Z1)dZ∫Zq1(Z1)q2(Z2)…qM(ZM)log⁡q1(Z1)dZ∫Z1Z2…ZMq1(Z1)q2(Z2)…qM(ZM)log⁡q1(Z1)dZ1dZ2…dZM∫Z1q1(Z1)log⁡q1(Z1)dZ1∏i2M∫Ziqi(Zi)dZi∫Z1q1(Z1)log⁡q1(Z1)dZ1\begin{align} \int_Z\prod_{i1}^Mq_i(Z_i)\cdot\log q_1(Z_1)dZ\int_Zq_1(Z_1)q_2(Z_2)\dots q_M(Z_M)\log q_1(Z_1)dZ\\ \int_{Z_1Z_2\dots Z_M}q_1(Z_1)q_2(Z_2)\dots q_M(Z_M)\log q_1(Z_1)dZ_1dZ_2\dots dZ_M\\ \int_{Z_1}q_1(Z_1)\log q_1(Z_1)dZ_1\prod_{i2}^M\int_{Z_i}q_i(Z_i)dZ_i\\ \int_{Z_1}q_1(Z_1)\log q_1(Z_1)dZ_1 \end{align} ∫Z​i1∏M​qi​(Zi​)⋅logq1​(Z1​)dZ​∫Z​q1​(Z1​)q2​(Z2​)…qM​(ZM​)logq1​(Z1​)dZ∫Z1​Z2​…ZM​​q1​(Z1​)q2​(Z2​)…qM​(ZM​)logq1​(Z1​)dZ1​dZ2​…dZM​∫Z1​​q1​(Z1​)logq1​(Z1​)dZ1​i2∏M​∫Zi​​qi​(Zi​)dZi​∫Z1​​q1​(Z1​)logq1​(Z1​)dZ1​​​ 把 q1(Z1)q_1(Z_1)q1​(Z1​) 相关的移到一起剩下的积分全都是 1 ②∑i1M∫Ziqi(Zi)log⁡qi(Zi)dZi∫Zjqj(Zj)log⁡qj(Zj)dZjC\begin{align} ②\sum_{i1}^M\int_{Z_i}q_i(Z_i)\log q_i(Z_i)dZ_i\\ \int_{Z_j}q_j(Z_j)\log q_j(Z_j)dZ_jC\\ \end{align} ②​i1∑M​∫Zi​​qi​(Zi​)logqi​(Zi​)dZi​∫Zj​​qj​(Zj​)logqj​(Zj​)dZj​C​​ 有了 i1i1i1 时的表示我们就把整个第二项写成连加的形式我们只关心第 jjj 项其余的视作常数 CCC 这样处理完两项有 ①−②∫Zjqj(Zj)⋅E∏i≠jMqi(Zi)[log⁡P(X,Z)]dZj−∫Zjqj(Zj)log⁡qj(Zj)dZjC∫Zjqj(Zj)⋅log⁡P^(X,Zj)dZj−∫Zjqj(Zj)log⁡qj(Zj)dZjC∫Zjqj(Zj)⋅log⁡P^(X,Zj)qj(Zj)dZj−KL(P^(X,Zj)∣∣qj(Zj))≤0\begin{align} ①-②\int_{Z_j}q_j(Z_j)\cdot\mathbb{E}_{\prod_{i\ne j}^Mq_i(Z_i)}[\log P(X,Z)]dZ_j-\int_{Z_j}q_j(Z_j)\log q_j(Z_j)dZ_jC\\ \int_{Z_j}q_j(Z_j)\cdot\log \hat{P}(X,Z_j) dZ_j-\int_{Z_j}q_j(Z_j)\log q_j(Z_j)dZ_jC\\ \int_{Z_j}q_j(Z_j)\cdot\log\frac{ \hat{P}(X,Z_j)}{q_j(Z_j)}dZ_j\\ -KL(\hat{P}(X,Z_j)||q_j(Z_j))\le 0 \end{align} ①−②​∫Zj​​qj​(Zj​)⋅E∏ijM​qi​(Zi​)​[logP(X,Z)]dZj​−∫Zj​​qj​(Zj​)logqj​(Zj​)dZj​C∫Zj​​qj​(Zj​)⋅logP^(X,Zj​)dZj​−∫Zj​​qj​(Zj​)logqj​(Zj​)dZj​C∫Zj​​qj​(Zj​)⋅logqj​(Zj​)P^(X,Zj​)​dZj​−KL(P^(X,Zj​)∣∣qj​(Zj​))≤0​​ 将 ① 中的期望写成一个函数的形式P^(X,Zj)\hat{P}(X,Z_j)P^(X,Zj​) 最后就是一个负的 KL 散度当 P^(X,Zj)qj(Zj)\hat{P}(X,Z_j)q_j(Z_j)P^(X,Zj​)qj​(Zj​) 时取到等号 Ref 机器学习白板推导
http://www.yutouwan.com/news/316578/

相关文章:

  • 海口网站建设服务网页设计学生作业模板
  • 自己做的小网站分享网络营销导向企业网站建设的原则包括
  • 做外贸的社交网站抖音制作视频的软件
  • 蔬菜网站模板点卡平台网站开发
  • 网站建设厘金手指专业如何更改wordpress语言
  • 食品 药品 监督 网站 源码 php网上宣传方法有哪些
  • 广州建设执业注册中心网站0资本建设网站
  • 网站网页模板做软件的网站担保网站
  • 学校后勤网站建设的作用会员卡管理系统怎么制作
  • wordpress换域名后图片无法显示google seo教程
  • 东莞黄江网站建设天天自学网网址
  • 公司做网站怎么收费wordpress手机顶部菜单
  • 网页设计与网站建设连接数据库国际近期新闻
  • 用闲置的安卓手机做网站服务器营销手段有哪些
  • 开发网站用什么软件广州网站制作费用
  • 学网站建设难吗专业移动网站建设
  • 长春求推荐好的网站优化推广虚拟空间做网站
  • 睢县网站建设成都做网站建设公司
  • 网站视觉元素网站建设的一些专业术语
  • 手机免费创网站备案期间 需要关闭网站
  • 企业资质证书查询官方网站亚洲室内设计公司排名
  • 网站建设合同交什么印花税电商网站的活动怎么做
  • 机械网站优化重庆市建设工程造价管理站
  • 四川网站建设和优化百度推广账户登录首页
  • 天猫的网站导航怎么做的简述网络营销服务的特点
  • 如何学习建设网站公司网站建设方案模板下载
  • 波兰网站后缀网站建设业务的销售人员培训文档
  • 站长统计性宝app图书电子商务网站建设
  • 招聘类网站怎么做北京网站开发团队
  • 成都移动网站建设专门做美妆的网站