当前位置：首页 > news >正文

上海企业模板建站c 微网站开发

news 2026/1/13 17:11:14

上海企业模板建站,c 微网站开发,上海自助建站系统,曲麻菜公司网站建设本系列文章主要是我在学习《数值优化》过程中的一些笔记和相关思考#xff0c;主要的学习资料是深蓝学院的课程《机器人中的数值优化》和高立编著的《数值最优化方法》等#xff0c;本系列文章篇数较多#xff0c;不定期更新#xff0c;上半部分介绍无约束优化#xff0c;… 本系列文章主要是我在学习《数值优化》过程中的一些笔记和相关思考主要的学习资料是深蓝学院的课程《机器人中的数值优化》和高立编著的《数值最优化方法》等本系列文章篇数较多不定期更新上半部分介绍无约束优化下半部分介绍带约束的优化中间会穿插一些路径规划方面的应用实例十五、高斯牛顿法 1、最小二乘问题最小二乘(Least SquaresLS)问题的定义如下 min ⁡ f ( x ) 1 2 ∑ i 1 m r i 2 ( x ) 1 2 r ( x ) T r ( x ) , x ˙ ∈ R n , m ⩾ n , \min f(x)\dfrac{1}{2}\sum_{i1}^{m}r_i^2(x)\dfrac{1}{2}r(x)^{\mathrm T}r(x),\quad\dot x\in\mathbb R^n,m\geqslant n, minf(x)21i1∑mri2(x)21r(x)Tr(x),x˙∈Rn,m⩾n, 这里 r ( x ) ( r 1 ( x ) , r 2 ( x ) ⋅ . . , r m ( x ) ) T r(x)(r_1(x), r_2(x)· .. ,r_m(x))^T r(x)(r1(x),r2(x)⋅..,rm(x))T称为剩余函数。点α处剩余函数的值称为剩余量。若 r i ( x ) ( i l , . . . , m ) r_i(x)(i l,... ,m) ri(x)(il,...,m)均为线性函数,则称为线性最小二乘问题;若至少有一个 r i ( x ) r_i(x) ri(x)为非线性函数,则称为非线性最小二乘问题。最小二乘问题大量产生于数据拟合问题:给定一组试验数据(ti,yi) (i 1,… , m)和一函数模型f(x; t)我们要确定x,使得f(x; t)在剩余量平方和意义下尽可能好地拟合给定的数据,其中剩余量 r i ( x ) r_i(x) ri(x)为 r i ( x ) y i − f ~ ( x ; t i ) , i 1 , ⋯ , m , r_i(x)y_i-\tilde{f}(x;t_i),\quad i1,\cdots,m, ri(x)yi−f~(x;ti),i1,⋯,m, 由此得到最小二乘问题此外,最小二乘问题亦可用于解非线性方程组 r i ( x ) 0 , i 1 , ⋯ , m , r_i(x)0,\quad i1,\cdots,m, ri(x)0,i1,⋯,m, 当mn时,方程组称为适定方程组;当m n时方程组称为超定方程组。最小二乘问题固然可以用前面讲过的一般无约束最优化方法去求解,然而由于该问题的目标函数有特殊结构,我们可以利用问题的结构对某些已讲过的方法进行改造,使之对最小二乘问题更简单或更有效. 此外,最小二乘问题亦可用于解非线性方程组 2、最小二乘问题分类下面我们来看最小二乘问题的目标函数f(x)的一、二阶导数的形式.设J(x)是r(x)的雅可比矩阵: J ( x ) [ ∇ r 1 T ⋮ ∇ r m T ] ∈ R m × n , J(x)\left[\begin{array}{c}\nabla r_1^{\mathrm{T}}\\ \vdots\\ \nabla r_m^{\mathrm{T}}\end{array}\right]\in\mathbb{R}^{m\times n}, J(x) ∇r1T⋮∇rmT ∈Rm×n, 则fx的梯度和Hessian矩阵分别为 g ( x ) ∑ i 1 m r i ( x ) ∇ r i ( x ) J ( x ) T r ( x ) , g(x)\sum\limits_{i1}^m r_i(x)\nabla r_i(x)J(x)^\mathrm{T}r(x), g(x)i1∑mri(x)∇ri(x)J(x)Tr(x), G ( x ) ∑ i 1 m ∇ r i ( x ) ∇ r i ( x ) T ∑ i 1 m r i ( x ) ∇ 2 r i ( x ) J ( x ) T J ( x ) S ( x ) , \begin{aligned}G(x)\sum\limits_{i1}^m\nabla r_i(x)\nabla r_i(x)^{\mathrm{T}}\sum\limits_{i1}^m r_i(x)\nabla^2r_i(x)\\ J(x)^{\mathrm{T}}J(x)S(x),\end{aligned} G(x)i1∑m∇ri(x)∇ri(x)Ti1∑mri(x)∇2ri(x)J(x)TJ(x)S(x), 其中 S ( x ) ∑ i 1 m r i ( x ) ∇ 2 r i ( x ) . S(x)\sum\limits_{i1}^m r_i(x)\nabla^2r_i(x). S(x)i1∑mri(x)∇2ri(x). 为方便描述我们对上述符号进行如下的简记 J ⋆ J ( x ⋆ ) , J k J ( x k ) , S ⋆ S ( x ⋆ ) , S k S ( x k ) . \begin{array}{c}J^{\star}J(x^{\star}),\quad J_kJ(x_k),\\ \\ S^{\star}S(x^{\star}),\quad S_kS(x_k).\end{array} J⋆J(x⋆),JkJ(xk),S⋆S(x⋆),SkS(xk). 在点x * 处||S * || 的大小取决于剩余量与问题的非线性性.对零剩余或线性最小二乘问题||S * || 0 . 随着剩余量的增大或 r i ( x ) ( i l , . . . , m ) r_i(x)(i l,... ,m) ri(x)(il,...,m)的非线性的增强,||S * ||的值变大.根据问题的这种特点,我们的算法将分为小剩余算法与大剩余算法.小剩余算法处理||S * ||为零或不太大的问题,大剩余算法处理||S * ||较大的问题. 3、牛顿方法解最小二乘问题解最小二乘问题的Newton方程为 ( J k T J k S k ) d k − J k T r k (J_k^\mathrm{T}J_kS_k)d_k-J_k^\mathrm{T}r_{k} (JkTJkSk)dk−JkTrk 对最小二乘问题,Newton方法的缺点是每次迭代都要求 S k S_k Sk,即计算m个nxn对称矩阵显然,对一个算法而言 S k S_k Sk的计算是一个沉重的负担.解决这个问题的方法是或者在Newton方程中忽略 S k S_k Sk,或者用一阶导数信息近似 S k S_k Sk.而要忽略 S k S_k Sk则应在 r i ( x ) r_i(x) ri(x)接近于0或接近于线性时进行即下面我们要讲的小剩余算法。 4、高斯牛顿法在方程 ( J k T J k S k ) d k − J k T r k (J_k^\mathrm{T}J_kS_k)d_k-J_k^\mathrm{T}r_{k} (JkTJkSk)dk−JkTrk中忽略 S k S_k Sk就可以得到Gauss-Newton (GN)方法该方法以也可以理解为在点 x k x_k xk处线性化剩余函数 r i ( x k d ) , r_{i}(x_{k}d), ri(xkd),线性化后 S k S_k Sk的值即为0。忽略 S k S_k Sk后得到的Gauss-Newton (GN)方程如下 J k T J k d − J k T r k . J_k^\mathrm{T}J_k d-J_k^\mathrm{T}r_k. JkTJkd−JkTrk. 上述方程的解等价于求下述关于d的线性最小二乘问题的极小值问题。 min ⁡ d ∈ R n q k ( d ) 1 2 ∥ J k d r k ∥ 2 2 , \min\limits_{d\in\mathbb{R}^n}q_k(d)\dfrac{1}{2}\|J_k dr_k\|_2^2, d∈Rnminqk(d)21∥Jkdrk∥22, 其中 q k ( d ) 1 2 ( J k d r k ) T ( J k d r k ) 1 2 d T J k T J k d d T ( J k T r k ) 1 2 r k T r k . \begin{aligned}q_k(d)\frac{1}{2}(J_k dr_k)^{\mathrm{T}}(J_k dr_k)\\ \frac{1}{2}d^{\mathrm{T}}J_k^{\mathrm{T}}J_k dd^{\mathrm{T}}(J_k^{\mathrm{T}}r_k)\frac{1}{2}r_k^{\mathrm{T}}r_k.\end{aligned} qk(d)21(Jkdrk)T(Jkdrk)21dTJkTJkddT(JkTrk)21rkTrk. 这里 q k ( d ) q_k(d) qk(d)是对 f ( x k d ) f(x_kd) f(xkd)的一种二次近似,它与 f ( x k d ) f(x_kd) f(xkd)的二次Taylor近似的差别在于二次项中少了 S k S_k Sk 用Gauss-Newton方法求解最小二乘问题的算法如下: – 基本Gauss-Newton方法是指 α k α_k αk 1的 Gauss-Newton方法带线搜索的 Gauss-Newton方法称为阻尼 Gauss-Newton方法. Gauss-Newton方法的优点在于它无须计算r(z)的二阶导数. 另外当 J k J_k Jk满秩 g k g_k gk不为零的时候可以保证 d k d_k dk是下降方向。基本Gauss-Newton方法有如下两种情形的收敛速度: · 1二阶收敛速度若||S(x*)|| 0即在零剩余问题或是线性最小二乘问题的情形,则方法在x * 附近具有Newton方法的收敛速度。 2线性收敛速度若||S(x*)||≠0,则方法的收敛速度是线性的。收敛速度随||S(x*)||的增大而变慢. 由此可见,基本Gauss-Newton方法的收敛速度是与x*处剩余量的大小及剩余函数的线性程度有关的,即剩余量越小或剩余函数越接近线性,它的收敛速度就越快;反之就越慢,甚至对剩余量很大或剩余函数的非线性程度很强的问题不收敛。此外高斯牛顿法要求矩阵J(x)列满秩.如若不然,则矩阵 J ( x ) T J ( x ) J(x)^{\mathrm{T}}J(x) J(x)TJ(x)奇异,我们不能从Gauss-Newton方程求得 d k d_k dk。十六、LMF方法 Gauss-Newton方法在迭代中会出现 J k T J k J_k^\mathrm{T}J_k JkTJk为奇异的情形.为了克服这个困难,Levenberg在 1944年提出由下面的方程求解 d k d_k dk其中 v k ≥ 0 v_k ≥ 0 vk≥0。这个方法由于1964年时Marquardt的努力而得到广泛应用,故称为LM (Levenberg-Marquardt)方法,下式称为LM方程. ( J k T J k ν k I ) d − J k T r k (J_k^\mathrm{T}J_k\nu_kI)d-J_k^\mathrm{T}r_k (JkTJkνkI)d−JkTrk 在上述方程中,对任意 v k ≥ 0 v_k ≥ 0 vk≥0 J k T J k ν k I J_k^\mathrm{T}J_k\nu_kI JkTJkνkI正定。从计算的角度出发,为保证该矩阵充分正定, v k v_k vk可能需要取得适当的大, J k T J k ν k I J_k^\mathrm{T}J_k\nu_kI JkTJkνkI的正定性保证了由上述方程得到的方向是下降方向。 LM 方法是一种信赖域型方法, v k v_k vk的值可以用信赖域方法的思想在迭代中修正得到前文中我们介绍过信赖域方法中信赖域半径是如何修正的现在只要找出 LM 方程与信赖域问题的关系就可以根据修正信赖域半径的方法修正 v k v_k vk的值。 LM方程与信赖域问题的关系 min ⁡ d 1 2 ∥ J k d r k ∥ 2 , \min\limits_d\dfrac12\|J_k dr_k\|^2, dmin21∥Jkdrk∥2, s.t. ∥ d ∥ 2 ⩽ Δ k 2 , Δ k 0 \text{s.t.}~~\|d\|^2\leqslant\Delta^2_k,~\Delta_k0 s.t. ∥d∥2⩽Δk2, Δk0 上式为信赖域子问题 d k d_k dk其全局极小解的充分必要条件是对满足上式的的 d k d_k dk,存在 v k ≥ 0 v_k≥0 vk≥0,使得 ( J k T J k ν k I ) d k − J k T r k ˉ , ν k ( Δ k 2 − ∥ d k ∥ 2 ) 0. \begin{array}{l}(J_{k}^{\mathrm T}J_{k}\nu_{k}I)d_{k}-J_{k}^{\mathrm T}r_{\bar k},\\ \nu_{k}(\Delta_{k}^{2}-\|d_{k}\|^{2})0.\end{array} (JkTJkνkI)dk−JkTrkˉ,νk(Δk2−∥dk∥2)0. LM 方程与信赖域问题的关系是 Fletcher在1981年提出的.故由此建立起来的方法称为LMF (Levenberg-Marquardt-Fletcher)方法. 下面我们来考虑 v k v_k vk的修正方法,它与信赖域半径△k的修正是相关的.在信赖域方法中从 x k x_k xk到 x k d k x_k d_k xkdk f(x)的实际减少量为 Δ f k f ( x k ) − f ( x k d k ) , \Delta f_kf(x_k)-f(x_kd_k), Δfkf(xk)−f(xkdk), 上文给出的近似函数 q k ( d ) 1 2 ( J k d r k ) T ( J k d r k ) 1 2 d T J k T J k d d T ( J k T r k ) 1 2 r k T r k . \begin{aligned}q_k(d)\frac{1}{2}(J_k dr_k)^{\mathrm{T}}(J_k dr_k)\\ \frac{1}{2}d^{\mathrm{T}}J_k^{\mathrm{T}}J_k dd^{\mathrm{T}}(J_k^{\mathrm{T}}r_k)\frac{1}{2}r_k^{\mathrm{T}}r_k.\end{aligned} qk(d)21(Jkdrk)T(Jkdrk)21dTJkTJkddT(JkTrk)21rkTrk. 的减少量为 Δ q k q k ( 0 ) − q k ( d k ) , \Delta q_kq_k(0)-q_k(d_k), Δqkqk(0)−qk(dk), 其中 q k ( 0 ) f k q_{k}(0)f_{k} qk(0)fk另外由LM方程与 d k T g k 0 d_{k}^{\mathrm{T}}g_{k}0 dkTgk0知 Δ g k g k ( 0 ) − g k ( d k ) − 1 2 d k T J k T J k d k − d k T ( J k T r k ) 1 2 d k T ( − J k T J k d k − ν k d k ν k d k − 2 J k T r k ) 1 2 d k T ( − ( J k T J k ν k ) d k ν k d k − 2 J k T r k ) 1 2 d k T ( v k d k − g k ) 0 , \begin{aligned}\Delta g_kg_k(0)-g_k(d_k)\\ -\frac{1}{2}d_k^{T}J_k^{T}J_k d_k-d_k^{T}(J_k^{T}r_k)\\ \frac{1}{2}d_k^{T}(-J_k^{T}J_k d_k-\nu_k d_k\nu_k d_k-2J_k^{T}r_k)\\ \frac{1}{2}d_k^{T}(-(J_k^{T}J_k\nu_k)d_k\nu_k d_k-2J_k^{T}r_k)\\ \frac{1}{2}d_k^{T}(v_k d_k-g_k)0,\end{aligned} Δgkgk(0)−gk(dk)−21dkTJkTJkdk−dkT(JkTrk)21dkT(−JkTJkdk−νkdkνkdk−2JkTrk)21dkT(−(JkTJkνk)dkνkdk−2JkTrk)21dkT(vkdk−gk)0, 其中 g k J k T r k . g_kJ_k^{\mathrm{T}}r_k. gkJkTrk. 进行如下定义 γ k Δ f k Δ q k . \gamma_k\dfrac{\Delta f_k}{\Delta q_k}. γkΔqkΔfk. 在第k步迭代, γ k \gamma_{k} γk的值可以反映出 q k ( d k ) q_k(d_k) qk(dk)近似f(.zck dk)的好坏.关于yxe的值如何反映 q(d)近似 f ( x k d k ) f(x_{k}d_{k}) f(xkdk)的好坏,以及如何由此修正△k的问题。由LM 方程知, v k v_{k} vk可以控制 ∣ ∣ d k ∣ ∣ ||d_k|| ∣∣dk∣∣的大小,从而可以控制信赖域的大小.若 v k v_{k} vk变大的话, ∣ ∣ d k ∣ ∣ ||d_k|| ∣∣dk∣∣会变小,反之亦然,所以对, v k v_{k} vk大小的修正应该与信赖域方法中对△k大小的修正相反。下面给出 LMF方法的步骤: 上述算法中 v 0 v_{0} v0 0可以任取. Fletcher指出该算法对0.25、0.75等常数并不敏感。LMF方法可以用于求解一般无约束最优化问题。在修正Newton方法中,我们曾经提到过这个方法。修正Newton方程与信赖域问题的关系如下: 十七、Dogleg方法 Dogleg方法是一种非线性最小化的数值优化方法用于寻找函数的最小值。它的基本思想是将当前迭代点处的函数模型分为两部分一部分是线性模型另一部分是二次模型。在每次迭代中该方法会将搜索方向限制在两个较小的半径内以保证在可接受误差范围内找到局部极小值。具体来说Dogleg方法的实现分为以下几步构建当前迭代点处的函数模型并计算其梯度和Hessian矩阵计算当前迭代点处的两个半径一是当函数模型为线性时的半径另一个是当函数模型为二次时的半径计算在两个半径内的最优搜索方向。当搜索方向在线性半径内时直接沿着负梯度方向进行搜索当搜索方向在二次半径内时计算二次模型的极小值点并将搜索方向设置为连接当前迭代点和极小值点的线段如果最优搜索方向在线性半径内直接更新迭代点如果最优搜索方向在二次半径内则需要计算更新点以确保搜索方向在两个半径之间。与其他优化方法相比Dogleg方法具有收敛速度快和收敛精度高的优点。但它也存在一些缺点例如无法处理约束条件等。在实际应用中需要根据具体问题选择合适的优化方法。算法流程如下所示其中 Gauss-Newton方向 d k G N d^{GN}_k dkGN由Gauss-Newton方程给出 d k S D − J k T r k d^{SD}_k-J_{k}^{\mathrm{T}}r_{k} dkSD−JkTrk,最速下降方法的步长为: α k arg ⁡ min ⁡ q k ( α d k S D ) ∥ d k S D ∥ 2 ∥ J k d k S D ∥ 2 , \alpha_k\arg\min q_k(\alpha d_k^{\mathrm{SD}})\frac{\|d_k^{\mathrm{SD}}\|^2}{\|J_k d_k^{\mathrm{SD}}\|^2}, αkargminqk(αdkSD)∥JkdkSD∥2∥dkSD∥2, 其中 q k ( α d k S D ) ≜ 1 2 ∥ α J k d k S D r k ∥ 2 1 2 ∥ J k d k S D ∥ 2 α 2 − ∥ d k S D ∥ 2 α f k . q_{k}(\alpha d_{k}^{\mathrm{SD}})\triangleq\frac{1}{2}\|\alpha J_{k}d_{k}^{\mathrm{SD}}r_{k}\|^{2}\frac{1}{2}\|J_{k}d_{k}^{\mathrm{SD}}\|^{2}\alpha^{2}-\|d_{k}^{\mathrm{SD}}\|^{2}\alphaf_{k}. qk(αdkSD)≜21∥αJkdkSDrk∥221∥JkdkSD∥2α2−∥dkSD∥2αfk. 参考资料 1、数值最优化方法高立编著 2、机器人中的数值优化

查看全文

http://www.yutouwan.com/news/343973/