免费网站制作软件,自建网站的步骤,添加到wordpress视频库中,wordpress修改页面标题显示不出来本文介绍两篇使用语义地图进行视觉定位的论文#xff0c;两篇论文工程性很强#xff0c;值得一学。
AVP-SLAM是一篇关于自动泊车的视觉定位方案#xff0c;收录于 IROS 2020。论文链接为#xff1a;https://arxiv.org/abs/2007.01813#xff0c;视频链接为#xff1a;ht…
本文介绍两篇使用语义地图进行视觉定位的论文两篇论文工程性很强值得一学。
AVP-SLAM是一篇关于自动泊车的视觉定位方案收录于 IROS 2020。论文链接为https://arxiv.org/abs/2007.01813视频链接为https://zhuanlan.zhihu.com/p/157340737。
RoadMap是轻量级的室外语义地图视觉定位方案收录于 ICRA2021。论文链接为https://arxiv.org/abs/2106.02527视频链接为https://zhuanlan.zhihu.com/p/382183817。 1.AVP-SLAM AVP-SLAM自动泊车SLAM框架采用停车线等作为定位标志IROS20201.1 System Overview
自动泊车视觉定位方案如下图所示使用到的传感器有4个环视摄像头1个IMU2个轮速编码器轮速编码器和IMU组成里程计可以据此得到车辆的相对位置。
整个方案分为两部分
第一部分是建立全局语义地图4个环视摄像头采集到的图像首先投影到鸟瞰图然后合并成全方位图神经网络检测语义特征包括车道线、车位线、地面引导标志、减速带。结合里程计将语义特征投影到全局坐标同时使用回环检测最终得到全局图。第二部分是定位与建图相似通过鸟瞰图提取语义特征然后与全局图进行匹配来定位。同时使用EKF将视觉地位与里程计定位进行融合。 1.2 Methodology
1全方位图合成
4个环视摄像头如图3所示每个摄像头的内参和外参都已提前标定。图像中的像素投影到汽车中心坐标地面z0z0z0投影方程为 1λ[xvyv1][Rctc]col:1,2,4−1πc−1([uv1])\frac{1}{\lambda}\left[\begin{array}{c} x^{v} \\ y^{v} \\ 1 \end{array}\right]\left[\mathbf{R}_{c} \mathbf{t}_{c}\right]_{\operatorname{col}: 1,2,4}^{-1} \pi_{c}^{-1}\left(\left[\begin{array}{l} u \\ v \\ 1 \end{array}\right]\right) λ1⎣⎡xvyv1⎦⎤[Rctc]col:1,2,4−1πc−1⎝⎛⎣⎡uv1⎦⎤⎠⎞
其中 πc(.)\pi_{c}(.)πc(.) 是摄像头投影模型πc(.)−1\pi_{c}(.)^{-1}πc(.)−1 是逆投影。[Rt,tc][\mathbf{R}_t,\mathbf{t}_c][Rt,tc] 是每个摄像头相对汽车中心的外参[u,v][u,v][u,v] 是像素坐标[xv,yv][x^v,y^v][xv,yv] 是对应在汽车中心坐标的像素位置。
逆投影之后合成全方位图如下图4所示。全方位图合成方程为 [uipmvipm1]Kipm[xvyv1]\left[\begin{array}{c} u_{i p m} \\ v_{i p m} \\ 1 \end{array}\right]\mathbf{K}_{i p m}\left[\begin{array}{c} x^{v} \\ y^{v} \\ 1 \end{array}\right] ⎣⎡uipmvipm1⎦⎤Kipm⎣⎡xvyv1⎦⎤
其中 Kipm\mathbf{K}_{ipm}Kipm 是合成全方位图内参。
2特征检测
下面就是特征检测这里使用的分割网络为 U-Net作者专门针对车库场景进行了训练分割结果如图4所示。 3建图
特征检测之后有用的语义特征车位线、引导标志、减速带位置会转换到3D空间坐标转换方程为 [xvyv1]Kipm−1[uipmvipm1]\left[\begin{array}{c} x^{v} \\ y^{v} \\ 1 \end{array}\right]\mathbf{K}_{i p m}^{-1}\left[\begin{array}{c} u_{i p m} \\ v_{i p m} \\ 1 \end{array}\right] ⎣⎡xvyv1⎦⎤Kipm−1⎣⎡uipmvipm1⎦⎤
结合里程计这些特征将会从汽车中心坐标转换到世界坐标转换方程为 [xwywzw]Ro[xvyv0]to\left[\begin{array}{l} x^{w} \\ y^{w} \\ z^{w} \end{array}\right]\mathbf{R}_{\mathbf{o}}\left[\begin{array}{c} x^{v} \\ y^{v} \\ 0 \end{array}\right]\mathbf{t}_{o} ⎣⎡xwywzw⎦⎤Ro⎣⎡xvyv0⎦⎤to
其中 [Ro,to][\mathbf{R}_o,\mathbf{t}_o][Ro,to] 是从里程计得到的汽车位置这样就得了局部地图。
由于里程计会随时间漂移这里使用回环检测进行优化如图5所示。两个局部地图使用ICP方法进行匹配如果匹配成功就得到了两个局部图的相对位置这些相对位置会用在全局位置图优化中。全局优化方程为
X∗argminX∑t∥f(rt1,tt1,rt,tt)−zt,t1o∥2∑i,j∈L∥f(ri,ti,rj,tj)−zi,jl∥2\begin{gathered} \mathcal{X}^{*}\underset{\mathcal{X}}{\arg \min } \sum_{t}\left\|f\left(\mathbf{r}_{t1}, \mathbf{t}_{t1}, \mathbf{r}_{t}, \mathbf{t}_{t}\right)-\mathbf{z}_{t, t1}^{o}\right\|^{2} \sum_{i, j \in \mathcal{L}}\left\|f\left(\mathbf{r}_{i}, \mathbf{t}_{i}, \mathbf{r}_{j}, \mathbf{t}_{j}\right)-\mathbf{z}_{i, j}^{l}\right\|^{2} \end{gathered} X∗Xargmint∑∥∥f(rt1,tt1,rt,tt)−zt,t1o∥∥2i,j∈L∑∥∥f(ri,ti,rj,tj)−zi,jl∥∥2
其中 X[r0,t0,...,rt,tt]T\mathcal{X}[\mathbf{r}_0,\mathbf{t}_0,...,\mathbf{r}_t,\mathbf{t}_t]^{T}X[r0,t0,...,rt,tt]T 是 所有局部图的位置zt,t1o\mathbf{z}_{t, t1}^{o}zt,t1o 是从里程计得到的局部图 ttt 和 t1t1t1 相对位置zi,jl\mathbf{z}_{i,j}^lzi,jl 是回环帧对 i,ji,ji,j 的相对位置。优化方法为高斯牛顿法。
4定位
定位如图6所示和建图类似首先是检测语义特征检测到的语义特征与全局图进行匹配匹配方法为 r∗,t∗argminr,t∑k∈S∥R(r)[xkvykv0]t−[xkwykwzkw]∥2\mathbf{r}^{*}, \mathbf{t}^{*}\underset{\mathbf{r}, \mathbf{t}}{\arg \min } \sum_{k \in \mathcal{S}}\left\|\mathbf{R}(\mathbf{r})\left[\begin{array}{c} x_{k}^{v} \\ y_{k}^{v} \\ 0 \end{array}\right]\mathbf{t}-\left[\begin{array}{l} x_{k}^{w} \\ y_{k}^{w} \\ z_{k}^{w} \end{array}\right]\right\|^{2} r∗,t∗r,targmink∈S∑∥∥∥∥∥∥R(r)⎣⎡xkvykv0⎦⎤t−⎣⎡xkwykwzkw⎦⎤∥∥∥∥∥∥2
其中 r,t\mathbf{r},\mathbf{t}r,t 是当前帧的旋转和平移向量S\mathcal{S}S 是当前特征点集合[xkv,ykv,0][x_k^v,y_k^v,0][xkv,ykv,0] 是当前特征点在汽车坐标的位置[xkw,ykw,zkw][x_k^w,y_k^w,z_k^w][xkw,ykw,zkw] 是全局坐标系下与特征匹配的最近点。
在实际应用中使用里程计进行位置预测视觉定位结果进行更新。同时在特征检测时还要检测停车位位置这里通过检测停车位顶点和车位线位置来实现如图7所示。 1.3 Experimental Results
实验采集平台摄像头采集频率为为30Hz图像精度为 1280×7201280\times7201280×720 pixels图像分割处理频率为15Hz。为了评估建图精度在室外场景中使用RTK-GPS作为真值结果如表1所示建图精度比纯里程计和ORB-SLAM2要高。
下面是召回率比较为了公平比较使用了里程计辅助ORB-SLAM2建图结果如表2所示可以看出语义特征比几何特征定位更稳定。
然后是地图大小比较 如表3所示语义地图比传统描述子地图更高效。最后是定位误差如表4所示测量的是汽车中心与车位线之间实际距离以及地图上两者之间距离两个距离之差为定位误差总共进行了20次停车测试可以看到定位误差达到了厘米级。 2.RoadMap
文方案探索的是使用轻量化的众包语义地图取代传统的高精地图实现视觉定位。
2.1 System Overview
如下图所示定位方案包括三部分车端建图、云端建图、终端定位。
配备有前视摄像头、RTK-GPS以及其它传感器的高端车辆如Robo-taxi) 每天收集大量实时数据通过分割网路从前视图像提取语义特征然后根据优化的汽车位置将语义特征投影到世界坐标同时将局部语义地图上传到云端云端服务器接收多个车辆上传的局部语义地图合并成全局地图然后进行地图压缩提取轮廓接着将压缩的语义地图发送至终端车辆配置低成本传感器的终端车辆接收云端的语义地图前视图像提取的语义特征与地图进行匹配定位。 2.2 Methodology
1车端建图
首先是图像分割如图3所示使用车道线、停车线、道路标志来建立语义地图。
在使用RTK-GPS进行定位时会受到周围遮挡物的影响因此这里还需要进行位置图优化如图4和5所示优化方程为 mins0…sn{∑i∈[1,n]∥ro(si−1,si,m^i−1,io)∥σ2∑i∈G∥rg(si,m^ig)∥σ2}\min _{\mathbf{s}_{0} \ldots \mathbf{s}_{n}}\left\{\sum_{i \in[1, n]}\left\|\mathbf{r}_{o}\left(\mathbf{s}_{i-1}, \mathbf{s}_{i}, \hat{\mathbf{m}}_{i-1, i}^{o}\right)\right\|_{\boldsymbol{\sigma}}^{2}\sum_{i \in \mathcal{G}}\left\|\mathbf{r}_{g}\left(\mathbf{s}_{\mathbf{i}}, \hat{\mathbf{m}}_{i}^{g}\right)\right\|_{\boldsymbol{\sigma}}^{2}\right\} s0…snmin⎩⎨⎧i∈[1,n]∑∥∥ro(si−1,si,m^i−1,io)∥∥σ2i∈G∑∥rg(si,m^ig)∥σ2⎭⎬⎫
其中sss 是位置状态量mi−1,io{\mathbf{m}}_{i-1, i}^{o}mi−1,io 是里程计测量mig\mathbf{m}_{i}^{g}mig 是GNSS测量里程计和GNSS残差 ro\mathbf{r}_oro 和 rg\mathbf{r}_grg 为 ro(si−1,si,m^i−1,io[R(qi−1)−1(pi−pi−1)−δp^i−1,io[qi−1⋅qi−1⋅δq^i−1,io]xyz]rg(si,m^ig)pi−m^ig\begin{aligned} \mathbf{r}_{o}\left(\mathbf{s}_{i-1}, \mathbf{s}_{i}, \hat{\mathbf{m}}_{i-1, i}^{o}\right.\left[\begin{array}{c} \mathbf{R}\left(\mathbf{q}_{i-1}\right)^{-1}\left(\mathbf{p}_{i}-\mathbf{p}_{i-1}\right)-\delta \hat{\mathbf{p}}_{i-1, i}^{o} \\ {\left[\mathbf{q}_{i}{ }^{-1} \cdot \mathbf{q}_{i-1} \cdot \delta \hat{\mathbf{q}}_{i-1, i}^{o}\right]_{x y z}} \end{array}\right] \\ \mathbf{r}_{g}\left(\mathbf{s}_{\mathbf{i}}, \hat{\mathbf{m}}_{i}^{g}\right) \mathbf{p}_{i}-\hat{\mathbf{m}}_{i}^{g} \end{aligned} ro(si−1,si,m^i−1,iorg(si,m^ig)[R(qi−1)−1(pi−pi−1)−δp^i−1,io[qi−1⋅qi−1⋅δq^i−1,io]xyz]pi−m^ig
最后是建立局部语义地图与AVP-SLAM类似即将语义特征根据优化的位置转换到全局坐标。 2云端建图
云端将各个车辆收集来的地图进行合并得到全局地图同时提取出地图轮廓然后再发送给其它量产车。 3终端定位
首先是复原地图这里是使用同样的语义标签填充轮廓然后将标签像素投影到世界坐标。定位方法与AVP-SLAM一样即 q∗,p∗argminq,p∑k∈S∥R(q)[xkvykv0]p−[xkwykwzkw]∥2\mathbf{q}^{*}, \mathbf{p}^{*}\underset{\mathbf{q}, \mathbf{p}}{\arg \min } \sum_{k \in \mathcal{S}}\left\|\mathbf{R}(\mathbf{q})\left[\begin{array}{c} x_{k}^{v} \\ y_{k}^{v} \\ 0 \end{array}\right]\mathbf{p}-\left[\begin{array}{c} x_{k}^{w} \\ y_{k}^{w} \\ z_{k}^{w} \end{array}\right]\right\|^{2} q∗,p∗q,pargmink∈S∑∥∥∥∥∥∥R(q)⎣⎡xkvykv0⎦⎤p−⎣⎡xkwykwzkw⎦⎤∥∥∥∥∥∥2 2.3 Experimental Results
下面是定位精度比较这里RTK-GPS做真值可以看出其定位精度比激光雷达还要准。