NEWS
—— 新聞中心 ——
【智能IoT】SLAM初識(shí)
發(fā)布時(shí)間:2019-12-29瀏覽次數(shù):0
SLAM初識(shí)
原作者: sixgod 來(lái)自: 計(jì)算機(jī)視覺life
最近幾年,隨著以掃地機(jī)器人為代表智能機(jī)器人技術(shù)的普及,以及自動(dòng)駕駛、AR等技術(shù)的爆發(fā),作為核心技術(shù)之一的SLAM技術(shù)逐漸受到許多研究者的關(guān)注。
什么是SLAM?
SLAM(Simultaneous Localization and Mapping),中文譯作同時(shí)定位與地圖創(chuàng)建。
外行乍一聽起來(lái)非常拗口,為了不在一開始就嚇跑讀者,我們先不對(duì)其進(jìn)行專業(yè)的解釋,用一個(gè)形象的例子來(lái)進(jìn)行說(shuō)明。我們知道現(xiàn)在有不少家用的掃地機(jī)器人(如下圖所示),可以代替人對(duì)室內(nèi)進(jìn)行自動(dòng)清掃。早期的掃地機(jī)器人并不智能,它只是具有簡(jiǎn)單的避障功能,在室內(nèi)隨機(jī)游走,遇到障礙物就轉(zhuǎn)彎,這樣會(huì)導(dǎo)致有很多地方會(huì)漏掉,掃地效率非常低。
掃地機(jī)器人
要想真正實(shí)現(xiàn)智能的清掃,掃地機(jī)器人至少需要知道以下幾件事情:
1、我在哪里?也就是掃地機(jī)器人在工作過(guò)程中要知道自己在房間的具體位置。對(duì)應(yīng)的術(shù)語(yǔ)叫:定位(Localization)。
2、我周圍的環(huán)境是什么樣子?也就是掃地機(jī)器人需要知道整個(gè)房間的地面結(jié)構(gòu)信息。對(duì)應(yīng)的術(shù)語(yǔ)叫:建圖(Mapping)。
3、我怎樣到達(dá)指定地點(diǎn)(充電器)?當(dāng)掃地機(jī)器人電量不足時(shí),如何以最短的路徑到達(dá)充電器所在位置進(jìn)行自動(dòng)充電。對(duì)應(yīng)的術(shù)語(yǔ)叫:路徑規(guī)劃(Route Planning)。
有了以上的幾個(gè)能力,掃地機(jī)器人就立馬變的智能了,不再像無(wú)頭蒼蠅一樣在室內(nèi)亂跑,而是可以從任意位置出發(fā),一邊清掃一邊對(duì)周圍的環(huán)境(房屋結(jié)構(gòu)、障礙物)建立地圖,同時(shí)根據(jù)地圖定位自己當(dāng)前在地圖中的位置,并實(shí)時(shí)調(diào)整規(guī)劃路線。隨著使用時(shí)間的增長(zhǎng),掃地機(jī)器人建立的地圖會(huì)越來(lái)越準(zhǔn)確,規(guī)劃的清掃路線越來(lái)越高效,變的越來(lái)越智能。這也不難理解斷點(diǎn)續(xù)掃(一次掃不完,回到充電地點(diǎn)重合點(diǎn),回到原位置繼續(xù)清掃)的功能是如何實(shí)現(xiàn)的了。
掃地機(jī)器人斷點(diǎn)續(xù)掃示意圖
看明白了上面的例子,我們給出SLAM的定義。SLAM是指當(dāng)某種移動(dòng)設(shè)備(如機(jī)器人)從一個(gè)未知環(huán)境里的未知地點(diǎn)出發(fā),在運(yùn)動(dòng)過(guò)程中通過(guò)傳感器觀測(cè)定位自身位置、姿態(tài)、運(yùn)動(dòng)軌跡,再根據(jù)自身位置進(jìn)行增量式的地圖構(gòu)建,從而達(dá)到同時(shí)定位和地圖構(gòu)建的目的。定位和建圖是兩個(gè)相輔相成的過(guò)程,地圖可以提供更好的定位,而定位也可以進(jìn)一步擴(kuò)建地圖。SLAM非常強(qiáng)調(diào)未知環(huán)境,是自主移動(dòng)機(jī)器人的核心技術(shù)。
SLAM 傳感器
很多人注意到,同一個(gè)行業(yè)的SLAM應(yīng)用,有人用相對(duì)傳統(tǒng)的激光雷達(dá)作為傳感器,有人用最近幾年興起的視覺攝像頭作為傳感器,當(dāng)然,還有人將它們結(jié)合起來(lái)使用,它們的區(qū)別在哪里呢?事實(shí)上,SLAM的實(shí)現(xiàn)方式與難度和傳感器的形式與安裝方式密切相關(guān)。用于SLAM的傳感器主要分為激光雷達(dá)和視覺兩大類。
1、激光雷達(dá)
激光雷達(dá)是非常傳統(tǒng)的SLAM傳感器。它可以提供機(jī)器人本身與周圍環(huán)境障礙物間的距離信息。常見的激光雷達(dá)有SICK、Velodyne、Rplidar等。
激光雷達(dá)
主流的2D激光傳感器掃描一個(gè)平面內(nèi)的障礙物,適用于平面運(yùn)動(dòng)的機(jī)器人(如掃地機(jī)等)進(jìn)行定位,并建立2D的柵格地圖。這種地圖在機(jī)器人導(dǎo)航中很實(shí)用,因?yàn)槎鄶?shù)機(jī)器人還不能在空中飛行或走上臺(tái)階,仍限于地面。在SLAM研究史上,早期SLAM研究幾乎全使用激光傳感器進(jìn)行建圖,且多數(shù)使用濾波器方法,例如卡爾曼濾波器與粒子濾波器等。
激光雷達(dá)的技術(shù)方案有如下幾個(gè)特點(diǎn):
1、精度很高,也比較穩(wěn)定。
2、速度快,計(jì)算量也不大,容易做成實(shí)時(shí)SLAM。
3、理論研究成熟。激光雷達(dá)用于SLAM的技術(shù)方案(EKF-SLAM)因?yàn)檠芯枯^早,現(xiàn)在已經(jīng)非常成熟。當(dāng)然人們也對(duì)EKF-SLAM的缺點(diǎn)也有較清楚的認(rèn)識(shí),例如不易表示回環(huán)、線性化誤差嚴(yán)重、必須維護(hù)路標(biāo)點(diǎn)的協(xié)方差矩陣等。
4、笨重。從上圖就可以看出,激光雷達(dá)比普通的攝像頭在空間體積上大了不少。
5、價(jià)格昂貴。激光雷達(dá)成本很高,因此激光的研究主要集中于如何降低傳感器的成本上,現(xiàn)在激光雷達(dá)也有平價(jià)的產(chǎn)品了,現(xiàn)在高級(jí)的掃地機(jī)器人中就已經(jīng)在使用激光雷達(dá)了,但性能配置會(huì)低一些。
2、視覺傳感器
視覺SLAM是最近幾年SLAM研究熱點(diǎn)之一。它有如下幾個(gè)特點(diǎn):
1、價(jià)格便宜。
2、體積小,重量輕。想想手機(jī)里動(dòng)輒幾千萬(wàn)像素的攝像頭也就占指甲蓋那么小的面積。
3、可以獲取豐富且直觀的信息。有研究表明,視覺信息占了人類獲取信息的80%以上,所以通過(guò)攝像頭可以獲取的信息要遠(yuǎn)遠(yuǎn)超過(guò)通過(guò)激光雷達(dá)獲得的信息。
4、計(jì)算量大。往往信息量和計(jì)算量是成正比的,視覺SLAM中的特征點(diǎn)檢測(cè)、匹配等過(guò)程非常耗時(shí)。不過(guò)隨著CPU、GPU處理器速度的飛速發(fā)展,很多以前被認(rèn)為無(wú)法實(shí)時(shí)化的視覺算法,得以近乎實(shí)時(shí)化地運(yùn)行。
5、需要一定的假設(shè)條件。比如視覺算法無(wú)法在無(wú)紋理區(qū)域進(jìn)行。
視覺SLAM傳感器主要分為三大類:?jiǎn)文?、雙目(或多目)、RGBD。此外還有魚眼、全景等特殊相機(jī),由于在研究和產(chǎn)品中都屬于少數(shù)在此不做介紹。
就實(shí)現(xiàn)難度而言,這三類方法難易程度從難到易依次為:?jiǎn)文恳曈X、雙目視覺、RGBD。下面來(lái)具體介紹。
單目相機(jī)
單目相機(jī)SLAM簡(jiǎn)稱MonoSLAM,即只用一個(gè)攝像頭實(shí)現(xiàn)SLAM。優(yōu)勢(shì)是傳感器特別的簡(jiǎn)單、成本特別的低,所以單目SLAM非常受研究者關(guān)注。相比別的視覺傳感器,單目有個(gè)較大的問(wèn)題,就是沒法確切地得到深度。單目相機(jī)有如下幾個(gè)特點(diǎn):
1、單目SLAM只能估計(jì)一個(gè)相對(duì)深度。由于深度未知,單目SLAM沒法得到機(jī)器人運(yùn)動(dòng)軌跡以及地圖的真實(shí)大小。直觀地說(shuō),如果把軌跡和房間同時(shí)放大兩倍,單目看到的像是一樣的。
2、單目相機(jī)必須通過(guò)運(yùn)動(dòng)才能獲取深度。它無(wú)法僅根據(jù)一張圖像獲得圖像中物體離自己的相對(duì)距離。為了估計(jì)這個(gè)相對(duì)深度,單目SLAM要靠運(yùn)動(dòng)中的三角測(cè)量,來(lái)求解相機(jī)運(yùn)動(dòng)并估計(jì)像素的空間位置。也就是說(shuō),它的軌跡和地圖,只有在相機(jī)運(yùn)動(dòng)之后才能收斂,如果相機(jī)不進(jìn)行運(yùn)動(dòng)時(shí),就無(wú)法得知像素的位置。
3、相機(jī)必須進(jìn)行旋轉(zhuǎn)和平移。相機(jī)運(yùn)動(dòng)還不能是純粹的旋轉(zhuǎn),這就給單目SLAM的應(yīng)用帶來(lái)了一些麻煩,好在日常使用SLAM時(shí),相機(jī)都會(huì)發(fā)生旋轉(zhuǎn)和平移。
4、既可以用于室內(nèi),又可以用于室外。
雙目相機(jī)
與單目不同的是,雙目立體視覺既可以在運(yùn)動(dòng)時(shí)估計(jì)深度,也可在靜止時(shí)估計(jì),消除了單目視覺的許多麻煩。不過(guò),雙目或多目相機(jī)配置與標(biāo)定均較為復(fù)雜,其深度量程也受雙目的基線與分辨率限制。此外,通過(guò)雙目圖像計(jì)算深度計(jì)算量也非常大。
RGBD相機(jī)
RGBD相機(jī)是一種可以獲得彩色圖并測(cè)量深度的相機(jī)。目前常用的RGBD相機(jī)包括Kinect一代、Kinect 二代、Xtion、Realsense等。RGBD相機(jī)有如下特點(diǎn):
1、一般通過(guò)結(jié)構(gòu)光或Time-of-Flight原理,直接測(cè)出物體離攝像頭的距離。相對(duì)于雙目立體視覺,它的速度非???,可以用于實(shí)時(shí)應(yīng)用。
2、它比單目或雙目相機(jī)能夠提供更豐富的信息。
3、現(xiàn)在多數(shù)RGBD相機(jī)還存在視場(chǎng)角小、分辨率低等諸多問(wèn)題。主要用于室內(nèi)SLAM。
總結(jié)
本文從一個(gè)形象的例子——掃地機(jī)器人談起,介紹了SLAM的定義。然后介紹了用于SLAM的兩大類傳感器:激光雷達(dá)和視覺傳感器,并介紹了其特點(diǎn)及應(yīng)用。
歡迎加入本站公開興趣群
商業(yè)智能與數(shù)據(jù)分析群(QQ群:956787284,AI-人工智能交流群)
興趣范圍包括:各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法,實(shí)際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)挖掘工具,報(bào)表系統(tǒng)等全方位知識(shí)






