觸摸(Touch)是人類在進(jìn)行協(xié)調(diào)交互時(shí)的主要方式之一。通過觸摸感知到的觸覺(Sense of Touch)可以幫助人類評(píng)估物體的屬性,如大小、形狀、質(zhì)地、溫度等。此外,還可以利用觸覺來檢測(cè)物體的滑脫,進(jìn)而發(fā)展人類對(duì)身體的認(rèn)識(shí)。觸覺將壓力、振動(dòng)、疼痛、溫度等多種感覺信息傳遞給中樞神經(jīng)系統(tǒng),幫助人類感知周圍環(huán)境,避免潛在的傷害。研究表明,與視覺和聽覺相比,人類的觸覺在處理物體的物質(zhì)特征和細(xì)節(jié)形狀方面更勝一籌。 與人類一樣,機(jī)器人的觸摸傳感(Touch Sensing)能夠幫助機(jī)器人理解現(xiàn)實(shí)世界中物體的交互行為,這些行為取決于其重量和剛度,取決于觸摸時(shí)表面的感覺、接觸時(shí)的變形情況以及被推動(dòng)時(shí)的移動(dòng)方式。只有給機(jī)器人也配備先進(jìn)的觸摸傳感器 --- 即 “觸覺傳感(Tactile Sensing)” 系統(tǒng),才能使其意識(shí)到周圍的環(huán)境,遠(yuǎn)離潛在的破壞性影響,并為后續(xù)的手部操作等任務(wù)提供信息。然而,目前大多數(shù)機(jī)器人交互式技術(shù)系統(tǒng)由于缺乏對(duì)觸覺傳感技術(shù)的有效應(yīng)用,其動(dòng)作不準(zhǔn)確、不穩(wěn)定,交互過程“笨拙”,極大地限制了他們的交互和認(rèn)知能力。 我們?cè)谶@篇文章中重點(diǎn)關(guān)注人類和機(jī)器人的觸覺傳感問題。首先,我們討論人類 "觸覺" 的生理和編碼方式,及其在傳遞觸覺數(shù)據(jù)等任務(wù)中的重要性。然后,在分析人類觸覺的基礎(chǔ)上探討機(jī)器人 “觸覺傳感” 系統(tǒng)的構(gòu)建,特別是觸摸感知(Tactile Perception)的方法和應(yīng)用。最后,具體分析兩篇關(guān)注在具體應(yīng)用場景中向機(jī)器人引入觸覺傳感技術(shù)的文章。 一、人類「觸覺」 首先,我們來分析人類的觸覺究竟是什么。人類的 “觸覺” 包括兩個(gè)主要的亞型,即 “皮膚(Cutaneous)” 和“動(dòng)覺(Kinesthetic)”。兩者主要是基于感覺輸入的部位來區(qū)分的:皮膚感覺接收來自嵌入皮膚的受體的感覺輸入,而動(dòng)覺感覺接收來自肌肉、肌腱和關(guān)節(jié)內(nèi)的受體的感覺輸入。在這兩個(gè)亞型的基礎(chǔ)上,研究人員區(qū)分定義了皮膚(Cutaneous)、動(dòng)覺(Kinesthetic)和觸覺(Haptic)三種感覺系統(tǒng)。其中,皮膚系統(tǒng)包括與刺激物的身體接觸,并通過中樞神經(jīng)系統(tǒng)(central nervous system,CNS)皮膚和相關(guān)體感區(qū)的受體提供對(duì)身體外表面刺激的感知;動(dòng)覺系統(tǒng)主要來自肌肉、關(guān)節(jié)和皮膚的傳入信息以及大腦可用的肌肉效能的相關(guān)聯(lián)系來提供有關(guān)靜態(tài)和動(dòng)態(tài)身體姿勢(shì)(頭部、軀干、四肢和末端執(zhí)行器的相對(duì)位置)的信息;觸覺系統(tǒng)利用的則是來自皮膚和動(dòng)覺系統(tǒng)的關(guān)于物體和事件的重要信息。 人類的觸覺通過分布在全身不同密度的大量受體(如壓力 / 振動(dòng)的機(jī)械感受器、溫度的熱感受器和疼痛 / 損傷的痛覺感受器)處理對(duì)外部刺激的時(shí)空感知。對(duì)機(jī)械刺激的反應(yīng)是由植入皮膚不同深度的機(jī)械感受器介導(dǎo)的。這些受體的分類、功能和位置如圖 1 所示 [1]。這些受體具有不同的感受野(受體反應(yīng)的身體區(qū)域的范圍)和不同的適應(yīng)率。一個(gè)快速適應(yīng)(fast-adapting,F(xiàn)A)受體在第一次被施加刺激時(shí)就會(huì)立刻產(chǎn)生動(dòng)作電位的爆發(fā)。相反,對(duì)于慢適應(yīng)(slow-adapting,SA)受體來說,在刺激與其感受野接觸的整個(gè)時(shí)期內(nèi)它都是活躍的狀態(tài)。對(duì)熱刺激的反應(yīng)被認(rèn)為是由皮膚中單獨(dú)的“熱” 和“冷”的熱受體群體介導(dǎo)的。此外,科學(xué)家還在體外和體內(nèi)對(duì)人體皮膚樣品進(jìn)行了研究,發(fā)現(xiàn)不同受體對(duì)外界刺激的反應(yīng)本質(zhì)上是熱電性和壓電性的。 圖 1. (a) 無毛皮膚切片,顯示各種機(jī)械感受器的物理位置和分類;(b) 從指尖到大腦體感區(qū)的觸覺信號(hào)傳遞;(c) 觸覺信號(hào)從接觸點(diǎn)傳遞到大腦過程中的功能事件,為了簡單起見,信號(hào)流是單向的 從皮膚受到刺激的那一刻起直到產(chǎn)生感知,會(huì)發(fā)生各種復(fù)雜的機(jī)械、感知和認(rèn)知現(xiàn)象。圖 1 給出了一個(gè)事件序列示例。當(dāng)皮膚與物體接觸時(shí),它會(huì)與物體表面保持一致,即保持相同的局部輪廓,從而將變形投射到大量的機(jī)械感受器(受體的一類)上。因此,每個(gè)機(jī)械感受器都能表征物體的一小部分,并將時(shí)空觸覺信息編碼為響應(yīng)于刺激大于閾值時(shí)產(chǎn)生的動(dòng)作電位電壓脈沖的峰值。刺激的振幅隨后被轉(zhuǎn)換成一系列動(dòng)作電位,這一步驟類似于用模數(shù)轉(zhuǎn)換器將模擬信號(hào)數(shù)字化和編碼過程。 時(shí)空限制和對(duì)機(jī)械刺激的敏感性直接影響人類的物體識(shí)別能力和方向敏感性等。皮膚感覺的模式感知能力受到其空間和時(shí)間敏感性的限制,因?yàn)樗鼈冊(cè)谄つw處理的早期階段就通過時(shí)空過濾來量化信息的丟失或模糊程度。這種效應(yīng)可以用來定義機(jī)器人觸覺傳感的 “串?dāng)_” 極限。 人類善于通過觸摸來識(shí)別普通物體,而物體的材料屬性、形狀等線索識(shí)別的結(jié)果都是至關(guān)重要的。皮膚、動(dòng)覺都有助于感知這些線索。不過,人類的觸覺感知更適合于感知物體的物質(zhì)屬性,而不是感知物體的形狀,特別是在當(dāng)物體較大、超過了手指接觸區(qū)域大小(7-12 mm)的情況下。不過,對(duì)手指接觸區(qū)域內(nèi)的物體進(jìn)行形狀(Shape)檢測(cè)是機(jī)械感受器的一項(xiàng)重要功能。 此外,粗糙平滑(roughness-smoothness)是另一個(gè)重要的感知維度。神經(jīng)生理學(xué)研究表明,觸覺粗糙度知覺是由 SA 傳入神經(jīng)放電的空間變化準(zhǔn)確預(yù)測(cè)的,因此,它是多種觸覺要素的函數(shù)。 對(duì)物體滑脫(Slip)的檢測(cè)可以看作是皮膚受體對(duì)運(yùn)動(dòng)的編碼。表面和皮膚之間的滑動(dòng)或相對(duì)運(yùn)動(dòng)對(duì)于感知粗糙度、硬度和形狀非常重要?;撟鳛橐环N誤差信號(hào),在人的握力控制中起著重要作用。物體接觸表面的觸覺反饋會(huì)影響對(duì)支撐物體的力的感知。除了大小之外,力的方向?qū)τ谔幚硇螤畈灰?guī)則的物體同時(shí)保持所需的方向也是至關(guān)重要的。在運(yùn)動(dòng)控制中,觸覺信息在控制伸手抓握動(dòng)作的執(zhí)行中起著重要作用。準(zhǔn)確地抓住一個(gè)物體不僅需要精確地控制手指肌肉的活動(dòng)強(qiáng)度,而且還需要精確地控制其在不同抓取階段的時(shí)間進(jìn)程或持續(xù)時(shí)間。缺乏觸覺感知會(huì)延長抓握的手指張開階段的持續(xù)時(shí)間,從而削弱抓握的控制。最后,人類通過皮膚這種介質(zhì)將接觸壓痕轉(zhuǎn)化為應(yīng)力 / 應(yīng)變。人體皮膚具有多層性、非線性、非均勻性和粘彈性,它是一個(gè)由肌肉和脂肪組成的可變形系統(tǒng)支撐的復(fù)雜結(jié)構(gòu)。不同的皮膚層有不同的剛度。有了這些特性,皮膚力學(xué)就在觸覺感知中發(fā)揮重要作用。 但是,需要指出的是,人是一個(gè)完整的、多層次的、綜合的系統(tǒng),“觸覺”并不是孤立的。人類感知一個(gè)刺激物依賴的是多個(gè)感官信息的集合,如觸覺、視覺、聽覺等。有時(shí),不同感覺方式的輸入效果是相互矛盾的,此時(shí),人需要判斷這些不同的感覺方式所輸入的信號(hào)的關(guān)系和正確性。而在更多其它的時(shí)候,人類的感知是由不同感官輸入信號(hào)的綜合體。即便僅涉及一個(gè)單一的輸入模態(tài),人類對(duì)一個(gè)物體的感知也可能是由于它的子模態(tài)的綜合作用所得到的。多個(gè)來源的感官信息的組合與整合能力是實(shí)現(xiàn)穩(wěn)健的人類感知的關(guān)鍵,因?yàn)樗畲笙薅鹊乩昧藖碜圆煌泄倌J降男畔?,從而提高了感官估?jì)的可靠性。 二、機(jī)器人「觸覺傳感」 對(duì)應(yīng)于人的觸覺,機(jī)器人的觸覺傳感(Tactile Sensing)系統(tǒng)就是一種可以通過接觸來測(cè)量物體給定屬性的裝置或系統(tǒng)。一般來說,機(jī)器人的觸覺感知與在預(yù)定區(qū)域內(nèi)的力的測(cè)量有關(guān)。為了改進(jìn)機(jī)器人的應(yīng)用效果,也應(yīng)當(dāng)為機(jī)器人配備先進(jìn)的觸覺感知系統(tǒng),以使其能夠感知周圍環(huán)境,遠(yuǎn)離潛在的破壞性影響,并為后續(xù)任務(wù)(如手部操作)提供有效信息。 機(jī)器人觸覺傳感有著眾多應(yīng)用場景:比如在操作任務(wù)中,使用觸覺信息作為機(jī)器人的控制參數(shù),例如,接觸點(diǎn)估計(jì)信息、表面法向和曲率等;在抓握任務(wù)中,通過測(cè)量法向靜態(tài)力來檢測(cè)物體滑動(dòng)情況,例如,將接觸力的測(cè)量值用于輔助抓握力控制,這對(duì)于機(jī)器人保持穩(wěn)定抓握至關(guān)重要;在機(jī)器人的靈巧操作任務(wù)中,判斷施加操作用力的方向也是至關(guān)重要的,例如,通過調(diào)節(jié)法向力和切向力之間的平衡,能夠保證抓握的穩(wěn)定性。 圖 2 給出了一個(gè)在指尖、指骨和手掌上配置觸覺傳感器的機(jī)器人手示例[3]。具備高空間和時(shí)間分辨率的觸覺傳感器為手部提供了豐富的觸覺信息,進(jìn)而用于輔助機(jī)器人執(zhí)行復(fù)雜任務(wù),例如,探索未知對(duì)象、工具使用和手部操作等。 圖 2. 陰影靈巧手(左)被觸覺皮膚覆蓋(中間),以便在多個(gè)位置提供觸覺信息(右側(cè)渲染圖中突出顯示的綠色區(qū)域)[3] 觸覺傳感器也可以嵌入機(jī)器人的其他身體部位,如手臂、軀干(圖 3 中 NAO 機(jī)器人示例)、腿和腳。由這些部位反饋的觸覺信息與輔助機(jī)器人繞行障礙物、完成人機(jī)交互和移動(dòng)等任務(wù)密切相關(guān)[3]。 圖 3. NAO 類人機(jī)器人覆蓋著一層多模人造機(jī)器人皮膚,提供振動(dòng)、溫度、力和接近信息[3] 文獻(xiàn) [2] 引入了觸覺傳感,結(jié)合傳統(tǒng)的視覺和聽覺,機(jī)器人的感知 - 控制 - 行為的架構(gòu)系統(tǒng)以圖 4 的形式展示出。其中,左側(cè)圖表示將觸覺感知過程被劃分為功能塊,在不同的層次上描述傳感過程、感知和控制行為。圖 1 的右側(cè)示出了與這些功能塊相對(duì)應(yīng)的硬件的結(jié)構(gòu)塊。傳感過程(Sensing)將外界刺激(如壓力、振動(dòng)和熱刺激)轉(zhuǎn)化為觸覺傳感器傳感元件的變化。利用嵌入式數(shù)據(jù)處理單元采集、調(diào)節(jié)和處理這些數(shù)據(jù),然后將其傳輸?shù)礁叩母兄獙樱≒erception)。感知層的任務(wù)是構(gòu)建用于生成感知交互對(duì)象特性(如形狀和材料特性)的模型。在感知階段,觸覺還可能還會(huì)與視覺和聽覺等其他感知方式相融合(Fusion)。最終,在控制層(Action)中機(jī)器人根據(jù)融合的知識(shí)執(zhí)行控制命令,使用控制器完成動(dòng)作。 圖 4. 機(jī)器人觸覺傳感系統(tǒng)的層次功能(左)和結(jié)構(gòu)(右)框圖 [2] 2.1 傳感層(Sensing) 傳感層是整個(gè)觸覺傳感系統(tǒng)中最底層的處理結(jié)構(gòu),根據(jù)傳感過程對(duì)應(yīng)的身體部位,主要?jiǎng)澐譃橐韵氯悾?/p> 單點(diǎn)接觸式傳感器(類似于單觸覺細(xì)胞):這種傳感器用于確認(rèn)物體與傳感器的接觸,并檢測(cè)接觸點(diǎn)處的力或振動(dòng)。根據(jù)傳感方式,單點(diǎn)接觸傳感器可分為:1)用于測(cè)量接觸力的力傳感器;2)用于測(cè)量接觸過程中振動(dòng)的仿生晶須,也稱為動(dòng)態(tài)觸覺傳感器; 高空間分辨率觸覺陣列(類似于人類的指尖):這種類型的觸覺傳感器是目前觸覺傳感研究中采用最多的傳感器,例如基于光纖的觸覺傳感元件的觸覺陣列、基于 MEMS 氣壓計(jì)的觸覺陣列傳感器和基于嵌入式相機(jī)的指尖傳感器等; 大面積觸覺傳感器(類似于人類手臂、背部和其他身體部位的皮膚):與指尖觸覺傳感器不同,這種類型的傳感器并不需要強(qiáng)調(diào)高空間分辨率的特性。對(duì)它們來說,更重要的是足夠靈活,以及可以連接到機(jī)器人彎曲的身體部位。 2.2 感知層(Perception) 觸覺感知(Perception)是指通過解釋和表達(dá)觸覺信息來觀察物體特性的過程,也是機(jī)器人觸覺傳感中重點(diǎn)關(guān)注的研究內(nèi)容。由圖 2 可知,感知位于傳感層之上,為控制層提供有用的、面向任務(wù)的信息。與觸覺傳感器的快速發(fā)展相比,對(duì)觸覺傳感器產(chǎn)生信息的理解(觸覺感知)發(fā)展尚不成熟。目前針對(duì)觸覺感知的研究主要包括物體識(shí)別、形狀識(shí)別、姿態(tài)識(shí)別、感知融合等。 [物體識(shí)別] 物體表面的材料特性是機(jī)器人與周圍環(huán)境進(jìn)行有效交互所需要的最重要的信息之一。視覺(Vision)一直是識(shí)別物體材料最常用的方法。然而,光憑視覺只能識(shí)別出一種已知的表面材料,而不能估計(jì)其物理參數(shù)。在這方面,必須引入觸覺來判斷材料特性。輔助觸覺物體識(shí)別的信息包括物體的表面紋理(Surface texture)、物體剛度(Object stiffness)等。 [形狀感知] 形狀感知是機(jī)器人識(shí)別或重建物體形狀的能力。在不同的機(jī)器人任務(wù)中,形狀感知的目標(biāo)不同,例如,捕捉精確的形狀,形狀元素或整體輪廓分類等。形狀感知能力對(duì)于機(jī)器人執(zhí)行任務(wù)(如抓取和手部操作)的完成效果至關(guān)重要。獲得的物體形狀信息越完整,機(jī)器人就越有能力規(guī)劃和執(zhí)行抓取軌跡和操縱策略。 經(jīng)典的形狀識(shí)別研究主要是基于視覺的方法。然而,當(dāng)存在遮擋或光照條件較差時(shí),機(jī)器人是無法觀察到視覺形狀特征的。相比之下,觸覺物體的形狀感知并不受這些因素的影響,可以通過傳感器與物體的相互作用來判斷物體的細(xì)節(jié)形狀。此外,近年來高性能觸覺傳感器的大規(guī)模量產(chǎn)進(jìn)一步促進(jìn)了通過觸覺識(shí)別物體形狀的算法的推廣。 形狀感知算法主要包括局部形狀感知和全局形狀感知兩類。局部形狀感知類似于人類皮膚的觸覺感覺,全局形狀感知?jiǎng)t是皮膚和動(dòng)覺共同反饋?zhàn)饔玫慕Y(jié)果,例如對(duì)超出指尖范圍的輪廓的感知。在一些機(jī)器人內(nèi)置的內(nèi)部傳感器中,例如關(guān)節(jié)中的本體感受器,常被用來獲取手指 / 末端執(zhí)行器的位置和運(yùn)動(dòng),通過將這些手指 / 末端執(zhí)行器與局部特征結(jié)合起來以識(shí)別物體。 [姿態(tài)識(shí)別] 機(jī)器人實(shí)現(xiàn)對(duì)物體的操縱需要以精確和及時(shí)地估計(jì)物體的姿態(tài)為前提。一般情況下,使用物體(對(duì)象)相對(duì)于機(jī)器人末端效應(yīng)器或全局坐標(biāo)系的位置和方向描述其姿態(tài)。針對(duì)物體位置的估計(jì)即使存在很小的誤差,也會(huì)導(dǎo)致機(jī)器人手指在物體上的位置不正確,從而產(chǎn)生關(guān)于抓握穩(wěn)定性的錯(cuò)誤假設(shè),并影響操作任務(wù)的成功。因此,魯棒、準(zhǔn)確和快速地感知物體的姿態(tài)是任何復(fù)雜的抓取和操縱系統(tǒng)的關(guān)鍵部分。 機(jī)器人學(xué)中最常用的估計(jì)物體姿態(tài)的方法是使用計(jì)算機(jī)視覺。然而,當(dāng)機(jī)器人接近要操縱的物體時(shí),會(huì)存在遮擋的現(xiàn)象,進(jìn)而影響視覺估計(jì)的效果。為了解決這一問題,研究人員通過引入觸覺傳感系統(tǒng)來幫助機(jī)器人確定被觸摸物體的姿態(tài)。根據(jù)傳感層輸入的不同,姿態(tài)識(shí)別方法主要包括單點(diǎn)接觸式傳感器和觸覺傳感陣列。 [感知融合] 機(jī)器人必須配備不同的傳感方式,才能在非結(jié)構(gòu)化環(huán)境中工作。將這些不同來源的數(shù)據(jù)融合成更有意義的、更高層次的狀態(tài)表征也是感知過程的一部分。多個(gè)傳感器可以提供更及時(shí)、成本更低的信息。此外,由于傳感器的工作速度不同,可以并行處理它們的信息。 在需要與環(huán)境交互來完成的任務(wù)中,可以將觸覺感知與其他感知方式相結(jié)合,以提高任務(wù)完成的準(zhǔn)確度和魯棒性。典型的感知融合方式有觸覺感知與視覺、動(dòng)覺線索、力矩和距離感測(cè)的結(jié)合等等。 2.3 控制層(Action) 最后,我們從控制層的角度討論觸覺傳感技術(shù)在機(jī)器人中的應(yīng)用。豐富的觸覺信息能夠?yàn)閳?zhí)行觸覺相關(guān)任務(wù)提供多種可能性,包括:觸覺探索、抓取、手部操作、移動(dòng)、工具操作、人機(jī)交互和無意識(shí)操作等[3]。 [觸覺探索(Tactile Exploration)] 觸覺探索是一種通過觸覺提取未知物體屬性的有效方法。人類通過多種探索方法來獲得關(guān)于物體的知識(shí),例如側(cè)向運(yùn)動(dòng)、壓力、封閉、輪廓跟蹤、物體部分運(yùn)動(dòng)測(cè)試和啟示性測(cè)試等。受到這些人類行為的啟發(fā),研究人員開發(fā)了多種基于觸覺的探索方法用以估計(jì)機(jī)器人的控制參數(shù),包括物體表面幾何結(jié)構(gòu)、材料屬性、形狀等。 觸覺傳感在機(jī)器人觸覺探索中的另一個(gè)代表性應(yīng)用是觸覺伺服控制(Tactile servoing control),即通過單個(gè)或多個(gè)接觸區(qū)域內(nèi)得到的物體相關(guān)信息以確定期望的機(jī)器人與物體的接觸模式(接觸模式是指接觸位置和力)。例如,可以使用觸覺陣列通過執(zhí)行滑動(dòng)和滾動(dòng)動(dòng)作來探索物體的表面特征,從而通過最小化觸覺模式的偏差來控制動(dòng)作。這種方法也可用于控制機(jī)器人手進(jìn)行探索,控制器利用手部多個(gè)接觸區(qū)域,探索未知物體的表面,提高機(jī)器人的抓取能力。 [無意識(shí)操作(Nonprehensile Manipulation)] 無意識(shí)操作主要是指在沒有明確抓取任務(wù)的情況下機(jī)器人與物體之間的交互。這種類型的操作包括推、戳、打、鉤、旋轉(zhuǎn)、翻轉(zhuǎn)、投擲、擠壓、旋轉(zhuǎn)和打擊等。無意識(shí)操作中的觸覺感知通常用于對(duì)接觸過程進(jìn)行建模,并提供低水平的反饋控制,以及監(jiān)控動(dòng)作狀態(tài)和估計(jì)物體屬性等。 [抓取(Grasping)] 抓取是機(jī)器人操作中研究最廣泛的一個(gè)方面,它為機(jī)器人提供了對(duì)被抓取物體的控制能力,是機(jī)器人使用工具的一個(gè)常見先決條件。與觸覺探索相似,觸覺抓取是提取物體屬性的重要方法。觸覺感知也被用于分析型抓取控制器、數(shù)據(jù)驅(qū)動(dòng)抓取合成、抓取結(jié)果檢測(cè)和重抓取等控制器中。分析型抓取控制器依賴于準(zhǔn)確的接觸位置、法向和力估計(jì)來計(jì)算最大化抓取質(zhì)量指標(biāo)的抓取姿勢(shì)。而在數(shù)據(jù)驅(qū)動(dòng)的方法中,機(jī)器人使用先前抓取的接觸和物體信息來預(yù)測(cè)抓取質(zhì)量并計(jì)算重抓取的姿勢(shì)。一旦抓住了物體,觸覺反饋可用于控制接觸力并檢測(cè)初始滑動(dòng)。通過使用觸覺數(shù)據(jù)檢測(cè)或預(yù)測(cè)初始滑動(dòng),機(jī)器人可以自動(dòng)增加抓地力以避免較大的滑動(dòng),而無需明確估計(jì)物體 - 手指摩擦系數(shù)。 [手部操作(In-Hand Manipulation)] 在手部操作中,使用機(jī)器人手的靈巧性來改變被抓取物體的狀態(tài),此時(shí),機(jī)器人多采用的控制器包括多指機(jī)械手(Multifingered Robot Hands)、夾持器(Grippers)等。為了在保持接觸的同時(shí)進(jìn)行局部重新定位,首先要將物體精確地抓住,然后再使用機(jī)器人的指尖移動(dòng)物體。觸覺傳感用于估計(jì)接觸和物體信息,并主動(dòng)控制手指和物體之間的接觸。觸覺傳感也可用于直接學(xué)習(xí)從接觸傳感器信息到機(jī)器人手指所需關(guān)節(jié)速度的映射。 為了進(jìn)一步移動(dòng)物體,機(jī)器人需要用手指在不同的抓握之間進(jìn)行切換,同時(shí)保持手中的物體不掉落。為此,手指需要通過觸覺感應(yīng)來檢測(cè)手和物體之間的縫隙情況,以及接觸物體的情況,從而有效地在物體表面滑動(dòng)。為了更進(jìn)一步的模仿人類,可以通過在受試者的手上安裝觸覺指套來獲得帶有觸覺信號(hào)的滑動(dòng)行為演示,用于控制機(jī)器人。 [工具操作(Tool Manipulation)] 工具操作是許多機(jī)器人操作任務(wù)中都具有的一個(gè)內(nèi)容。在工具操作中引入觸覺感知的一個(gè)重要前提是,任務(wù)接觸必須位于物體和手持工具之間。因此,除非工具本身裝有儀器,否則觸點(diǎn)不會(huì)直接位于觸覺傳感器上。觸覺感知可用于檢測(cè)工具上的接觸,定位工具提示和被操作工具的其他重要內(nèi)容,監(jiān)控任務(wù)進(jìn)度和檢測(cè)操作失敗等任務(wù)。觸覺反饋還可以用來估計(jì)和保持接觸點(diǎn)的方向和力,以執(zhí)行后續(xù)的控制任務(wù)。觸覺感知也可用于雙臂裝置,以估計(jì)抓取工具的運(yùn)動(dòng)參數(shù)。 此外,觸覺感知還可以用于控制和使用未知工具。在這類任務(wù)中,主要的挑戰(zhàn)是沒有運(yùn)動(dòng)學(xué)或動(dòng)力學(xué)操作模型可以直接用于計(jì)算給定任務(wù)的觸覺動(dòng)作信息。此時(shí),可以引入基于數(shù)據(jù)驅(qū)動(dòng)的方法作為一種隱式計(jì)算操作命令的有效方法。 [運(yùn)動(dòng)(Locomotion)] 觸覺感知不僅對(duì)完成操作任務(wù)有用,對(duì)于引導(dǎo)和實(shí)現(xiàn)機(jī)器人運(yùn)動(dòng)也是非常有效的。地面車輛和步行機(jī)器人,如人形機(jī)器人、四足動(dòng)物、六足動(dòng)物和蛇形機(jī)器人,都需要利用與環(huán)境的接觸來移動(dòng)。觸覺感知為完成這些任務(wù)提供了對(duì)機(jī)器人狀態(tài)和環(huán)境地形的估計(jì)。例如,輪式機(jī)器人可以使用觸覺感知來監(jiān)測(cè)它們與地面的接觸。來自車輪中麥克風(fēng)或加速計(jì)的振動(dòng)信號(hào)可用于確定地形類型。 保持平衡是機(jī)器人站立和行走的關(guān)鍵部分。為了保持平衡,機(jī)器人需要使用觸覺感知來估計(jì)其支撐的接觸位置,以及檢測(cè)可能導(dǎo)致其失去平衡的障礙物和其他擾動(dòng)。觸覺感知還可用于學(xué)習(xí)站立時(shí)的觸覺運(yùn)動(dòng)映射。機(jī)器人步行階段之間的轉(zhuǎn)換通常由接觸事件所觸發(fā),例如腳后跟與地面的接觸。在這種場景中可以應(yīng)用觸覺感應(yīng)來判斷機(jī)器人的腳應(yīng)該放在哪里,此時(shí)通過估計(jì)地形類型,機(jī)器人可以生成合適的步態(tài)并切換到合適的腿部控制器。 [人機(jī)交互(Human–Robot Interaction,HRI)] 除了與無生命物體和地形交互外,機(jī)器人還需要與人類進(jìn)行物理交互。HRI 的應(yīng)用范圍廣泛,包括穿上衣服、移交物品、與協(xié)作機(jī)器人的安全交互等。在這些任務(wù)中,機(jī)器人需要確保相互作用的力是安全的,并且其發(fā)出的力量能夠適應(yīng)人體。 最新的 HRI 研究進(jìn)展是探索從觸覺感知的反饋中推斷人類的潛在狀態(tài)和意圖。例如,在移交過程中,機(jī)器人可以利用視覺和觸覺反饋來確定人類何時(shí)有合適的抓地力并準(zhǔn)備好接受對(duì)象。類似的,在執(zhí)行協(xié)作任務(wù)時(shí),如搬運(yùn)大型物品,機(jī)器人通過手腕上的力 / 力矩傳感器測(cè)量交互力和扭矩,以執(zhí)行任務(wù)并做出相應(yīng)的反應(yīng)。 除了執(zhí)行任務(wù)外,HRI 還可以用來教機(jī)器人從演示中獲得新技能。通過這種方式,機(jī)器人可以直接由人類使用力控制器引導(dǎo)。例如,穿衣是日常生活中的一項(xiàng)基本任務(wù),開發(fā)穿衣機(jī)器人可以為運(yùn)動(dòng)障礙患者提供幫助。利用觸覺信息,機(jī)器人可以調(diào)整以減小對(duì)人的姿態(tài)估計(jì)中的誤差,并在提供穿衣輔助的同時(shí),實(shí)時(shí)跟蹤該人的輪廓和動(dòng)作。 基于前面關(guān)于人類觸覺和機(jī)器人觸覺傳感的討論,以下準(zhǔn)則可以作為一般機(jī)器人系統(tǒng)中觸覺傳感設(shè)計(jì)的參考[1]: 隨著功能劃分的多樣化和分布式接收器的出現(xiàn),可以向機(jī)器人中引入不同類型的小型傳感器,其中每種傳感器都能以最佳方式測(cè)量特定的接觸參數(shù),例如,接觸力和硬度檢測(cè)、測(cè)量多個(gè)接觸參數(shù)的觸覺和熱傳感器等等。 在設(shè)計(jì)機(jī)器人的過程中,可以基于身體部位將觸覺傳感器的空間分辨率分布或排列成一個(gè)陣列。例如,對(duì)于指尖可以設(shè)置為 1 毫米左右,相當(dāng)于指尖大小區(qū)域上大約 15×10 個(gè)元素的網(wǎng)格;對(duì)于手掌和肩膀等不太敏感的部分,可以設(shè)置到 5 毫米。 傳感器應(yīng)具有高靈敏度和寬動(dòng)態(tài)范圍,還應(yīng)該能夠測(cè)量力的方向。這一點(diǎn)很重要,因?yàn)橐话銇碚f,機(jī)器人并不掌握真實(shí)世界物體的先驗(yàn)?zāi)P汀?/p> 為機(jī)器人所設(shè)計(jì)的觸覺傳感器應(yīng)該具備快速響應(yīng)的功能。如果觸覺反饋用于機(jī)器人控制,這一點(diǎn)尤為重要。在機(jī)器人應(yīng)用的控制回路中引入觸覺感知是很重要的,因?yàn)閺娜斯ぜ∪饣騽?dòng)覺單獨(dú)獲得的接觸信息不足。人體皮膚中不同的機(jī)械感受器響應(yīng)的信號(hào)頻率范圍可用于設(shè)置傳感器的響應(yīng)時(shí)間要求。一般來說,對(duì)于實(shí)時(shí)接觸,每個(gè)觸摸元件的響應(yīng)速度應(yīng)為 1ms。 對(duì)于人類來說,觸覺數(shù)據(jù)并不是直接發(fā)送到大腦的。相反,一些處理是在不同層次上進(jìn)行的,以適應(yīng)人類神經(jīng)系統(tǒng)有限的吞吐量。因此,為了減少機(jī)器人傳遞到中央處理器的信息量,對(duì)于大型觸覺陣列或模塊來說,在感覺位置進(jìn)行某種程度的預(yù)處理(數(shù)據(jù)選擇、局部計(jì)算等)是很重要的。這樣的架構(gòu)將解放 “機(jī)器人大腦” 進(jìn)行更智能的工作?;蛘?,它可以將系統(tǒng)擴(kuò)展到幾乎任何數(shù)量的傳感器中。 可以將傳感器的彈性覆蓋層設(shè)計(jì)成在皮膚中有中間和乳頭狀突起的結(jié)構(gòu)。通過將應(yīng)力集中在傳感元件上,這種結(jié)構(gòu)還可以補(bǔ)償彈性材料的模糊效應(yīng)。彈性材料表面的乳頭狀脊?fàn)罴y理增加了可檢測(cè)性。 生物傳感器可以獲得像物體的詳細(xì)輪廓這樣的信息,因?yàn)槠つw是柔順的,并與物體保持一致。因此,機(jī)器人支架應(yīng)堅(jiān)固、靈活、舒適、可伸展和柔軟,從而能夠承受溫度、濕度、化學(xué)應(yīng)力、電場、突然力等惡劣條件。當(dāng)它們分布在身體上時(shí),生物傳感器不應(yīng)顯著增加機(jī)器人連桿 / 部件的直徑 / 厚度。 三、「觸覺傳感」技術(shù)應(yīng)用 3.1 基于粘著控制摩擦的工業(yè)夾具的改進(jìn)(Improving Industrial Grippers With Adhesion-Controlled Friction)[4] 在制造業(yè)中,有效地處理精密物體是一個(gè)具有挑戰(zhàn)性的問題。實(shí)現(xiàn)穩(wěn)定的抓取、同時(shí)避免施加過大的抓取力是在精密儀器處理任務(wù)重引入機(jī)器人操作的重要目標(biāo)。例如,在處理易碎物品時(shí),機(jī)器人必須將施加在抓取物體上的力降到最低,以防止損壞。再比如,處理可變形物體時(shí),要做到不擠壓就可以抓取物體,以保持物體的形狀或表面特性等特征。 人類在處理類似的問題時(shí),能夠根據(jù)對(duì)物體重量和初次接觸時(shí)形成的摩擦特性的估計(jì),快速調(diào)整抓地力。針對(duì)這些刺激,人類能夠做到只應(yīng)用最小的力加上適度的安全空隙程度來執(zhí)行基本的操作而不會(huì)滑脫。這種策略使得人能夠有效地與易碎和可變形的物體進(jìn)行交互。相比之下,大多數(shù)機(jī)器人很難預(yù)測(cè)和維持抓住精密物體所需的最小力。 與傳統(tǒng)的使用專門夾具或控制方案的方法不同,本文提出了一種將壁虎式定向粘合劑粘貼到工業(yè)機(jī)器人夾持器和觸覺傳感器上的解決方案用以完成機(jī)器人處理精密物體的任務(wù)。作者將定向的、受到壁虎特性啟發(fā)的粘合劑整合到商業(yè)夾持器的鉗口中,使其能夠抓住非常精細(xì)的物體,并以較小的抓握面積抵抗大的發(fā)力瞬間,具體見圖 5。 圖 5. 工業(yè)機(jī)器人,利用壁虎啟發(fā)的粘合劑排列在抓爪墊上,可以抓握和操縱腐爛的番茄。它也可以施加相當(dāng)大的扭矩,僅使用其接觸面的 3/4 3.1.1 方法簡述 摩擦力通常有兩種:一個(gè)是由于分子的吸引力和遲滯,另一個(gè)是由于分子相互碰撞造成的。前者是一種粘附控制元件,它取決于分子尺度上的實(shí)際接觸面積。后者是一個(gè)負(fù)載控制部件,它依賴于法向力。對(duì)于大多數(shù)硬材料,前一部分可忽略不計(jì),后一部分提供了最大摩擦力,該摩擦力隨施加的載荷線性增長。具體見下式: 其中,f_t 表示切向力,f_n 表示法向力,μ表示摩擦系數(shù)。對(duì)于壁虎式膠粘劑,即使在正常力的作用下,面積依賴性部分通常占主導(dǎo)地位。在靜態(tài)條件下,期望的粘接劑的切向力為正法向力是: 其中,p(x,y)表示觸點(diǎn)給定位置處的壓力,c_1 和 c_a 為常數(shù),A 為接觸面積。同樣,在靜態(tài)條件下,關(guān)于垂直于指尖表面的軸的力矩應(yīng)為: 其中,r=[x,y]表示從 A 的壓力中心到 A 中每個(gè)元素的向量。本文工作涉及定向粘合劑,因此常數(shù) c_a 表示粘合劑的首選加載方向與施加切向力的角度之間的函數(shù):c_a(φ)。具體的,圖 6 示出定向粘合劑的兩種可能的設(shè)置方案。 圖 6. 機(jī)器人從其重心處撿起物體的圖畫。底部:指尖覆蓋 a)均勻?qū)R的直楔(θ=0°)和 b)楔體旋轉(zhuǎn) ±θ度的人字形圖案所產(chǎn)生的力和扭矩。插圖 c)顯示了墊上壁虎材料的細(xì)節(jié),以匹配 b)的人字形圖案排列。 如果夾持器只需要在一個(gè)方向上施加切向力,例如在通過抓住物體的質(zhì)心來提升物體時(shí),使定向粘合劑與提升方向平行是最有效的方法。然而,操縱通常涉及到圍繞多個(gè)軸旋轉(zhuǎn)抓取的對(duì)象。此外,這些物體可能是不均勻的,或者可能無法沿著它們的中心線抓住它們。因此,如圖 6 所示,單機(jī)械手的抓取嘗試通常會(huì)引入與物體接觸點(diǎn)有關(guān)的力矩。然而,當(dāng)試圖最小化抓取力時(shí),有可能發(fā)生滑動(dòng)。一個(gè)力矩在旋轉(zhuǎn)中心周圍形成一個(gè)圓形的剪切力模式,其中只有一小部分與粘合劑的最強(qiáng)方向?qū)R。 為了補(bǔ)償上述效果,可以安排具有多個(gè)取向的小面積定向粘合劑。圖 7 示出了幾種不同模式的預(yù)期結(jié)果,假設(shè)粘合劑在φ=0 時(shí)具有最大強(qiáng)度,正交方向φ=±90° 處具有最小強(qiáng)度。圖的色標(biāo)與φ呈線性分布,φ被定義為粘合劑的首選方向與實(shí)際加載方向之間的夾角[見圖 7(d)]。 圖 7. 當(dāng)產(chǎn)生純逆時(shí)針扭矩(a-c)或純向上切向力(b-d)時(shí),直線(a-b)和定向(c-d)壁虎粘合劑設(shè)計(jì)的效率圖比較。半透明箭頭指示壁虎粘合劑的首選加載方向 由圖 7 中還可以看出,θ通常應(yīng)根據(jù)指尖的尺寸進(jìn)行調(diào)整。此外,對(duì)于矩形表面上的最佳力矩補(bǔ)償,無論切向力補(bǔ)償如何,都應(yīng)使楔塊朝向如下: 其中,h_f 和 w_f 分別表示指端接觸區(qū)的高度和寬度。相應(yīng)地選擇θ可以確保楔型與指尖的主對(duì)角線平行。 3.1.2 實(shí)驗(yàn)分析 本文實(shí)驗(yàn)采用圖 8 所示的實(shí)驗(yàn)裝置。一個(gè) UR-5 機(jī)器人,同時(shí)手臂配備了 Robotiq 雙指 85 夾持器和 FT-300 力 / 扭矩感應(yīng)手腕。每個(gè)夾持手指都有一個(gè) 7×4 的觸覺傳感器陣列和一個(gè)有圖案的定向粘合劑皮膚。這些傳感器的數(shù)據(jù)與來自機(jī)器人手臂編碼器的位置和速度信息相結(jié)合,提供了機(jī)器人抓取的動(dòng)態(tài)和靜態(tài)的完整圖像。作者在實(shí)驗(yàn)中,制作了一組特殊的粘合表面,以實(shí)現(xiàn)上文介紹的微型楔塊的對(duì)角線 “人字形” 圖案。 圖 8. 機(jī)器人抓取實(shí)驗(yàn)裝置 實(shí)驗(yàn)中制作了多個(gè)壁虎粘合劑面板,面板兩半的方位角以 7.5° 增量變化,從θ=0° 到θ=45°,即從完全垂直于力線(Line of Force)到遠(yuǎn)離力線 45° 的位置。接下來,使用每套壁虎膠覆蓋的面板進(jìn)行各種實(shí)驗(yàn)。實(shí)驗(yàn)中設(shè)計(jì)了機(jī)器人手臂的兩種運(yùn)動(dòng)模式。每次運(yùn)行時(shí),亞克力板上的標(biāo)稱接觸面(Nominal Surface Contact)逐漸增加,從 25% 開始,然后到 50%、75%,直至最后 100% 覆蓋(通過手動(dòng)測(cè)量和預(yù)先編程的抓取點(diǎn)進(jìn)行調(diào)節(jié))。 實(shí)驗(yàn)過程從一塊大約四分之一英寸厚的剛性附著的丙烯酸板開始。實(shí)驗(yàn)要求是,在規(guī)定的正常力水平下,用涂有粘合劑的兩指夾持器捏住。在實(shí)驗(yàn)過程中,通過調(diào)節(jié)夾持器的閉合設(shè)定值,可以改變?cè)搳A持力。作者在實(shí)驗(yàn)中發(fā)現(xiàn),對(duì)可用設(shè)定值的離散化處理使得在飽和致動(dòng)器和傳感器之前只能在四種確定的、不同的法向力之間變化,而其中只有三種可以被調(diào)節(jié)到低壓范圍內(nèi)。在完成這種捏合之后,第一種運(yùn)動(dòng)模式是向上拉動(dòng)剛性連接的丙烯酸板,從而在指尖的粘合表面上施加純剪切力。第二種運(yùn)動(dòng)模式是圍繞接觸面的質(zhì)心旋轉(zhuǎn),這樣一個(gè)純力矩就被施加在指尖的粘合劑上。 本文實(shí)驗(yàn)給出了一個(gè)法向應(yīng)力和剪切應(yīng)力的離散化結(jié)果,對(duì)應(yīng)于觸覺陣列中的單元數(shù) N,每個(gè)區(qū)域 a_t 具有: 其中,P_i 表示每個(gè)壓電傳感器的壓力,F(xiàn)_T 表示由手腕上的力 - 力矩傳感器測(cè)量得到的切向力。圖 9(a)給出了每一組測(cè)試的圖案粘合劑的最大剪切應(yīng)力和法向應(yīng)力之間的關(guān)系。最大切向力支撐通常采用無角楔塊(在這種情況下,θ=φ=0°)。擬合冪函數(shù)清楚地顯示了如下趨勢(shì):隨著θ的增大,最大容許剪切應(yīng)力持續(xù)降低,逐漸改變了楔體的方向。此外,觸覺圖像的標(biāo)準(zhǔn)化中心力矩由以下公式給出: 其中,{x_i, y_i}表示壓電傳感器 i 相對(duì)于質(zhì)心的坐標(biāo)。上式中分子是每個(gè)壓電傳感器對(duì)腕部總測(cè)量力矩的貢獻(xiàn)之和,分母是壓電傳感器和質(zhì)心之間的平均距離。對(duì)分子進(jìn)行標(biāo)準(zhǔn)化處理,以便在具有不同接觸面積值的數(shù)據(jù)之間進(jìn)行更好的比較。標(biāo)準(zhǔn)化力矩由下式得出: 其中,M 是力扭矩傳感器測(cè)量的力矩。圖 9(b)示出了不同θ值的最大歸一化力矩與觸覺圖的歸一化中心力矩之間的關(guān)系。與前面的情況相反[圖 9(a)],最大允許力矩隨著θ而增大??紤]到實(shí)際接觸面積(A_r)對(duì)壓力的依賴性,曲線具有非線性性質(zhì)。 圖 9. 機(jī)器人抓取實(shí)驗(yàn)結(jié)果。(a) 運(yùn)動(dòng) 1:最大剪切應(yīng)力(τ)是不同θ值下法向應(yīng)力(σ)的函數(shù)。其中,對(duì)于每個(gè) angle.s 數(shù)據(jù)集,一個(gè)冪函數(shù)(y=ax^b)與實(shí)驗(yàn)數(shù)據(jù)相匹配,以顯示總體趨勢(shì);(b) 運(yùn)動(dòng) 2:最大規(guī)范化扭矩(M),作為不同θ值的歸一化法向應(yīng)力(μ)的函數(shù) 3.1.3 小結(jié) 由本文的工作可知,通過預(yù)先了解夾持器的性能,引入觸覺傳感裝置,能夠有效將抓握力的精確應(yīng)用與壁虎膠接觸性能的改進(jìn)結(jié)合起來,進(jìn)而減少對(duì)夾持器控制器本身的要求。例如,可以使用較小的控制器,從而使機(jī)械臂上的工具更輕、更安全。這種改變對(duì)協(xié)作機(jī)器人的實(shí)際應(yīng)用是非常有利的。 關(guān)于后續(xù)工作,作者認(rèn)為主要有三個(gè)方向:一是,需要針對(duì)其它材料和粗糙度的面板進(jìn)行測(cè)試,以驗(yàn)證本文實(shí)驗(yàn)中觀察到的趨勢(shì)是否依然成立;二是,在非平面抓取的理想工作條件下,性能會(huì)出現(xiàn)多大程度的下降;三是,可以對(duì)動(dòng)態(tài)情況下的抓取效果進(jìn)行測(cè)試,從而驗(yàn)證在復(fù)雜條件下的操作任務(wù)完成情況。 3.2 基于接觸反饋和 GPU 加速機(jī)器人仿真的手持式目標(biāo)姿態(tài)跟蹤(In-Hand Object Pose Tracking via Contact Feedback and GPU-Accelerated Robotic Simulation)[5] 機(jī)器人能夠靈巧的進(jìn)行操縱,得益于其對(duì)手持物體姿勢(shì)的穩(wěn)健估計(jì)。然而,由于存在嚴(yán)重的遮擋問題,在機(jī)器人手握住和操縱物體時(shí),很難跟蹤物體的姿態(tài)。為了解決機(jī)器人操作過程中的手持式(In-Hand)目標(biāo)跟蹤問題,本文提出將一個(gè) GPU 加速的高保真物理模擬器 [6] 作為前向動(dòng)力學(xué)模型與基于樣本的優(yōu)化框架相結(jié)合,以跟蹤具有接觸反饋的物體姿勢(shì)(如圖 10 所示)的方法。該方法將機(jī)器人控制器發(fā)送到一個(gè) GPU 加速物理模擬器中,該模擬器并行運(yùn)行許多機(jī)器人的狀態(tài)模擬運(yùn)算,每一個(gè)都有不同的物理參數(shù)和擾動(dòng)的物體姿態(tài)。將觀察成本(如來自真實(shí)世界和模擬的接觸反饋等)傳遞給基于樣本的無導(dǎo)數(shù)優(yōu)化器,該優(yōu)化器定期更新所有模擬的狀態(tài)和參數(shù),以更好地匹配真實(shí)世界。在任意時(shí)刻,該方法都最終選擇代價(jià)最低的仿真姿態(tài)作為當(dāng)前目標(biāo)的姿態(tài)估計(jì)。 無導(dǎo)數(shù)優(yōu)化是數(shù)學(xué)優(yōu)化中的一門學(xué)科,它不使用經(jīng)典意義上的導(dǎo)數(shù)信息來尋找最佳解:有時(shí),關(guān)于目標(biāo)函數(shù) f 的導(dǎo)數(shù)的信息不可用,不可靠或不切實(shí)際。比如本文就用取樣 (Sampling) 來更新和優(yōu)化函數(shù)值。 圖 10. 手持式目標(biāo)姿態(tài)跟蹤框架 3.2.1 方法簡述 首先,作者定義了機(jī)械手在物體操縱過程中對(duì)手持物體姿態(tài)的跟蹤問題。在某個(gè)時(shí)刻 t,對(duì)象的姿勢(shì)表示為 p_t。作者首先定義一個(gè)物理動(dòng)力學(xué)模型 s_(t+1)=f(s_t,u_t,θ),其中 s_t 表示世界狀態(tài)(剛體的位置和速度,以及關(guān)節(jié)體中關(guān)節(jié)角的大?。?,u_t 表示機(jī)器人控制器(使用期望的關(guān)節(jié)位置作為動(dòng)作空間),θ表示模擬的固定參數(shù)(如質(zhì)量和摩擦力)。 對(duì)于仿真模型 f,給定初始值 p_0、s_0、θ,只需要回放仿真中機(jī)器人的動(dòng)作序列 u_t 來估計(jì)姿態(tài)。然而,由于前向模型不完善,姿態(tài)的初始值有噪聲,可以通過引入觀測(cè)反饋(觸覺感知的一種方式)來改進(jìn)姿態(tài)估計(jì)。令 D 表示機(jī)器人關(guān)節(jié)的數(shù)目,L 為它的接觸傳感器的數(shù)目。將觀測(cè)向量 o_t 定義為機(jī)器人 q_t 關(guān)節(jié)位置配置值的串聯(lián)結(jié)果,以及如下定義:R_t(位于指尖上)、感應(yīng)接觸的力矢量 c_t、接觸面 d_t 上的平移滑移方向上的單位矢量,以及接觸面 R_t 上的旋轉(zhuǎn)滑移的二元方向,其中 l 表示第 l 個(gè)接觸傳感器。一般的手持式姿態(tài)估計(jì)問題是:給定當(dāng)前和過去的觀測(cè)值 o_(1:t),機(jī)器人控制器 u_(1:t),以及初始姿態(tài) p_0,找到當(dāng)前物體最可能的姿態(tài) p_t。完整流程見算法 1。 首先,通過一個(gè)基于視覺(Vision)的物體姿態(tài)估計(jì)器來估計(jì)物體的初始姿態(tài)。然后,在給定初始目標(biāo)姿態(tài)估計(jì)和機(jī)器人配置值的情況下,初始化 K 個(gè)并行仿真,并在每一個(gè)時(shí)間步長 t 內(nèi)將真實(shí)的機(jī)器人動(dòng)作 u_t 復(fù)制到所有 K 個(gè)仿真中。給定一個(gè)成本函數(shù) C,當(dāng)前時(shí)間 t 的最佳姿態(tài)估計(jì)是第 i 次模擬的姿態(tài)(p_t)^(i* ),其中第 i 次模擬是在過去某個(gè)時(shí)間窗口 t 中產(chǎn)生最低平均成本的模擬: 使用成本定期更新仿真及其參數(shù),從而可以更好地與真實(shí)的機(jī)器人對(duì)象系統(tǒng)對(duì)齊。期望的代價(jià)函數(shù)與手持式操作的對(duì)象姿態(tài)差異相關(guān),因此,較低的成本即對(duì)應(yīng)于較好的姿態(tài)估計(jì)。本文使用的成本函數(shù)的形式如下: 對(duì)于成本函數(shù)中的第一項(xiàng)(比較模擬環(huán)境和真實(shí)世界機(jī)器人之間的 q_t)的作用在于,即使它們共享相同的 u_t,依賴于與機(jī)器人手接觸的物體當(dāng)前姿態(tài)施加的碰撞約束不同,q_t 也可能會(huì)不同。在上式中,如果接觸式傳感器的力的值大于閾值,則該傳感器處于接觸狀態(tài)。當(dāng)?shù)?i 次仿真的第 l 個(gè)接觸傳感器的二元接觸狀態(tài)與真實(shí)接觸傳感器的接觸狀態(tài)一致時(shí),α_(i,l)為 1,否則,α_(i,l)為 0。類似的,當(dāng)?shù)?i 次仿真的第 l 個(gè)接觸傳感器與實(shí)際接觸傳感器在是否發(fā)生平移滑動(dòng)的狀態(tài)方面都是一致的,β_(i,l)為 1,否則,β_(i,l)為 0。γ_(i,l)表征旋轉(zhuǎn)滑動(dòng)的類似情況。設(shè)置成本項(xiàng)的權(quán)重 w_s,使每個(gè)項(xiàng)的相應(yīng)平均量大致歸一化為 1。 然而通過仿真進(jìn)行目標(biāo)姿態(tài)估計(jì)存在兩個(gè)不確定性:一是,基于視覺的姿態(tài)估計(jì)器的初始姿態(tài)估計(jì) p_0 是有噪聲的;二是,模擬的和真實(shí)世界的動(dòng)力學(xué)之間存在不匹配的問題,這些不匹配一部分是由于不完善的建模所造成的,而另一部分則是由未知的真實(shí)世界中的物理參數(shù)引起的。 為了解決第一個(gè)問題,作者通過從以視覺為中心的估計(jì)姿態(tài)分布中采樣的方式,來實(shí)現(xiàn)在不同的模擬中擾動(dòng)生成初始姿態(tài)估計(jì): 此外,作者還增加了模擬次數(shù) K(本文實(shí)驗(yàn)中 K=40)。當(dāng) K 值足夠大,那么真實(shí)的初始姿態(tài)很有可能在一組仿真中得到充分的表示,之后通過優(yōu)化代價(jià)函數(shù)就能夠找到這個(gè)正確的姿態(tài)進(jìn)行仿真。 為了對(duì)初始對(duì)象姿態(tài)進(jìn)行采樣,作者分別對(duì)平移和旋轉(zhuǎn)的狀態(tài)進(jìn)行采樣。其中,平移從各向同性正態(tài)分布中采樣,而旋轉(zhuǎn)采樣通過在 so(3)中繪制零均值、各向同性切線向量來實(shí)現(xiàn),之后將其應(yīng)用于平均旋轉(zhuǎn)中。 SO(3)是包含旋轉(zhuǎn)矩陣 R 的一種特殊正交群,一般稱之為三維旋轉(zhuǎn)群。在三維空間中,三維旋轉(zhuǎn)群組表示能在合成算子的作用下,圍繞原點(diǎn)旋轉(zhuǎn)的群組。旋轉(zhuǎn)能保持被旋轉(zhuǎn)向量的長度和相對(duì)矢量方向,同時(shí)是線性的。在機(jī)器人學(xué)中,這種旋轉(zhuǎn)十分重要,它能標(biāo)志剛體在三維空間中的旋轉(zhuǎn):剛體精確地要求在運(yùn)動(dòng)時(shí)保持剛體內(nèi)部的距離、角度和相對(duì)方向,否則,就不能能稱為剛體。 為了解決第二個(gè)問題,作者提出使用無導(dǎo)數(shù)、基于樣本的優(yōu)化算法在姿態(tài)跟蹤過程中調(diào)整模擬和真實(shí)世界的動(dòng)力學(xué)之間存在的不匹配。具體地說,在每個(gè) T 時(shí)間步長之后,將在這個(gè)窗口期間所有模擬的平均成本,以及模擬狀態(tài)、參數(shù)傳遞給指定的優(yōu)化器。優(yōu)化器使用自己更新的參數(shù)確定下一組仿真。下一個(gè)集合中的模擬是從當(dāng)前集合的模擬中取樣的,并對(duì)模擬參數(shù)和對(duì)象姿態(tài)添加一些擾動(dòng)。這種探索過程保持了仿真的多樣性,防止了由于觀測(cè)噪聲而陷入次優(yōu)的仿真參數(shù)或狀態(tài)。 最后,為了優(yōu)化 K 模擬的參數(shù),使其模擬狀態(tài)更接近真實(shí)世界,作者提出并評(píng)估了三個(gè)無導(dǎo)數(shù)、基于樣本的優(yōu)化器。 1)加權(quán)重采樣(Weighted Resampling ,WRS): WRS 基于現(xiàn)有的模擬狀態(tài) s^(1:K)構(gòu)建了一個(gè)概率質(zhì)量函數(shù)(Probability Mass Function,PMF),并從該分布中抽取 K 次替換,以形成下一組模擬。為了形成 PMF,WRS 在模擬成本上應(yīng)用 softmax: 其中,λ它決定了分布的清晰度。重新采樣后,通過擾動(dòng)模擬參數(shù)和對(duì)象姿態(tài)對(duì)所有模擬進(jìn)行探索。 2) 相對(duì)熵策略搜索(Relative Entropy Policy Search,REPS): 本文使用基于樣本的 REPS 變量來計(jì)算每個(gè)模擬的權(quán)重,并從這些權(quán)重的 softmax 形成的分布中進(jìn)行采樣。WRS 使用一個(gè)固定的參數(shù)λ來構(gòu)造分布,REPS 求解自適應(yīng)溫度參數(shù)η,該參數(shù)在舊樣本分布和更新樣本分布之間的 KL 散度約束條件下,能夠較好地改善總體分布的性能。為了使用 REPS,利用下式將代價(jià)重構(gòu)為獎(jiǎng)勵(lì): 通過優(yōu)化一個(gè)對(duì)偶函數(shù) g(η)來計(jì)算η,之后使用η構(gòu)建 REPS 重采樣后,會(huì)以與 WRS 相同的方式對(duì)每個(gè)模擬進(jìn)行擾動(dòng)處理。 3) 基于群體的優(yōu)化(Population-Based Optimization,PBO):受基于人群的訓(xùn)練(Population-Based Training ,PBT)方法啟發(fā)[7],PBO 首先根據(jù)平均成本對(duì)所有模擬進(jìn)行排序,并找到成本最低的最優(yōu) K_best 模擬。然后,通過將剩余的 K-K_best 模擬替換為 K_best 模擬的副本,并對(duì)其進(jìn)行替換取樣后再進(jìn)行利用。最后,仍然以與 WRS 相同的方式對(duì) K_best 模擬進(jìn)行擾動(dòng)處理。 3.2.2 實(shí)驗(yàn)分析 作者使用由 Allegro Hand 搭配 Kuka IIWA7 的機(jī)械手臂,通過仿真和真實(shí)世界的實(shí)驗(yàn)來評(píng)估本文提出的方法的性能。在仿真實(shí)驗(yàn)中,首先用手跟蹤操作系統(tǒng)采集手部目標(biāo)的操縱軌跡,然后通過離線運(yùn)行本文提出的算法來評(píng)估姿態(tài)估計(jì)誤差。對(duì)于真實(shí)世界的實(shí)驗(yàn),作者使用 PoseRBPF[8],一種最新的基于 RGB-D 的粒子濾波的姿態(tài)估計(jì)算法來獲得物體的初始和最終姿態(tài),同時(shí)將這些初始和最終目標(biāo)姿態(tài)視為真實(shí)值,并將最終姿態(tài)與本文提出的算法預(yù)測(cè)的姿態(tài)進(jìn)行比較。 作者將 4 指 16 自由度的 Allegro Hand 安裝在 7 自由度 Kuka IIWA7 機(jī)器人手臂上。為了獲得真實(shí)世界中的接觸反饋,將 SynTouch BioTac 傳感器連接到每個(gè)指尖。 實(shí)驗(yàn)中使用耶魯 - 哥倫比亞大學(xué) - 伯克利分校(Yale-Columbia-Berkeley,YCB)對(duì)象數(shù)據(jù)集中的 3 個(gè)對(duì)象(垃圾郵件罐、泡沫磚和玩具香蕉),以及文獻(xiàn) [9] 中發(fā)布的數(shù)據(jù)集中獲得的模型、紋理和點(diǎn)云。之所以選擇這些物體,是因?yàn)樗鼈冞m合 Allegro Hand 的大小,而且足夠輕,因此可以形成堅(jiān)固的精密抓握(作者清空了垃圾郵件罐,以減輕其重量)。 對(duì)于每一個(gè)目標(biāo)對(duì)象,在模擬實(shí)驗(yàn)和真實(shí)世界的實(shí)驗(yàn)中,作者給出了兩種操作軌跡的演示:1)用手指抓握和手內(nèi)物體旋轉(zhuǎn)來拾取和放置,以及 2)相同的操作但在抓取過程中指尖斷開并重新建立接觸(手指轉(zhuǎn)動(dòng))。演示給出了總共 24 條軌跡,用于模擬和真實(shí)世界實(shí)驗(yàn)的分析。在這兩種操作的軌跡類型中,目標(biāo)對(duì)象都會(huì)因慣性力和與工作臺(tái)的推力接觸而發(fā)生平移和旋轉(zhuǎn)滑動(dòng)。每個(gè)軌跡持續(xù)一分鐘左右。假設(shè)可以在大約 30Hz 的頻率下運(yùn)行姿態(tài)估計(jì)算法,最終得到的每個(gè)軌跡總共大約 2k 幀。除了本文建議的優(yōu)化器(WRS、REPS、PBO),作者還評(píng)估了以下兩個(gè)基線方法:開環(huán)(Open Loop,OLP)和標(biāo)識(shí)(Identity,EYE)。OLP 使用 1 個(gè)模擬來跟蹤對(duì)象的姿勢(shì)。EYE 使用一組有噪聲的初始姿態(tài)進(jìn)行初始化,并且總是選擇成本最低的模擬姿態(tài),但它不執(zhí)行任何重新采樣或優(yōu)化器更新處理。最后,本文使用平均距離偏差(Average Distance Deviation,ADD)作為評(píng)估指標(biāo)。ADD 計(jì)算真實(shí)姿勢(shì)和預(yù)測(cè)姿勢(shì)的對(duì)象點(diǎn)云中相應(yīng)點(diǎn)之間的平均距離。 圖 11 給出模擬環(huán)境中的實(shí)驗(yàn)結(jié)果。其中,黑色垂直線的長度表示 1 個(gè)標(biāo)準(zhǔn)偏差。優(yōu)化方法通常具有較低的平均值和方差,但它們的相對(duì)排序取決于初始姿態(tài)噪聲的大小。REPS 和 PBO 分別在 5.8mm 和 5.9mm 的中等噪聲條件下獲得了最佳的 ADD 性能。由圖 11 可知,ADD 隨著初始姿態(tài)誤差的增加而增大,而基于優(yōu)化器方法的 ADD 值相對(duì)較小。雖然 EYE 有時(shí)可以獲得與使用優(yōu)化器的方法相當(dāng)?shù)男Ч?,但后者通常具有較小的誤差方差和較大的誤差。在中等噪聲的情況下,REPS 和 PBO 的最優(yōu) ADD 值分別為 5.8mm 和 5.9mm。 圖 11. 在所有模擬實(shí)驗(yàn)中,不同優(yōu)化器對(duì)初始姿態(tài)噪聲水平的姿態(tài)跟蹤誤差比較 圖 12. 真實(shí)世界中 3 個(gè)物體的姿態(tài)跟蹤實(shí)驗(yàn) 圖 12 給出真實(shí)世界中的實(shí)驗(yàn)結(jié)果。其中,ADD 值比模擬環(huán)境中實(shí)驗(yàn)的結(jié)果 ADD 值都要高,一方面,這是由于與具有不同參數(shù)的仿真相比,真實(shí)世界的動(dòng)力學(xué)與仿真之間的差異更大;另一方面,真實(shí)世界中的觀察值存在比模擬環(huán)境中更嚴(yán)重的噪聲問題。由圖 12 可以看出,沒有優(yōu)化器能夠有效跟蹤玩具香蕉的真實(shí)數(shù)據(jù),由于物體(香蕉)的長力臂和低摩擦系數(shù),使得其滑動(dòng)行為難以精確建模。這是本文算法的一種失敗模式,如果所有的模擬都發(fā)散,那么算法將無法在隨后的優(yōu)化程序更新中恢復(fù)。 3.2.3 小結(jié) 本文提出了一種基于樣本的優(yōu)化算法,通過接觸反饋和 GPU 加速機(jī)器人仿真來跟蹤手部目標(biāo)的姿態(tài)。并行仿真同時(shí)保持了對(duì)真實(shí)世界和模型對(duì)象姿態(tài)變化的多種狀態(tài)估計(jì),這些變化是由復(fù)雜的接觸動(dòng)力學(xué)引起的。優(yōu)化算法在目標(biāo)姿態(tài)跟蹤過程中調(diào)整仿真參數(shù),進(jìn)一步提高跟蹤性能。在未來的工作中,作者計(jì)劃向優(yōu)化的循環(huán)中引入接觸傳感(Contact Sensing)與基于視覺的姿態(tài)跟蹤。 四、文章小結(jié) 本文對(duì)人類和機(jī)器人的觸覺傳感知識(shí)進(jìn)行了簡單的梳理和探討,并以此為基礎(chǔ)給出了兩篇論文中的應(yīng)用實(shí)例。針對(duì)人類如何運(yùn)用觸覺信號(hào)來探索、感知,以及學(xué)習(xí)如何操縱、控制物體,研究人員已經(jīng)進(jìn)行了大量的深入分析。然而,生物系統(tǒng)處理感官信息以控制行為的方式,未必總是適合直接應(yīng)用于機(jī)器人的工程解決方案中。不過,它們提供了關(guān)于行為生物體如何對(duì)動(dòng)態(tài)變化的環(huán)境做出反應(yīng)的參考,也提供了一個(gè)機(jī)器人開發(fā)和應(yīng)用的多層次概念框架。研究人員可以在這個(gè)框架內(nèi)進(jìn)行對(duì)機(jī)器人系統(tǒng)傳感器的總體設(shè)計(jì)。 系統(tǒng)的整體性能不僅取決于單個(gè)系統(tǒng)元素的獨(dú)立質(zhì)量,還取決于它們的集成方式。用亞里士多德的話來說,“整體比它的某些部分更重要(“the whole is more than some of its parts )?!痹谠O(shè)計(jì)觸覺傳感設(shè)備時(shí),考慮到各種系統(tǒng)約束對(duì)于最終實(shí)現(xiàn)機(jī)器人的自動(dòng)控制非常有用。這就需要在不同的層次上理解傳感器系統(tǒng)的體系結(jié)構(gòu),從感知外部刺激到刺激的結(jié)果。在將人工觸覺傳感技術(shù)應(yīng)用于真實(shí)世界環(huán)境之前,還需要進(jìn)行大量的系統(tǒng)級(jí)工作。這將為今后開發(fā)實(shí)用、經(jīng)濟(jì)的觸覺傳感系統(tǒng)奠定基礎(chǔ)。將觸覺傳感器有效地應(yīng)用于機(jī)器人中,不僅可以促進(jìn)機(jī)器人學(xué)的研究,還將有助于理解人類與環(huán)境的相互作用。 |
|