許多研討人工智慧(AI)的公司都在透過(guò)深度學(xué)習(xí)來(lái)教會(huì)機(jī)器人辨識(shí)圖像,卡內(nèi)基美隆大學(xué)(CMU)的研討團(tuán)隊(duì)則選了別的一種辦法,他們?cè)囍?jīng)驗(yàn)機(jī)器人透過(guò)觸摸來(lái)認(rèn)知世界,就像嬰兒一樣。
TechCrunch 報(bào)導(dǎo),在每天 8 小時(shí)實(shí)驗(yàn)時(shí)期,這個(gè)名為「Baxter」的機(jī)器人只需一個(gè)任務(wù)要進(jìn)行──從桌上隨機(jī)抓取物品,它的動(dòng)作緩慢而笨拙,即使如此,這一個(gè)月時(shí)期也現(xiàn)已進(jìn)行了 5 萬(wàn)次的抓取動(dòng)作,Baxter 正在透過(guò)觸覺(jué)反應(yīng)和檢驗(yàn)過(guò)錯(cuò)來(lái)學(xué)習(xí)。
研討團(tuán)隊(duì)在宣布的論文中,說(shuō)明了他們?cè)鯓油高^(guò)讓機(jī)器人反覆觸摸物品,來(lái)進(jìn)步對(duì)物品的認(rèn)知,「以嬰兒來(lái)說(shuō),他們透過(guò)用手推、戳物品、把東西放進(jìn)嘴裡或扔出去來(lái)學(xué)會(huì)認(rèn)知表徵,我們也希望到達(dá)這么的方針,所以在 Baxter 的程式平臺(tái)中建構(gòu)了類似的方式,讓它們?cè)谧烂姝h(huán)境上戳、抓取并查詢物品。」
為了闡明學(xué)習(xí)觸摸的重要性,研討室助理 Dhiraj Gandhi 用 1970 時(shí)代中期英國(guó)的一項(xiàng)實(shí)驗(yàn)做為比方,其時(shí)研討人員對(duì)兩隻貓進(jìn)行認(rèn)知實(shí)驗(yàn),其間一隻就像平常一樣日子、與世界觸摸,另一隻貓則只可以觀看,不被容許觸摸物品,畢竟只需被容許與環(huán)境互動(dòng)的學(xué)會(huì)爬行,只能查詢的不能做出一樣做法。
而在實(shí)驗(yàn)中,Baxter 逐漸地展現(xiàn)出對(duì)物品認(rèn)知的進(jìn)步,當(dāng)機(jī)器人認(rèn)出了解的物品時(shí),平板閃現(xiàn)螢?zāi)簧蠒?huì)暴露「微笑」,并且抓取物品放入適宜的籃子;如果對(duì)物品不了解,螢?zāi)簧蟿t會(huì)暴露「利誘」的表情──研討人員并不擔(dān)憂,他們信任沒(méi)有什麼是別的 5 萬(wàn)次抓取練習(xí)學(xué)習(xí)不了的。
這項(xiàng)研討改變了傳統(tǒng)的機(jī)器視覺(jué)學(xué)習(xí)方式,不同于以往系統(tǒng)透過(guò)現(xiàn)已輸入的標(biāo)籤去區(qū)分、尋覓物品,Baxter 是透過(guò)觸摸來(lái)自我學(xué)習(xí)認(rèn)知,Gandhi 說(shuō)明,以前圖像和標(biāo)籤之間并沒(méi)有互動(dòng),在視覺(jué)系統(tǒng)中只需被逼數(shù)據(jù)可以收集。
「我們想要的是與物品時(shí)可以取得活動(dòng)的數(shù)據(jù),并透過(guò)這些學(xué)習(xí)對(duì)別的視覺(jué)任務(wù)有用的功用?!?/p>
Baxter 的系統(tǒng)中有著類似 Kinect 的 3D 鏡頭,將收集到的視覺(jué)與觸覺(jué)音訊發(fā)送到深層的神經(jīng)網(wǎng)路,并在 ImageNet 中與圖像穿插參看。團(tuán)隊(duì)在其間意外發(fā)現(xiàn),收集的觸摸數(shù)據(jù)讓 Baxter 的辨識(shí)精準(zhǔn)度,較別的只運(yùn)用圖像辨識(shí)的機(jī)器人高出 10%,團(tuán)隊(duì)認(rèn)為這十分鼓舞人心。
儘管如今研討還處于前期時(shí)期,但團(tuán)隊(duì)十分看好將來(lái)的展開(kāi),Gandhi 標(biāo)明,他認(rèn)為聯(lián)系視覺(jué)與觸摸學(xué)習(xí)的機(jī)器人可以用于揀選分類,就像 ZenRobotics 開(kāi)發(fā)的類型,將來(lái)能為廢物進(jìn)行分類回收,這在實(shí)際中是一個(gè)十分大的應(yīng)戰(zhàn),「當(dāng)然,我們?nèi)缃襁€在嬰兒學(xué)步呢?!?/p>