科幻電影裏的(de)機器人(rén)早就(jiù)能和(hé / huò)人(rén)類無障礙溝通了(le/liǎo),但在(zài)現實生活中,機器人(rén)理解自然語言的(de)能力還非常差,稍微複雜一(yī / yì /yí)點的(de)指令,就(jiù)會讓它們不(bù)知所措。
比如說(shuō):把我剛才放下的(de)箱子(zǐ)拿起來(lái)。
讓機器人(rén)明白這(zhè)樣的(de)指令,是(shì)MIT計算機科學和(hé / huò)人(rén)工智能實驗室(CSAIL)最近才取得的(de)突破。
MIT CSAIL設計出(chū)了(le/liǎo)一(yī / yì /yí)種方法,讓機器人(rén)可以(yǐ)理解并響應以(yǐ)清晰明了(le/liǎo)的(de)語言發出(chū)的(de)語音指令。這(zhè)個(gè)系統已經先進到(dào)可以(yǐ)理解涉及語境的(de)指令,例如參考之(zhī)前的(de)命令和(hé / huò)對象。
由CSAIL研究員開發的(de)ComText(“語境中的(de)指令”的(de)縮寫)系統提供了(le/liǎo)“類似Alexa”的(de)機器人(rén)語音控制功能。這(zhè)樣的(de)機器人(rén)可以(yǐ)理解語境,包括此前的(de)指令,以(yǐ)及與之(zhī)互動的(de)對象和(hé / huò)周圍環境。
這(zhè)意味着,用戶可以(yǐ)像與他(tā)人(rén)互動一(yī / yì /yí)樣與機器人(rén)互動。此前,與機器人(rén)的(de)互動是(shì)個(gè)巨大(dà)的(de)挑戰,阻礙了(le/liǎo)機器人(rén)在(zài)商業場景和(hé / huò)一(yī / yì /yí)般消費級場景中的(de)應用。即使是(shì)在(zài)産業界,如果機器人(rén)可以(yǐ)理解自然語言語音指令,那麽就(jiù)可以(yǐ)更好地(dì / de)與人(rén)類合作。
通過對某些對象的(de)理解,ComText可以(yǐ)用在(zài)工作中。例如,你可以(yǐ)告訴它,“我拿着的(de)這(zhè)個(gè)工具是(shì)我的(de)工具”。未來(lái),當你對它說(shuō)“把我的(de)工具拿給我”時(shí),它就(jiù)會找到(dào)正确的(de)工具。
如上(shàng)圖所示,告訴機器人(rén)“我剛才放在(zài)桌子(zǐ)上(shàng)的(de)盒子(zǐ)是(shì)我的(de)”,然後對它說(shuō)“拿起我的(de)盒子(zǐ)”,它就(jiù)能正确理解。
研究人(rén)員使用Baxter模型對ComText系統進行了(le/liǎo)檢驗。Baxter是(shì)Rethink Robotics開發的(de)雙臂人(rén)形機器人(rén)。
ComText在(zài)實現過程中采用了(le/liǎo)不(bù)同類型的(de)記憶方式,包括用于(yú)一(yī / yì /yí)般信息的(de)語義記憶,以(yǐ)及與特定事件關聯在(zài)一(yī / yì /yí)起的(de)情景記憶。
在(zài)測試過程中,機器人(rén)能在(zài)約90%的(de)情況下對語音指令做出(chū)正确反應。研究團隊希望通過更複雜的(de)輸入信息,包括多步指令,以(yǐ)及深化機器人(rén)對上(shàng)下文信息的(de)理解,提高正确響應的(de)水平。
這(zhè)項研究相關的(de)論文Temporal Grounding Graphs for Language Understanding with Accrued Visual-Linguistic Context發表在(zài)剛剛結束的(de)學術會議IJCAI 17上(shàng),作者包括MIT的(de)Rohan Paul、Andrei Barbu、Sue Felshin、Boris Katz和(hé / huò)Nicholas Roy。
地(dì / de)址:http://static.ijcai.org/proceedings-2017/0629.pdf
轉載36氪:http://36kr.com/p/5090803.html