“左右勾拳、側(cè)踢、膝踢、閃避、跌倒起身,被KO……”一場機器人之間的格斗比賽在昨晚開打。
在這場于杭州舉行的《CMG世界機器人大賽·系列賽》機甲格斗擂臺賽上,宇樹科技以合作方身份參賽,上場的機器人均為宇樹 G1人形機器人,而內(nèi)嵌算法則由四個比賽團(tuán)隊自研,并進(jìn)行現(xiàn)場的手柄操控。經(jīng)過幾輪比拼,黑隊"AI策算師"最終奪得冠軍。
“這次比賽的格斗動作,采集自外部專業(yè)人員,用來給AI模型提供學(xué)習(xí)參考。”宇樹科技相關(guān)負(fù)責(zé)人向《科創(chuàng)板日報》介紹。
在此次比賽過程中,機器人暴露了仍存在動態(tài)控制、感知不足等問題,也展現(xiàn)出較強的平衡控制、人機協(xié)同能力。
多名業(yè)內(nèi)人士對《科創(chuàng)板日報》表示,從格斗過程來看,機器人底層算法已經(jīng)較為出色,但缺少真正的空間智能大模型作為機器人的大腦。為了更好地在實際應(yīng)用落地,后續(xù)產(chǎn)業(yè)鏈或?qū)⒂楷F(xiàn)更多二次開發(fā)的機器人解決方案商,在公版機器人基礎(chǔ)上開發(fā)專業(yè)的大腦。
拳腳相加!機器人遭重?fù)艉?秒起身
《科創(chuàng)板日報》注意到,在相互出拳、踢腿的格斗過程中,參賽機器人能通過步伐的調(diào)整來保持自身的平衡。在被擊中后,機器人也能迅速起身。“雖然格斗效果一般,摔倒爬起來的靈活性把我驚呆了,支撐力拉滿?!庇杏^眾表示。
“機器人倒地五秒內(nèi)馬上能起來,重心不穩(wěn)的情況下能調(diào)整身形維持平衡,這兩點讓我印象較為深刻。” 快思慢想研究院院長、上海交通大學(xué)計算法學(xué)與AI倫理研究中心聯(lián)席主任田豐表示,“兩足機器人的動態(tài)平衡性要比四足難得多。機器狗的重心只需要落在4個腳組成的矩形內(nèi)就行,支撐的面積大。而兩足人形機器人的重心需要落在兩足的連線內(nèi)?!?/p>
據(jù)悉,宇樹G1機器人在對抗中保持平衡,主要依賴于仿真環(huán)境的AI強化學(xué)習(xí)和本體關(guān)節(jié)的感知。通過對大量平衡數(shù)據(jù)的學(xué)習(xí)和模擬訓(xùn)練,機器人不斷優(yōu)化自身的平衡控制策略,同時本體關(guān)節(jié)的高精度傳感器能夠?qū)崟r感知身體各部位的姿態(tài)和受力情況,為平衡控制提供關(guān)鍵數(shù)據(jù)。
宇樹科技相關(guān)負(fù)責(zé)人向《科創(chuàng)板日報》介紹,IMU(慣性測量單元)在機器人保持平衡中發(fā)揮著重要作用,在仿真訓(xùn)練中同樣不可或缺。IMU可以實時監(jiān)測機器人的姿態(tài)、加速度等信息。
值得一提的是,此次參賽的宇樹科技G1手臂進(jìn)行了定制化設(shè)計,擁有7個自由度,比常規(guī)的5個自由度多出兩個,目的是在格斗中進(jìn)行更靈活的招式變化,如勾拳、擺拳、上勾拳等拳擊動作中的手腕調(diào)整,增加攻擊的角度和靈活性。
上述人員介紹,G1格斗模式的訓(xùn)練難度一是在于瞬間爆發(fā)力要求高,需要機器人具備強大的動力系統(tǒng)來提供足夠的扭矩,以實現(xiàn)快速動作響應(yīng)。二是對控制算法精準(zhǔn)度和穩(wěn)定性要求高,控制算法要實時處理大量傳感器數(shù)據(jù),精確計算身體各部位的運動軌跡與發(fā)力時機,實現(xiàn)對多關(guān)節(jié)、重心、姿態(tài)毫秒級的精準(zhǔn)控制,保證動作既有力又不失協(xié)調(diào)。三是機械結(jié)構(gòu)強度要求高,在進(jìn)行該動作時,機器人的機械結(jié)構(gòu)需要承受較大的沖擊力,對關(guān)節(jié)、骨骼等結(jié)構(gòu)的強度和穩(wěn)定性提出了很高的要求。
人機協(xié)同為主,操作員手柄遙控機器人對戰(zhàn)
G1機器人操控方式包括AI語音操控、手柄操控、體感操控,各有優(yōu)缺點。而本次比賽中主要采用現(xiàn)場人員進(jìn)行手柄操作的方式。在比賽過程中,可以看到操作員在一旁控制機器人進(jìn)行格斗。
宇樹科技相關(guān)負(fù)責(zé)人對此解釋道,AI語音操控響應(yīng)延遲比較明顯,影響對機器人的實時控制。手柄操控讓參賽者更直觀、更精準(zhǔn)地操控機器人,也更易于上手,有利于擴大參賽者范圍。而體感操控在沉浸感上更具潛力,宇樹已經(jīng)開發(fā)了一套體感人形機器人控制系統(tǒng),后續(xù)的比賽應(yīng)該就可以給參賽者使用。
中國信通院泰爾系統(tǒng)實驗室副總工程師劉泰介紹,對機器人進(jìn)行手柄操控,與日常普通的遙控玩具,存在一定的區(qū)別。人形機器人其背后是一整套的大模型、運動控制模型的算法支撐,實際上是在通過這些算法來進(jìn)行操控。
“采用傳統(tǒng)的控制方法很難讓它站得住走得穩(wěn),現(xiàn)在通過強化學(xué)習(xí)的訓(xùn)練方式,讓它往能夠站得平衡的方式由自己去探索。整體的比賽非常振奮,它的表現(xiàn)可以說比以往更進(jìn)了一步,能夠看到機器人在對抗比較強的情況下,也能夠保持很好的穩(wěn)定性,包括全身的運動機構(gòu)協(xié)調(diào),是科技進(jìn)步和產(chǎn)業(yè)進(jìn)步很好的結(jié)合?!?劉泰提到。
田豐認(rèn)為,“在暫時還不能實現(xiàn)通用人工智能AGI的前提下,能否通過人機協(xié)同來達(dá)到比較好的效果,是當(dāng)前業(yè)內(nèi)探索的方向。而這場比賽也展現(xiàn)了一定的成果,這也是很有價值的。”
實時感知仍存困境 機器人大腦待突破
不過,由人類遙控操作的機器人也存在比賽失誤的情況。比如選擇主動攻擊對手,不當(dāng)心撲空后,導(dǎo)致參賽機器人失去穩(wěn)定性倒地,被對手“KO”。機器人想要后退來調(diào)整對戰(zhàn)角度,卻意外被擂臺的圍繩給纏住,需要人類來解綁等等。這其實暴露了機器人動態(tài)運動控制與實時感知的不足。
“這就涉及到一個問題,機器人是否要完成仿真人類的形態(tài)。比如人背后沒有長眼睛,但機器人后背是否應(yīng)該設(shè)置攝像頭,讓機器人擴大感知范圍。再比如人只有5個手指,但有些工業(yè)場景可能6個手指會更好。人形機器人可能只是一個過渡階段,未來可能會發(fā)展出超越人形的機器人形態(tài)。” 田豐表示。
一名觀賽的業(yè)內(nèi)人士認(rèn)為,從格斗過程來看,底層算法已經(jīng)較為出色,包括穩(wěn)定性、視覺、靈活性、速度連貫性等,目前缺少的是真正的空間智能大模型作為機器人的大腦。
田豐表示,從中美來看,在機器人大腦的投入是美國的比例更大些?!皣鴥?nèi)企業(yè)大部分都在做機器人本體,有一些機器人企業(yè)在做小腦,也就是運動控制系統(tǒng)。做機器人大腦的企業(yè)大概在1/20的比例。不過,已經(jīng)有一些機器人企業(yè)正在進(jìn)行大腦研發(fā)。”
從產(chǎn)業(yè)鏈來看,田豐認(rèn)為業(yè)內(nèi)更多的關(guān)注焦點在于整機廠商,以及電機等硬件層面,而大腦也是通用型的基礎(chǔ)性大腦?!暗珯C器人整機其實需要軟件二次開發(fā),才能更好地在實際應(yīng)用。比如面向格斗、工廠、物流等場景進(jìn)行二次開發(fā)。后續(xù)產(chǎn)業(yè)鏈會涌現(xiàn)這類的機器人解決方案商,在公版機器人基礎(chǔ)上開發(fā)專業(yè)的大腦。這就涉及到多模態(tài)大模型,以及RAG知識庫進(jìn)行融合?!?/p>
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。