-
全球首個(gè)端到端抓取大模型發(fā)布,國(guó)產(chǎn)機(jī)器人攻克大瓶頸?
-
連政gczhewanxgun
最后更新: 2025-01-10 14:13:45在剛剛結(jié)束的 NVIDIA CES 2025 發(fā)布會(huì)上,全場(chǎng)唯一的輪式人形機(jī)器人托舉起了英偉達(dá)新一代顯卡產(chǎn)品 RTX5090 引發(fā)關(guān)注。而該機(jī)器人正是來(lái)自北京銀河通用機(jī)器人有限公司的Galbot。
與此同時(shí),在英偉達(dá)位于美國(guó)拉斯維加斯 Fountainebleu 展臺(tái)上,Galbot 機(jī)器人還首次進(jìn)行了真機(jī)演示。觀眾在現(xiàn)場(chǎng)24小時(shí)無(wú)人值守的便利店場(chǎng)景中,通過(guò)iPad模擬下單,即可體驗(yàn)機(jī)器人在便利店中取貨、送貨的便捷服務(wù)。
Galbot 憑借高效、流暢的工作展示,也讓其背后的銀河通用具身大模型技術(shù)和創(chuàng)新成果走向臺(tái)前。1月9日,銀河通用對(duì)外正式發(fā)布GraspVLA,號(hào)稱(chēng)全球首個(gè)端到端具身抓取基礎(chǔ)大模型(Foundation Model)。
據(jù)銀河通用介紹,GraspVLA 的訓(xùn)練包含預(yù)訓(xùn)練和后訓(xùn)練兩部分,其中預(yù)訓(xùn)練完全基于合成大數(shù)據(jù)。即無(wú)需大規(guī)模真實(shí)數(shù)據(jù)、僅通過(guò)合成數(shù)據(jù)達(dá)到基礎(chǔ)模型的預(yù)訓(xùn)練過(guò)程,和進(jìn)一步通過(guò)小樣本微調(diào)使基礎(chǔ)“通才”快速成長(zhǎng)為指定場(chǎng)景“專(zhuān)家”的能力,解決了世界范圍內(nèi)具身通用機(jī)器人當(dāng)前發(fā)展的兩大瓶頸—— 數(shù)據(jù)瓶頸和泛化瓶頸。
此外,針對(duì)特別需求,GraspVLA 的后訓(xùn)練則僅需小樣本學(xué)習(xí)即可遷移基礎(chǔ)能力到特定場(chǎng)景,維持高泛化性的同時(shí),還能形成符合產(chǎn)品需求的專(zhuān)業(yè)技能。
僅通過(guò)合成大數(shù)據(jù)的預(yù)訓(xùn)練
就可以實(shí)現(xiàn)充分泛化
具體而言,銀河通用提出了 VLA(視覺(jué)-語(yǔ)言-動(dòng)作模型) 達(dá)到基礎(chǔ)模型,所需滿(mǎn)足的七大泛化情況,并以GraspVLA進(jìn)行展示。
光照泛化。咖啡廳、便利店、生產(chǎn)車(chē)間、KTV 等不同光照條件下,光線(xiàn)的冷暖、強(qiáng)弱變化,包括漸變和驟變,以及在極端黑暗環(huán)境下移動(dòng)目標(biāo)物體時(shí),模型都應(yīng)該具備準(zhǔn)確找到并正常抓取物體的能力。
文內(nèi)圖片展示包括2倍、3倍或5倍速。“銀河通用”公眾號(hào)
背景泛化。實(shí)際環(huán)境中,機(jī)器人工作場(chǎng)景不盡相同,模型需要面對(duì)不同材質(zhì)、不同紋理的桌面和操作臺(tái),甚至動(dòng)態(tài)變化的背景畫(huà)面。
平面位置泛化。模型還需要面對(duì)將物體在桌面上隨意平移、旋轉(zhuǎn)的情況。
空間高度泛化。即使面對(duì)物體擺放高低錯(cuò)落的工作臺(tái),模型也應(yīng)該可以從容抓取。
動(dòng)作策略泛化。模型應(yīng)實(shí)時(shí)進(jìn)行推理決策,不僅會(huì)移動(dòng)跟隨目標(biāo),對(duì)于物體豎放、倒放等不同擺放方式,還可根據(jù)物體和夾爪的位姿自動(dòng)調(diào)整策略,選擇最安全合理的抓取方式,處理復(fù)雜情況。
動(dòng)態(tài)干擾泛化。真實(shí)工作場(chǎng)景復(fù)雜多變,機(jī)器人在執(zhí)行任務(wù)時(shí)常常會(huì)受到干擾。在工作過(guò)程中,即使往工作空間中隨意添加干擾物體,甚至發(fā)生撞擊并使目標(biāo)物體隨機(jī)移位,模型也需要可以穩(wěn)定地完成任務(wù)。
物體類(lèi)別泛化。銀河通用稱(chēng),在上述測(cè)試中,所有物體、場(chǎng)景、擺放方式均未進(jìn)行任何訓(xùn)練,GraspVLA 僅通過(guò)仿真合成數(shù)據(jù)學(xué)習(xí)到的語(yǔ)義和動(dòng)作能力,就實(shí)現(xiàn)了在真實(shí)世界中零樣本泛化測(cè)試。
此外,通過(guò)把仿真合成的動(dòng)作數(shù)據(jù)和海量互聯(lián)網(wǎng)語(yǔ)義數(shù)據(jù)巧妙地聯(lián)合訓(xùn)練,對(duì)于沒(méi)有學(xué)習(xí)過(guò)動(dòng)作數(shù)據(jù)的物體類(lèi)別,GraspVLA 也能把已掌握的動(dòng)作能力泛化遷移:
通過(guò)少量真實(shí)數(shù)據(jù)的后訓(xùn)練
即可滿(mǎn)足特定場(chǎng)景特殊需求
另一方面,經(jīng)過(guò)合成大數(shù)據(jù)的預(yù)訓(xùn)練,GraspVLA 已經(jīng)天然滿(mǎn)足大多數(shù)應(yīng)用需求,但是在產(chǎn)品和特定場(chǎng)景中常常有一些特殊需求,因此模型需要擁有對(duì)新需求的快速適應(yīng)及遷移能力。
銀河通用介紹,以商超場(chǎng)景為例,用戶(hù)希望模型按照順序取出同類(lèi)商品。為滿(mǎn)足用戶(hù)需求,針對(duì)一箱怡寶礦泉水,僅需采集少量(少于一個(gè)人遙操一天)的真實(shí)數(shù)據(jù),就能讓 GraspVLA 理解并滿(mǎn)足按序抓取的需求。
GraspVLA在經(jīng)過(guò)怡寶一人/天采集數(shù)據(jù)的后訓(xùn)練,就可以舉一反三,將這種少樣本習(xí)得的行為自動(dòng)遷移到其他品牌的飲品(農(nóng)夫山泉、東方樹(shù)葉),按擺放順序分別抓取了瓶身顏色不同,瓶蓋大小不一的同類(lèi)商品。這展現(xiàn)了天量合成大數(shù)據(jù)預(yù)訓(xùn)練達(dá)成的基礎(chǔ)模型。
工業(yè)場(chǎng)景中,往往有大量行業(yè)專(zhuān)用的特殊零件。雖然模型僅需預(yù)訓(xùn)練就可以抓起任意零件,但難以直接根據(jù)語(yǔ)言指令抓起對(duì)應(yīng)物體,比如指定“抓取車(chē)窗控制器”,但模型抓起了接線(xiàn)座。
為了提升模型識(shí)別罕見(jiàn)零件的能力,僅需采集少量軌跡進(jìn)行快速后訓(xùn)練。GraspVLA 就可以迅速掌握諸如接線(xiàn)座(Wiring Base)、三角板(Triangular Panel)、黑色軟管(Black Hose)等特殊工業(yè)名詞,能從任意擺放的密集場(chǎng)景中精準(zhǔn)找出對(duì)應(yīng)零件。
在家庭場(chǎng)景中,人們對(duì)機(jī)器人的行為會(huì)有特定的偏好,例如抓取杯子時(shí)不要碰到杯子內(nèi)壁。同樣通過(guò)采集少量帶偏好的抓取軌跡,GraspVLA 即可學(xué)會(huì)按照自然語(yǔ)義抓取。
對(duì)此,銀河通用表示,這種預(yù)訓(xùn)練全合成大數(shù)據(jù)方案在人力和資金投入上成本更低,時(shí)間效率更高,可持續(xù)發(fā)展性更好,也是 VLA 模型商業(yè)化應(yīng)用中必備的能力。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 連政 
-
鴻蒙原生版微信正式上架,騰訊公布開(kāi)發(fā)歷程
2025-01-09 21:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
-
全球三分之二iPad、超億臺(tái)手機(jī)都是“川渝造”
2025-01-09 17:02 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
中國(guó)航司正迅速填補(bǔ)西方空缺
2025-01-09 16:57 航空航天 -
債務(wù)是中性的,既不是魔鬼也不是靈丹妙藥
2025-01-09 15:50 問(wèn)診2025中國(guó)經(jīng)濟(jì) -
-
-
-
-
微信被美國(guó)移出“惡名市場(chǎng)名單”,多家中國(guó)企業(yè)仍在列
2025-01-09 11:10 -
去年全球手機(jī)面板出貨突破22億片,創(chuàng)歷史新高
2025-01-09 10:58 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
離岸人民幣匯率連跌3個(gè)月,央行出手:600億!
2025-01-09 10:27 香港 -
全球首款卷軸屏電腦亮相,起售價(jià)2.6萬(wàn)
2025-01-08 20:13 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
淘寶也上線(xiàn)了“送禮物”功能,三大平臺(tái)角逐社交電商
2025-01-08 17:08 電子商務(wù) -
國(guó)家發(fā)改委:京東即將接入支付寶
2025-01-08 16:05 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
很快將演示核聚變突破?奧爾特曼又畫(huà)大餅
2025-01-08 16:03 大公司 -
傳上汽和華為明天官宣合作,雙方尚未回應(yīng)
2025-01-08 15:11 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
全球六大手機(jī)品牌均未在美國(guó)CES發(fā)新品
2025-01-08 15:04 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
“MAGA巨星”唱反調(diào),阿根廷業(yè)界:中國(guó)制造真香 評(píng)論 127特朗普喊話(huà):俄烏別打了,一起跟美國(guó)做大生意發(fā)大財(cái) 評(píng)論 237MAGA基本盤(pán)還能“忍”特朗普多久? 評(píng)論 172從2000兆帕潛艇級(jí)熱成型鋼的“登天”說(shuō)開(kāi)去…… 評(píng)論 103美媒焦慮:哪怕只為跟上中國(guó),美政府都不能這么干啊 評(píng)論 159最新聞 Hot
-
“MAGA巨星”唱反調(diào),阿根廷業(yè)界:中國(guó)制造真香
-
又一起!白宮平面圖遭萬(wàn)人共享
-
“特朗普非常憤怒:再砍10億”
-
“我們被美國(guó)夢(mèng)騙了,精英把我們出賣(mài)了”
-
“美國(guó)太自滿(mǎn),恐在這三方面落后中國(guó)”
-
泄密不止一次,美防長(zhǎng)在“家人群”也發(fā)了
-
特朗普喊話(huà):俄烏別打了,一起跟美國(guó)做大生意發(fā)大財(cái)
-
中方出手,日歐車(chē)企“慌了”
-
她被提名為聯(lián)大主席,“德國(guó)完了”
-
美媒焦慮:哪怕只為跟上中國(guó),美政府都不能這么干啊
-
特朗普“抱怨”后,日本考慮放寬汽車(chē)進(jìn)口安全標(biāo)準(zhǔn)
-
“五角大樓里完全崩潰了”,3名美國(guó)防部高官被解雇
-
“趁納瓦羅不在,他們沖進(jìn)白宮勸說(shuō)特朗普暫停關(guān)稅”
-
澤連斯基回應(yīng):?;?0小時(shí)太短,建議30天
-
韓國(guó)一戰(zhàn)機(jī)飛行訓(xùn)練中掉落機(jī)炮吊艙和空油箱
-
“美國(guó)在地球上跟中國(guó)爭(zhēng),卻把太空主導(dǎo)地位拱手讓出”
快訊- 普京宣布暫時(shí)?;?,中方回應(yīng)
- 美菲聯(lián)合軍演,中方回應(yīng)
- 聚焦高端芯片等關(guān)鍵技術(shù),最高法持續(xù)加大知識(shí)產(chǎn)權(quán)司法保護(hù)力度
- 反制!中方宣布制裁
- 服務(wù)業(yè)擴(kuò)大開(kāi)放,金融、醫(yī)療等多領(lǐng)域明確155項(xiàng)試點(diǎn)任務(wù)
- 江蘇銀行2024年財(cái)報(bào):穩(wěn)健經(jīng)營(yíng)顯成效,高質(zhì)量發(fā)展再上新臺(tái)階
- 途虎養(yǎng)車(chē)參加上海外貿(mào)拓內(nèi)銷(xiāo)對(duì)接會(huì) 以自有自控品牌戰(zhàn)略助力出口轉(zhuǎn)內(nèi)銷(xiāo)
- 事關(guān)核能發(fā)展,我國(guó)與沙特簽了
-