成人网18视频网站,qvod激情视频在线观看,色国产精品一区在线观看,久久99热国产这有精品,天天舔天天爽,国产日韩视频,伊人久久精品成人网


首頁(yè)
產(chǎn)品系列
行業(yè)應用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng )澤
| En
 
  當前位置:首頁(yè) > 新聞資訊 > 行業(yè)動(dòng)態(tài) > OmniManip引⼊了 VLM 規劃和機器⼈執⾏的雙閉環(huán)系統設計,提升機器人3D操作能力  
 

OmniManip引⼊了 VLM 規劃和機器⼈執⾏的雙閉環(huán)系統設計,提升機器人3D操作能力

來(lái)源:機器人大講堂      編輯:創(chuàng )澤      時(shí)間:2025/1/27      主題:其他   [加盟]

近年來(lái)視覺(jué)語(yǔ)⾔基礎模型(Vision  Language  Models,  VLMs)在多模態(tài)理解和⾼層次常識推理上⼤放異彩,如何將其應⽤于機器⼈以實(shí)現通⽤操作是具身智能L域的⼀個(gè)核⼼問(wèn)題。這⼀⽬標的實(shí)現受兩⼤關(guān)鍵挑戰制約:

1. VLM 缺少準確的 3D 理解能⼒:通過(guò)對⽐學(xué)習范式訓練、僅以 2D 圖像 / ⽂本作為輸⼊的 VLM 的天然局限;

2. ⽆法輸出低層次動(dòng)作:將 VLM 在機器⼈數據上進(jìn)⾏微調以得到視覺(jué) - 語(yǔ)⾔ - 動(dòng)作(VLA)模型是⼀種有前景的解決⽅案,但⽬前仍受到數據收集成本和泛化能⼒的限制。

針對上述難題,北⼤攜⼿智元機器⼈團隊提出了 OmniManip 架構,基于以對象為中⼼的 3D 交互基元,將 VLM 的G層次推理能力轉化為機器⼈的低層次G精度動(dòng)作。

針對⼤模型幻覺(jué)問(wèn)題和真實(shí)環(huán)境操作的不確定性,OmniManip 創(chuàng )新性地引⼊了 VLM 規劃和機器⼈執⾏的雙閉環(huán)系統設計,實(shí)現了操作性能的顯著(zhù)突破。

實(shí)驗結果表明,OmniManip 作為⼀種免訓練的開(kāi)放詞匯操作⽅法,在各種機器⼈操作任務(wù)中具備強⼤的零樣本泛化能⼒。

OmniManip 的關(guān)鍵設計包括:

基于 VLM 的任務(wù)解析:利⽤ VLM 強⼤的常識推理能⼒,將任務(wù)分解為多個(gè)結構化階段(Stages),每個(gè)階段明確指定了主動(dòng)物體(Active)、被動(dòng)物體(Passive)和動(dòng)作類(lèi)型(Action)。

以物體為中⼼的交互基元作為空間約束:通過(guò) 3D 基座模型⽣成任務(wù)相關(guān)物體的 3D 模型和規范化空間(canonical space),使 VLM 能夠直接在該空間中采樣 3D 交互基元,作為 Action 的空間約束,從⽽優(yōu)化求解出 Active 物體在 Passive 物體規范坐標系下的⽬標交互姿態(tài)。

閉環(huán) VLM 規劃:將⽬標交互姿態(tài)下的 Active/Passive 物體渲染成圖像,由 VLM 評估與重采樣,實(shí)現 VLM 對⾃身規劃結果的閉環(huán)調整。

閉環(huán)機器⼈執⾏:通過(guò)物體 6D 姿態(tài)跟蹤器實(shí)時(shí)更新 Active/Passive 物體的位姿,轉換為機械臂末端執⾏器的操作軌跡,實(shí)現閉環(huán)執⾏。

物體的交互基元通過(guò)其在標準空間中的交互點(diǎn)和⽅向來(lái)表征。交互點(diǎn) p∈R3 表示物體上關(guān)鍵的交互位置,⽽交互⽅向 v∈R3 代表與任務(wù)相關(guān)的主要軸。這兩者共同構成交互基元 O={p,v},封裝了滿(mǎn)⾜任務(wù)約束所需的基本⼏何和功能屬性。這些標準交互基元相對于其標準空間定義,能夠在不同場(chǎng)景中保持⼀致,實(shí)現更通⽤和可重⽤的操作策略。

對于通⽤物體的交互點(diǎn)提取,OmniManip 利⽤視覺(jué)語(yǔ)⾔模型(VLM)在原圖(當部件可⻅且實(shí)體存在時(shí))或在正交視圖中渲染的 3D ⽹格(當部件不可⻅或實(shí)體不存在時(shí))上進(jìn)⾏定位。

與 CoPa 和 ReKep 等⽅法不同,OmniManip 直接讓 VLM 進(jìn)⾏ grounding,不會(huì )受限于不穩定的 part 分割或聚類(lèi)結果。

在交互⽅向的采樣⽅⾯,由于物體的規范化空間通過(guò) Omni6DPose 錨定,軸的⽅向與語(yǔ)義對⻬,該團隊讓 VLM 直接對物體標準空間的軸進(jìn)⾏語(yǔ)義描述,并根據操作任務(wù)進(jìn)⾏匹配度排序,以獲得交互⽅向的候選。

雙閉環(huán)系統設計

李⻜⻜團隊的⼯作 ReKep 通過(guò)關(guān)鍵點(diǎn)跟蹤巧妙地實(shí)現了機械臂的閉環(huán)執⾏,但其 VLM 規劃過(guò)程是開(kāi)環(huán)的。OmniManip 則更進(jìn)⼀步,得益于以物體為中⼼的設計理念,⾸次在 VLM 規劃和機械臂執⾏層⾯實(shí)現了雙閉環(huán)系統:

閉環(huán)規劃:在實(shí)驗中,VLM 推理很容易出現幻覺(jué),導致錯誤的規劃結果(尤其是在涉及 3D 旋轉的任務(wù)中,如倒⽔、插筆)。OmniManip 賦予 VLM 閉環(huán)規劃能⼒,通過(guò)渲染物體的三維模型,幫助 VLM 「腦補」出規劃結果后的物體樣貌,再判斷其合理性。

這⼀功能賦予了 VLM 空間反思能⼒,使其能夠在測試時(shí)進(jìn)⾏推理,類(lèi)似于 OpenAI 的 O1,⼤⼤提⾼了操作成功率。為了保持框架的簡(jiǎn)潔性,研究團隊沒(méi)有設計復雜的測試時(shí)推理流程,僅作⼀輪校驗就已明顯提⾼了 VLM 的規劃準確率。

閉環(huán)執⾏:OmniManip 提取的交互基元位于物體的規范空間中,只需引⼊⼀個(gè) 6D 位姿跟蹤器即可輕松實(shí)現閉環(huán)操作。與 ReKep 使⽤的關(guān)鍵點(diǎn)跟蹤器相⽐,基于物體的 6D 位姿跟蹤⽅式更為穩定,并對遮擋具有更強的魯棒性。(缺點(diǎn)則是不如關(guān)鍵點(diǎn)靈活、⽆法建模柔性物體操作。)

▍實(shí)驗結果

強⼤的開(kāi)放詞匯操作性能

在 12 個(gè)真機短程任務(wù)上,OmniManip 均展現出不錯的性能。

雙閉環(huán)系統設計為 OmniManip 帶來(lái)了約 17% 的性能提升,這證明了 RRC 在有效減少⼤模型幻覺(jué)影響⽅⾯的作⽤。

交互基元的魯棒性

VLM 需要基于交互基元對機器⼈操作進(jìn)⾏規劃,如果交互基元本身存在問(wèn)題,VLM 就會(huì )陷⼊「巧婦難為⽆⽶之炊」的困境。因此,可靠的交互基元⾄關(guān)重要。以往的⽅法通常是讓 VLM 直接在相機拍攝的 2D 圖像上采樣交互基元,然后通過(guò)相機的內外參數轉換到 3D 空間。

然⽽,由于 2D 圖像存在空間歧義,采樣效果對相機視⻆、圖像紋理和部件形狀等因素J為敏感(例如,當相機平視杯⼦時(shí),之前的⽅法只能對準杯⼦的側壁、⽽不是開(kāi)⼝)。⽽ OmniManip 則是在物體的 3D 規范空間中進(jìn)⾏采樣,能夠輕松克服 2D 圖像的局限性,實(shí)現可靠的 3D 交互基元提取。

強⼤的拓展性與潛⼒

OmniManip 能夠與 high-level 任務(wù)規劃器結合,實(shí)現⻓程任務(wù)操作

作為⼀種以物體為中⼼的算法,OmniManip 與機械臂本體解耦,能夠零成本遷移⾄不同形態(tài)的本體(例如雙臂⼈形機器⼈)。

OmniManip 具有強⼤的通⽤泛化能⼒,不受特定場(chǎng)景和物體限制。團隊已將其應⽤于數字資產(chǎn)⾃動(dòng)標注 / 合成管道,實(shí)現⼤規模的機器⼈軌跡⾃動(dòng)采集。



中國人工智能系列白皮書(shū):復合多態(tài)機器人,具身智能重要實(shí)現路徑的技術(shù)特點(diǎn)、應用場(chǎng)景及未來(lái)發(fā)展潛力

探討了復合多態(tài)機器人作為具身智能重要實(shí)現路徑的技術(shù)特點(diǎn)、應用場(chǎng)景及未來(lái)發(fā)展潛力。報告通過(guò)多模態(tài)感知、多場(chǎng)景適應和功能解耦等技術(shù)核心,全面分析了智能機器人如何革新服務(wù)與生產(chǎn)模式

移動(dòng)機器人(AGV_AMR)專(zhuān)用激光雷達產(chǎn)品發(fā)展藍皮書(shū)-銷(xiāo)售數量約210000 臺, 銷(xiāo)售規模約 8億

中國市場(chǎng)AG V/AMR專(zhuān)用激光雷達銷(xiāo)售數量約 210000 臺, 銷(xiāo)售規模約 8億元; 相信 3D多線(xiàn) 激光雷達將在移動(dòng)機器人領(lǐng)域迅速打開(kāi)市場(chǎng)

表情陪伴人形機器人:AI 陪伴的高級賽道,市場(chǎng)需求近萬(wàn)億,老年人群中的潛在需求約4200億

測算出陪伴機器人在老年人群中的潛在需求約 4200億元人民幣,陪伴機器人在青年人群中的潛在需求約5000億元人民幣,在醫療場(chǎng)景下也有較大的應用前景

表情陪伴人形機器人:AI陪伴的高級賽道,需求近萬(wàn)億,老年人需求約 4200億

人人都需要陪伴,中國陪伴機器人潛在市場(chǎng)需求近萬(wàn)億;老年人群中的潛在需求約4200億元;在青年人群中的潛在需求約5000億,自閉癥兒童的情緒監控領(lǐng)域也有較大的應用前景

醫療場(chǎng)景陪伴機器人市場(chǎng)前景:潛在需求約39億

全球5歲以下患自閉癥兒童人數超過(guò)60萬(wàn)人,平均每個(gè)兒童每年花費6萬(wàn) 美元,每年治療費用約360億美元。假設當前的陪伴機器人價(jià)格為6500美 元(參考東芝的宮原香苗機器人價(jià)格6500美元~12000美元),若每個(gè)自閉 癥兒童配備一個(gè)陪伴機器人,潛在市場(chǎng)需求為39億美元

青年陪伴機器人市場(chǎng)前景:潛在需求約5000億

陪伴機器人在中國青年人群中的潛在市場(chǎng)需求約5000億,售價(jià)將會(huì )在0.5-6萬(wàn)元區間,我們認為以2萬(wàn)元/臺作為價(jià)格的中性假設是合理的

深圳人形機器人產(chǎn)業(yè)發(fā)展情況:具有人形機器人產(chǎn)業(yè)先發(fā)優(yōu)勢

深圳市機器人產(chǎn)業(yè)發(fā)展良好,且擁有優(yōu)必選、逐際動(dòng)力、樂(lè )聚機器人等一批本體企業(yè),發(fā)布了優(yōu)必選Walker X、樂(lè )聚夸父、逐際動(dòng)力CL-1等人形機器人產(chǎn)品,已具有人形機器人產(chǎn)業(yè)先發(fā)優(yōu)勢

珠三角人形機器人產(chǎn)業(yè)發(fā)展情況:全球人形機器人供應鏈的重要集聚區

珠三角地區是全球人形機器人供應鏈的重要集聚區,控制、伺服系統技術(shù)較為領(lǐng)先;以深圳為發(fā)展重心,廣佛莞為發(fā)展主力的人形機器人產(chǎn)業(yè)發(fā)展格局

長(cháng)三角人形機器人產(chǎn)業(yè)發(fā)展情況:完整的機器人產(chǎn)業(yè)鏈條

長(cháng)三角是我國工業(yè)機器人產(chǎn)業(yè)發(fā)展最為完備的區域之一,產(chǎn)能規模大,產(chǎn)業(yè)鏈條完整,產(chǎn)業(yè)投資集聚度高,以上海為核心,蘇州、南京、常州、杭州、寧波、蕪湖多點(diǎn)發(fā)力的發(fā)展格局,綜合實(shí)力走在全國前列。

京津冀人形機器人產(chǎn)業(yè)發(fā)展情況:產(chǎn)業(yè)鏈協(xié)同發(fā)展模式

北京科技創(chuàng )新資源豐富,產(chǎn)業(yè)發(fā)展程度在三地居于首位,而天津與河北工業(yè)基礎也較雄厚且傳統產(chǎn)業(yè)轉型需求旺盛,故許多機器人企業(yè)采取北京研發(fā),生產(chǎn),落地在天津,河北的模式,且河北發(fā)展成為京津機器人企業(yè)的重要零部件供應地

老人陪伴機器人市場(chǎng)前景:潛在需求約4200億

陪伴機器人在中國老年人群中的潛在市場(chǎng)需求為4200億人民幣,未來(lái)中國陪伴機器人(含桌面級、寵物級、表情陪 伴機器人)的售價(jià)將會(huì )在0.5-6萬(wàn)元區間

機器人產(chǎn)業(yè)面臨的三個(gè)主要問(wèn)題:行業(yè)內卷無(wú)序價(jià)格競爭,關(guān)鍵核心技術(shù)和占有率低

機器人產(chǎn)品在技術(shù)上趨于同質(zhì)化,難以形成明顯的差異化競爭優(yōu)勢;部分關(guān)鍵核心技術(shù)仍需突破,限制產(chǎn)業(yè)進(jìn)一步發(fā)展;部分國產(chǎn)機器人品牌在高端市場(chǎng)表現相對薄弱
 
資料獲取

服務(wù)機器人在展館迎賓講解
新聞資訊
== 資訊 ==
» 2025養老機器人行業(yè)政策-《互聯(lián)家庭環(huán)
» 養老機器人研究,近萬(wàn)億級機器人市場(chǎng),生態(tài)
» 人形機器人市場(chǎng)規模,它還能有多大-205
» 7個(gè)關(guān)于人形機器人的關(guān)鍵要點(diǎn):市場(chǎng),技術(shù)
» 2025~2035元趨勢報告(機器人)-
» 山東省“人工智能+教育”實(shí)施方案2025
» 2025具身機器人行業(yè)未來(lái)展望報告-當前
» 機器人和嵌入式邊緣AI應用設計的計算平臺
» 人腦與機器人大腦對應關(guān)系:大小腦對中央控
» 人形機器人運動(dòng)控制:制約商業(yè)化落地進(jìn)程的
» 山東省機器人產(chǎn)業(yè)高質(zhì)量發(fā)展行動(dòng)計劃(20
» 2025AI賦能教育:高考志愿填報工具使
» 核電人形機器人的八點(diǎn)特性:高輻射耐受性,
» 核電人形機器人專(zhuān)題報告[工業(yè)應用場(chǎng)景],
» 機器人的大腦在手眼腦協(xié)同中發(fā)揮怎么樣的作
 
== 機器人推薦 ==
 
迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人底盤(pán)

機器人底盤(pán)

 

商用機器人  Disinfection Robot   展廳機器人  智能垃圾站  輪式機器人底盤(pán)  迎賓機器人  移動(dòng)機器人底盤(pán)  講解機器人  紫外線(xiàn)消毒機器人  大屏機器人  霧化消毒機器人  服務(wù)機器人底盤(pán)  智能送餐機器人  霧化消毒機  機器人OEM代工廠(chǎng)  消毒機器人排名  智能配送機器人  圖書(shū)館機器人  導引機器人  移動(dòng)消毒機器人  導診機器人  迎賓接待機器人  前臺機器人  導覽機器人  酒店送物機器人  云跡科技潤機器人  云跡酒店機器人  智能導診機器人 
版權所有 © 創(chuàng )澤智能機器人集團股份有限公司     中國運營(yíng)中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷(xiāo)售1:4006-935-088    銷(xiāo)售2:4006-937-088   客服電話(huà): 4008-128-728