国产精品视频在线免费观看_免费久久久一本精品久久区_国产精品麻豆免费版_久久天堂国产精品_欧美日韩亚洲在线_日韩hmxxxx_国产有色视频色综合_国严精品久久久久久亚洲影视_色播亚洲婷婷_亚洲毛片aa

更多精彩 >

首個(gè)端到端強(qiáng)化學(xué)習(xí)具身模型PsiR0,橫空出世!

2024-12-30 13:23:28   來(lái)源:搜狐網(wǎng)  作者: 

摘要:近日,靈初智能發(fā)布首個(gè)基于強(qiáng)化學(xué)習(xí)(RL)的端到端具身模型PsiR0。

近日,靈初智能發(fā)布首個(gè)基于強(qiáng)化學(xué)習(xí)(RL)的端到端具身模型Psi R0。該模型支持雙靈巧手協(xié)同進(jìn)行復(fù)雜操作,將多個(gè)技能串聯(lián)混訓(xùn),生成具有推理能力的智能體,從而完成并閉環(huán)長(zhǎng)程靈巧操作任務(wù)。并且,Psi R0還可以實(shí)現(xiàn)跨物品、跨場(chǎng)景級(jí)別的泛化。

21.png

真實(shí)世界中,人類生活近乎100%的場(chǎng)景涉及抓握、轉(zhuǎn)動(dòng)、捏取、觸摸等操作,而其中超過(guò) 90% 的操作屬于多技能融合的長(zhǎng)程任務(wù)。然而在當(dāng)下具身業(yè)界,多局限于Pick and Place操作的泛化,一旦任務(wù)復(fù)雜化、長(zhǎng)程化,泛化性和成功率則大大降低,無(wú)法兼顧——這也是具身智能只能存在于demo,遲遲無(wú)法在真實(shí)場(chǎng)景中落地的核心原因!機(jī)器人如何突破Pick and Place、脫離遙操作,擁有自主完成長(zhǎng)程靈巧操作的能力,實(shí)現(xiàn)真正類人的場(chǎng)景級(jí)任務(wù)閉環(huán),仍是具身智能亟待攻克的難題。

RL是長(zhǎng)程靈巧操作實(shí)現(xiàn)任務(wù)閉環(huán)的唯一解

在真實(shí)世界中,機(jī)器人解決長(zhǎng)程任務(wù)必須通過(guò)Learning-based模式,目前主流技術(shù)路徑有兩種:模仿學(xué)習(xí)(IL)和強(qiáng)化學(xué)習(xí)(RL)。

純模仿學(xué)習(xí)的泛化能力受限于示范行為的多樣性和質(zhì)量。加之長(zhǎng)程任務(wù)步驟較多,更容易出現(xiàn)分布漂移問(wèn)題,使得 IL實(shí)現(xiàn)長(zhǎng)程任務(wù)的泛化性能較差,魯棒性也較弱。

基于RL的Psi R0 模型,使用海量仿真數(shù)據(jù)高效訓(xùn)練出雙手操作的智能體,并通過(guò)雙向訓(xùn)練框架串聯(lián)多技能,在業(yè)界率先完成開放環(huán)境中的長(zhǎng)程任務(wù),具備較強(qiáng)的泛化能力與較高的魯棒性。這一技能訓(xùn)練框架從物體時(shí)空軌跡抽象出關(guān)鍵信息以構(gòu)建通用目標(biāo)函數(shù),從而解決獎(jiǎng)勵(lì)函數(shù)難設(shè)計(jì)的問(wèn)題。在后訓(xùn)練階段,通過(guò)少量高質(zhì)量真機(jī)數(shù)據(jù)對(duì)齊,進(jìn)一步提升長(zhǎng)程任務(wù)的成功率。除此之外,雙向訓(xùn)練框架中的轉(zhuǎn)移可行性函數(shù)發(fā)揮著重要作用,它能夠微調(diào)技能以提高串聯(lián)的成功率與泛化性,同時(shí)賦予模型自主切換技能的能力,使其在遭遇操作失敗時(shí)能夠迅速調(diào)整策略,確保高成功率。

22.png

Sequential Dexterity: Chaining Dexterous Policies for Long-Horizon Manipulation  

Yuanpei Chen, Chen Wang*, Li Fei-Fei, C. Karen Liu

Psi R0 模型表現(xiàn)出的靈巧性、高成功率以及泛化性,充分展示了其大腦的任務(wù)拆解與規(guī)劃能力,以及小腦的靈巧操作、泛化和魯棒能力。這一模型的誕生,突破了當(dāng)前具身機(jī)器人在商業(yè)化應(yīng)用進(jìn)程中所面臨的核心技術(shù)瓶頸,為整個(gè)行業(yè)的未來(lái)發(fā)展開拓出一片全新且廣闊的天地,有望引領(lǐng)具身機(jī)器人邁向全新的發(fā)展階段。

從理論概念到有效落地,Psi R0解答了具身智能商業(yè)化的終極命題

長(zhǎng)程任務(wù)靈巧操作場(chǎng)景無(wú)處不在,從工廠產(chǎn)線組裝,到服務(wù)業(yè)的揀貨打包,到家居環(huán)境的清潔整理。

Psi R0模型的智能體展示了其強(qiáng)大的場(chǎng)景落地能力。以電商場(chǎng)景為例,商品打包是典型的長(zhǎng)程任務(wù)作業(yè),需對(duì)上萬(wàn)件商品進(jìn)行抓取,掃碼,放置,塑料袋打結(jié)等多個(gè)操作。Psi R0能夠使用雙靈巧手流暢地完成這一系列動(dòng)作(此系列動(dòng)作在客戶現(xiàn)場(chǎng)可以取代一個(gè)完整工位),成為首個(gè)基于強(qiáng)化學(xué)習(xí)訓(xùn)練完成長(zhǎng)程靈巧操作任務(wù)的具身機(jī)器人。

視頻中,機(jī)器人系統(tǒng)接收到的指令僅僅是“將桌面的物體打包”,而這一看似簡(jiǎn)單的任務(wù)背后,是靈初智能極具創(chuàng)新性的端到端技術(shù)架構(gòu)在發(fā)揮作用。當(dāng)指令下達(dá)后,上層視覺語(yǔ)言模型(VLM)對(duì)桌上混亂擺放的商品進(jìn)行分析,編排出商品的操作順序,下層操作模型拆解出單個(gè)商品的子任務(wù),如抓取、放置、掃碼、打包等,智能體依次執(zhí)行。

抓取環(huán)節(jié),面對(duì)隨意擺放、形狀各異的商品,模型必須具備高度的泛化能力,才能成功完成商品的逐個(gè)抓取。視頻中展示的品客薯片,Psi R0 僅僅依靠 20 條真機(jī)數(shù)據(jù),模型就成功實(shí)現(xiàn)了99%+的成功抓取率。

23.png

掃碼環(huán)節(jié)更是考驗(yàn)機(jī)器人的靈巧操作水平,需要雙手高度精細(xì)地協(xié)調(diào)彼此相對(duì)位置,以確保掃碼槍與商品條碼能夠精準(zhǔn)對(duì)齊,任何細(xì)微偏差都可能導(dǎo)致掃碼失敗。此時(shí),RL訓(xùn)練策略為雙手雙臂構(gòu)成的高自由度復(fù)雜系統(tǒng)提供了可靠的實(shí)時(shí)閉環(huán)控制,保障掃碼動(dòng)作精準(zhǔn)流暢地完成。

打包環(huán)節(jié),需要雙手協(xié)調(diào)完成對(duì)塑料袋的靈巧操作。在動(dòng)態(tài)打包的過(guò)程中,塑料袋的形狀會(huì)隨動(dòng)作變化,需要實(shí)時(shí)調(diào)整操作。為了提升機(jī)器人對(duì)柔性物體的操作適應(yīng)能力,Psi R0在仿真環(huán)境中模擬多種柔性物體的操作場(chǎng)景,同時(shí)結(jié)合真機(jī)數(shù)據(jù)進(jìn)行微調(diào)優(yōu)化。甚至在被打斷、干擾的情況下,也能自適應(yīng)調(diào)整策略,重新進(jìn)行打包動(dòng)作。

24.png

靈初智能Psi R0模型是具身智能遞歸性成長(zhǎng)的第一步。具身智能將遵從從簡(jiǎn)單到復(fù)雜、從保護(hù)到協(xié)同的漸進(jìn)式演進(jìn)。在早期,小腦是與真實(shí)世界交互的物理基礎(chǔ),其設(shè)計(jì)需結(jié)合領(lǐng)域知識(shí),滿足環(huán)境中的約束條件,同時(shí)具備容錯(cuò)性,支持大腦學(xué)習(xí)與優(yōu)化。Psi R0模型發(fā)揮RL算法探索的優(yōu)勢(shì),支持小腦的快速迭代,生成支持長(zhǎng)程靈巧操作的智能體。通過(guò)靈巧操作轉(zhuǎn)動(dòng)數(shù)據(jù)飛輪,實(shí)現(xiàn)從小腦Action到大腦Cognition的閉環(huán)回饋,驅(qū)動(dòng)大腦認(rèn)知能力優(yōu)化,模型持續(xù)迭代,形成小腦協(xié)同+大腦優(yōu)化的具身智能“神經(jīng)回路”,使端到端模型完成從簡(jiǎn)單到復(fù)雜、從保護(hù)到協(xié)同的漸進(jìn)式演進(jìn)。


猜你喜歡

十大新手貴金屬交易平臺(tái)推薦:低門檻貴金屬交易APP

金融科技貴金屬交易平臺(tái)

如今,打開一款貴金屬交易APP,即使賬戶里只有100美元,你也能在國(guó)際黃金市場(chǎng)上開始自己的第一次交易...

3小時(shí)前

2026香港十大期貨交易APP軟件平臺(tái)排名

金融科技期貨交易平臺(tái)

期貨指可供出貨、儲(chǔ)存和制造業(yè)使用的實(shí)物商品。

3小時(shí)前

國(guó)內(nèi)受投資者認(rèn)可的十大現(xiàn)貨交易平臺(tái)排名2026版

金融科技黃金交易平臺(tái)

雖然從產(chǎn)生到現(xiàn)在已經(jīng)擁有了三百多年的發(fā)展歷史,現(xiàn)貨黃金投資的魅力并沒有隨著時(shí)間的轉(zhuǎn)移而消散,反而在世...

3小時(shí)前

國(guó)際十大專業(yè)的電子黃金交易平臺(tái)最新渠道排行名單2026版

金融科技黃金交易平臺(tái)

隨著世界局勢(shì)不斷動(dòng)蕩,投資市場(chǎng)也不斷發(fā)生巨大的變化。

3小時(shí)前

香港十大正規(guī)炒黃金交易平臺(tái)排名(2026年度)

金融科技黃金交易平臺(tái)

隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,,個(gè)人財(cái)富也在攀升,人們手中持有的閑置資金多了,就會(huì)開始萌生理財(cái)意識(shí),并表現(xiàn)...

3小時(shí)前

“全社會(huì)反詐青年在行動(dòng)”活動(dòng)來(lái)啦!微眾銀行微粒貸助力金融反詐宣導(dǎo)

金融科技微眾銀行

根據(jù)中央宣傳部、公安部“全民反詐在行動(dòng)”集中宣傳月活動(dòng)安排,7月18日,公安部刑偵局在京舉辦“全社會(huì)...

2025-07-22

中國(guó)石墨產(chǎn)業(yè)大會(huì)共繪高質(zhì)量藍(lán)圖,全球負(fù)極龍頭貝特瑞引領(lǐng)行業(yè)協(xié)同共贏

上市公司貝特瑞

7月22日,一場(chǎng)被業(yè)內(nèi)譽(yù)為“破局之戰(zhàn)”的石墨產(chǎn)業(yè)峰會(huì)——中國(guó)石墨產(chǎn)業(yè)高質(zhì)量發(fā)展大會(huì)在深圳光明科學(xué)城舉...

2025-07-22

歐瑞澤宣布旗下成長(zhǎng)型基金第四期完成6.5億歐元首輪募集,聚焦歐洲人工智能領(lǐng)軍企業(yè)

金融科技歐瑞澤

2025年7月16日,歐瑞澤投資集團(tuán)宣布旗下成長(zhǎng)型基金第四期(Eurazeo Growth Fund...

2025-07-22

黃芪中的黃金血脈——走進(jìn)大同渾源!

大消費(fèi)黃芪

黃芪中的黃金血脈——走進(jìn)大同渾源!

2025-07-22

財(cái)經(jīng)銳眼

中國(guó)最大茶葉公司,又要IPO了

上市公司

八馬茶葉,就算最后在港股成功上市,似乎也不會(huì)掀起什么浪花。

2025-07-22

投資家網(wǎng)(www.hbzbj.cn)是國(guó)內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國(guó)市場(chǎng)的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫(kù)服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長(zhǎng)按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。

京杭對(duì)話:杭州,憑什么吸引北京創(chuàng)新企業(yè)?

京杭對(duì)話:杭州,憑什么吸引北京創(chuàng)新企業(yè)?

從一張精準(zhǔn)的產(chǎn)業(yè)藍(lán)圖,到一個(gè)敏捷的創(chuàng)新操作系統(tǒng),再到一片豐沃的賦能土壤,杭州的生產(chǎn)性服務(wù)業(yè)正在這條路...

第19屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)在滬成功舉辦

第19屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)在滬成功舉辦

11月27日,由投中信息和投中網(wǎng)主辦的第19屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)在上海舉辦。

“京杭聚勢(shì),共啟新篇”:招商新路徑,奏響區(qū)域協(xié)同發(fā)展強(qiáng)音

“京杭聚勢(shì),共啟新篇”:招商新路徑,奏響區(qū)域協(xié)同發(fā)展強(qiáng)音

在區(qū)域經(jīng)濟(jì)協(xié)同發(fā)展的大背景下,京杭兩地的經(jīng)濟(jì)協(xié)作正以一種全新的姿態(tài)加速推進(jìn)。

第19屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)即將在滬啟幕

第19屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)即將在滬啟幕

作為中國(guó)股權(quán)投資領(lǐng)域備受矚目的年度盛會(huì),第19屆中國(guó)投資年會(huì)·有限合伙人峰會(huì)定于2025年11月26...

投資家網(wǎng)主辦:“智造未來(lái)-人工智能與機(jī)器人”專場(chǎng)路演成功舉辦

投資家網(wǎng)主辦:“智造未來(lái)-人工智能與機(jī)器人”專場(chǎng)路演成功舉辦

投資家網(wǎng)聯(lián)合深圳市龍崗區(qū)人工智能(機(jī)器人)署于9月28日聯(lián)合主辦“智造未來(lái)——人工智能與機(jī)器人”專場(chǎng)...

永久久久久久| 99精品99久久久久久宅男| 久久国产一区| 亚洲欧美在线网| 欧美人与物videos另类| 成人欧美一区二区| 一本色道久久综合亚洲精品婷婷 | 欧美日韩国产精品一区二区| 午夜精品福利一区二区| 亚洲韩国在线| 91成人免费观看| 1区1区3区4区产品乱码芒果精品| 久久青青草原| 99精彩视频| 精品产品国产在线不卡| 国产91免费视频| 999精品视频一区二区三区| 国模精品娜娜一二三区| 99视频在线播放| 国产伦精品一区二区三区视频免费| 国产精品日韩高清| 免费不卡亚洲欧美| 成人av资源网| 国产欧美日韩一区| 视频一区二区三区免费观看| 日韩免费一区二区三区| 国产高清精品一区二区| 亚洲砖区区免费| 91久久精品国产91久久性色tv | 最新不卡av| 99re在线观看| av在线不卡观看| 国产一区二区三区免费不卡| 日本一区二区久久精品| 国产精品久久精品视| 91丝袜脚交足在线播放| 3d精品h动漫啪啪一区二区| 中文字幕欧美日韩一区二区| 国产v亚洲v天堂无码| 先锋影音网一区| 好吊色欧美一区二区三区| 亚洲a∨一区二区三区| 一区二区三区av| 国产精品伊人日日| 99r国产精品视频| 国产99在线免费| 欧美一级二级三级九九九| 深田咏美在线x99av| 999国产视频| www.成人av.com| 日本一区二区三区四区在线观看| 色乱码一区二区三在线看| 欧美一区观看| 99在线视频首页| 亚洲欧洲日夜超级视频| 国产精品久久亚洲7777| 久久国产精品免费一区| 成人免费看片网址| 亚洲啪啪av| 国产精品久久久久久久免费大片 | 欧美精品亚洲精品| 91久久大香伊蕉在人线| 99在线热播| 欧美极品一区二区| 99在线高清视频在线播放| 国产一区二区三区奇米久涩| 欧美大陆一区二区| 精品国产一区二区三区久久久久久| 欧美xxxx黑人又粗又长密月| 在线观看福利一区| 在线观看日韩片| 国产精品美女久久久久av福利| 日韩一区不卡| 国产精品jizz视频| 狠狠色狠狠色综合人人| 亚洲日本精品| 日本成人三级| 精品国产免费一区二区三区| 午夜精品一区二区在线观看| 国产一区在线观| 91视频婷婷| 91文字幕巨乱亚洲香蕉| 91超碰在线免费观看| 性欧美大战久久久久久久免费观看| 成人动漫视频在线观看完整版| 视频一区二区三区免费观看| 久久婷婷开心| 日本视频一区在线观看| 一区二区三区四区欧美日韩| 97人人干人人| 久久久久一区二区| 国产一区喷水| 日韩精品在在线一区二区中文| 日本不卡二区| 日韩一区不卡| 5566av亚洲| 欧美成ee人免费视频| 视频三区二区一区| 亚洲免费在线精品一区| 亚洲国产成人不卡| 亚洲第一导航| 久久国产精品 国产精品| 日本一区二区视频| 欧美日韩三区四区| 五码日韩精品一区二区三区视频| 亚洲午夜激情| 一本一道久久久a久久久精品91| 好吊色欧美一区二区三区| 91久久精品国产91久久性色tv| 在线观看日韩羞羞视频| 亚洲国产欧美日韩| 亚洲国产精品视频一区| 日韩精品久久久免费观看| 久久国产一区| 日本一区二区免费看| 日韩精品大片| 国产厕所精品在线观看| 中文字幕一区二区三区乱码| 国内一区二区在线视频观看| 97中文在线观看| 久久综合九色综合网站| 日本10禁啪啪无遮挡免费一区二区 | 天堂va久久久噜噜噜久久va| 黑人另类av| 成人欧美一区二区三区视频| 亚洲三区视频| 一区二区三区电影| 亚洲精美视频| 国产欧美日韩在线播放| 狠狠色狠狠色综合人人| 久久国产日韩欧美| 国产伦精品一区二区三区高清| 日本在线播放一区| 成人欧美一区二区三区在线观看 | 电影午夜精品一区二区三区| 久久精品一二三区| 欧美性bbwbbwbbwhd| 日本一区二区在线视频观看| 天天综合色天天综合色hd| 九九久久99| 国产98在线|日韩| 国产日韩精品久久| 欧美高清视频一区| 无遮挡亚洲一区| 久久99精品久久久久久秒播放器 | 偷拍视频一区二区| 国产精品日韩欧美一区二区三区| 久久伊人资源站| 91一区二区三区| 亚洲激情一区二区| 一区二区三区四区国产| 久久国产精品一区二区三区| 日韩久久不卡| 3d动漫精品啪啪一区二区三区免费 | 天堂av一区二区| 精品无人乱码一区二区三区的优势| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 亚洲人一区二区| 日本不卡一区二区三区在线观看| 大波视频国产精品久久| 99久久精品无码一区二区毛片 | 国产伦精品一区| 蜜桃av噜噜一区二区三区| 欧美日韩一区二| 99九九视频| 日韩免费中文专区| 欧美性大战久久久久| 久久精品国产美女| 欧美高清性xxxxhd | 亚洲欧美日韩综合一区| 日本一区视频在线| 色一情一区二区三区四区| 国产精品三区www17con| 91成人伦理在线电影| 日本不卡二区高清三区| 不卡视频一区二区| 操一操视频一区| 亚洲国产欧美不卡在线观看| 国产高清在线一区| 自拍偷拍亚洲色图欧美| 中国人体摄影一区二区三区| 99久re热视频这里只有精品6| 欧洲在线视频一区| 久久精品人人做人人爽电影| 女同一区二区| www.久久草| 91在线看网站| 欧美人与物videos另类| 日韩资源av在线| 精品一区二区三区自拍图片区| 色999五月色| 国产精品国产一区二区| 亚洲精品欧美精品| 在线视频一区观看| 手机成人在线| 日韩欧美一区二区三区四区| 青娱乐国产91| 国产精品毛片va一区二区三区| 日本不卡一二三区| 99电影在线观看|