掃一掃
下載數(shù)字化報(bào)APP
《科創(chuàng)板日?qǐng)?bào)》10月21日訊(編輯 宋子喬)如今,科技巨頭主動(dòng)肩負(fù)起機(jī)器人研發(fā)的重任,正你追我趕奔赴下一場(chǎng)科技盛宴。當(dāng)?shù)貢r(shí)間10月20日,英偉達(dá)、Meta各自發(fā)布了重磅機(jī)器人訓(xùn)練工具。
英偉達(dá)開發(fā)的AI代理Eureka可以教會(huì)機(jī)器人復(fù)雜的運(yùn)動(dòng)控制技能,比如轉(zhuǎn)筆、打開抽屜和柜子、拋球和接球、操作剪刀。英偉達(dá)稱這一突破將重新定義機(jī)器學(xué)習(xí)。
Meta則推出了Habitat 3.0模擬器,可教授機(jī)器人如何與物理世界進(jìn)行交互,Meta將其稱為“社交智能機(jī)器人研發(fā)路上的里程碑”。
究竟是什么樣的工具?新成果的意義何在?
▌?dòng)ミ_(dá)Eureka——大模型參與訓(xùn)練機(jī)器人
Eureka的全稱是Evolution-driven Universal Reward Kit for Agent,本質(zhì)是一種由大模型驅(qū)動(dòng)的算法生成工具。借助GPT-4寫代碼的能力,Eureka擁有了出色的獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)能力,可以自主編寫?yīng)剟?lì)算法來訓(xùn)練機(jī)器人。
Eureka的關(guān)鍵所在,是通過上下文來實(shí)現(xiàn)了人類水平的獎(jiǎng)勵(lì)算法設(shè)計(jì)。簡(jiǎn)單來說,就是用GPT-4的零樣本生成、代碼編寫以及上下文改進(jìn)功能,對(duì)獎(jiǎng)勵(lì)執(zhí)行策略進(jìn)行優(yōu)化,由此通過強(qiáng)化學(xué)習(xí)來進(jìn)行復(fù)雜的技能。
英偉達(dá)稱,在29種不同的開源強(qiáng)化學(xué)習(xí)(RL)環(huán)境中,Eureka獎(jiǎng)勵(lì)設(shè)計(jì)的性能達(dá)到了人類水平,這些環(huán)境包括10種不同的機(jī)器人形態(tài)(四足機(jī)器人、四旋翼機(jī)器人、雙足機(jī)器人、機(jī)械手以及幾種靈巧手)。在沒有任何特定任務(wù)提示或獎(jiǎng)勵(lì)模板的情況下,Eureka生成的獎(jiǎng)勵(lì)程序在超過80%的任務(wù)上優(yōu)于專家編寫的獎(jiǎng)勵(lì)程序。這使得機(jī)器人的平均性能提高了50%以上。
機(jī)器人通過Eureka學(xué)會(huì)了轉(zhuǎn)筆、拋接球、打開柜子(注:這些機(jī)械手指上下翻飛的場(chǎng)景,暫時(shí)僅限于虛擬環(huán)境)人形機(jī)器人通過Eureka學(xué)習(xí)跑步步態(tài)
英偉達(dá)這項(xiàng)研究由其與賓夕法尼亞大學(xué)、加州理工學(xué)院、德州大學(xué)奧斯汀分校的研究人員合作完成。目前該項(xiàng)目完全開源。
在機(jī)器人領(lǐng)域,有一個(gè)“莫拉維克悖論”——人類所獨(dú)有的高階智慧能力只需要非常少的計(jì)算能力,但無意識(shí)的技能和直覺(如辨識(shí)人臉、舉起鉛筆、在房間內(nèi)走動(dòng)、回答問題等能力)卻需要極大的運(yùn)算能力,即越簡(jiǎn)單的事情越難,越難的事情越簡(jiǎn)單。
這也是為什么人類早已創(chuàng)造出打敗世界頂級(jí)棋手的AlphaGo,卻仍不能讓機(jī)器人擁有像兩三歲小孩一樣的感知力和行動(dòng)力。
英偉達(dá)的最新成果展示了大模型在機(jī)器人精細(xì)化控制方面的作用,在英偉達(dá)的推動(dòng)下,更智能的機(jī)器學(xué)習(xí)方式有望被迅速引入工業(yè)和消費(fèi)應(yīng)用領(lǐng)域。
▌Meta Habitat——人機(jī)交互直指具身智能
Meta的Habitat同樣為訓(xùn)練機(jī)器人而生。據(jù)介紹,Habitat 3.0是第一個(gè)支持在多樣化、逼真的室內(nèi)環(huán)境中,就人機(jī)交互任務(wù)進(jìn)行大規(guī)模訓(xùn)練的模擬器。
具體來看,Habitat 3.0可以利用紅外捕捉系統(tǒng)精心構(gòu)建一個(gè)虛擬環(huán)境,如辦公空間、住宅和倉(cāng)庫(kù)等,其中物體的形狀和大小完全復(fù)制現(xiàn)實(shí)世界,該工具還可在外貌和姿勢(shì)上對(duì)人類進(jìn)行真實(shí)的模擬,支持從簡(jiǎn)單(如行走和揮手)到復(fù)雜(如與物體交互)等各種類型的動(dòng)作,還可模擬多種真實(shí)的社交場(chǎng)景。
機(jī)器人和人形化身同處一個(gè)空間,且虛擬環(huán)境中的人形化身既可由算法控制,也可由真人通過鍵盤、鼠標(biāo)以及VR頭顯等進(jìn)行控制。網(wǎng)上已經(jīng)有人期待在Meta Quest VR中體驗(yàn)Habitat 3.0了。
Meta的目的很明確——通過Habitat 3.0,讓AI智能體在真實(shí)世界和人類互動(dòng)。
值得注意的是,與真實(shí)世界進(jìn)行交互正是實(shí)現(xiàn)具身智能的基礎(chǔ),正如Meta的AI研究部門(FAIR)所說,Habitat 3.0等新產(chǎn)品的發(fā)布代表了他們?cè)诰呱碇悄芊矫娴倪M(jìn)步。
FAIR表示,Habitat 3.0將把機(jī)器人AI代理的學(xué)習(xí)時(shí)間從幾個(gè)月甚至幾年縮短到幾天。它還能在安全的模擬環(huán)境中更快速地測(cè)試新模型,不會(huì)有任何風(fēng)險(xiǎn)。
在推出Habitat 3.0的同時(shí),Meta還宣布發(fā)布Habitat合成場(chǎng)景數(shù)據(jù)集(Habitat Synthetic Scenes Dataset),這是一個(gè)由藝術(shù)家撰寫的三維數(shù)據(jù)集,可用于訓(xùn)練人工智能導(dǎo)航代理;同時(shí)還發(fā)布了Home Robot,這是一個(gè)機(jī)器人助手軟硬件平臺(tái),可在模擬和真實(shí)環(huán)境中使用。
英偉達(dá)深耕運(yùn)動(dòng)控制,Meta注重交互能力,這兩大能力正是機(jī)器人進(jìn)入千家萬戶的前提。
華為“天才少年”稚暉君離開華為后奔赴機(jī)器人創(chuàng)業(yè),他曾在其機(jī)器人產(chǎn)品首秀上引用一個(gè)網(wǎng)絡(luò)段子:我們想讓AI做的事,是做飯、打掃房間、洗衣服、扔垃圾,然而它們實(shí)際在做的事,是聊天、繪畫、寫作、作曲、打游戲……
工業(yè)機(jī)器人已經(jīng)愈發(fā)普及的當(dāng)下,如何讓機(jī)器人成為普通家庭的助手、日常生活中的伙伴,已經(jīng)成為新的科技熱點(diǎn)。
一個(gè)包攬家務(wù)活、零碎事的家用機(jī)器人,距離我們還有多遠(yuǎn)呢?
(來源金融界)未經(jīng)數(shù)字化報(bào)網(wǎng)授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
特別提醒:如內(nèi)容、圖片、視頻出現(xiàn)侵權(quán)問題,請(qǐng)發(fā)送郵箱:tousu_ts@sina.com。
風(fēng)險(xiǎn)提示:數(shù)字化報(bào)網(wǎng)呈現(xiàn)的所有信息僅作為學(xué)習(xí)分享,不構(gòu)成投資建議,一切投資操作信息不能作為投資依據(jù)。本網(wǎng)站所報(bào)道的文章資料、圖片、數(shù)據(jù)等信息來源于互聯(lián)網(wǎng),僅供參考使用,相關(guān)侵權(quán)責(zé)任由信息來源第三方承擔(dān)。
本文地址: http:///news/47790.shtml
數(shù)字化報(bào)(數(shù)字化商業(yè)報(bào)告)是國(guó)內(nèi)數(shù)字經(jīng)濟(jì)創(chuàng)新門戶網(wǎng)站,以數(shù)字技術(shù)創(chuàng)新發(fā)展為中心,融合數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)發(fā)展,聚焦制造業(yè)、服務(wù)業(yè)、農(nóng)業(yè)等產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,致力為讀者提供最新、最權(quán)威、最全面的科技和數(shù)字領(lǐng)域資訊。數(shù)字化報(bào)并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù);
商務(wù)合作:Hezuo@szhww.com
稿件投訴:help@szhww.com
Copyright ? 2013-2023 數(shù)字化報(bào)(數(shù)字化報(bào)商業(yè)報(bào)告)
數(shù)字化報(bào)并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù)
浙ICP備2023000407號(hào)數(shù)字化報(bào)網(wǎng)(杭州)信息科技有限公司 版權(quán)所有浙公網(wǎng)安備 33012702000464號(hào)