極客網(wǎng)·極客觀察8月29日 過(guò)去幾年里,AI聊天機(jī)器人飛速進(jìn)化,現(xiàn)在很多人將它當(dāng)成個(gè)人助手、客服代表和治療專(zhuān)家。驅(qū)動(dòng)聊天機(jī)器人運(yùn)行的是大語(yǔ)言模型(LLM),它以機(jī)器學(xué)習(xí)算法作為基礎(chǔ),算法根據(jù)互聯(lián)網(wǎng)海量數(shù)據(jù)而訓(xùn)練。
一些科技人士預(yù)測(cè),只要短短幾年,利用機(jī)器學(xué)習(xí)算法就能孵化各種機(jī)器人,比如外科手術(shù)機(jī)器人、替代工廠(chǎng)工人的機(jī)器人、家庭管家機(jī)器人等。但加州大學(xué)伯克利分校機(jī)器人專(zhuān)家肯·戈德伯格(Ken Goldberg)并不認(rèn)同這種說(shuō)法。
8月27日,戈德伯格在《Science Robotics》雜志發(fā)表兩篇論文,指出想讓人形機(jī)器人獲得可以在真實(shí)世界應(yīng)用的技能,速度會(huì)極慢——與AI聊天機(jī)器人獲得技能的速度相差極遠(yuǎn),核心原因在于可供人形機(jī)器人訓(xùn)練的數(shù)據(jù)太少了,與AI聊天機(jī)器人之間差了10萬(wàn)年。
在第二篇論文中,來(lái)自麻省理工學(xué)院、佐治亞理工學(xué)院和蘇黎世聯(lián)邦理工學(xué)院的機(jī)器人專(zhuān)家討論了機(jī)器人的未來(lái)發(fā)展方向,他們展開(kāi)激烈爭(zhēng)論。爭(zhēng)論的焦點(diǎn)在于:到底是采集更多數(shù)據(jù)來(lái)訓(xùn)練人形機(jī)器人,還是依靠傳統(tǒng)工程方法給機(jī)器人編程,讓它完成現(xiàn)實(shí)任務(wù)?
以下是加州大學(xué)新聞網(wǎng)站與戈德伯格的對(duì)話(huà):
問(wèn):最近,馬斯克等科技領(lǐng)袖談到了人形機(jī)器人的未來(lái),比如,他認(rèn)為在未來(lái)五年內(nèi)機(jī)器人將會(huì)超越人類(lèi)外科醫(yī)生。你認(rèn)同這種預(yù)測(cè)嗎?
戈德伯格:機(jī)器人技術(shù)的確在快速進(jìn)化,但遠(yuǎn)未達(dá)到馬斯克所說(shuō)的程度?,F(xiàn)在的熱潮存在炒作,宣傳的內(nèi)容超出了機(jī)器人的實(shí)際能力。
在視覺(jué)和語(yǔ)言領(lǐng)域,ChatGPT展示了驚人成就,但大多研究者對(duì)公眾認(rèn)知感到擔(dān)憂(yōu)——公眾認(rèn)為問(wèn)題既然已經(jīng)解決,明年就能實(shí)現(xiàn)突破,實(shí)際上太樂(lè)觀了。
我并不是說(shuō)馬斯克描繪的未來(lái)永遠(yuǎn)不會(huì)實(shí)現(xiàn),只是說(shuō)未來(lái)兩年、五年或者十年不會(huì)發(fā)生。
問(wèn):未來(lái)如果想讓人形機(jī)器人做手術(shù),或者擔(dān)任私人管家,存在哪些限制?會(huì)在哪些方面遇到困難?
戈德伯格:最重要的難點(diǎn)在于靈活性,比如讓人形機(jī)器人拿起物體。想拿起一只杯子或者更換燈泡是一件很難的事,現(xiàn)在還沒(méi)有機(jī)器人能做到。
這里有一個(gè)悖論,我們管它叫Moravec悖論,也就是說(shuō)一件事人類(lèi)可以毫不費(fèi)力做到,所以我理所當(dāng)然認(rèn)為機(jī)器人應(yīng)該也能做到。
如果讓人工智能玩國(guó)際象棋和圍棋,表現(xiàn)比人還好,我們就會(huì)問(wèn):“為什么機(jī)器人不能拿起一個(gè)杯子呢?”看起來(lái)拿杯子比下棋容易得多。
然而事實(shí)并非如此,想拿起杯子,需要對(duì)杯子在空間中的位置有清晰感知,需要將手指移動(dòng)到準(zhǔn)確位置,然后以適當(dāng)?shù)姆绞侥笞。y度相當(dāng)大。
問(wèn):在論文中,你說(shuō)數(shù)據(jù)之間存在10萬(wàn)年的差距。所謂的數(shù)據(jù)差距是什么,AI聊天機(jī)器人與人形機(jī)器人在實(shí)際操作能力上差距又是如何造成的?
戈德伯格:為了計(jì)算數(shù)據(jù)缺口,我查看了互聯(lián)網(wǎng)上的文本數(shù)據(jù)量,計(jì)算一個(gè)人需要多長(zhǎng)時(shí)間才能閱讀完。答案是10萬(wàn)年,要十萬(wàn)年才能讀完。我們用這么多的數(shù)據(jù)訓(xùn)練LLM。
我們用10萬(wàn)年的數(shù)據(jù)訓(xùn)練文本模型,但想訓(xùn)練機(jī)器人,10萬(wàn)年數(shù)據(jù)微不足道。可以確定的是,訓(xùn)練機(jī)器人更復(fù)雜,我們需要更多數(shù)據(jù)。
有人認(rèn)為,可以觀察人類(lèi)相關(guān)視頻,從中獲取數(shù)據(jù)。但如果只是看視頻圖像,根本無(wú)法知道動(dòng)作細(xì)節(jié)是怎樣的,從2D轉(zhuǎn)化為3D也是極具挑戰(zhàn)的事。所以這一難題無(wú)法解決。
還有一個(gè)辦法是讓機(jī)器人運(yùn)動(dòng),獲得模擬數(shù)據(jù)。如果機(jī)器人只是奔跑或者表演雜技,用這種方法還不錯(cuò)。你可以讓機(jī)器人在模擬環(huán)境中進(jìn)行后空翻操作,收集大量數(shù)據(jù),在特定情況下,這些數(shù)據(jù)能應(yīng)用于機(jī)器人。但就靈活性而言,仍然遠(yuǎn)遠(yuǎn)不夠。
現(xiàn)在有了些工作可以遠(yuǎn)程操作,像操縱木偶一樣操縱機(jī)器人,完成各種任務(wù)。中國(guó)和美國(guó)的倉(cāng)庫(kù)里已經(jīng)有類(lèi)似的工作,但對(duì)于人類(lèi)來(lái)說(shuō),這樣的工作十分枯燥。每工作8小時(shí),就能獲得8小時(shí)數(shù)據(jù),但要獲得10萬(wàn)年的數(shù)據(jù)量,太過(guò)漫長(zhǎng)。
問(wèn):如果不收集數(shù)據(jù),能不能推動(dòng)人形機(jī)器人發(fā)展?
戈德伯格:目前的機(jī)器人技術(shù)處在范式轉(zhuǎn)變階段,有點(diǎn)像物理學(xué)發(fā)展到量子力學(xué)一樣。行業(yè)分成兩派,展開(kāi)激烈爭(zhēng)論。機(jī)器人技術(shù)正處在爭(zhēng)論之中。
一派認(rèn)為,人形機(jī)器人的發(fā)展依賴(lài)于優(yōu)秀工程學(xué)技術(shù),比如物理學(xué)、數(shù)學(xué)、環(huán)境建模。另一派認(rèn)為,機(jī)器人根本不需要使用傳統(tǒng)工具和方法,只要有數(shù)據(jù),就能讓人形機(jī)器人走向完美。
第二派鼓舞人心,背后有大量資金支持,但到了研究時(shí),大家爭(zhēng)論不休,在傳統(tǒng)方法和新方法之間有許多爭(zhēng)吵。
問(wèn):你認(rèn)為未來(lái)的方向是什么?
戈德伯格:我認(rèn)為工程、數(shù)學(xué)、科學(xué)仍然極為重要,因?yàn)橛辛诉@些,機(jī)器人才能運(yùn)行,然后我們就可以收集數(shù)據(jù)。
當(dāng)機(jī)器人執(zhí)行任務(wù)時(shí),如果表現(xiàn)達(dá)到消費(fèi)者可接受水平,就能將機(jī)器人投入市場(chǎng),接下來(lái)在實(shí)際運(yùn)行中持續(xù)收集數(shù)據(jù)。
谷歌Waymo無(wú)人駕駛汽車(chē)采用上述模式,Ambi包裹分揀機(jī)器人也一樣,它在倉(cāng)庫(kù)真實(shí)環(huán)境中運(yùn)行,持續(xù)收集數(shù)據(jù),不斷迭代升級(jí)。(小刀)
- 人形機(jī)器人為何進(jìn)展緩慢?伯克利專(zhuān)家:因?yàn)閿?shù)據(jù)量差了10萬(wàn)年
- “AI泡沫”可能要破滅了?華爾街憂(yōu)心忡忡
- 特朗普 “混改” 英特爾:全球半導(dǎo)體格局“碎片化”風(fēng)險(xiǎn)進(jìn)一步加劇
- 外媒評(píng)北京世界人形機(jī)器人運(yùn)動(dòng)會(huì):進(jìn)步神速,比真人刺激
- GPT-5難續(xù)輝煌:縮放定律失靈,AI經(jīng)濟(jì)規(guī)??挚s至千億級(jí)?
- 美國(guó)AI正快速催生億萬(wàn)富豪 但對(duì)整體就業(yè)市場(chǎng)影響不大
- 大模型訓(xùn)練“練兵千日”,別輸在AI推理“用兵一時(shí)”
- 硅谷告別躺平時(shí)代!996甚至007套餐已經(jīng)安排上
- 來(lái)自上海WAIC的信號(hào):AI大模型實(shí)現(xiàn)飛躍,人形機(jī)器人進(jìn)步神速
- WAIC 2025觀察 | “沖上去”的超聚變,如何做智能體時(shí)代的探索者?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。