今日看點:OpenAI聯(lián)合創(chuàng)始人:自動駕駛和VR都是“歧途” AI智能體才是未來
在黃仁勛和馬斯克接連看到了AI智能體的發(fā)展?jié)摿?,OpenAI聯(lián)合創(chuàng)始人,特斯拉前人工智能總監(jiān)Andrej Karpathy也在最近高呼,AI智能體代表著一個瘋狂的未來。
Andrej Karpathy直言,自己在特斯拉的工作時“被自動駕駛分了心”,鉆研自動駕駛和VR都不是發(fā)展AI智能體的正確道路。此刻正是回歸神經(jīng)科學(xué),從中尋求靈感的時刻。
另一方面,Andrej Karpathy認(rèn)為每個人在構(gòu)建AI智能體的方面都比OpenAI這樣的公司更有優(yōu)勢,大家目前處于平等競爭的狀態(tài),因此他很期待看到這方面的成果:
(資料圖片)
AI智能體代表著一個瘋狂的未來,雖然可能還有點遠,但是今天到場的大家構(gòu)建的AI智能體已經(jīng)處于AI智能體能力的最前沿。
現(xiàn)在所有正在做大語言模型的機構(gòu),比如OpenAI等,我覺得都沒有處于這個領(lǐng)域的最前,最前沿的是在座的各位。
谷歌旗下AI團隊DeepMind的最新論文介紹了一種能夠進行自我改進的AI智能體——RoboCat,本質(zhì)上是由AI賦能的軟件程序,相當(dāng)于機器人的“大腦”。由其加持的機器人與傳統(tǒng)機器人不同之處在于,RoboCat更具“通用性”,并可實現(xiàn)自我改進、自我提升。
具身智能比人形機器人更有價值
具身智能相當(dāng)于AI的大腦,而這個大腦的載體可以是任何形式??梢允且粋€機械臂,一只機器狗,更或者是一輛小汽車。
而反觀人形機器人,當(dāng)下為何被看做是一個不太聰明的鋼鐵巨人,核心還是因為缺少AI大腦+不太靈活的軀體。
簡單來說,類似GPT-4這樣的大模型,對物理世界并不能真的產(chǎn)生影響,而具身智能則多了一個身體,通過傳感器收集環(huán)境信息,利用機械執(zhí)行器進行物理操作,或者通過機器人等具體實體與人類和環(huán)境進行實時互動。
馬斯克曾說,雖然未來有一天人人可能會擁有一個人形機器人,但是目前展現(xiàn)的Optimus人形機器人產(chǎn)品也就只能執(zhí)行重復(fù)性的簡單勞動。
具身智能的目標(biāo)是使機器能夠更好地理解和適應(yīng)復(fù)雜的環(huán)境,更高效地解決問題,并具備更靈活的行為能力。通過融合感知、決策和執(zhí)行的過程,具身智能使機器能夠更接近人類智能的表現(xiàn),從而在機器人技術(shù)、自動駕駛、智能制造等領(lǐng)域發(fā)揮重要作用。
Karpathy直言,在7年前,研究AI智能體的時機還不成熟,因技術(shù)所限做出來的效果不好,于是他和OpenAI就改變了方向,開始研究大語言模型。
而現(xiàn)在有了全新的技術(shù)手段來研究AI智能體,情況和2016年完全不同了:
最簡單的例子就是,現(xiàn)在沒有人再像2016年那樣用強化學(xué)習(xí)的方法來研究AI智能體了?,F(xiàn)在的研究方法和方向在當(dāng)年是不可想象的。
AI下一個浪潮?
大語言模型的出現(xiàn),給構(gòu)建具身智能體帶來了全新的可能性。因為基于LLM的智能體可以利用預(yù)訓(xùn)練模型中蘊含的世界知識,生成一致的行動計劃或可執(zhí)行策略,這就非常適合應(yīng)用于游戲和機器人之類的任務(wù)。
DeepMind的RoboCat只是AI賦能機器人的主要案例之一。
今年以來,已經(jīng)有數(shù)家公司將語言模型運用到了機器人上:2023年年初,谷歌推出視覺語言模型PaLM-E,并運用到工業(yè)機器人上;4月,阿里巴巴將千問大模型接入工業(yè)機器人;5月,特斯拉人形機器人Optimus展示了精準(zhǔn)的控制、感知能力,同月,英偉達發(fā)布全新自主移動機器人平臺。
得益于此,人工智能加持的機器人化身具身智能吸引了全球的廣泛關(guān)注。
馬斯克在特斯拉2023年股東大會上便表示,人形機器人將是今后特斯拉主要的長期價值來源:
“如果人形機器人和人的比例是2比1左右,那么人們對機器人的需求量可能是100億乃至200億個,遠超電動車的數(shù)量”。
英偉達創(chuàng)始人黃仁勛在ITF World 2023半導(dǎo)體大會上也表示,AI下一個浪潮將是“具身智能”。華爾街見聞此前指出,國盛證券分析師認(rèn)為,具身智能有著物理反饋、物理輸出的特性,可以成為成為通信、計算和存儲的新載體:
未來具身智能將會越來越強調(diào)邊緣通信能力與邊緣算力的匹配和耦合。
AI的軀體其實并非是最重要的,核心應(yīng)該是發(fā)展AI大腦,打通人機交互方式,讓AI能夠主動感知物理世界,擬人化的思維路徑才能做到人類期待的行為反饋。機器視覺和多模態(tài)大模型正是開啟這個世界的兩把鑰匙。
風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: