世界快看點(diǎn)丨AI一周見聞:“AI界春晚”眾星齊聚智源大會,Sam Altman提出兩種AI監(jiān)管方式;國產(chǎn)大模型—悟道3.0全面開源;蘋果大事件MR引入腦機(jī)接口 | 見智研究
一周焦點(diǎn)
1、聚焦北京智源大會:AI安全監(jiān)管迫在眉睫;名人焦點(diǎn)言論;
2、蘋果大事件—MR引入腦機(jī)接口進(jìn)行行為預(yù)測;iOS17引入大語言模型;
(資料圖片僅供參考)
3、大模型:
國產(chǎn)大模型—悟道3.0全面開源比GPT-4算數(shù)能力更強(qiáng)的GOAT大模型靈活調(diào)用各種API的Gorilla模型MetaVL開啟下一個多模態(tài)時代GPT寫指令的程序-PromptAppGPT
4、AI應(yīng)用:
Stability AI又放大招,核彈級更新一鍵擴(kuò)圖Tafi3D角色生成引擎重磅來襲,游戲、影視動畫創(chuàng)作將直接受益AI醫(yī)療-Carbon Health的新AI工具,創(chuàng)建醫(yī)療記錄
見智視角
北京智源大會堪比AI界春晚
轟轟烈烈的2023智源大會,可以說是本年度國內(nèi)AI領(lǐng)域規(guī)格最高的、最受矚目的大會。眾多AI圈知名創(chuàng)始人和專家紛紛發(fā)表了言論。
總得來看,關(guān)注度最高的還是AI的安全性,人工智能正以爆發(fā)式的速度發(fā)展,未來十年可能就會出現(xiàn)超強(qiáng)AI。而對AI的風(fēng)險監(jiān)管等級高到要建議成立類似國際原子能機(jī)構(gòu)的組織。
OpenAI的創(chuàng)始人Sam Altman提出兩種監(jiān)管方式:一是可擴(kuò)展監(jiān)督,嘗試用AI系統(tǒng)協(xié)助人類監(jiān)督其他人工智能系統(tǒng)。二是可解釋性,嘗試?yán)斫獯竽P蛢?nèi)部運(yùn)作「黑箱」。
其次,大模型的開源是必然的發(fā)展路徑。
這個觀點(diǎn)見智也曾多次在日報\周報中進(jìn)行過分析,對于政務(wù)、金融等行業(yè)應(yīng)用視角來看,模型的安全高于一切,必然不可能采用長期處于封閉訓(xùn)練的大模型作為通用大模型。Sam Altman也表示,openAI未來會有更多開源。
名人焦點(diǎn):
“AI教父”Geoffrey Hinton在2023北京智源大會上發(fā)言焦點(diǎn):
1、人工神經(jīng)網(wǎng)絡(luò)很快會比真正的神經(jīng)網(wǎng)絡(luò)更強(qiáng)大嗎?會,且很快會發(fā)生。
2、算力成為了AI發(fā)展的阻礙,"activity perturbation"的算法可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),且節(jié)省算力。
3、超級智能控制問題非常重要,希望年輕一代的研究人員能夠找到解決方案,使超級智可以為人類帶來更好的生活同時又不會剝奪人類的控制權(quán)。
4、AI會欺騙人類,且發(fā)現(xiàn)操縱人來獲得更多的權(quán)力很容易。
Midjourney創(chuàng)始人David Holz在2023北京智源大會上發(fā)言焦點(diǎn):
1、?Midjourney的目標(biāo)之一是建造新的人類基礎(chǔ)設(shè)施;使用midjourney不僅僅是學(xué)習(xí)如何使用這個工具,而是學(xué)習(xí)所有的藝術(shù)和歷史:
2、?用戶界面友好可以讓人工智能變成用戶們自思維的一種延伸;
3、?當(dāng)前世界害怕人工智能很正常,但同時,人們又不想要一個缺乏智慧的世界:
“索羅斯戰(zhàn)友”、傳奇投資人Stanley Druckenmiller再度力挺AI:
斯坦利·德魯肯米勒(Stanley Druckenmiller)日前表示:人工智能可以像互聯(lián)網(wǎng)一樣具有創(chuàng)新性。如果對AI的判斷正確,會再持有英偉達(dá)兩到三年、甚至更長時間這一立場,這與羅斯柴爾德家族對英偉達(dá)的高位減持形成對比。
字節(jié)跳動創(chuàng)始人張一鳴在香港成立了一個個人投資基金Cool River Venture,主要聚焦科技投資,尤其是AI領(lǐng)域。
蘋果大事件
在iOS17中加入transformer語言模型,用于提高文字和語音轉(zhuǎn)文字時的準(zhǔn)確性。
見智研究觀點(diǎn):
蘋果使用transformer模型用于一些基礎(chǔ)應(yīng)用符合蘋果一直以來的務(wù)實(shí)精神,蘋果從不強(qiáng)調(diào)某項(xiàng)技術(shù)是否先進(jìn),而是要在用戶體驗(yàn)上做到極致。這也是蘋果一直強(qiáng)調(diào)技術(shù)落地到應(yīng)用的體現(xiàn)。預(yù)計(jì)蘋果設(shè)備在明年將會擁有自己的llm模型,而這個模型按照蘋果一貫的隱私保護(hù)模式,應(yīng)為純本地化的模型。
Vision Pro里用了“腦機(jī)”,通過檢測眼睛準(zhǔn)確預(yù)測用戶下一步要做什么
見智研究觀點(diǎn):
蘋果通過全新的神經(jīng)技術(shù)對人的行為進(jìn)行預(yù)測,從而大幅減小了vision產(chǎn)品整個UI操作的延遲,大幅提升用戶體驗(yàn)。從無數(shù)細(xì)節(jié)中可以看到,蘋果在用搬山能力處理每一個細(xì)節(jié),這個軟硬整合能力,不是誰能可以隨便模仿的,它所體現(xiàn)的每一個細(xì)節(jié),都看出蘋果花費(fèi)巨大的功夫在解決交互體驗(yàn)。這也是蘋果之所以偉大的地方。
大模型
1、國產(chǎn)大模型—悟道3.0全面開源
繼智源悟道大模型項(xiàng)目連創(chuàng)中國首個+世界最大紀(jì)錄之后,悟道3.0進(jìn)入全面開源的新階段。 悟道3.0是一個大模型系列。 具體來說,包括悟道·天鷹(Aquila)語言大模型系列、天秤(FlagEval)大模型評測體系、「悟道·視界」視覺大模型系列,以及多模態(tài)大模型系列。
見智研究觀點(diǎn):
特別值得關(guān)注的是國產(chǎn)大模型的優(yōu)勢在于中文語料,并且是安全合規(guī)的數(shù)據(jù)庫。比如悟道·天鷹就是中英雙語大模型,不只能生成中文,還能讀懂大量的中文世界的原生知識(放了近40%的中文語料);并且由于規(guī)模小,該模型在消費(fèi)級顯卡上就支持運(yùn)行,方便C端用戶訓(xùn)練。
2、比GPT-4算數(shù)能力更強(qiáng)的GOAT大模型
新加坡發(fā)布AI模型,算數(shù)能力強(qiáng)于GPT-4新加坡國立大學(xué)推出了Goat模型,稱該AI模型“專門用于算術(shù)問題”。研究人員表示,"在對LLaMA模型進(jìn)行微調(diào)后,Goat在算數(shù)上實(shí)現(xiàn)了比GPT-4更高的準(zhǔn)確度與更出色的性能。
見智研究觀點(diǎn):
專用領(lǐng)域的AI模型將會此起彼伏的出現(xiàn),在通用模型的基礎(chǔ)上進(jìn)行專用數(shù)據(jù)的投喂和訓(xùn)練,很容易實(shí)現(xiàn)高于通用大模型的專項(xiàng)水平。未來還會有更多行業(yè)會采用這種方式進(jìn)行AI模型訓(xùn)練,包括金融、政府等領(lǐng)域;比如微軟開始向美國政府提供GPT-4和GPT-3兩個大型語言模型的聊天機(jī)器人技術(shù),未來可以基于Azure云服務(wù)進(jìn)行專項(xiàng)模型訓(xùn)練。
3、靈活調(diào)用各種API的Gorilla模型
UC伯克利華人博士生做了一個以大猩猩命名的Gorilla模型,可以靈活調(diào)用各種API,性能超過GPT-4。API的功能是一種通用語言,使不同的系統(tǒng)之間能夠進(jìn)行有效地溝通,正確使用API可以提高LLM與更廣泛的工具進(jìn)行互動的能力。
見智研究觀點(diǎn):
API調(diào)用一直是LLM大模型最具有挑戰(zhàn)對的任務(wù)之一,主要是由于無法生成準(zhǔn)確的輸入?yún)?shù),并且LLM容易對API調(diào)用的錯誤使用產(chǎn)生幻覺。Gorilla的優(yōu)勢在于理解和推理約束能力,并且還能夠大大緩解了LLM會經(jīng)常遇到的幻覺問題,使得檢索反饋結(jié)果的準(zhǔn)確性更高。
4、MetaVL: 將上下文學(xué)習(xí)能力從語言模型遷移到視覺,開啟下一個多模態(tài)時代
實(shí)驗(yàn)證明,跨模態(tài)的上下文學(xué)習(xí)能力可以轉(zhuǎn)移,該模型顯著提高了視覺-語言任務(wù)上的上下文學(xué)習(xí)能力,并且在模型大小方面能夠有顯著的優(yōu)化,例如在VQA、OK-VQA和GQA上,所提出方法在參數(shù)數(shù)量減少約20倍的情況下超過了基準(zhǔn)模型。
見智研究觀點(diǎn):
上下文學(xué)習(xí)能力從單模態(tài)遷移到多模態(tài)的可能性,證明了在視覺-語言任務(wù)中通過遷移可以顯著提升上下文學(xué)習(xí)能力,甚至在模型大小方面實(shí)現(xiàn)優(yōu)化。這意味著多模態(tài)情況下的對話能力將得到加強(qiáng),對于現(xiàn)有的文生圖來說可能會帶來新的變化,生成模式對用戶將更友好。
5、給GPT寫指令的APP
CCF理論計(jì)算機(jī)科學(xué)技術(shù)委員會委員張長旺,開發(fā)了一個基于低代碼提示語的快速應(yīng)用開發(fā)框架PromptAppGPT,可以實(shí)現(xiàn)基于GPT的自然語言快速應(yīng)用開發(fā)。
見智研究觀點(diǎn):
ChatGPT能夠發(fā)揮多少能力,很大程度上取決于Prompt的質(zhì)量。Prompt是指用戶在發(fā)起對話時輸入的初始消息,作為與模型進(jìn)行交互的指令方式。所以這是為什么現(xiàn)在都在學(xué)習(xí)Prompt的核心原因。
而PromptAppGPT的推出能夠幫助用戶大大提高效率,提供多任務(wù)條件觸發(fā)、結(jié)果驗(yàn)證和失敗重試能力,可以讓原本需要多步驟的手動生成任務(wù)變成自動完成,不需要自己記憶和輸入繁瑣的Prompt咒語,只輸入任務(wù)核心必要信息就可以輕松完成任務(wù)。
應(yīng)用
1、Stability AI又放大招,核彈級更新一鍵擴(kuò)圖
AI修圖繼續(xù)開卷,PS平替Uncrop Clipdrop一鍵擴(kuò)圖+重構(gòu)圖片。
Stability AI又又又更新了,它聯(lián)合Clipdrop推出了Uncrop Clipdrop——一個終極圖像比例編輯器。通過創(chuàng)建擴(kuò)展背景,這個工具可以補(bǔ)充任何現(xiàn)有照片或圖像,來更改任何圖像的比例。
見智研究觀點(diǎn):
AI作圖圈幾乎每周都會有重磅更新,之前我們也持續(xù)對AI作圖產(chǎn)品和工具進(jìn)行更新,上周還有谷歌定制大師StyleDrop又來炸場。AI作圖可以說是AI應(yīng)用內(nèi)卷最嚴(yán)重的賽道了,無論是巨頭還是小廠都將作圖大戰(zhàn)進(jìn)行到了白熱化的階段。從這個節(jié)奏來看,無疑是對用戶端的最大利好,未來AI高質(zhì)量作圖免費(fèi)也會成為常態(tài)化趨勢。
2、強(qiáng)大的3D角色生成引擎重磅來襲,游戲、影視動畫創(chuàng)作將直接受益
Tafi一家領(lǐng)先的3D數(shù)字內(nèi)容和軟件提供商剛剛宣布推出一款突破性的文本轉(zhuǎn)3D角色引擎,該引擎將改變藝術(shù)家、開發(fā)人員和其他專業(yè)人士的創(chuàng)作過程。僅基于簡單的文本輸入,即可在幾分鐘內(nèi)輕松生成高質(zhì)量的3D角色。生成數(shù)百億種獨(dú)特的 3D 角色變體。 將角色直接導(dǎo)出到Blender,Unreal或Unity。
見智研究觀點(diǎn):
該款引擎的推出極大的解決了3D創(chuàng)作中最困難的部分,將使得3D角色創(chuàng)造成本更低。傳統(tǒng)的視覺訓(xùn)練模型渲染非常耗費(fèi)時間,而Tafi的這款基于自然語言文本生成自定義 3D 字符的引擎不僅僅使得每一個3D角色都是獨(dú)一無二的,更重要的創(chuàng)作時間縮短到只要幾分鐘。這對于游戲NPC、影視動畫角色的創(chuàng)建帶來極大的降本增效。
3、Carbon Health的新AI工具通過生成記錄和計(jì)費(fèi)代碼來減少醫(yī)生的工作量
采用GPT來創(chuàng)建醫(yī)療記錄不僅僅是能夠提高醫(yī)生的工作效率,同時還能夠有助于提供更加標(biāo)準(zhǔn)化和一致的醫(yī)療記錄,這對于不同醫(yī)院病歷之間的協(xié)作和信息共享非常重要。
見智研究觀點(diǎn):AI工具還能夠?yàn)獒t(yī)生提供有關(guān)患者護(hù)理的指南和建議,基于大量的醫(yī)療知識和數(shù)據(jù)。這有助于醫(yī)生做出更準(zhǔn)確、更綜合的診斷和治療決策,提高患者的治療效果。
但仍需注意的是:盡管AI在醫(yī)療記錄方面具有很多優(yōu)勢,但它并不能完全取代醫(yī)生的專業(yè)判斷和臨床經(jīng)驗(yàn)。
下周關(guān)注
360智腦發(fā)布會定檔6月13日。
風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: