AI見(jiàn)聞日?qǐng)?bào):AI智能體成為科技巨頭爭(zhēng)搶的新風(fēng)口 | 見(jiàn)智研究 當(dāng)前熱聞
今日要點(diǎn)
1、AI智能體成為科技巨頭爭(zhēng)搶的新風(fēng)口;
2、宣稱(chēng)超越Gen-2還免費(fèi)開(kāi)放,文生視頻大模型進(jìn)入開(kāi)源競(jìng)賽;
3、國(guó)內(nèi)發(fā)布首個(gè)胸部X-ray診斷大模型,將提高醫(yī)療診斷準(zhǔn)確性和效率;
(資料圖)
每日見(jiàn)智AI
1、AI智能體成為科技巨頭爭(zhēng)搶的新風(fēng)口
近期,AI?領(lǐng)域的大佬和科技巨頭對(duì)人工智能智能體的發(fā)展表現(xiàn)出極大興趣,并寄予了厚望。特斯拉前AI總監(jiān)、今年年初回歸OpenAI的Andrej?Karpathy近日在一次開(kāi)發(fā)者活動(dòng)上透露,OpenAI內(nèi)部對(duì)于新的AI智能體論文表現(xiàn)出極大興趣,并進(jìn)行認(rèn)真討論。
與此同時(shí),英偉達(dá)公司開(kāi)源的VOYAGER也給AI圈帶來(lái)了轟動(dòng)效應(yīng)。作為一個(gè)基于大模型驅(qū)動(dòng)和具備終身學(xué)習(xí)能力的游戲智能體,VOYAGER在《我的世界》中展現(xiàn)出了非凡的水平。這一成就進(jìn)一步引發(fā)了對(duì)于AI智能體的興趣,并被認(rèn)為是通用人工智能(AGI)的雛形之一。
見(jiàn)智點(diǎn)評(píng):
盡管目前這些AI智能體還遠(yuǎn)未達(dá)到完全模擬人類(lèi)智能的程度,但其出現(xiàn)表明了人工智能領(lǐng)域正在不斷向前發(fā)展,并且吸引了全球范圍內(nèi)的關(guān)注。對(duì)于這些智能體的研究和開(kāi)發(fā)有望為我們?cè)谖磥?lái)實(shí)現(xiàn)通用人工智能的目標(biāo)邁出重要一步。
隨著越來(lái)越多的公司和研究機(jī)構(gòu)投入到AI智能體的研究中;比如已經(jīng)出現(xiàn)用于科學(xué)發(fā)現(xiàn)的智能體ChemCro能夠完成有機(jī)合成、藥物發(fā)現(xiàn)和材料設(shè)計(jì)等任務(wù);未來(lái)可以預(yù)見(jiàn),我們將會(huì)看到更多令人驚嘆的成果和突破,推動(dòng)人工智能技術(shù)邁向新的高度。
2、宣稱(chēng)超越Gen-2還免費(fèi)開(kāi)放,文生視頻大模型進(jìn)入開(kāi)源競(jìng)賽
最近,Huggingface上有作者發(fā)布了一個(gè)文生視頻模型Zeroscope_v2,開(kāi)發(fā)者cerspense表示,他的目標(biāo)就是和Gen-2進(jìn)行開(kāi)源較量,即提高模型質(zhì)量的同時(shí),還能免費(fèi)供大眾使用。
Zeroscope_v2大模型是基于17億參數(shù)量ModelScope-text-to-video-synthesis模型進(jìn)行二次開(kāi)發(fā)。相比于原版本,Zeroscope生成的視頻沒(méi)有水印,并且流暢度和分辨率都得到了提升,適配16:9的寬高比。
見(jiàn)智點(diǎn)評(píng):
文生視頻領(lǐng)域仍處于起步階段,可生成幾秒鐘的視頻且存在視覺(jué)缺陷。Zeroscope_v2的快速生成速度和較低的顯存需求使其適用于視頻概念的快速驗(yàn)證。這將幫助創(chuàng)作者、設(shè)計(jì)師等快速生成原型和樣本視頻,節(jié)省時(shí)間和資源成本。
但見(jiàn)智并不認(rèn)為目前該模型具備超越Gen2的能力;不過(guò)Zeroscope_v2為開(kāi)發(fā)者提供了高質(zhì)量的開(kāi)源模型,提高了視頻生成效率,同時(shí)也為文生視頻應(yīng)用的創(chuàng)新提供了更廣闊的可能性。
與文生圖不同,文生視頻領(lǐng)域面臨更高的資源需求和技術(shù)挑戰(zhàn),同時(shí)對(duì)時(shí)間和連貫性有更高的要求,應(yīng)用領(lǐng)域也更為廣泛。
3、國(guó)內(nèi)發(fā)布首個(gè)胸部X-ray診斷大模型,將提高醫(yī)療診斷準(zhǔn)確性和效率
上海交通大學(xué)與上海人工智能實(shí)驗(yàn)室聯(lián)合團(tuán)隊(duì)聚焦醫(yī)學(xué)人工智能,提出了首個(gè)基于醫(yī)學(xué)領(lǐng)域知識(shí)增強(qiáng)的?Chest?X-ray?的基礎(chǔ)模型:即?KAD(Knowledge-enhanced?Auto?Diagnosis?Model),論文成果入選Nature子刊。
KAD模型通過(guò)在大規(guī)模醫(yī)學(xué)影像與放射報(bào)告數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,通過(guò)文本編碼器對(duì)高質(zhì)量醫(yī)療知識(shí)圖譜進(jìn)行隱空間嵌入,利用視覺(jué)?-?語(yǔ)言模型聯(lián)合訓(xùn)練實(shí)現(xiàn)了知識(shí)增強(qiáng)的表征學(xué)習(xí)。
在不需要任何額外標(biāo)注情況下,KAD?模型即可直接應(yīng)用于任意胸片相關(guān)疾病的診斷,為開(kāi)發(fā)人工智能輔助診斷的基礎(chǔ)模型提供了一條切實(shí)可行的技術(shù)路線。
見(jiàn)智點(diǎn)評(píng):
KAD模型提出了一種基于知識(shí)增強(qiáng)的表征學(xué)習(xí)方法,為醫(yī)療基礎(chǔ)模型的應(yīng)用和落地提供了解決方案。其訓(xùn)練框架只需要影像-報(bào)告數(shù)據(jù),不依賴于人工注釋?zhuān)⑶覠o(wú)需監(jiān)督微調(diào)即可達(dá)到與專(zhuān)業(yè)醫(yī)生相當(dāng)?shù)木?。這一創(chuàng)新有望推動(dòng)醫(yī)療基礎(chǔ)模型在臨床實(shí)踐中的應(yīng)用,提高醫(yī)療效率和診斷準(zhǔn)確性。
總體而言,KAD模型在醫(yī)學(xué)人工智能領(lǐng)域具有重要的意義和影響。它為醫(yī)學(xué)影像診斷提供了一種新的技術(shù)路線,能夠加速診斷過(guò)程、提高準(zhǔn)確性,并為醫(yī)生提供更多的輔助信息。隨著該模型的進(jìn)一步發(fā)展和推廣,預(yù)計(jì)會(huì)促進(jìn)醫(yī)療基礎(chǔ)模型在臨床實(shí)踐中的廣泛應(yīng)用,為醫(yī)療行業(yè)帶來(lái)更多的創(chuàng)新和效益。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: