AI見聞日?qǐng)?bào):見智實(shí)測(cè)“超級(jí)網(wǎng)紅”Runway Gen2,一鍵文生視頻,比Midjourney更易用 | 見智研究
今日要點(diǎn):
1、谷歌大手筆投資的Runway正式發(fā)布Gen2,文字生成視頻成真,內(nèi)附見智實(shí)測(cè);
2、360智腦通過中國(guó)信通院可信AIGC大語言模型功能評(píng)估,為國(guó)內(nèi)首家;
(資料圖)
3、阿里達(dá)摩院開源Video-LLaMA,幫大語言模型加上“眼睛”、“耳朵”;
4、AI生成二維碼—將快速應(yīng)用于廣告市場(chǎng);
每日AI
1、谷歌大手筆投資的Runway正式發(fā)布Gen2,文字生成視頻成真,內(nèi)附見智實(shí)測(cè)
今天,真正的文本一鍵生成視頻出現(xiàn)了。Stable Diffusion和《瞬息全宇宙》背后技術(shù)公司Runway,出品的text?to?video的AI視頻編輯工具Gen2,今日開放用戶使用。Gen2,也在內(nèi)測(cè)階段就被網(wǎng)友稱贊“視頻界的Midjourney”。
見智今天使用runway的app版本做了一個(gè)貓的視頻;Prompt:?A golden gradient cat is jumping in the grass,同時(shí)又給了一張小貓咪的圖作為模板。
目前來看runway已經(jīng)能夠按照指令生成相應(yīng)的視頻,但是精細(xì)程度和對(duì)prompt的理解程度相對(duì)圖片生成平臺(tái)Midjourney還是明顯要弱一些的。但是隨著用戶大規(guī)模的使用改進(jìn),相信Runway的Gen2很快可以風(fēng)靡小視頻創(chuàng)作領(lǐng)域。
見智點(diǎn)評(píng):隨著多模態(tài)模型的發(fā)展,從文字-圖片-視頻之間的相互生成將改變整個(gè)用戶生態(tài)。對(duì)于產(chǎn)業(yè)界來說,只成為素材生產(chǎn)者還遠(yuǎn)遠(yuǎn)不夠,能夠?qū)⑸伤夭倪M(jìn)一步便捷讓用戶生成最終形態(tài)應(yīng)用將是AI應(yīng)用發(fā)展更重要的一步。
2、360智腦通過中國(guó)信通院可信AIGC大語言模型功能評(píng)估,為國(guó)內(nèi)首家
360智腦的360GPT-S2-V8型號(hào)產(chǎn)品獲得了中國(guó)信息通信研究院“可信AIGC大語言模型基礎(chǔ)能力”評(píng)估報(bào)告,報(bào)告顯示必選項(xiàng)目評(píng)估內(nèi)容均通過。據(jù)悉,360智腦是國(guó)內(nèi)首個(gè)通過中國(guó)信通院該項(xiàng)權(quán)威評(píng)估的大模型產(chǎn)品。
見智點(diǎn)評(píng):360智腦成為首家通過中國(guó)信通院權(quán)威認(rèn)證,一方面說明了通用大模型的基礎(chǔ)能力得到認(rèn)可,重要的是數(shù)據(jù)集的安全性有了國(guó)家的背書,更有助于之后大范圍的商用應(yīng)用推廣。同時(shí)關(guān)注明天的360智腦發(fā)布會(huì)。
3、阿里達(dá)摩院開源Video-LLaMA,幫大語言模型加上“眼睛”、“耳朵”
阿里達(dá)摩院的研究人員提出了 Video-LLaMA,一個(gè)具有綜合視聽能力大模型。Video-LLaMA 能夠感知和理解視頻中的視頻和音頻信號(hào), ?并能理解用戶輸入的指令,完成一系列基于音視頻的復(fù)雜任務(wù),例如音 / 視頻描述,寫作,問答等。目前論文,代碼,交互 demo 都已開放。另外,在 Video-LLaMA 的項(xiàng)目主頁(yè)中,該研究團(tuán)隊(duì)還提供了中文版本的模型,讓中文用戶的體驗(yàn)更絲滑。
見智點(diǎn)評(píng):阿里達(dá)摩院讓Video-LLaMA開源,進(jìn)一步推動(dòng)國(guó)內(nèi)多模態(tài)大模型的發(fā)展進(jìn)程。視聽綜合大模型非常適用于辦公、學(xué)習(xí)領(lǐng)域的應(yīng)用。另外,Video-LLaMA大模型對(duì)于靜態(tài)圖像也有比較強(qiáng)的理解能力,能夠完成圖片描述和問答。
4、AI生成二維碼—將快速應(yīng)用于廣告市場(chǎng)
擺脫單調(diào)的黑白,使用 ControlNet 的 AI 生成的二維碼將更具特色和商業(yè)價(jià)值。
具體來看一個(gè)應(yīng)用顯示:識(shí)別二維碼推薦的是QRBTF -就是一款能夠制作漂亮有趣二維碼的免費(fèi)開源在線工具;
見智點(diǎn)評(píng):ControlNet是基于Stable_Diffusion進(jìn)行AI生成的一種訓(xùn)練方式,它的特點(diǎn)是計(jì)算方法更高效,因?yàn)橛?xùn)練不需要在原始編碼器上進(jìn)行,所以更節(jié)省GPU內(nèi)存,訓(xùn)練速度也更快。最值得關(guān)注的是,ControlNet這種有控制的生成AI圖像更能夠得到我們想要的圖片結(jié)果,同時(shí)操作方式簡(jiǎn)單能夠在PC端運(yùn)行。
從應(yīng)用層面來看,我們看到這種創(chuàng)意形 AI 生成的二維碼更能夠具有品牌專屬特性且方便進(jìn)行品牌或者網(wǎng)站等任何產(chǎn)品的推廣應(yīng)用。在不久的將來,這將在廣告中越來越普遍。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: