AI一周見(jiàn)聞:微軟win11啟動(dòng)AI變革;英偉達(dá)助力辦公軟件降本23%;視頻訓(xùn)練成為機(jī)器人重要學(xué)習(xí)路徑 | 見(jiàn)智研究
見(jiàn)智視角
本周AI的重要風(fēng)向在win操作系統(tǒng)、辦公軟件應(yīng)用和大模型私有化部署所展現(xiàn)出巨大的市場(chǎng)潛力。微軟的操作系統(tǒng)變革將為用戶(hù)帶來(lái)更智能、高效的體驗(yàn),辦公軟件應(yīng)用的AI技術(shù)將提高圖像處理能力,而大模型私有化部署的發(fā)展將使AI在to B應(yīng)用上更加安全可控,這些趨勢(shì)將對(duì)相關(guān)行業(yè)和公司的發(fā)展產(chǎn)生重要影響,為AI的廣泛應(yīng)用提供更多機(jī)遇。
本周要點(diǎn)
AI應(yīng)用:
(資料圖片)
Copilot"落戶(hù)"Windows11,操作系統(tǒng)的AI變革時(shí)刻已來(lái)金山辦公引入英偉達(dá)推理服務(wù)器和GPU,圖像任務(wù)能降本23%Midjourney 5.2又更新,這次AI生圖開(kāi)始卷向表情包十秒剪視頻,Whisper模型讓每個(gè)人都能成為“剪輯師”機(jī)器人看YouTube學(xué)會(huì)做家務(wù),大規(guī)模視頻訓(xùn)練機(jī)器人成為重要路徑Unity推出AI Hub平臺(tái),股價(jià)飆漲 15%,AI革命游戲的進(jìn)程在加速大模型:
谷歌 DeepMind花數(shù)千萬(wàn)美元打造ChatGPT的競(jìng)品,多模態(tài)視頻訓(xùn)練將成為特色PrivateGPT 開(kāi)源模型可實(shí)現(xiàn)不連網(wǎng)提問(wèn);本地部署未來(lái)空間大恒生電子發(fā)布金融行業(yè)大模型LightGPT,金融大模型場(chǎng)景多樣化,需求確定性強(qiáng)智譜AI為大模型應(yīng)用更近一步!成為法律專(zhuān)用大模型底座融資風(fēng)向:AI安全成為資本的下一個(gè)風(fēng)口,CalypsoAI融資2300萬(wàn)美元
AI應(yīng)用
1、Copilot"落戶(hù)"Windows11,操作系統(tǒng)的AI變革時(shí)刻已來(lái)
微軟官宣向開(kāi)發(fā)者頻道中的 Windows Insiders 提供 Windows Copilot 的早期預(yù)覽。
第一個(gè)預(yù)覽版重點(diǎn)關(guān)注集成 UI 體驗(yàn),Windows Copilot 將顯示為??吭谟覀?cè)的側(cè)欄,不會(huì)與桌面內(nèi)容重疊,并且將在打開(kāi)的應(yīng)用程序窗口旁邊無(wú)障礙運(yùn)行,可以隨時(shí)與 Windows Copilot 進(jìn)行交互。 ?
在window11?Copilot 的預(yù)覽版本中,用戶(hù)可以提出以下種類(lèi)問(wèn)題:
內(nèi)容涉及:個(gè)性化系統(tǒng)設(shè)置、截圖、文生文和文生圖的功能;
此外,Win11更新還包括本機(jī)支持讀取其他存檔文件格式 ;如常見(jiàn).rar\ .7z等壓縮文件;
見(jiàn)智點(diǎn)評(píng):
微軟兌現(xiàn)了在 5 月份的 Build 大會(huì)上的承諾,本次Copilot 的預(yù)覽版本落地win11,成為操作系統(tǒng)邁入AI時(shí)代的重要一步,之后win11會(huì)成為第一代AI系統(tǒng)的大規(guī)模商用版本;此外,微軟也表示在25年會(huì)停止win10的服務(wù),包括專(zhuān)業(yè)版和家庭版,意味著那時(shí)起操作系統(tǒng)將會(huì)全面進(jìn)入AI 時(shí)代。這將為用戶(hù)提供更智能、高效的操作體驗(yàn),并為微軟帶來(lái)新的商業(yè)機(jī)會(huì)。
2、 金山辦公引入英偉達(dá)推理服務(wù)器和GPU,圖像任務(wù)能降本23%
金山辦公官宣與NVIDIA 團(tuán)隊(duì)合作,為解決圖像識(shí)別和理解任務(wù)耗時(shí)過(guò)長(zhǎng)和成本的問(wèn)題,
引入 ?NVIDIA T4 Tensor Core GPU 進(jìn)行推理、NVIDIA TensorRT 8.2.4 進(jìn)行模型加速、NVIDIA Triton 推理服務(wù)器 22.04 在 K8S 上進(jìn)行模型部署與編排。
通過(guò) GPU 推理和 TensorRT 加速,成功將耗時(shí)從15秒降低到了 2.4 秒左右;部署成本節(jié)省了 23% 。
見(jiàn)智點(diǎn)評(píng):
英偉達(dá)推理服務(wù)器的部署,成功優(yōu)化了GPU的利用率,提高了辦公軟件對(duì)圖像文檔識(shí)別和推理的效率,能夠?qū)崿F(xiàn)辦公軟件業(yè)務(wù)降本增效的預(yù)期。這一合作為WPS AI的落地應(yīng)用提供了更高效的解決方案,這部分 AI 新能力集中在閱讀理解、問(wèn)答、人機(jī)交互等方面。
WPS AI 已經(jīng)開(kāi)始內(nèi)測(cè)階段,啟動(dòng)大規(guī)模商用后,對(duì)國(guó)內(nèi)辦公軟件使用體驗(yàn)將帶來(lái)全面升級(jí)。這一合作將提升金山辦公的圖像處理能力,并為其在辦公軟件市場(chǎng)中的競(jìng)爭(zhēng)力帶來(lái)優(yōu)勢(shì)。
3、Midjourney 5.2又更新,這次AI生圖開(kāi)始卷向表情包
Midjourney 5.2更新「weird」新功能,可自定義詭異等級(jí)。根據(jù)官網(wǎng)顯示通過(guò)調(diào)節(jié)weird參數(shù)的大小即能夠控制生成照片的詭異風(fēng)格,參數(shù)越大照片越奇怪;但是該功能還只限于付費(fèi)用戶(hù)使用;
此外,還更新了「turbo」模式:該功能是能夠以四倍速加速圖片生成;不過(guò)相較于傳統(tǒng)快速作業(yè)模式仍舊是需要消耗2倍的GPU;
見(jiàn)智點(diǎn)評(píng):
圖片生成在AI的影響下正在從傳統(tǒng)模式進(jìn)入一種新范式,weird模式增加了圖片超越常規(guī)認(rèn)知的可能性創(chuàng)作,這種模式具備更多娛樂(lè)屬性,如果免費(fèi)開(kāi)放應(yīng)用,那么大概率會(huì)在社交圈引爆。這一更新將進(jìn)一步推動(dòng)表情包制作的自動(dòng)化和智能化,為用戶(hù)提供更多創(chuàng)意和娛樂(lè)選擇。
4、十秒剪視頻,Whisper模型讓每個(gè)人都能成為“剪輯師”
荷蘭開(kāi)發(fā)者M(jìn)atthijs Hollemans在HuggingFace上基于Whisper開(kāi)發(fā)了視頻剪輯新功能,現(xiàn)在剪視頻能夠精準(zhǔn)到每個(gè)字。
在平臺(tái)上可以對(duì)上傳的視頻內(nèi)容進(jìn)行同步文字轉(zhuǎn)化,只需要選擇留下的文字,然后就可以直接生成所需的片段。使用過(guò)程非常簡(jiǎn)單,可累比相機(jī)界的“傻瓜相機(jī)”。
見(jiàn)智點(diǎn)評(píng):
AI應(yīng)用層出不窮,此前主要是AI生成圖片內(nèi)卷非常嚴(yán)重,幾乎是每周都有重要更新,現(xiàn)在這個(gè)迭代速度已經(jīng)開(kāi)始向視頻領(lǐng)域蔓延,這個(gè)小白剪視頻的功能讓剪視頻門(mén)檻大大降低,同時(shí)節(jié)省了很多制作時(shí)間,效率優(yōu)化超過(guò)90%,對(duì)于視頻創(chuàng)作行業(yè)來(lái)說(shuō)具有重大影響。這將進(jìn)一步推動(dòng)用戶(hù)在社交媒體上的創(chuàng)作和分享活動(dòng),對(duì)于Whisper模型的開(kāi)發(fā)商來(lái)說(shuō),商業(yè)機(jī)會(huì)也將隨之增加。
5、機(jī)器人看YouTube學(xué)會(huì)做家務(wù),大規(guī)模視頻訓(xùn)練機(jī)器人成為重要路徑
CMU機(jī)器人研究所助理教授Deepak Pathak展示了一種視覺(jué)機(jī)器人橋方法(VRB);通過(guò)讓機(jī)器觀看人類(lèi)行為方式的視頻完成行為模擬,并驗(yàn)證了該方法的有效性。機(jī)器人觀看了幾個(gè)人類(lèi)開(kāi)抽屜的視頻后,可以效仿人類(lèi)行為做出打開(kāi)抽屜的動(dòng)作。
見(jiàn)智點(diǎn)評(píng):
這種方法的關(guān)鍵在于利用大規(guī)模的視頻數(shù)據(jù)來(lái)訓(xùn)練機(jī)器人,并從中學(xué)習(xí)人類(lèi)行為和操作。這為機(jī)器人的應(yīng)用提供了更廣泛的可能性,可以通過(guò)觀察互聯(lián)網(wǎng)和YouTube等視頻來(lái)獲取更多的訓(xùn)練數(shù)據(jù)。這種方法可以改進(jìn)機(jī)器人的操作能力,并為機(jī)器人在日常生活中的應(yīng)用提供更多的機(jī)會(huì)。
視頻訓(xùn)練將成為機(jī)器人學(xué)習(xí)的重要路徑,進(jìn)一步推動(dòng)機(jī)器人技術(shù)在家庭和服務(wù)領(lǐng)域的應(yīng)用和發(fā)展。
6、Unity推出AI Hub平臺(tái),股價(jià)飆漲 15%,AI革命游戲的進(jìn)程在加速
全球領(lǐng)先的3D內(nèi)容平臺(tái)Unity宣布推出AI Hub平臺(tái),允許 AI 軟件開(kāi)發(fā)者通過(guò) AI Hub 向游戲研發(fā)商直接供應(yīng)開(kāi)發(fā)軟件,并通過(guò) Unity 的 Asset Store 收費(fèi);
同時(shí)推出了10個(gè)經(jīng)驗(yàn)證的解決方案,還在Unity Asset Store中推出兩款新的AI產(chǎn)品“Unity Sentis“及“Unity Muse”并正式啟動(dòng)內(nèi)測(cè),預(yù)計(jì)將賦能AI驅(qū)動(dòng)的游戲開(kāi)發(fā)效率提升以及玩法升級(jí)。
見(jiàn)智點(diǎn)評(píng):
AI將以非常迅速的節(jié)奏改變游戲制作方式以及降低成本,這已經(jīng)成為游戲行業(yè)不可逆轉(zhuǎn)的路徑。游戲行業(yè)的格局或許也會(huì)因?yàn)樯墒紸I帶來(lái)巨變,AI革命游戲行業(yè)的進(jìn)程在加速。
新AI平臺(tái)的推出印證了目前開(kāi)發(fā)人員對(duì)于AI工具的巨大需求存在,而Unity似乎已經(jīng)找到了新的盈利模式,AI Hub平臺(tái)很快將成為開(kāi)發(fā)者和游戲公司最受歡迎的資源聚合平臺(tái),看起來(lái)Unity將會(huì)在這場(chǎng)全新變革中賺的盆滿(mǎn)缽滿(mǎn)
大模型
1、谷歌 DeepMind花數(shù)千萬(wàn)美元打造ChatGPT的競(jìng)品,多模態(tài)視頻訓(xùn)練將成為特色
谷歌DeepMind CEO Hassabis近日對(duì)外媒Wired表示,Gemini還在開(kāi)發(fā)中,還需要幾個(gè)月,而谷歌DeepMind已經(jīng)準(zhǔn)備砸進(jìn)數(shù)千萬(wàn)美元,甚至數(shù)億。
The Information最近的一篇報(bào)道表述:谷歌的研究人員一直在使用YouTube來(lái)開(kāi)發(fā)Gemini。
人工智能從業(yè)者表示:這可能是谷歌DeepMind的一個(gè)優(yōu)勢(shì),因?yàn)樗梢浴氨茸ト∫曨l的競(jìng)爭(zhēng)對(duì)手更完整地訪問(wèn)視頻數(shù)據(jù)”。
見(jiàn)智點(diǎn)評(píng):
Google或是受到上一代聊天機(jī)器人Bard發(fā)布會(huì)重大失誤的刺激,目前對(duì)Gemini給予了厚望,希望不僅僅是對(duì)標(biāo)ChatGPT,更想要超越,所以在訓(xùn)練下一代聊天機(jī)器人時(shí)候,更側(cè)重多模態(tài)訓(xùn)練,特別是視頻數(shù)據(jù)投喂,這點(diǎn)目前是ChatGPT所做不到的,也是Google想要的差異化市場(chǎng)競(jìng)爭(zhēng),大廠對(duì)大模型的爭(zhēng)奪仍在繼續(xù)。
2、PrivateGPT 開(kāi)源模型可實(shí)現(xiàn)不連網(wǎng)提問(wèn);本地部署未來(lái)空間大
開(kāi)發(fā)者Iván Martínez Toro發(fā)布了PrivateGPT開(kāi)源模型,該模型允許用戶(hù)在無(wú)需互聯(lián)網(wǎng)連接的情況下,通過(guò)提供自己的文檔來(lái)向模型提問(wèn)。
PrivateGPT可以在家用設(shè)備上進(jìn)行本地運(yùn)行,使用前需要下載名為"gpt4all"的開(kāi)源大語(yǔ)言模型(LLM)。用戶(hù)需要將所有相關(guān)文件放入一個(gè)目錄中,以供模型引入所有數(shù)據(jù)。完成LLM的訓(xùn)練后,用戶(hù)可以向模型提出任何問(wèn)題,它將使用提供的文檔作為上下文來(lái)回答。PrivateGPT能夠處理超過(guò)58000個(gè)單詞,目前需要大量本地計(jì)算資源(推薦使用高端CPU)進(jìn)行設(shè)置。
Toro表示,當(dāng)前PrivateGPT處于概念驗(yàn)證(PoC)階段,它至少證明了可以在本地創(chuàng)建類(lèi)似于ChatGPT的大模型??梢灶A(yù)見(jiàn),一旦這種PoC轉(zhuǎn)變?yōu)閷?shí)際產(chǎn)品,PrivateGPT將具備讓公司獲得個(gè)性化、安全和私密的ChatGPT來(lái)提高生產(chǎn)力的潛力。
見(jiàn)智點(diǎn)評(píng):
PrivateGPT開(kāi)啟行業(yè)對(duì)本地化部署的重視程度,這對(duì)于那些關(guān)注數(shù)據(jù)隱私和安全的行業(yè)和個(gè)人非常重要。通過(guò)本地化部署,用戶(hù)可以更好地控制和保護(hù)他們的數(shù)據(jù),減少了數(shù)據(jù)泄露和侵犯隱私的風(fēng)險(xiǎn);開(kāi)源模型和本地化部署將在未來(lái)產(chǎn)生積極的影響。
3、恒生電子發(fā)布金融行業(yè)大模型LightGPT,金融大模型場(chǎng)景多樣化,需求確定性強(qiáng)
LightGPT可以為投顧、客服、投研、運(yùn)營(yíng)、風(fēng)控、合規(guī)、研發(fā)等金融業(yè)務(wù)場(chǎng)景提供底層AI能服務(wù),支持超過(guò)80+金融專(zhuān)屬任務(wù)指令微調(diào)。具備金融專(zhuān)業(yè)問(wèn)答、邏輯推理、超長(zhǎng)文本處理能力、多模態(tài)交互能力、代碼處理等能力;
模型使用了超4000億tokens的金融領(lǐng)域數(shù)據(jù)(包括資訊、公告、研報(bào)、結(jié)構(gòu)化數(shù)據(jù)等)和超過(guò)400億tokens的語(yǔ)種強(qiáng)化數(shù)據(jù)(包括金融教材、金融百科、政府報(bào)告、法規(guī)條例等),并以之作為大模型的二次預(yù)訓(xùn)練語(yǔ)料。
LightGPT擁有更為豐富、輕量化的部署方式,支持私有化/云部署以及靈活A(yù)PI調(diào)用,推理端僅需一機(jī)2卡部署。
見(jiàn)智點(diǎn)評(píng):
一方面基于數(shù)據(jù)安全,一方面基于應(yīng)用場(chǎng)景多樣化,金融大模型的需求確定性很強(qiáng)。
此前彭博已推出金融行業(yè)大語(yǔ)言模型BloombergGPT;騰訊云也正在攜手神州信息開(kāi)展金融大模型合作;此前我們也作過(guò)多次金融大模型發(fā)展的動(dòng)態(tài)點(diǎn)評(píng),很多券商、銀行和基金公司都在進(jìn)行AI研發(fā)投入,以及AI產(chǎn)品的推出;恒生電子基于此前金融行業(yè)多年的IT服務(wù)經(jīng)驗(yàn),本次推出LightGPT大模型具有重要意義,之后我們也會(huì)繼續(xù)跟進(jìn)LightGPT開(kāi)放測(cè)試之后的體驗(yàn)反饋。
4、智譜AI為大模型應(yīng)用更近一步!成為法律專(zhuān)用大模型底座
冪律聯(lián)合智譜AI發(fā)布基于中文千億大模型的法律垂直大模型——PowerLawGLM,聚焦于法律細(xì)分領(lǐng)域,針對(duì)中文法律場(chǎng)景的應(yīng)用效果具有獨(dú)特優(yōu)勢(shì),具備豐富的法律知識(shí)和法律語(yǔ)言理解能力。
基于PowerLawGLM大模型的能力,冪律還打造了法律對(duì)話產(chǎn)品ChatMe,現(xiàn)已正式上線,首批開(kāi)放50個(gè)內(nèi)測(cè)名額
PowerLawGLM是基于智譜的ChatGLM 130B通用千億對(duì)話大模型進(jìn)行聯(lián)合研發(fā),經(jīng)過(guò)多輪多次高質(zhì)量法律文本數(shù)據(jù)(裁判文書(shū)、法律法規(guī)、法律知識(shí)問(wèn)答等)清洗及模型增量訓(xùn)練,得到法律版基座大模型LawGLM 130B。在100個(gè)問(wèn)題的評(píng)測(cè)結(jié)果上來(lái)看:PowerLawGLM可實(shí)現(xiàn)70%左右的最優(yōu)答案。
見(jiàn)智點(diǎn)評(píng):
大模型如果直接應(yīng)用在法律領(lǐng)域,會(huì)存在輸出結(jié)果與需求很?chē)?yán)重不匹配程度很高的問(wèn)題。因?yàn)榇竽P偷臄?shù)據(jù)結(jié)果是基于數(shù)據(jù)訓(xùn)練來(lái)生成的,但是不同國(guó)家的法律規(guī)則是完全不同的,具有很強(qiáng)的專(zhuān)業(yè)性和區(qū)域限制,所以采用全球通用大模型很難得到滿(mǎn)意的內(nèi)容。
中文千億大模型的法律垂直大模型PowerLawGLM就能夠很好的適配我國(guó)的案例情況。中文法律大模型僅僅是一個(gè)開(kāi)始,未來(lái)很多行業(yè)都會(huì)陸續(xù)推出專(zhuān)業(yè)領(lǐng)域的大模型,同時(shí)會(huì)基于垂直大模型打造人工智能對(duì)話產(chǎn)品。智譜AI做為最底層模型,對(duì)于開(kāi)發(fā)專(zhuān)業(yè)領(lǐng)域大模型具有重要意義;之前還開(kāi)源過(guò)一個(gè)更小容量的ChatGLM-6B模型,特別適合學(xué)習(xí)和輕量開(kāi)發(fā);另外最值得關(guān)注的是大模型訓(xùn)練中如何平衡訓(xùn)練穩(wěn)定性和效率。
AI融資
AI安全成為資本的下一個(gè)風(fēng)口,CalypsoAI融資2300萬(wàn)美元
CalypsoAI的產(chǎn)品可對(duì)標(biāo)360安全管家,主要發(fā)布一些ChatGPT等大語(yǔ)言模型提供安全護(hù)欄的產(chǎn)品,包括惡意代碼檢測(cè)、越獄預(yù)防等特色防護(hù)功能。要解決數(shù)據(jù)隱私、安全防護(hù)、輸出非法信息等難點(diǎn),以加快金融、醫(yī)療、法律等行業(yè)對(duì)ChatGPT等生成式AI產(chǎn)品的場(chǎng)景化落地。
CalypsoAI在官網(wǎng)宣布,獲得2300萬(wàn)美元(約1.6億元)A-1輪融資。本次由Paladin Capital Group 領(lǐng)投,洛克希德·馬丁風(fēng)險(xiǎn)投資、Hakluyt Capital等跟投。
見(jiàn)智點(diǎn)評(píng):
資本的關(guān)注焦點(diǎn)已經(jīng)不局限于大模型、AI應(yīng)用、現(xiàn)在已經(jīng)開(kāi)始下注AI安全產(chǎn)品。畢竟大模型做為底層工具,一旦被污染或遭受攻擊,輸出的內(nèi)容則會(huì)完全偏離預(yù)期,無(wú)疑是對(duì)算力資源的浪費(fèi),同時(shí)還會(huì)產(chǎn)生公司數(shù)據(jù)泄露等安全問(wèn)題。所以AI安全產(chǎn)品也必然會(huì)成為未來(lái)市場(chǎng)需求的一個(gè)重要領(lǐng)域。
下周關(guān)注:人工智能大會(huì)
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: