AI見聞日報:被曝光!BING和ChatGPT都要升級了,360多模態(tài)來了 | 見智研究
今日要點
微軟Bing要升級識圖功能;ChatGPT上傳文件更新遭泄露;Windows 12要來了;360智腦4.0發(fā)布,從對話進(jìn)入多模態(tài);Reddit 要API收費(fèi),訓(xùn)練語料成本大幅上升;又有音頻新應(yīng)用,每人都可以定制自己的AI語音克??;
每日見智AI
1、微軟Bing要升級識圖功能
有Reddit網(wǎng)友發(fā)現(xiàn),Bing的界面上突然就出現(xiàn)了個上傳圖片的選項。據(jù)說,上傳一張圖片之后,Bing什么都能干。不管是編程寫代碼、做題作圖,甚至看病,通通不在話下。(似乎還在小規(guī)模測試)
2、ChatGPT上傳文件更新遭泄露
(相關(guān)資料圖)
ChatGPT的新功能遭泄露?一位Reddit用戶在挖掘源代碼時遇到了一個新的ChatGPT界面,就像他們在發(fā)布前一周發(fā)現(xiàn)“聊天共享”功能。泄露的屏幕截圖展示了“工作區(qū)”,允許用戶創(chuàng)建ChatGPT可以輕松記住的配置文件,并且似乎還暗示了文件上傳這一功能。這一發(fā)現(xiàn)也符合 OpenAI 承諾未來推出 ChatGPT 業(yè)務(wù)變體的計劃。此外,還討論了新的隱私措施的推出,新業(yè)務(wù)ChatGPT不再使用用戶數(shù)據(jù)來訓(xùn)練模型。
見智點評:無論是Bing還是?ChatGPT的業(yè)務(wù)升級都符合市場的預(yù)期,在人工智能助手迭代速度越來越快的今天,識別圖片和文件也勢必要成為人工智能助手升級的重要方向,上傳文件功能的開通更能夠增加用戶對文本操作的便捷性;另外讓機(jī)器理解圖片的基本內(nèi)容是比較容易的,但是理解深層引申含義恐怕還比較難。
3、Windows 12要來了
根據(jù)微軟內(nèi)部測試的情況,Windows 12可能具備一個外觀不同的桌面和沒有系統(tǒng)托盤的浮動任務(wù)欄等獨(dú)特的功能根據(jù)微軟內(nèi)部測試的情況,Windows 12可能具備一個外觀不同的桌面和沒有系統(tǒng)托盤的浮動任務(wù)欄等獨(dú)特的功能。
新系統(tǒng)還將擁有深度集成的人工智能功能,而智能Snap UI和Windows Copilot只是其中一部分。盡管目前還沒有官方的消息確認(rèn),但這些傳聞已經(jīng)讓許多Windows用戶對Windows 12充滿了期待。
另外,微軟還宣布推出 NewBing 桌面語音聊天功能,在 BingChat 對話框中增加語音輸入按鈕,只需單擊 BingChat 對話框上的麥克風(fēng),即可用語音向 NewBing 提問。
見智點評:Windows12預(yù)計將全面結(jié)合AI功能,大概率將改變用戶對操作系統(tǒng)的長期使用習(xí)慣,AI功能集成到操作系統(tǒng)中將極大的提高工作效率。微軟此前還宣布將在6月開始在Windows11中提供Copilot,讓用戶盡早使用AI工具,并為之后的操作系統(tǒng)全面AI化進(jìn)行過度。
4、360智腦4.0發(fā)布,從對話進(jìn)入多模態(tài)
360智腦大會發(fā)布了最新4.0版本,目前已經(jīng)具備多模態(tài)功能,包括文生圖、圖生圖、圖生文、視頻理解和文生視頻。360全家桶也積極全面接入360智腦,包括安全衛(wèi)士、瀏覽器和桌面等場景。另外值得關(guān)注的就是數(shù)字人對話功能非常有趣,并且可以定制自己的數(shù)字人。預(yù)計下個月會發(fā)布5.0插件版本
見智點評:國內(nèi)大模型的迭代速度非???,特別是多模態(tài)競爭上未來一定是重要領(lǐng)域,將圖片、視頻、語音等多場景結(jié)合才能夠讓AI工具發(fā)揮出更出色的效果。另外,數(shù)字人現(xiàn)在也是非常重要的領(lǐng)域,由于成本的大幅下降,定制自己的數(shù)字人也非常方便,這將極大的推動數(shù)字人應(yīng)用的大范圍應(yīng)用落地。
5、Reddit 要API收費(fèi),訓(xùn)練語料成本大幅上升
Reddit 表示將在 7 月 1 日開始對現(xiàn)有 API 收費(fèi),屆時第三方 Reddit 都將無法正常使用。在 Reddit 新政策下,第三方每調(diào)用一千次 Reddit 的 API 需要支付 0.24 美元(約 1.71 元人民幣);
知名第三方 Reddit App,例如 RIF、ReddPlanet、Sync 也宣布將在同一天停止服務(wù)。RIF 表示自己的營收遠(yuǎn)遠(yuǎn)無法承擔(dān) Reddit API 所要的費(fèi)用。還包括自動駕駛開發(fā)平臺Apollo。
見智點評:Reddit是一家知名的在線論壇公司,同時給企業(yè)提供API用于訪問數(shù)據(jù),第三方公司可以創(chuàng)建與Reddit相關(guān)的應(yīng)用程序。
即便是收到了眾多第三方用戶的反對,但Reddit預(yù)計仍舊堅持推行收費(fèi)支付,因為目前Reddit還沒有盈利,隨著API調(diào)用量的激增,訓(xùn)練語料成本大幅上升,Reddit也需要有一定的收入來繼續(xù)運(yùn)營數(shù)據(jù)從而提供商業(yè)服務(wù)。
在品牌影響力已經(jīng)足夠大的時候,長期免費(fèi)并不符合公司的發(fā)展路徑,畢竟不是公益企業(yè),一切運(yùn)營都需要開支。短期來看,公司的用戶量肯定會受到影響,但是也會篩選出長期合作用戶以提供更優(yōu)質(zhì)的服務(wù)。
6、又有音頻新應(yīng)用,每人都可以定制自己的AI語音克隆
PlatTH可以為用戶定制免費(fèi)的AI語音克隆,準(zhǔn)確率高達(dá)99%。操作簡單,無需專業(yè)設(shè)備,只要上傳2-3小時的語音,便可以得到自己的克隆聲音。
見智點評:超逼真的AI語音克隆適用于眾多視頻生產(chǎn)和游戲領(lǐng)域。比如制作抖音短視頻、B站長視頻、還可以創(chuàng)建人工智能博客等等,AI工具的出現(xiàn)讓視頻生產(chǎn)的效率獲得極大的改變。
風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: