啟明創(chuàng)投發(fā)布生成式AI重磅報(bào)告!調(diào)研近200家相關(guān)企業(yè),剖析大模型創(chuàng)新進(jìn)程
作者 | ZeR0
編輯 | 漠影
(資料圖)
智東西7月7日?qǐng)?bào)道,在2023世界人工智能大會(huì)(WAIC)啟明創(chuàng)投論壇“生成式AI與大模型:變革與創(chuàng)新”上,啟明創(chuàng)投聯(lián)手未盡研究共同發(fā)布重磅報(bào)告《生成式AI》| State of Generative AI 2023。
該報(bào)告的撰寫基于啟明創(chuàng)投團(tuán)隊(duì)一年內(nèi)與近200家GPT-3發(fā)布后成立的生成式AI企業(yè)的交流、對(duì)超過(guò)600家美國(guó)生成式AI創(chuàng)新企業(yè)的追蹤與研究、對(duì)超過(guò)100名全球科技大廠和頂級(jí)研究機(jī)構(gòu)的業(yè)界AI領(lǐng)域的訪談,以及基于未盡研究對(duì)數(shù)百篇研究論文的梳理和分析等來(lái)源。
2022年被稱為生成式AI之年,擴(kuò)散模型應(yīng)用取得突破,ChatGPT出世,一系列開(kāi)創(chuàng)性的研究論文發(fā)表。2023年則把大模型推向了一個(gè)高峰,以GPT-4發(fā)布為標(biāo)志,生成式AI朝著通用人工智能的方向,進(jìn)入了創(chuàng)新應(yīng)用的階段。 這一階段最重要的特征,是應(yīng)用、研究、監(jiān)管,合力開(kāi)辟著生成式AI的創(chuàng)新之路。
在啟明創(chuàng)投微信公眾號(hào)后臺(tái)回復(fù)“生成式AI報(bào)告”即可獲取完整報(bào)告下載方式。
一、創(chuàng)新應(yīng)用:更多新公司聚焦于底層技術(shù)創(chuàng)新
人們很快從生成式AI中看到了新的商業(yè)生態(tài)的出現(xiàn)。生成式AI在中國(guó)似乎受到了更加熱情的接納和鼓勵(lì),不及政府鼓勵(lì)支持,大廠爭(zhēng)相布局,許多從事知識(shí)工作的中小企業(yè)也已經(jīng)積極使用。
企業(yè)們被卷入這一革命性的技術(shù)浪潮節(jié)奏不同、介入程度不同,它們成為新技術(shù)浪潮下的守成者、創(chuàng)新者、采納者,利潤(rùn)率被永久改變。
1. 守成者:既得利益者,轉(zhuǎn)型緩慢。能否采納生成式AI是第一個(gè)關(guān)鍵,采納后能否提價(jià)是第二個(gè)關(guān)鍵。
2. 創(chuàng)新者:新技術(shù)積極擁抱者。將通過(guò)生成式AI打造新產(chǎn)品和新服務(wù),獲得新的溢價(jià)。
3. 采納者:公司內(nèi)部業(yè)務(wù)和流程中采納新技術(shù)。降低研發(fā)、管理和銷售成本。優(yōu)化流程,提高工作效率。
算力目前是最稀缺的資源,也處于最容易獲利的要津。算力是大模型成本結(jié)構(gòu)中最大的一塊,GPU的性能,實(shí)際上決定了這個(gè)新興行業(yè)的步調(diào)。隨著算力與模型的進(jìn)步,更多初創(chuàng)企業(yè)正在涌入,它們搶到了時(shí)間的紅利,但也面臨競(jìng)爭(zhēng)和可能的巨頭碾壓??梢哉f(shuō),這是初創(chuàng)企業(yè)的藍(lán)海,也有航道下的暗礁。
競(jìng)爭(zhēng)促進(jìn)了創(chuàng)新。與2022年快速涌現(xiàn)出的生產(chǎn)力工具方向的創(chuàng)業(yè)公司不同,2023 年,有更多比例的新公司聚焦在底層技術(shù)的創(chuàng)新;大模型創(chuàng)業(yè)公司也開(kāi)始分化,在通用大模型創(chuàng)業(yè)公司方興未艾的同時(shí),許多面向醫(yī)療、電商、科研、工業(yè)、自動(dòng)駕駛和機(jī)器人等特定方向的垂直大模型公司開(kāi)始出現(xiàn)。
與截至2023年Q1基于啟明創(chuàng)投團(tuán)隊(duì)交流過(guò)的100余家生成式AI企業(yè)的統(tǒng)計(jì)相比,截至2023年上半年基于啟明創(chuàng)投團(tuán)隊(duì)交流過(guò)的近200家生成式AI企業(yè)的統(tǒng)計(jì)結(jié)果顯示,聚焦底層技術(shù)的生成式AI企業(yè)占比顯著增長(zhǎng),聚焦大模型研發(fā)的企業(yè)占比從7%增至14%。
二、前沿研究:研究和解決技術(shù)規(guī)模應(yīng)用中的問(wèn)題
2022年和2023年,是生成式AI技術(shù)取得突破的兩年,啟明創(chuàng)投和未盡研究團(tuán)隊(duì)梳理了論文,發(fā)現(xiàn)生成式AI領(lǐng)域的一個(gè)突出特征,是研究與創(chuàng)新過(guò)程的密切結(jié)合,許多在企業(yè)內(nèi)部實(shí)現(xiàn),迅速推出用例和產(chǎn)品。
這種研究與創(chuàng)業(yè)的一體化,初創(chuàng)企業(yè)和風(fēng)險(xiǎn)資本起到了重要的作用,而美國(guó)科技巨頭和主要AI企業(yè)的研究投入與人才,包括一些底層技術(shù)的研究,這些年來(lái)已經(jīng)超過(guò)了大學(xué)等研究機(jī)構(gòu)。
盡管從GPT-4的技術(shù)報(bào)告,到微軟的研究論文,都展示出它所具有的接近于人類的文字處理能力、數(shù)學(xué)推理能力,以及諸多專業(yè)領(lǐng)域的知識(shí)。“我們認(rèn)為它可以合理地被視為人工通用智能(AGI)系統(tǒng)的早期(盡管仍不完整)版本?!钡谕ㄍㄓ萌斯ぶ悄艿牡缆飞?,需要研究和解決的問(wèn)題反而更多了。如信心校準(zhǔn)、長(zhǎng)期記憶、持續(xù)學(xué)習(xí)、個(gè)性化、規(guī)劃和概念跨越、透明度、認(rèn)知謬誤和非理性,等等。
過(guò)去半年最重要的研究方向,是破解和理解大模型神秘而又令人興奮的智能“涌現(xiàn)”。大模型既需要超越對(duì)下一個(gè)詞的預(yù)測(cè)能力,也需要一個(gè)更豐富、更復(fù)雜的“慢思考”深層機(jī)制,來(lái)監(jiān)督“快思考”預(yù)測(cè)下一個(gè)詞的機(jī)制。
那些最好的前沿研究,一定是研究和解決技術(shù)規(guī)模應(yīng)用中遇到的問(wèn)題。
研究如何減少幻覺(jué),調(diào)教大模型更加準(zhǔn)確地輸出真實(shí)的內(nèi)容,訓(xùn)練出更強(qiáng)的推理能力;如何更集約地訓(xùn)練模型,降低門檻,推出新產(chǎn)品,讓更多的各行各業(yè)和消費(fèi)者都能用上;如何能像人一樣,與真實(shí)的物理世界互動(dòng);如何成為人類復(fù)雜工作的助手,設(shè)計(jì)并幫助執(zhí)行科學(xué)實(shí)驗(yàn);如何影響就業(yè),從而做出政策的響應(yīng);如何讓人工智能安全和可信。
三、監(jiān)管 | 安全 | 政策 | 人才
各國(guó)政府對(duì)于生成式AI的監(jiān)管呈現(xiàn)出不同的特點(diǎn)。
中國(guó)在迅速推出生成式人工智能的監(jiān)管辦法并征求意見(jiàn)的同時(shí),也在鼓勵(lì)發(fā)展通用人工智能,北京、上海、深圳是最具雄心的第一梯隊(duì),均提出了較具雄心的人工智能科研、創(chuàng)新與產(chǎn)業(yè)目標(biāo)。
歐盟繼續(xù)在監(jiān)管和立法方面領(lǐng)先,一如其5年前率先推出GDPR。美國(guó)更在意人工智能技術(shù)的領(lǐng)先地位,正在形成以風(fēng)險(xiǎn)管理為原則的監(jiān)管框架。
長(zhǎng)期來(lái)看,人才對(duì)AI未來(lái)的影響超過(guò)了算力。中國(guó)研究人員發(fā)布的論文在數(shù)量上已經(jīng)超過(guò)了美國(guó),但金字塔頂端,無(wú)論是研究還是創(chuàng)業(yè),美國(guó)仍然占據(jù)明顯的優(yōu)勢(shì)。
在全球范圍內(nèi),AI研究創(chuàng)新的重心正從高校轉(zhuǎn)移至企業(yè),美國(guó)擁有頂尖學(xué)者最多的前三大機(jī)構(gòu),分別是谷歌、微軟與Meta,合計(jì)招攬了美國(guó)頂級(jí)學(xué)者的30%。中國(guó)仍以高校為主,僅阿里巴巴躋身前10。
科技部已經(jīng)提出了AI企業(yè)應(yīng)該接受科技倫理審查;審查主體應(yīng)該設(shè)立科技倫理(審查)委員會(huì)。
美國(guó)AI企業(yè)較早開(kāi)始設(shè)立負(fù)責(zé)任與可信人工智能部門,從去年到今年以來(lái)經(jīng)過(guò)一些調(diào)整,反映出在生成式AI發(fā)生變革之際,企業(yè)正在尋求用更好的技術(shù)和方案,來(lái)安全和負(fù)責(zé)地部署新技術(shù)。
四、十大前瞻:明年中國(guó)將出現(xiàn)比肩GPT-4的大模型
《生成式AI》報(bào)告還發(fā)布了面向大語(yǔ)言模型、多模態(tài)模型、商業(yè)機(jī)會(huì)的十大展望。
(一)大語(yǔ)言模型
1. 2024年中國(guó)將出現(xiàn)比肩GPT-4的多語(yǔ)言通用大模型;
2. 超長(zhǎng)上下文(Long Context)將引領(lǐng)下一次LLM技術(shù)突破;
3. 在出現(xiàn)更有前景的大語(yǔ)言模型之前,為實(shí)現(xiàn)垂直領(lǐng)域更好的效果,以下三種方式將共存:
i)在不改變數(shù)據(jù)分布的情況下,利用更多通用數(shù)據(jù)進(jìn)行通用大模型預(yù)訓(xùn)練,不特別引入行業(yè)數(shù)據(jù),
ii)利用行業(yè)專屬數(shù)據(jù)微調(diào)(Fine-Tuning)通用大模型,
iii)利用行業(yè)數(shù)據(jù)占比更高的數(shù)據(jù)集進(jìn)行垂直模型預(yù)訓(xùn)練。
(二)多模態(tài)模型
4. 當(dāng)前CLIP + Diffusion的文生圖模型是過(guò)渡態(tài),未來(lái)2年內(nèi)將出現(xiàn)一體化的模型結(jié)構(gòu);
5. 下一代Text-to-Image模型將具備更強(qiáng)的可控性,它將結(jié)合底層模型能力和前端控制方式,對(duì)模型的設(shè)計(jì)將注重與控制方式的結(jié)合;
6. 2025年之前,Video和3D等模態(tài)將迎來(lái)里程碑式的模型,大幅提高生成效果;
7. 以PALM-E為代表的具身智能(Embodied AI)展現(xiàn)出在機(jī)器人的感知、理解和決策等方向上的巨大潛力,但當(dāng)前訓(xùn)練和可靠性存在較大挑戰(zhàn);
8. 短期內(nèi)Transformer正成為多個(gè)模態(tài)的主流網(wǎng)絡(luò)結(jié)構(gòu),但壓縮整個(gè)數(shù)字世界的通用方法尚未出現(xiàn),Transformer并不是人工智能技術(shù)的終點(diǎn)。
(三)商業(yè)機(jī)會(huì)
9. 3年內(nèi),顛覆式的AI應(yīng)用的核心驅(qū)動(dòng)力來(lái)自于底層模型的創(chuàng)新,兩者無(wú)法解耦,模型的作用將大于產(chǎn)品設(shè)計(jì)的作用;
10. 當(dāng)前生成式AI市場(chǎng)處于技術(shù)主導(dǎo)的早期階段,存在千億美元市值的平臺(tái)性企業(yè)的機(jī)會(huì)。
關(guān)鍵詞: